• Title/Summary/Keyword: 과학 텍스트

Search Result 598, Processing Time 0.025 seconds

텍스트 마이닝의 개념과 응용

  • 조태호
    • 지식정보인프라
    • /
    • 통권5호
    • /
    • pp.76-85
    • /
    • 2001
  • 정보검색시스템은 물론 텍스트 데이터를 대상으로하는 지식관리 시스템, 문서관리시스템, 그리고 전자도서관등에서 텍스트 마이닝에 대한 기술에 대한 수요가 증가하고 있는 추세이다. 이 글에서는 텍스트 마이닝의 개념을 소개하고, 텍스트 마이닝의 주요기능, 그리고, 응용사례등을 기술할것이다. 텍스트 마이닝은 텍스트 데이터를 대상으로 하여 그들간의 암묵적인 정보를 추출하는 과정으로 정의할 수 있다. 데이터마이닝과 텍스트 마이닝의 차이는 대상이 텍스트 데이터와 수치 데이터하는 점에서 구분되고 텍스트 마이닝은 데이터 마이닝과 달리 이를 구조화시키는 과정이 필요하다. 텍스트마이닝에 있어서 구조화하는 과정에서 가장 보편적으로 사용되는것은 문서색인이다.

  • PDF

고등학교 과학 수업에서 의미지도 읽기 전략이 고등학생의 과학 텍스트 읽기 능력에 미치는 영향 (The Effects of Implementing Semantic Mapping Reading Strategy in Science Class On High School Students' Science Text Reading Ability)

  • 이수진;남정희
    • 대한화학회지
    • /
    • 제66권5호
    • /
    • pp.376-389
    • /
    • 2022
  • 이 연구는 과학 수업에서 의미지도 읽기 전략이 고등학생의 과학 텍스트 읽기 능력에 미치는 영향을 알아보는 것을 목적으로 하였다. 이를 위해 중소도시 소재의 과학중점학교 3학년 학생들(40명)을 대상으로 한 학기 동안 사회과학적 이슈와 화학 개념에 대한 8개의 과학 텍스트를 이용하여 의미지도 읽기 전략 수업을 적용하였다. 의미지도 읽기 전략이 과학 텍스트 읽기 능력에 미치는 영향을 알아보기 위해 학생들이 작성한 사전·사후 과학 읽기 능력 검사를 비교 분석하였다. 분석 결과, 의미지도 수업을 적용한 실험집단의 과학 읽기 능력 검사 점수의 평균이 비교집단보다 유의미하게 높았다. 읽기 과제를 해결하기 전에 의미지도를 그리는 것은 학생들이 텍스트에서 정보를 찾고, 의미를 추론하는 것에 효과가 나타났다. 학생들 역시 의미지도가 텍스트의 내용을 시각화하여 개념들 사이의 관계를 파악하기 쉽고, 자신의 배경지식과 텍스트 내용을 연결시킬 수 있어 텍스트의 이해에 도움이 된다고 인식하고 있음을 알 수 있다.

사회과학을 위한 양적 텍스트 마이닝: 이주, 이민 키워드 논문 및 언론기사 분석 (Quantitative Text Mining for Social Science: Analysis of Immigrant in the Articles)

  • 이수정;최두영
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.118-127
    • /
    • 2020
  • 본 연구는 최근 사회과학에서 실시되고 있는 양적 텍스트 분석의 흐름과 분석을 실시함에 있어 주의해야 할 사례를 포함하여 기술 하였다. 특히, 2017년부터 2019년까지 3년간 학술지와 언론에서 사용된 "이주", "이민" 키워드를 기반으로 사례연구를 실시하였다. 이를 위해 최근 사회과학분야에서 주목 받는 자연어 처리 기술(NLP)를 이용한 양적 텍스트 분석 (Quantitate text analysis)을 사용하였다. 양적 텍스트 분석은 문서를 구조적 데이터로 변환하여, 가설의 발견 및 검증을 실시하는 데이터 과학의 영역으로, 데이터의 모델링 및 가시화 등이 가능하고, 특히 비구조화 된 데이터를 구조화할 수 있다는 점에서 사회과학 분야에 많이 도입하였다. 따라서 본 연구는 양적 텍스트 분석을 통해 "이주", "이민"을 키워드로 한 연구 및 언론 기사에 대한 통계 분석을 실시하고 도출된 결론에 대한 해석을 실시하였다.

지구과학 논문과 지구과학 교과서 텍스트의 과학 언어적 특성 비교 (Comparison of the Features of Science Language between Texts of Earth Science Articles and Earth Science Textbooks)

  • 이정아;김찬종;맹승호
    • 한국과학교육학회지
    • /
    • 제27권5호
    • /
    • pp.367-378
    • /
    • 2007
  • 과학 교과서와 과학 연구 논문의 과학 언어적 특성을 조사하기 위하여 지구과학 교과서 2 종과 지구과학 논문 2 편을 선정하여 각 텍스트의 과학 용어 분류, 설명 텍스트의 구조 분석과 접속 관계를 통한 추론 분석, 접속어의 기능에 대한 분석 방법을 적용하여 분석하였다. 연구 결과, 지구과학 교과서에서 드러난 학교 과학의 언어는 명명어의 비중이 높으며, 정의/예시 구조와 기술 구조 중심의 설명 텍스트 구조를 보였다. 또한, 논리적 추론보다는 부가적인 나열 관계를 나타내는 내적 관계가 우세하였다. 이에 반해 지구과학 논문에서 볼 수 있는 과학자의 과학 언어는 명명어의 비중이 큰 가운데서도 과정어와 개념어의 비중이 과학 교과서의 과학 언어에 비해 높았으며, '도입 - 연관 계열 - 결론'에 이르는 설명 텍스트의 도식적 구조를 갖추고 있었다. 또한, 연관 계열을 이루는 각 문장의 텍스트 구조는 원인/결과 구조 또는 기술 구조에 뒤이은 문제/해결 구조를 보였으며, 각 문장틀 간에 부사형 어미나 동사를 이용한 내적 관계를 통해 인과적 추론 또는 귀추적 추론 관계를 표현하고 있었다. 학생들의 진정한 과학 언어 사용을 위해서는 두 언어 사이의 간극을 줄이는 것이 필요하다. 이를 위해 학교 과학의 언어와 과학자의 언어를 매개하는 지구과학 교사의 교수 언어로서 중간 언어를 제안하였다.

과학텍스트의 읽기 및 이해에 대한 결속장치의 선택적 영향 (The Selective Effect of Cohesive Devices on Scientific Text Reading and Comprehension)

  • 김세영;한광희;조숙환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.226-232
    • /
    • 2001
  • 본 연구는 결속장치(cohesive devices)가 과학텍스트의 읽기 속도와 내용 이해에 끼치는 영향에 대해 연구하였다. 연구의 목적을 위한 실험을 통해서 먼저, 텍스트의 문단별 읽기 시간을 측정하여 온라인 처리 과정을 검토하였고, 둘째, 회상과 재인 검사를 실시하여 오프라인 상태에서의 이해도를 조사하였다. 이 연구의 재료로 사용된 텍스트는 번개 생성과정에 대한 과학텍스트로서, 반복, 지시사, 정박(anchoring), 인과적 접속사 등의 결속장치를 이용하여 응집성(coherence)의 강도를 높고, 낮게 조작하였다. 실험 결과, 결속장치가 길속장치의 종류와 지엽적 응집성의 강도에 따라 과학텍스트 읽기와 이해에 선택적으로 영향을 끼친다는 것을 발견하였다. 첫째, 인과적 접속사는 읽기 시간에는 영향을 주지 않는 반면, 이해를 촉진했는데, 이 긍정적 효과는 과제의 종류에 따라 다르게 나타났다. 즉, 회상 검사 결과에서는 인과적 접속사가 쓰인 모든 문단에서 유의한 차이가 나타났으나, 재인 검사에서는 유의한 차이가 부분적으로만 나타났다. 둘째, 반복 결속장치는 다른 결속장치와 같이 발생할 경우에만 읽기 시간과 이해를 부분적으로 촉진하는 것으로 나타났다. 셋째. 정박 결속장치의 영향은 읽기와 이해 두 처리 과정에 모두 선택적으로 영향을 준 것으로 나타났다. 인과적 접속사와 함께 쓰인 문단의 경우에는 회상 검사에서만, 반복 결속장치가 함께 쓰인 문단에서는 회상, 재인 검사에서 모두 긍정적 영향을 준 것으로 관찰되었다.

  • PDF

마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환 (Unpaired Korean Text Style Transfer with Masked Language Model)

  • 배장성;이창기;황정인;노형종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.391-395
    • /
    • 2021
  • 텍스트 스타일 변환은 입력 스타일(source style)로 쓰여진 텍스트의 내용(content)을 유지하며 목적 스타일(target style)의 텍스트로 변환하는 문제이다. 텍스트 스타일 변환을 시퀀스 간 변환 문제(sequence-to-sequence)로 보고 기존 기계학습 모델을 이용해 해결할 수 있지만, 모델 학습에 필요한 각 스타일에 대응되는 병렬 말뭉치를 구하기 어려운 문제점이 있다. 따라서 최근에는 비병렬 말뭉치를 이용해 텍스트 스타일 변환을 수행하는 방법들이 연구되고 있다. 이 연구들은 주로 인코더-디코더 구조의 생성 모델을 사용하기 때문에 입력 문장이 가지고 있는 내용이 누락되거나 다른 내용의 문장이 생성될 수 있는 문제점이 있다. 본 논문에서는 마스크 언어 모델(masked language model)을 이용해 입력 텍스트의 내용을 유지하면서 원하는 스타일로 변경할 수 있는 텍스트 스타일 변환 방법을 제안하고 한국어 긍정-부정, 채팅체-문어체 변환에 적용한다.

  • PDF

과학 텍스트 의미지도 읽기 전략이 고등학생의 추론적 이해에 미치는 영향 (The Effects of Semantic Mapping as a Science Text Reading Strategy On High School Students' Inferential Comprehension)

  • 이수진;박지훈;남정희
    • 대한화학회지
    • /
    • 제67권5호
    • /
    • pp.362-377
    • /
    • 2023
  • 이 연구는 과학 텍스트 읽기 전략으로 의미지도가 고등학생의 추론적 이해에 미치는 영향을 알아보는 것을 목적으로 하였다. 이를 위해 고등학교 3학년 과학중점반 2개 학급 학생 46명을 대상으로 한 학기 동안 의미지도 읽기 전략을 활용하여 8개 주제의 과학 텍스트 읽기 수업을 실시하였다. 의미지도 읽기 전략이 과학 텍스트의 추론적 이해에 미치는 영향을 알아보기 위해 학생들이 작성한 사전·사후 읽기 능력 검사지를 비교 분석하였다. 추론적 이해 변화를 알아보기 위해 추론적 이해 분석틀을 개발하여 추론적 이해 수준을 분석하였다. 추론적 이해 변화를 분류하기 위해 추론적 이해 분석틀의 세부 항목인 3개 항목의 수준을 점수로 환산하였다. 학생들의 추론적 이해 변화 분석 결과는 의미지도 읽기 전략 수업이 고등학생의 추론적 이해 변화에 영향을 미쳤으며, 특히 추론적 이해의 하위 유형 중 교량 추론과 정교화 추론에 영향을 미치는 것으로 나타났다.

응집장치가 과학텍스트의 기억과 이해에 미치는 효과 (The Effect of Cohesive Devices on Memory and Understanding of Scientific Text)

  • 김세영;한광희;조숙환
    • 인지과학
    • /
    • 제13권2호
    • /
    • pp.1-13
    • /
    • 2002
  • 본 논문에서는 표층 언어 표현의 응집성 (coherence)이 과학 텍스트의 이해에 어떤 효과를 주는지에 대해 검토하였다 이 연구는 응집성의 강도가 과학 텍스트 이해의 정도와 관계가 있는 지 검토하고. 텍스트의 이해가 지엽적 응집성과 총체적 응집성의 관점으로 어떻게 설명될 수 있는지, 또는 다른 요인과 어떠한 관계가 있는지 조사하였다. 이해에 대한 응집성 강도의 효과를 알아보기 위하여 원인, 반복, 직시사 (deixis). 정박 (anchoring)등의 응집장치 (cohesive devices)를 이용하여 텍스트의 응집성 강도를 조작하였으며. 이에 대한 오프라인 처리 과제를 실시하였다 실험 결과, 응집성이 강한 텍스트가 보다 용이하게 이해된 것으로 나타났다 단락별로 분석된 회상 및 재인 검사의 결과에서는 응집장치의 종류에 따른 응집성 효과가 선택적으로 나타났다 이는 응집장치의 지엽적 효과가 일관적이지 않다는 것을 의미하는 것으로 보인다. 한편 텍스트의 주제가 얼마나 긴밀하게 연결되었는지 분석한 결과. 주제 연결 (topic continuity)의 긴밀성 정도가 텍스트 이해와 관련되어 있음을 발견하게 되었다 이러한 결과는 텍스트 이해가 지엽적 응집성의 선택적 효과에 의해 구축되는 상향적 (bottom-up) 과정뿐만 아니라. 텍스트 전체를 지배하는 하향적 (top-down) 과정에 의해 촉진됨을 암시한다

  • PDF

교육과정 변천에 따른 초등 과학 교과서 텍스트에 대한 체계기능언어학적 분석 (The Systemic Functional Linguistics Analysis of Texts in Elementary Science Textbooks by Curriculum Revision)

  • 맹승호;김혜리;김찬종;이정아
    • 한국과학교육학회지
    • /
    • 제27권3호
    • /
    • pp.242-252
    • /
    • 2007
  • 이 연구는 교수요목기부터 7차 교육과정까지의 모든 과학(자연) 교과서에서 공통적으로 제시되는 '기압'과 '바람'을 다루는 텍스트를 체계기능언어학적으로 분석하였다. 연구 결과는 다음과 같다. 관념적 메타기능 측면에서 과학적 정보를 많이 담고 있는 텍스트는 교육과정 개정에 따라 줄어든 것으로 나타났다. 대부분의 정보의 형태는 '원리'보다는 '정의'와 '사실'이었다. 상호적 메타기능 측면에서 학생과 텍스트 사이의 거리는 점점 줄어들었으며, 학생들의 사회적 지위는 교육과정 개정에 따라 점차적으로 고려되었다. 구성적 메타기능 측면에서 전문적 용어와 기호의 비율은 감소 추세에 있었으나, 과학 교과서에서 텍스트양 또한 줄어든 것으로 나타났다. 초기에는 문장에 주어가 제시되었으나, 시간이 흐르면서 주어가 생략되었다. 또한 주어와 문장 첫 구의 일치율은 7차의 교과서 텍스트에서 그 일치도가 현저히 줄어든 것으로 나타났다.

과학교과서의 학년 간 언어적 특성 분석 -텍스트 정합성을 중심으로- (An Analysis of Linguistic Features in Science Textbooks across Grade Levels: Focus on Text Cohesion)

  • 류지수;전문기
    • 한국과학교육학회지
    • /
    • 제41권2호
    • /
    • pp.71-82
    • /
    • 2021
  • 교과서를 통한 학습의 효율성을 최대화하기 위해서는 교과서에 수록된 텍스트 특성이 예상된 학습자의 특성(i.e., 언어적 및 인지적 능력, 배경지식 수준)에 따라 체계적으로 조절되어야 한다. 이에 따라 현재 연구에서는 과학교과서 개발에 이러한 체계적인 원칙이 반영되어 있는지를 알아보기 위하여 중학교 1, 2, 3학년 과학교과서의 학년 간 언어적 특성을 비교 분석하였다. 구체적으로 한국어 분석 프로그램인 Auto-Kohesion 시스템을 활용하여 기존 텍스트 분석 연구에 많이 활용되었던 텍스트 표층 구조 측정치, 어휘 관련 측정치, 통사적 복잡성 측정치와 같은 피상적 측정치에 더하여 여러 정합성 관련 측정치(e.g., 명사 반복, 접속사, 대명사)를 분석하였다. 주요 분석 결과, 대체로 어절 및 문장 길이, 어휘 빈도와 같은 피상적으로 두드러지는 특성에 대해서는 학년이 증가함에 따라 텍스트 복잡도가 상승하는 방향으로 단계적으로 조절이 이루어졌지만, 그 외의 많은 언어적 특질에 대해서는 체계적으로 조절되지 않은 것으로 나타났다. 특히 여러 정합성 측정치들이 교과서 개발 과정에서 충분히 고려되지 않은 것으로 시사되었다. 이러한 결과는 저학년 학습자들이 교과서를 사용할 때 발달 단계에 맞지 않는 어려운 텍스트를 접할 가능성이 있어서 학습 의욕 및 효율성 저하 현상이 발생할 수 있다는 것을 제시한다. 아울러 고학년 교과서가 고등 교육을 대비하여 더욱 복잡한 텍스트를 처리할 수 있는 능력을 개발시키기 위한 용도로 적절하지 않을 수 있음을 시사한다. 본 연구는, 추후 교과서 개발 과정에서, 예상된 독자 특성의 변화에 따라 정합성 측정치를 포함한 여러 언어적 특성이 단계적으로 조절되어야 함을 제안한다.