• 제목/요약/키워드: 과학 텍스트

검색결과 598건 처리시간 0.027초

지구과학 논문의 언어 특성 이해: 레지스터 분석 (Understanding of the Linguistic Features of Earth Science Treatises: Register Analysis Approach)

  • 맹승호;신명환;차현정;함석진;신현정;김찬종
    • 한국지구과학회지
    • /
    • 제31권7호
    • /
    • pp.785-797
    • /
    • 2010
  • 이 연구에서는 과학 논문 레지스터를 분석하여 지구과학 논문의 언어 특성을 탐색하였다. 연구 자료로 지질과학, 대기과학, 해양과학의 한국어 논문 1편씩을 선정하였다. 지구과학 논문 레지스터의 특징은 다음과 같다. 첫째, 주제부와 설명부 간의 의미적, 지시적 연결이 체계적으로 이루어지고 있으며, 이를 통해 텍스트가 제시하려는 메시지와 요점이 통일적으로 응집력 있게 제시되었다. 둘째, 각 텍스트의 장르 요소에 따라 연역적 추론 또는 귀추적 추론 관계 및 인과 관계를 나타내는 술어들이 사용되었으며, 논리적 관계는 접속어구보다는 술어의 유형을 통해 표현되었다. 셋째, 대부분의 논문 텍스트에서 가능성을 나타내는 인식적 술어를 사용하여 과학자들의 해석과 설명 및 주장을 간접적으로 표현하는 약한 상호관계를 형성하였다. 연구 결과를 근거로 학생들이 과학 학습 과정에서 과학 텍스트에 대한 문해 능력을 높이고, 과학자들의 지식 구성 방식을 이해하기 위해서는 과학 글에서 각 문장을 구성하는 주제부와 설명부의 연결 관계를 파악하고, 술어의 유형에 따라 논리적 관계를 조사하는 과학 언어 풀어내기 활동이 과학 교육과정에 포함되어야 함을 논의하였다.

텐서보팅을 이용한 텍스트 배열정보의 획득과 이를 이용한 텍스트 검출 (Extraction of Text Alignment by Tensor Voting and its Application to Text Detection)

  • 이귀상;또안;박종현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권11호
    • /
    • pp.912-919
    • /
    • 2009
  • 본 논문에서는 이차원 텐서보팅과 에지 기반 방법을 이용하여 자연영상에서 문자를 검출하는 새로운 방법을 제시한다. 텍스트의 문자들은 보통 연속적인 완만한 곡선 상에 배열되어 있고 서로 가깝게 위치하며, 이러한 특성은 텐서보팅에 의하여 효과적으로 검출될 수 있다. 이차원 텐서보팅은 토큰의 연속성을 curve saliency 로 산출하며 이러한 특성은 다양한 영상해석에 사용된다. 먼저 에지 검출을 이용하여 영상 내의 텍스트 영역이 위치할 가능성이 있는 텍스트 후보영역을 찾고 이러한 후보영역의 연속성을 텐서보팅에 의해 검증하여 잡음영역을 제거하고 텍스트 영역만을 구분한다. 실험 결과, 제안된 방법은 복잡한 자연영상에서 효과적으로 텍스트 영역을 검출함을 확인하였다.

텍스트마이닝 기법과 구글데이터를 이용한 질병관련 유전자 식별 (Disease related Gene Identification Using Literature and Google data)

  • 김정우;김현진;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1084-1087
    • /
    • 2013
  • 텍스트마이닝은(Text mining) 바이오분야에서 사용되는 도구 중 하나이다. 본 논문에서는 전립선암(Prostate cancer)과 관련된 질병 유전자(Disease gene)를 찾기 위해 텍스트마이닝을 이용하여 유전자 네트워크(Gene-network)를 구축하였다. 추가적으로 구글(Google) 검색을 통해 네트워크 내의 유전자 노드(Node)들 사이의 간선(Edge)에 새로운 가중치(Weight)를 추가하고 네트워크를 재구성하였다. 구축된 네트워크에서 노드와 노드 사이의 가중치를 기반으로 전립선암과 관련된 질병 유전자를 추출하였다. 본 논문의 방법은 성공적으로 네트워크를 구축하고 질병 유전자를 찾았으며, 구글 데이터를 사용하지 않고 네트워크를 구축하는 경우보다 더 높은 정확성을 입증했다.

선형문서를 하이퍼텍스트문서로 자동변환시키기 위한 연구 및 구현 (Conversion of linear, paper-based documents into Hypertext)

  • 김진수;박동원
    • 자연과학논문집
    • /
    • 제8권1호
    • /
    • pp.101-107
    • /
    • 1995
  • 정보의 양이 늘어남에 따라, 필요한 정보를 빠르고 쉽게 추출할 수 있는 하이퍼텍스트 문서화에 대한 요구는 증가하고 있다. 기존의 서류문서를 하이퍼텍스트 전자문서로 변환시키기 위한 기술을 고찰하고 이를 구현하기 위한 소프트웨어를 개발하였다. 이 변환 작업은 세 과정은 세 과정으로 나누어져 있다. 첫 번째 과정에서는 스캐너를 이용하여 서류문서를 일단 전자문서화 시키고, 두 번째 과정에서는 첫 번째 과정의 output인 선형 전자문서를 전역 하이퍼텍스트 전자문서로 변환시킨다. 세 번째 과정에서는 이를 타겟 하이퍼텍스트 시스템의 포맷에 맞게끔 다시 변환시킨다. 이 작업을 통하여 실현가능성을 증명하였고, 또한 일반화시키기 위한 문제점들을 제시하였다.

  • PDF

과학기술데이터를 위한 자연어처리 기술 동향 (Natural Language Processing Trends For Science & Technology Data)

  • 정현지;장광선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.666-669
    • /
    • 2021
  • 연구수행과정에서 발생하는 논문, 특허, 연구보고서 등의 과학기술데이터는 다양한 과학기술지식을 포함한다. 연구자들의 효과적인 연구를 지원하기 위해서는 과학기술데이터 분석을 통한 지식 발견이 필수적이다. 과학기술데이터는 일반 텍스트와는 다르게 다수의 전문용어를 포함하고 있으며, 고유의 양식이 정해져 있고, 텍스트 길이가 대체로 길다는 특징이 있다. 본 고에서는 이러한 과학기술데이터만의 고유한 특징을 반영한 인공지능 기반 자연어처리 기술들을 소개함으로써 과학기술데이터 분석에 대한 이해를 돕고자 한다.

블록정렬압축을 이용한 접미사배열의 효율적인 저장 (Efficient Storing of Suffix Arrays using Block-Sorting Compression)

  • 이건호;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권7호
    • /
    • pp.350-355
    • /
    • 2001
  • 블록정렬압축은 빠른 속도로 동작하면서 높은 압축률을 나타내는 압축 방법이다. 또한 블록정렬방식으로 압축된 텍스트는 원래 텍스트를 복원하는 과정에서 접미사배열을 0(n) 시간만에 구할 수 있다. 그러나 접미사배열을 이용하여 효율적인 검색을 수행하려면 lcp(longest common prefix)정보가 추가적으로 필요하다. 본 논문에서는 텍스트와 접미사배열이 주어졌을 때 lcp정보를 0(n) 시간만에 구할 수 있는 알고리즘을 제시한다.

  • PDF

2015 개정 초등학교 과학 교과서 텍스트의 명제 연결에 대한 분석 (Analyses on Propositional Connections in the Texts of Elementary School Science Textbooks Developed under the 2015 Revised Science Curriculum)

  • 송혜원;강석진
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제41권1호
    • /
    • pp.79-92
    • /
    • 2022
  • 이 연구에서는 2015 개정 과학교육과정의 3학년 1학기와 6학년 2학기 과학 교과서 텍스트에서 명제들 사이의 연결 유형과 명제의 연결에 사용된 표지 유형을 분석하여, 국어 교과서 및 사회 교과서와 비교하였다. 명제의 연결은 강조, 상술, 예시, 나열, 추가, 차례, 대응, 인과, 조건, 목적 유형 등으로 분류하였고, 명제의 연결에 사용된 명제 관계 표지의 유형은 지시어나 접속어를 사용한 경우, 쉼표를 사용한 경우, 특정 언어 요소를 사용한 경우, 표지가 없는 경우 등으로 분류하였다. 6학년 과학 교과서는 텍스트에 사용된 명제의 연결 관계가 국어나 사회 교과서에 비해 적었지만, 3학년 과학 교과서는 텍스트에 사용된 명제의 연결 관계 빈도가 사회 교과서보다는 낮았고 국어 교과서보다는 높았다. 명제의 연결 유형에서는 차례, 나열, 조건, 인과 유형이 대부분을 차지하였고, 이러한 경향은 국어나 사회 교과서에서도 유사하게 나타났다. 3학년과 6학년 교과서 모두 명제를 연결할 때 특별한 표지가 없는 비율이 40% 이상이었고, 특히 차례와 인과 유형에서는 표지가 없는 비율이 상대적으로 높았다.

하이퍼텍스트상의 정보획득과 성인과 아동의 정보탐색 (Information acquisition and searching in hypertext: Comparison Between adults and children)

  • 최순희;조경자;이승복
    • 인지과학
    • /
    • 제11권3_4호
    • /
    • pp.1-11
    • /
    • 2000
  • 본 연구에서는 하이퍼텍스트에서의 정보획득의 효율성과 정보탐색에서의 아동과 성인의 수행 차이를 알아보고자 하였다. 또 하이퍼텍스트의 깊이 수준이 정보탐색에 어떠한 인지적 부담 주는 지를 깊은 수준(7수준) 문제에 대한 수행 분석으로 알아보고자 하였다. 실험 1에서 성인을 대상으로 인쇄물과 하이퍼텍스트에서의 정보획득과정을 비교한 결과, 인쇄물 조건일 때 하이퍼텍스트 조건일 때보다 정보획득을 더 잘 했다. 또한 하이퍼텍스트 조건에서 인터넷 사용경험에 따라서 정보 획득반응에 차이를 보였다. 실험 2에서 성인과 아동이 하이퍼텍스트에서 보이는 정보탐색 수행을 비교해 보았다. 결과 하이퍼텍스트에서 정보탐색을 하는데 걸리는 시간은 성인이 아동보다 빨랐으나 정확반응에는 유의미한 차이를 보이지 않았다. 반면에 사용경험으로 보면, 실험참가자 두 집단 모두 인터넷 사용경험이 증가할수록 탐색 시간이 더 걸렸지만, 7 수준 문제를 맞추기도 하고, 인터넷 사용경험도 많은 아동 7수준 문제를 틀리고 사용경험이 없는 성인보다 정확한 반응에서도 더 잘하였고 반응시간도 덜 걸리는 것으로 나타났다. 본 연구결과 사용자에게 익숙해지면 지식 수준이 좀 더 떨어지는 아동이라 할지라도 하이퍼텍스트에서 정보탐색을 효율적으로 할수 있으며, 이들에게는 하이퍼텍스트가 능동적인 지식획득과 정보를 탐색하게 도와주는 매체인 것으로 보인다.

  • PDF

텍스트 네트워크 분석을 이용한 보험 이미지 분석 (Analyzing insurance image using text network analysis)

  • 박경보;고해리;홍종의
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.531-541
    • /
    • 2018
  • 본 연구는 소비자들의 농협보험에 대한 이미지 이미지를 분석하기 위해 텍스트 마이닝과 텍스트 네트워크 분석을 실시하였다. 최근 소셜미디어의 발달로 많은 텍스트가 생산 및 재생산되고 있으며, 텍스트는 기업에게 중요한 정보들을 제공한다. 이러한 정보의 의미를 도출하기 위해, 텍스트 마이닝과 텍스트 네트워크 분석을 많은 연구에서 실시하고 있다. 텍스트 분석결과, 농협보험의 긍정적 이미지는 주로 안전과 안정으로 나타났다. 농협보험의 부정적 이미지로는 우려와 불안으로 나타났다. 텍스트 네트워크 분석을 통해 도출한 농협보험의 이미지는 안전과 우려를 중심으로 형성되었다. 텍스트 네트워크 분석을 통해 도출된 결과를 인터뷰를 통해 확인하였다. 인터뷰 결과, 농협은 자산규모 등을 통해 안정적인 재무와 보험금 지급은 안전함이 긍정적 이미지의 주요한 요인이었다. 부정적 이미지로는 최근의 정보유출 사태로 인해 소비자들의 개인정보유출에 대한 우려가 큰 것으로 나타났다. 본 연구에서 분석을 통해 타 상품의 이미지 분석도 사용가능할 것이다.

계량정보학의 변천과 응용에 관한 고찰 -정보서비스를 중심으로- (A Transition of Informetrics and Its Application : With Relation to Information Service)

  • 장우권
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.101-104
    • /
    • 1996
  • 학문은 다양한 이론적 배경을 토대로 시대적 환경에 적응하여 발전한다. 즉, 서로의 영역을 공유하면서 새로운 이론을 창출하고 실제로 이를 응용하고 있는 것이다. 계량서지학, 계량과학학, 문헌과학학등으로 일컫고 있는 계량정보학은 문헌의 분석을 위해 수량학적 방법으로 적용하여 연구하는 학문으로, 활발히 연구되어 응용되고있는 분야는 텍스트검색시스템, OPACs, 비디오텍스시스템, 하이퍼텍스트시스템, CD-ROM, 온라인 정보서비스, 전자출판, 전자우편, 케이블 TV 등의 전자정보서비스 분야이다. 본 연구에서는 계량정보학의 사적변천과 연구영역, 그 응용과 실제를 고찰하였다.

  • PDF