• 제목/요약/키워드: 어구 색인

검색결과 7건 처리시간 0.02초

의문의 초점을 고려한 자연어 기반의 정보검색 시스템 (Natural language based Information Retrieval System considering the focus of the question)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF

구 분할을 이용한 명사구기반 색인의 성능향상 (Improvement of phrase-based indexing performance using phrase segmentation)

  • 이충희;김현진;장명길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.585-588
    • /
    • 2002
  • 정보검색의 정확률을 높이는 것이 최근 정보검색 연구의 추세이며, 정확률을 높일 수 있는 방법 중 하나로 명사구단위 색인이 있다. 명사구 색인을 하는 방법에는 구문분석기를 이용하는 방법과 패턴 규칙을 이용하는 방법으로 나눌 수 있다. 구문분석기를 이용하여 전체 문장을 분석한 후 명사구단위 색인을 할 경우, 범용적으로 이용할 수 있지만 속도와 정확도가 떨어진다는 문제점이 있으며 패턴 규칙을 이용하는 경우는 속도는 빠르지만 정확도 및 확장성에 문제를 가지고 있다. 이런 문제들을 해결하기 위해 본 논문에서는 문장으로부터 명사구를 분할한 후, 분할된 명사구를 완전 구문 분석하여 색인하는 방법을 제안한다. 명사구는 속격어구와 관형형 명사구를 대상으로 하였고, 구 분할은 속격조사와 관형형어미를 중심으로 주변 형태소와 품사를 고려하는 규칙을 만들어 실행하였다. 실험대상은 짧은 문장, 중간문장, 긴 문장을 각각 25 개를 선정하여 실험하였고, 구 분할을 이용할 경우 평균 재현율은 86%, 평균 정확률은 74% 정도의 성능을 보였다. 긴 문장의 경우, 구 분할을 이용하지 않는 경우에 비해서 정확도 및 속도에서 월등한 성능향상이 있었다.

  • PDF

내용기반 음악검색 시스템의 비교 분석 (A Comparative Analysis of Content-based Music Retrieval Systems)

  • 노정순
    • 정보관리학회지
    • /
    • 제30권3호
    • /
    • pp.23-48
    • /
    • 2013
  • 본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

A Collocational Analysis of Korean High School English Textbooks and Suggestions for Collocation Instruction

  • Kim, Nahk-Bohk
    • 영어어문교육
    • /
    • 제10권3호
    • /
    • pp.41-66
    • /
    • 2004
  • Under the textbook-driven approach to English education in the Korean selling, the importance of the English textbook can not be overemphasized as the main source of learning materials. Recently, with the development of computer-based language corpora, the recognition of the importance of collocations and the availability of computerized databases of words have caused a resurgence and facilitation in the instruction of collocation. The primary purpose of the present study is to identify the characteristics of lexical collocation and the extent of its use in high school 10th-grade textbooks. From all the analyses, it is revealed that the language materials reflect various constructed collocation in the case of adjective+noun and noun+noun collocations in a natural context. However, verb+noun and adverb+verb collocations are not fully reflected. This is true for delexicalized verbs, and verb and adjective intensifiers. Also the language materials do not provide sufficient support for the lexical syllabus, even though all textbooks may be somewhat adequate in terms of vocabulary size. Finally, based on the analyses of the texts, the suggestions for English collocation instruction are made in the lexical approach.

  • PDF

자동색인을 위한 학습기반 주요 단어(핵심어) 추출에 관한 연구 (Learning-based Automatic Keyphrase Indexing from Korean Scientific LIS Articles)

  • 김혜진;정유경
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2017년도 제24회 학술대회 논문집
    • /
    • pp.15-18
    • /
    • 2017
  • 학술 데이터베이스를 통해 방대한 양의 텍스트 데이터에 대한 접근이 가능해지면서, 많은 데이터로부터 중요한 정보를 자동으로 추출하는 것에 대한 필요성 또한 증가하였다. 특히, 텍스트 데이터로부터 중요한 단어나 단어구를 선별하여 자동으로 추출하는 기법은 자료의 효과적인 관리와 정보검색 등 다양한 응용분야에 적용될 수 있는 핵심적인 기술임에도, 한글 텍스트를 대상으로 한 연구는 많이 이루어지지 않고 있다. 기존의 한글 텍스트를 대상으로 한 핵심어 또는 핵심어구 추출 연구들은 단어의 빈도나 동시출현 빈도, 이를 변형한 단어 가중치 등에 근거하여 핵심어(구)를 식별하는 수준에 그쳐있다. 이에 본 연구는 한글 학술논문의 초록으로부터 추출한 다양한 자질 요소들을 학습하여 핵심어(구)를 추출하는 모델을 제안하였고 그 성능을 평가하였다.

  • PDF

우리나라 제주도에서 관찰된 바다거북의 좌초와 혼획 (Observation and Record of Sea Turtles in Bycatch and Stranding from Jeju Island of Korea)

  • 정민민;문대연;김성호;김흥수;김재우
    • 수산해양교육연구
    • /
    • 제24권5호
    • /
    • pp.662-669
    • /
    • 2012
  • 2008년부터 2009년까지 제주도 연안 해역에서 혼획 및 좌초 되는 바다거북의 모니터링을 실시하였다. 그 결과 푸른바다거북(C. mydas) 12마리, 붉은바다거북(C. caretta) 3마리, 매부리바다거북(E. imbricata) 1마리, 미확인 종 25마리 등 총 41마리의 바다거북이 2년 동안 제주도 연안 해역에서 관찰되었다. 월별 및 해역별로는 8월에 제주도 북서부 연안의 애월읍 해역에서 혼획 및 좌초 빈도가 높았고 2008년 보다 2009년도에 증가하는 경향을 나타내었다. 특히 제주도 북부 해안에 위치한 애월읍 연안 해역에서 연속적으로 출현 개체 수가 증가하는 것으로 보아 이 지역은 바다거북의 색이장 및 생육장이 되고 있을 것으로 추측된다. 어구별로는 정치망과 자망에서 주로 혼획 되었으며, 수동적 어구 형태인 정치망의 혼획이 높은 것으로 보아 먹이를 쫓아가다가 혼획되는 것으로 판단된다. 이번 연구를 통하여 앞으로도 제주도 연안 해역에 출현하는 바다거북의 개체수는 점차 증가할 것으로 예측되어 체계적인 모니터링 시스템 구축이 필요할 것으로 판단된다.

인공진주 양식에 관한 시험연구 (An Experimental Study on Pearl Oyster (Pinctada fucata) Culture)

  • 조창환;권우섭;김무상;김남길;임동택
    • 한국양식학회지
    • /
    • 제1권1호
    • /
    • pp.85-102
    • /
    • 1988
  • 우리나라 진주양식에서 개발되어야 할 모패의 수급과 월동기술 등에 목적을 두고 1986년 12월부터 1988년 11월까지 시험조사를 하였다. 일본산 진주조개 (2연패)를 시료로 하여, 양성과 시술은 어구 앞바다에서, 월동은 고리와 서귀포 앞바다에서, 유생조사와 채묘시험은 한산만에서 실시하였다. 1. 어구양성장의 최고수온은 8월중 $23.6^{\circ}C$이었고 월동기간중 최하수온은 고리는 $13.2^{\circ}C$, 서귀포는 $14.0^{\circ}C$이었다. 먹이생물은 비교적 많은 편이지만 고리에는 부착생물 이외에도 뻘 등이 많아 전부착물의 $19.5\%$나 되었다 (어구와 서귀포는 각각 $13.2\%$$4.5\%$이었다). 2. 어구에서 성패의 성장은 양호한 편이었고 연령이 적은 조개일수록 성장이 빨랐다. 월동기간중 고리에서는 서귀포에 비해 성장은 약간 좋았으나 사망률은 약 2배나 되어 $20.5\%$이었다. 3. 진주의 생산율은 당년산이 $58.2\%$이었고 월동산은 $48.3\%$로 성적이 좋았다. 진주층의 두께는 당년산이 0.35 mm, 월동산은 0.47 mm이었으며, 핑크색이 가장 많아 $53.7\%$이었지만 가치가 적은 노란색도 $22.8\%$나 되었다. 품질 특급은 약 $10\%$이었다. 4. D형유생의 출현성기가 3차례 있었다. $10\%$정도가 성숙부유유생이 되었고 D형유생이 채묘기에 부착하는데는 약 1개월이 소요되었다. 부착은 1$\~$3 m층에 많았고 2 m층에 가장 많아, 삼나무가지 30 cm당 30$\~$40미이었다. 채묘장인 한산만에는 양성중인 모패가 많았고 수온이 높고 강수양이 적었던게 성공적인 채묘의 원인인 것 같았다.

  • PDF