• Title/Summary/Keyword: 어구 색인

Search Result 7, Processing Time 0.024 seconds

Natural language based Information Retrieval System considering the focus of the question (의문의 초점을 고려한 자연어 기반의 정보검색 시스템)

  • Park, Hong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF

Improvement of phrase-based indexing performance using phrase segmentation (구 분할을 이용한 명사구기반 색인의 성능향상)

  • Lee, Chung-Hee;Kim, Hyun-Jin;Jang, Myung-Gil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.585-588
    • /
    • 2002
  • 정보검색의 정확률을 높이는 것이 최근 정보검색 연구의 추세이며, 정확률을 높일 수 있는 방법 중 하나로 명사구단위 색인이 있다. 명사구 색인을 하는 방법에는 구문분석기를 이용하는 방법과 패턴 규칙을 이용하는 방법으로 나눌 수 있다. 구문분석기를 이용하여 전체 문장을 분석한 후 명사구단위 색인을 할 경우, 범용적으로 이용할 수 있지만 속도와 정확도가 떨어진다는 문제점이 있으며 패턴 규칙을 이용하는 경우는 속도는 빠르지만 정확도 및 확장성에 문제를 가지고 있다. 이런 문제들을 해결하기 위해 본 논문에서는 문장으로부터 명사구를 분할한 후, 분할된 명사구를 완전 구문 분석하여 색인하는 방법을 제안한다. 명사구는 속격어구와 관형형 명사구를 대상으로 하였고, 구 분할은 속격조사와 관형형어미를 중심으로 주변 형태소와 품사를 고려하는 규칙을 만들어 실행하였다. 실험대상은 짧은 문장, 중간문장, 긴 문장을 각각 25 개를 선정하여 실험하였고, 구 분할을 이용할 경우 평균 재현율은 86%, 평균 정확률은 74% 정도의 성능을 보였다. 긴 문장의 경우, 구 분할을 이용하지 않는 경우에 비해서 정확도 및 속도에서 월등한 성능향상이 있었다.

  • PDF

A Comparative Analysis of Content-based Music Retrieval Systems (내용기반 음악검색 시스템의 비교 분석)

  • Ro, Jung-Soon
    • Journal of the Korean Society for information Management
    • /
    • v.30 no.3
    • /
    • pp.23-48
    • /
    • 2013
  • This study compared and analyzed 15 CBMR (Content-based Music Retrieval) systems accessible on the web in terms of DB size and type, query type, access point, input and output type, and search functions, with reviewing features of music information and techniques used for transforming or transcribing of music sources, extracting and segmenting melodies, extracting and indexing features of music, and matching algorithms for CBMR systems. Application of text information retrieval techniques such as inverted indexing, N-gram indexing, Boolean search, truncation, keyword and phrase search, normalization, filtering, browsing, exact matching, similarity measure using edit distance, sorting, etc. to enhancing the CBMR; effort for increasing DB size and usability; and problems in extracting melodies, deleting stop notes in queries, and using solfege as pitch information were found as the results of analysis.

A Collocational Analysis of Korean High School English Textbooks and Suggestions for Collocation Instruction

  • Kim, Nahk-Bohk
    • English Language & Literature Teaching
    • /
    • v.10 no.3
    • /
    • pp.41-66
    • /
    • 2004
  • Under the textbook-driven approach to English education in the Korean selling, the importance of the English textbook can not be overemphasized as the main source of learning materials. Recently, with the development of computer-based language corpora, the recognition of the importance of collocations and the availability of computerized databases of words have caused a resurgence and facilitation in the instruction of collocation. The primary purpose of the present study is to identify the characteristics of lexical collocation and the extent of its use in high school 10th-grade textbooks. From all the analyses, it is revealed that the language materials reflect various constructed collocation in the case of adjective+noun and noun+noun collocations in a natural context. However, verb+noun and adverb+verb collocations are not fully reflected. This is true for delexicalized verbs, and verb and adjective intensifiers. Also the language materials do not provide sufficient support for the lexical syllabus, even though all textbooks may be somewhat adequate in terms of vocabulary size. Finally, based on the analyses of the texts, the suggestions for English collocation instruction are made in the lexical approach.

  • PDF

Learning-based Automatic Keyphrase Indexing from Korean Scientific LIS Articles (자동색인을 위한 학습기반 주요 단어(핵심어) 추출에 관한 연구)

  • Kim, Hea-Jin;Jeoung, Yoo-Kyung
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2017.08a
    • /
    • pp.15-18
    • /
    • 2017
  • 학술 데이터베이스를 통해 방대한 양의 텍스트 데이터에 대한 접근이 가능해지면서, 많은 데이터로부터 중요한 정보를 자동으로 추출하는 것에 대한 필요성 또한 증가하였다. 특히, 텍스트 데이터로부터 중요한 단어나 단어구를 선별하여 자동으로 추출하는 기법은 자료의 효과적인 관리와 정보검색 등 다양한 응용분야에 적용될 수 있는 핵심적인 기술임에도, 한글 텍스트를 대상으로 한 연구는 많이 이루어지지 않고 있다. 기존의 한글 텍스트를 대상으로 한 핵심어 또는 핵심어구 추출 연구들은 단어의 빈도나 동시출현 빈도, 이를 변형한 단어 가중치 등에 근거하여 핵심어(구)를 식별하는 수준에 그쳐있다. 이에 본 연구는 한글 학술논문의 초록으로부터 추출한 다양한 자질 요소들을 학습하여 핵심어(구)를 추출하는 모델을 제안하였고 그 성능을 평가하였다.

  • PDF

Observation and Record of Sea Turtles in Bycatch and Stranding from Jeju Island of Korea (우리나라 제주도에서 관찰된 바다거북의 좌초와 혼획)

  • Jung, Min-Min;Moon, Dae-Yeon;Kim, Seong-Ho;Kim, Heung-Soo;Kim, Jae-Woo
    • Journal of Fisheries and Marine Sciences Education
    • /
    • v.24 no.5
    • /
    • pp.662-669
    • /
    • 2012
  • Bycatch and stranding of sea turtles from Jeju coastal water of Korea were monitered from 2008 to 2009. A total of 41 sea turtles, consisting of 12 greens (Chelonia mydas), 3 loggerheads (Caretta caretta), 1 hawksbill (Eretmochelys imbricata) and 25 unidentified species, were recorded and observed in those area. Reported stranding and bycatch reached to a peak in August. The largest number of bycatch occurred in the coastal waters around Aewol-eup located in northwest area of Jeju Island. Most of the bycatch were taken by set nets and gill nets, which prevailed over the fishing grounds in the coastal waters of the Jeju Island. It is suggested that an appropriate monitoring system be necessary to conserve endangered sea turtle species in Jeju of Korea.

An Experimental Study on Pearl Oyster (Pinctada fucata) Culture (인공진주 양식에 관한 시험연구)

  • CHO Chang-Hwan;KWON Woo-Seop;KIM Moo-Sang;KIM Nam-Gil;LIM Dong-Taik
    • Journal of Aquaculture
    • /
    • v.1 no.1
    • /
    • pp.85-102
    • /
    • 1988
  • An experimental study on seedling production and wintering to develop pearl oyster, Pinctada fucata culture in Korea was carried out. from December 1986 to November 1988 in waters of Kori and of Seogwipo as wintering and of Eogu as culturing grounds. All pearl oysters as the sample were imported from Japan. The highest water temperature at Eogu was $23.6^{\circ}C$ in August and the lowest at Kori and Seogwipo were $13.2^{\circ}C$ and $14.0^{\circ}C$c in February, respectively, Phytoplankton was relatively plentiful but mortality of pearl oysters was $20.5\%$, which was twice at Seogwipo, due to high amount of suspended muds. It shows that Seogwipo is better wintering ground even though the amount of phytoplankton is lower than Kori. Average rates of pearl production after 6-months and 15-months period were $58.2\%$ and $48.3\%$ respecitively. Thickness of pearl layer and coating rate were also satisfactory. More than half of the pearls produced was so-called the pink-pearl, the best colour. About $10\%$ of them was the best quality. There were three peaks of D-shape larvae from July to September and it took about one month for D-shape larvae to become seed-shells. Settling was satisfactory and most of them settled at 1$\~$3 m layer and the best was 2 m-layer. Success of settling was supposed due to high water temperature and low precipitation than the normal year.

  • PDF