• Title/Summary/Keyword: 전거어 사전

Search Result 4, Processing Time 0.017 seconds

An Experimental Study on the Automatic Coding System for Statistical Information Classification in Korea (통계정보 분류의 자동코딩 성능 실험 연구)

  • Nam, Young-Jun;Ahn, Dong-Ein
    • Journal of the Korean Society for information Management
    • /
    • v.17 no.4
    • /
    • pp.27-45
    • /
    • 2000
  • National statistical data such as Korean Census is fundamental data for national administration. In this paper, we present an automatic coding system utilizing morphological analyser and knowledge dictionaries. Knowledge bases are constructed based on an authority dictionaries which were developed by authors utilizing a newly learning theory. Test data indicates 99.5% of productivity and 83.3% of accuracy. The presented methods can be effectively applied to analyze statistical information.

  • PDF

A design and implementation of query processor for travel information retrieval system (관광 정보 검색을 위한 자연언어 질의 해석 시스템 구현)

  • Kim, Myong-Cheol;Seo, Kwang-Jun;Jeon, Kyong-Hun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.449-458
    • /
    • 1992
  • 본 논문은 관광정보검색용 한국어 자연언어 질의 해석 시스템의 모델 정립 및 구현에 대한 것이다. 본 자연언어 질의 해석 시스템은 질의로 부터 정보 검색 시스템의 검색어들을 추출한다. 이를 위하여 1만 단어 수준의 중형사전을 구축하였으며, 불용어 사전, 전거어 사전, 유사어 사전, 복합명사 사전을 구축하였다. 사전의 어휘를 추출하기 위해서 한국어 대화체 문장에 대한 자료수집과 분석을 하였으며, 관광 정보 검색 시스템의 텍스트를 분석하였다. 200여 자연언어 질의 문장으로 실험한 결과는 비교적 좋았다.

  • PDF

Analysis of the Candidate Terms and Structure Using the Log-data (로그데이터를 이용한 디스크립터의 외형적 특성 분석)

  • Nam, Young-Joon;Lee, Too-Young
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2004.08a
    • /
    • pp.61-66
    • /
    • 2004
  • 본 연구에서는 시소러스를 구축하기 위해 필요한 디스크립터 수집원으로써 이용자 로그데이터를 분석하여 후보 디스크립터의 외형적 특성을 분석하였다. 분석대상인 이용자 로그데이터는 국내 검색엔진가운데 야후와 라이코스를 대상으로 하였다. 분석결과, 이용자들은 대부분 검색어로써 명사와 복합명사를 사용하였으며, 조사 '의'이외에는 다른 품사로 이루어진 검색어는 거의 존재하지 않음을 알 수 있었다. 또한 검색어로써 이용자들은 고유명사(외국어 포함)를 많이 사용함으로써, 국내외 지침에서 권고하는 고유명사의 최소한 사용지침과 실제 이용자 사이의 이용행태와의 차이를 알 수 있었다. 따라서 국내외 시소러스 개발지침을 수용하면서, 이용자 중심의 시소러스를 개발하기 위해서는 전거어나 유사어 사전을 대등관계와 연동하여 개발하는 것을 고려해야 한다.

  • PDF

A Study on the Korean-Engligh Semantic Thesaurus Construction for Knowledge Management System (지식관리시스템을 위한 의미형 한영 시소러스 구축에 관한 연구)

  • 남영준
    • Journal of Korean Library and Information Science Society
    • /
    • v.32 no.4
    • /
    • pp.77-98
    • /
    • 2001
  • As the role of a library has changed to the integrated management system of knowledge, the library needs new information retrieval tools. The purpose of this study is to propose a method and principle of the Korean-English semantic thesaurus construction for a knowledge management system. The method and principle is as follows; 1) in collecting terminology, I included not only internal documents but external documents on the web as a source for the descriptors extraction. 2) conceptual descriptors are more needed than semantic ones. I also proposed the necessity of the authority files for complement. 3) I proposed the appropriate scale of the descriptors to be 15,000 in a thesaurus. And 4) I proposed a hybrid method that used both a manual and an automatic process in establishing the relationship.

  • PDF