• 제목/요약/키워드: Korean thesaurus

검색결과 224건 처리시간 0.026초

정보검색에서 퍼지 언어 매트릭스에 근거한 효율적인 퍼지 질의 평가 방법 (Effectual Fuzzy Query Evaluation Method based on Fuzzy Linguistic Matrix in Information Retrieval)

  • 최명복;김민구
    • 한국지능시스템학회논문지
    • /
    • 제10권3호
    • /
    • pp.218-227
    • /
    • 2000
  • 본 논문에서는 시소러스에 근거한 새로운 퍼지 정보검색 기법을 제안한다. 제안된 방법에서 시소러스는 내부 용어들 간의 관련도를 정성적인 언어 갑으로 갖는 퍼지 언어 매트릭스로 표현되며 용어들간의 관계는 동의, 계층, 그릭 연관이 세 가지 관계가 제공된다 싯러스 내부 용어들 간이 무시된 관련도가 퍼기 이론에 근거한 퍼지이론에 근거한 퍼지 언어 매트릭스의 전이 폐쇄 알고리즘에 의해 추론된다 또한 제안돈 방법은 사용자의 질의, 그리고 문서와 같은 정보 항목의 표현에도 인간이 주관적이고 부정확한 측도를 그대로 반영하는 정성적인 언어 값을 허용한다. 따라서 논문 [1-3]에서 제안된 방법보다 좀 더 유용하다. 또한 질의 평가시 퍼지 언어 매트릭스와 AON(Associated Ordinary Number)값을 이용하기 때문에 논문 [1-3]에서 사용되는 방법보다 시간적으로 효츌적이다. 결과적으로 사용자가 좀 더 유용하고 지능적인 방법으로 질의를 처리할 수있도록 한다

  • PDF

논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법 (A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results)

  • 배경만;황재원;고영중;김종훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.214-221
    • /
    • 2010
  • 검색 결과 내 군집화(search-result clustering)는 검색 엔진으로부터 검색된 결과 내에서 비슷한 문서를 자동으로 군집화하는 기법이다. 본 논문에서는 논문 검색 서비스에 전문화된 새로운 결과 내 군집화 기법을 제안한다. 제안하는 시스템은 '범주체계생성기(Category Hierarchy Generation System)'와 '논문군집기(Paper Clustering System)'로 구성되어있다. '범주체계생생기'는 KOSEF의 연구 범주 체계를 이용하여 분야 시소러스라 불리는 범주 체계를 생성하고, K-means 알고리즘을 이용한 단어 군집화 알고리즘을 사용하여 분야 시소러스의 키워드 집합을 확장한다. '논문군집기'는 top-down 방식과 bottom-up 방식을 이용하여 각 논문의 범주를 결정한다. 제안하는 시스템은 논문 검색 서비스와 같은 전문 분야에 대한 검색 서비스에 유용하게 사용될 수 있을 것이다.

워드넷 기반 한국어 명사 어휘의미망의 정제 (Refinement of KorLex based on WordNet)

  • 황순희;윤애선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.267-272
    • /
    • 2005
  • 최근 들어 온톨로지(ontology), 시소러스(thesaurus) 등과 함께 주목받고 있는 Princeton 대학의 워드넷(WordNet, 이하 PWN) 은 자연어 처리(NLP)와 관련하여 대안을 제시할 수 있는 어휘의미망(lexico-semantic network)이다. 또한 PWN을 기반으로 상이한 개별어 어휘의미망 구축이 여러 차례 시도되었고, 현재도 진행 중이다. 본 연구는 간접 구축 방식에 의한 어휘의미망 구축 시 요구되는 정제(refinement) 방식들을 검토하고, 이를 한국어 명사 어휘의미망(KL)에 적용하여 정확도 검증 방법의 한 대안으로 제시하였다. 또한 보다 정교한 정제 방법의 모색과 고찰은 향후 과제로 삼고자 한다.

  • PDF

OPAC의 발전과정과 주제접근방법론 (Development of OPAC and theories on online subject access)

  • 최달현
    • 한국도서관정보학회지
    • /
    • 제20권
    • /
    • pp.155-186
    • /
    • 1993
  • This study aims at defining the concept of OPAC, tracing of research trends and development of it, and clarifying various methods of subject access and patterns of bibliographic searching in OPAC as well as strategies for improving to implement online catalogs. Although OPAC is so far the most user-friendly bibliographic searching method, there are still a lot of issues including online subject access in particular. Therefore a more effective and useful method for computer end-users have to be developed, for instance, improvement of an indexing system, a n.0, pplication of the classification system as a searching tool, a new design and construction of standardized thesaurus, betterment of user interface, introducing of expert system into bibliographic searching, establishment of subject authority file. Those would raise the success-rate of users seeking bibliographic information in the library catalogs. Korean libraries are in very early stage of OPAC implementation so that every efforts and concerns to improve strategies and techniques for subject access to OPAC have been strongly asked.

  • PDF

과학기술 분야 시소러스 상에서의 패싯들 (Facets on Thesaurus for Science and Technology Domain)

  • 정한민;성원경;박동인;황순희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.535-537
    • /
    • 2005
  • 본 논문에서는 시소러스 상에서 개념간 세분화를 위한 의미적 기준인 개념 패싯 (Conceptual Facet)과 관계 패싯 (Relational Facet) 그룹을 사용하는데, 패싯이란 공통의 특성을 갖는 개념들을 함께 그룹화하고 용어간 관계를 구조화하기 위한 장치이다. 개념 패싯은 용어가 갖는 대표적인 의미속성, 범주를 의미하며, 용어 각각을 구별되는 의미장 (Semantic Field)에 분류하도록 한다. 관계 패싯은 상$\cdot$하위 개념 간 의미 관계를 표현한 메타 개념이다. 본 시소러스는 여러 전문가들의 다양한 관점을 반영하도록 설계되었다. 관점이란 주관적이며, 임의적이어서 개별 개념에 내재된 자질 또는 속성과는 구별되는 독립적 속성이다. 개념 패싯, 관계 패싯의 도입은 계층 관계, 동등 관계, 범주 관계 등과 더불어 용어 간 관계를 보다 구체적으로 명시함으로써 최종 사용자에게 검색의 효율성과 정확성을 제공할 수 있다.

  • PDF

한.중 교차언어 검색에서 시소러스를 이용한 질의 확장 (Query Expansion Using Thesaurus for Korean to Chinese Cross- Language Text Retrieval)

  • 김풍;강인수;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.538-540
    • /
    • 2003
  • 본 논문은 한.중 교차언어 검색을 위한 효과적인 질의 확장에 대해 기술하고 있다. 한.중 교차언어 검색은 한국어 질의로 중국어 문서를 검색하는 것이고 본 논문에서는 대역어 사전을 이용하여 한국어 질의를 중국어 질의로 변환하는 방식을 사용한다. 질의 확장을 위한 방법으로 중국어 시소러스인“동의사사림”을 사용하였다. 그리고 동의어들과 주변 단어간의 상호 정보를 비교함으로서 재현률과 정확률을 높였다. 실험을 통하여 검증한 결과 사전만 사용하여 변환하는 방법에 비하여 검색 성능이 향상되었다.

  • PDF

시소러스 자동생성에 관한 실험적 연구 -법학 분야를 중심으로- (A Study on Automatic Construction of Thesaurus in the field of Law)

  • 남영준;최석두;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.25-30
    • /
    • 1997
  • 정보의 양이 많아질수록 색인과 검색의 중요성도 증가한다. 특히, 시소러스는 법학 분야와 같이 세부주제간 구분이 가능하고 복합적인 분야의 검색에는 매우 중요한 검색도구로 사용될 수 있다. 한편, 시소러스를 개발하는 가장 합리적인 방법으로는 기존에 개발된 시소러스의 수정 및 보완이라 할 수 있다. 즉, 기존에 구축된 시소러스를 대상으로 문헌정보학전문가와 법학 전문가가 함께 연구하는 것이 가장 바람직한 시소러스 구축방법이 될 것이다. 본 연구에서는 완전한 시소러스를 자동생성하기보다는 언어분석 도구를 이용하여 반제품형태의 시소러스를 제공하므로서, 기존에 개발된 법학분야의 시소러스가 있는 것과 같은 효과를 얻을 수 있는 반제품 시소러스의 개발방법을 제시한다.

  • PDF

An Operator Assisted Call Routing System

  • Lee, Chun-Jen;Jason S. Chang
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.271-280
    • /
    • 2002
  • A system to assist call routing task for telephone operators at the Directorate General of Telecommunications (DGT) in Taiwan is reported in this paper. The system was developed based on DGT organization profile with description of its six divisions instead of a corpus of recorded and transcribed call-routing dialogs. An acoustic module and an information retrieval module were built specifically for this task. The construction of IR module was based on term extraction and thesaurus discovery processes. By integrating acoustic and IR module, the system achieves satisfactory performance and provides a promising approach to call routing. Simulation results indicated that the proposed algorithm outperforms standard classification methods. A working system based on the proposed approach has been implemented and experimental results are presented.

  • PDF

객체 지향 개념을 이용한 시소러스 구축기 및 시각화 브라우져의 구현 (Implementation of Thesaurus Constructor and Visual Browser Based on Object-Oriented Paradigm)

  • 김기현;최재훈;한종진;양재동;금창섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.336-338
    • /
    • 1998
  • 시소러스는 구축 방법에 따라 매뉴얼 시소러스와 통계적 시소러스로 구분된다. 매뉴얼 시소러스는 정확한 의미 표현이 가능하지만 구축과정에 많은 비용이 소요되며, 통계적 시소러스는 자동으로 구축될 수는 있지만 개념간 의미 표현력이 부족하여 만족할 만한 검색 성능 향상을 기대할 수 없다. 따라서, 본 논문에서는 메뉴얼 시소러스에 객체 지향 개념을 적용하여 구축 비용을 감소시킬 수 있는 시소러스 구축기와 데이터 추상화 기법을 이용하여 선별적으로 개념들 간의 관계를 쉽게 참조할 수 있는 시소러스 시각화 브라우져를 구현하였다. 이 시스템은 시소러스 구축 과정에서 한 사람 이상의 전문가에게 일관된 관점을 제공하며 사용자에게는 높은 정확률의 검색 질의를 구성할 수 있도록 지원한다.

국내 인물데이터베이스의 구축과 서비스에 관한 비교 분석 (A Comparative Study about Construction and the Service of the Domestic Biographical Database)

  • 한상길
    • 한국도서관정보학회지
    • /
    • 제39권4호
    • /
    • pp.331-352
    • /
    • 2008
  • 인물데이터베이스는 우리나라에서 제작되어 서비스 되고 있는 데이터베이스 중 유료화가 가장 먼저 이루어졌고, 현재 활발히 서비스 되고 있는 데이터베이스이다. 본 연구에서는 국내 인물데이터베이스의 구축 및 서비스 현황을 살펴보고, 인물데이터베이스 구축과정에 대한 문제점과 검색항목 및 검색 방법을 비교분석한다. 이를 토대로 인물데이터베이스의 문제점을 분석하고, 이를 해결할 수 있는 방안을 제시한다. 그 대표적인 방안 중의 하나가 인물데이터베이스 구축에서 시소러스를 이용한 용어관계와 인물 속성데이터를 이용하는 것이다.

  • PDF