• Title/Summary/Keyword: 시소

Search Result 285, Processing Time 0.022 seconds

Identification of Is-a Relation in Ontology based on Thesaurus (시소러스를 이용한 온톨로지의 Is-a 관계 설정)

  • Huang, Jin-Xia;Lee, Sheen-Mok;Nam, Yun-Yeong;Shin, Ji-Ae;Choi, Key-Sun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.20-23
    • /
    • 2006
  • 시소러스의 개념과 개념간 계층관계가 온톨로지 구축에 흔히 이용되고 있다. 다만 시소러스 계층관계는 is-a관계 뿐만 아니라 세분화되지 않은 관계도 포함되고 있기 때문에, 온톨로지의 기본 관계인 is-a관계를 분별하는 작업이 필요하다. 본 논문은 개념의 어휘표현 정보를 이용하여 온톨로지의 is-a관계를 설정하는 규칙을 제시하였고, 개념의 정의문 정보를 이용하여 is-a관계를 검수하는 방법을 제안하였다. IT분야 시소러스에 대한 is-a관계 설정 실험결과, 어휘표현 정보를 이용한 규칙 기반 is-a관계 설정은 85.83%의 정확도를 보였고, 정의문 정보를 이용한 is-a관계 판단의 일관성 평가 결과 일치도가 86.44%였다.

  • PDF

An Overview of Thesaurus "TEST" (TEST 시소러스의 내용분석(內容分析))

  • Chun, Hak-Byoung
    • Journal of Information Management
    • /
    • v.23 no.1
    • /
    • pp.63-76
    • /
    • 1992
  • This is an overview of the TEST which effects on the development of thesaurus. Such term relations, display methods, classification schemes for the conventions of the thesaurus development are explained. This conventions of the TEST also effected on the ANSI guideline as well as UNESCO guideline for the thesaurus development. This explains on the development of microthesaurus through its application of TEST.

  • PDF

A Concept Acquisition Tool for Thesaurus Construction (시소러스 작성을 위한 개념 획득 도구)

  • Kim, Myoung-Cheol;Lee, Woon-Jae;Choi, Key-Sun;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.39-49
    • /
    • 1992
  • 시소러스를 작성하기 위해 시소러스 작성자가 고려래야 하는 문제는 단어간의 개념 관계이다. 단어간의 관개는 계층구조에 정의된 개념을 기반으로 분석하여 하향식으로 시소러스를 작성하는 것이 일반적이다. 이러한 방식은 작성자에 의존적이므로 시소러스의 정확도를 보장할 수 없고 주관적인 성향을 가진다. 그래서 Corpus에서 자동으로 개념 및 개념 관계를 추출하는 상향식 방법들이 다양하게 시도되고 있다. 본 논문에서는 시소러스 작성을 위한 자동 개념 획득 도구를 설계, 구현하였다. Mutual Information이라는 방법을 이용하여 공기 정보(Collocation)를 정량화하고 이를 통하여 단어간의 개념관계의 크기를 측정한 후 개념 관계의 크기(MI 값)가 큰 값을 선택하여 개념 화일을 작성한다. 실험 결과로 얻은 개념 화일은 두 개념간의 밀접도를 나타내므로 시소러스 작성에 매우 유용하다.

  • PDF

Category Comparison between Thousand-Character Text and Roget's Thesaurus (천자문과 로제 시소러스 범주체계 비교)

  • Kim, Sang-Rak;Yang, Jae-Gyun;Bae, Jae-Hak J.
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.85-89
    • /
    • 2008
  • 본 논문에서는 천자문과 로제 시소러스의 어휘 분류체계를 분석하였다. 전처리 작업으로서 천자문과 로제 시소러스를 데이터베이스화 하였다. 그리고 분석 작업의 용이성과 연구의 효율성을 높이기 위해서 천자문 대응 로제 시소러스 검색 시스템을 개발하였다. 연구결과 로제 시소러스 총 39개 과(Section) 가운데에서 'Creative Thought' 과를 제외하고 대부분의 과가 천자문 한자와 관련성을 가지는 것으로 나타났다. 'Space in General', 'Dimensions', 'Matter in General' 3개의 과가 가장 높은 대응률을 보였다. 상관계수값도 약 0.94로 나타나 천자문 한자와 로제 시소러스의 범주 관련성이 아주 높다는 사실을 발견하였다.

  • PDF

Personalized I-Mail Classification System Using Dynamic Thesaurus and Genetic Algorithm (동적 시소러스와 GA을 이용한 개별화된 E-Mail1 분류시스템 (PECS))

  • 안희국;노희영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.472-474
    • /
    • 2002
  • 본 논문에서는 전자메일을 사용자 적합도(선호도)를 기준으로 분류하기 위한 구조를 제안한다. 분류는 1차 분류와 2차 분류로 나눠지는데, 1차 분류에서는 사용자 적합도를 판단하기 위해 사용자 관련 정보로부터 동적 시소러스를 구축하고, 구축된 시소러스와의 비교를 통해 사용자에게 유용한 메일인지 아닌지를 결정하고, 2차 분류에서는 사용자가 지정한 폴더키워드를 중심으로 사용자 시소러스로부터 유전자 알고리즘을 이용해 추출한 키워드들과의 적합도 비교를 통해서 특정 폴더로의 분류가 이뤄지게 된다 테스트에는 메일 정보값(Mail Information Word)을 추출하기 위해 HAM(Hangup Analysys Module)을 포함하는 메일정보추줄 에이전트를 사용하였고, mail의 subject와 본문(body)로부터 추출된 16개의 word정보와 시소러스 적합도 정보, 분류 적합도 정보를 하나의 데이터구조로 사용하였다. 이러한 통할된 시스템 구조와 data structure를 이용해 mail을 사용자의 선호도에 따라. 1차와 2차에 걸친 분류시 분류가 사용자 선호도에 근접하게 이루어 질 수 있음을 확인하였다.

  • PDF

Efficient and Effective Query Evaluation Method based on Thesaurus in Information Retrieval (정보검색에서 시소러스를 이용한 효율적이고 효과적인 질의 평가 방법)

  • 최명복;김민구
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.10 no.6
    • /
    • pp.605-615
    • /
    • 2000
  • 본 논문에서는 정보검색에서 시소러스를 이용한 효율적이고 효과적인 질의 평가 기법을 제안한다. 제안된 방법에서 시소러스 내부 용어들 간의 관계와 관련도가 용어 매트릭스로 표현되며, 용어들 간의 관계는 동의, 계층, 그리고 연관관계의 세 가지 관계가 제공된다. 시소러스 내부 용어들 간의 무시된 관련도가 퍼지 이론에 근거한 용어 매트릭스의 전이폐쇄 알고리즘에 의해 추론된다. 따라서 다양한 관계에 따른 시소러스에 표현된 지식을 이용할 수 있다. 또한 질의 평가시 용어 매트릭스를 이용하기 때문에 논문[3-7]에서 사용되는 방법보다 시간적으로 효율적이다. 그리고 정의된 용어 매트릭스는 논문[8]에서 발생되는 문제점을 제거하여 검색 효과를 높이기 위해 논문[6]에서 제안된 질의 평가함수와 용이하게 통합시킨다.

  • PDF

The type of associative relationships of Thesaurus described in literature of science and technology (과학기술 문헌에 나타난 시소러스의 연관관계 유형에 관한 연구)

  • Song, Yoo-Hwa;Choe, Ho-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.117-122
    • /
    • 2011
  • 시소러스의 연관관계는 유형의 세분화에 관한 원칙과 방법론의 부재로 시소러스를 구축하는 기관에서 개별적인 분류를 사용하고 있다. 분류에 적용되는 패싯지시어 모형에 관한 연구는 계속 되고 있지만 그 타당성을 뒷받침 할 실증적 사례연구는 찾아볼 수 없다. 본 연구에서는 Inspec에서 구축한 시소러스 중에 일정 기준으로 선정한 우선어와 관련어를 대상으로 IEL에서 제공하는 문헌에서 두 용어가 동시에 출현하는 문장을 찾아 그 연관관계 모형을 제안한다.

  • PDF

Improving Patent Information Service System using Vector Space Model and Thesaurus (벡터스페이스모델과 시소러스를 이용한 특허검색시스템의 성능향상)

  • 임성신;정홍석;한기덕;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.802-804
    • /
    • 2004
  • 지적재산권이 산업의 핵심으로 자리잡음으로써 특허의 중요성이 날로 증가하고 있다. 현재 특허문서 검색을 서비스하고 있는 상용시스템의 경우 문서간의 유사도나, 질의어에 따른 순위(Ranking)가 매겨지지 않는 불리언 모델이 검색에 사용되고 있다. 본 논문에서는 유사도에 기반 한 순위화가 가능한 벡터모델기반의 특허검색시스템을 개발하고 시계분야의 시소러스를 구축하여 시계분야의 특허검색 시스템에 적용하였다. 쿼리확장의 성능을 평가하기 위해 10개의 쿼리로 실험하였고 평균 36.2%의 정확도가 향상되었다. 그리고 검색결과의 오른쪽에 시소러스를 제시함으로써 특허검색시스템을 이용하는 사용자에게 추가 질의어를 쉴게 선택할 수 있도록 하여 인터페이스 부분의 향상을 추구하였다.

  • PDF

An Algorithm of Documents Classification and Query Extension using Fuzzy Function (퍼지 함수에 의한 질의어 확장과 문서 분류 알고리즘)

  • Eun, Hye-Ju;Ha, Yan;Kim, Yong-Sung
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.3
    • /
    • pp.272-284
    • /
    • 2001
  • 웹 기반 검색 시스템에서사용자의 관심이 많은 문서를 선별하여 제공하기 위해 프로파일이나 시소러스에 관한 연구가 이루어지고 있다. 그러나, 프로파일이나 시소러스를 구축하고 유지보수 하는데 많은 시간과 노력이 필요하다. 특히 구축된 시소러스에 대해 구조화 및 적합성의 문제가 있다. 따라서, 이러한 문제점을 극복하고자 본 논문에서는 문서에서 추출한 용어 빈도를 문서에서 용어의 중요 정도로 사상시키기 위해 시그모이드 멤버 쉽 함수를 적용한다. 또한, 이 중요 정도에 따라 질의어를 확장하고 의미적으로 연결된 문서를 동일한 문서 집단으로 분류할 수 있는 알고리즘을 제안하여 사용자의 선호도가 반영된 문서를 선별하고 제공하고자 한다.

  • PDF

Design and Implementation of an Object-Based Thesaurus System: Semi-automated Construction, Abstracted Concept Browsing and Query-Based Reference (객체기반 시소러스 시스템의 설계 및 구현: 반자동화 방식의 구축, 추상화 방식의 개념 브라우징 및 질의기반 참조)

  • Choi, Jae-Hun;Kim, Ki-Heon;Yang, Jae-Dong
    • Journal of KIISE:Databases
    • /
    • v.27 no.1
    • /
    • pp.64-78
    • /
    • 2000
  • In this paper, we design and implement a system for managing domain specific thesauri, where object-oriented paradigm is applied to thesaurus construction, concept browsing and query-based reference. This system provides an objected-oriented mechanism to assist domain experts in constructing thesauri; it determines a considerable part of relationship degrees between terms by inheritance and supplies domain experts with information available from a thesaurus being constructed This information is especially useful to enforce consistency between the hierarchies of a thesaurus, each constructed by different experts in different sites through cooperation. It may minimize the burden of domain eIn this paper, we design and implement a system for managing domain specific thesauri, where object oriented paradigm is applied to thesaurus construction, concept browsing and query based reference. This system provides an objected mechanism to assist domain experts in constructing thesauri: it determines a considerable part of relationship degrees between terms by inheritance and supplies domain experts with information available from a thesaurus being constructed. This information is especially useful to enforce consistency between the hierarchies of a thesaurus, each constructed by different experts in different sites through cooperation. It may minimize the burden of domain experts caused from the exhaustive specification of individual relationship. This system also provides an abstracted browsing and a query based reference, which allow users to easily verify thesaurus terms before they are used in usual boolean queries. The verification is made by actively searching for them in the thesaurus. Reference queries and abstracted browsing views facilitate this searching. The facility is indispensable especially when precision counts for much.

  • PDF