• 제목/요약/키워드: thesaurus

검색결과 316건 처리시간 0.045초

기계 학습을 이용한 한의학 용어 유의어 사전 구축 방안 (A Strategy for Constructing the Thesaurus of Traditional East Asian Medicine (TEAM) Terms With Machine Learning)

  • 오준호
    • 대한한의학원전학회지
    • /
    • 제35권1호
    • /
    • pp.93-102
    • /
    • 2022
  • Objectives : We propose a method for constructing a thesaurus of Traditional East Asian Medicine terminology using machine learning. Methods : We presented a method of combining the 'Automatic Step' which uses machine learning and the 'Manual Step' which is the operator's review process. By applying this method to the sample data, we constructed a simple thesaurus and examined the results. Results : Out of the 17,874 sample data, a thesaurus was constructed targeting 749 terminologies. 200 candidate groups were derived in the automatic step, from which 79 synonym groups were derived in the manual step. Conclusions : The proposed method in this study will likely save resources required in constructing a thesaurus.

대순사상 시소러스의 구축에 관한 연구 (A study on the establishment and development of the Daesoon Thought Thesaurus)

  • 이상복;장인호
    • 대순사상논총
    • /
    • 제19권
    • /
    • pp.21-45
    • /
    • 2005
  • The purpose of this study is to examine the establishment and development of Daesoon Thought Thesaurus. Specifically, this study examined the matters to be considered in the stage of Thesauri planning according to the Thesauri Construction process : presents the methods and standards of Thesauri Construction according to processes such as identification of the indexing policy, establishment of Thesauri system, collection of vocabulary, selection of preferred term, clustering of the terms, establishment of term relationships, overall adjustment, Thesauri test, proofreading by professional display, maintenance and updating. Since religion information is unique or totally different from the information in other areas, it is most important to construct the Thesauri suitable for system after carefully recognizing the concept of religion terms.

  • PDF

A Digital Thesaurus of the Traditional Common Culture of the Greater Mekong Subregion

  • Suwannee Hoaihongthong;Kanyarat Kwiecien
    • Journal of Information Science Theory and Practice
    • /
    • 제12권3호
    • /
    • pp.63-74
    • /
    • 2024
  • This study aimed to develop a digital thesaurus dedicated to cataloging the traditional common culture of the Greater Mekong Subregion. The process followed a meticulous seven-step methodology, including scoping, vocabulary collection, knowledge structure analysis, relationship delineation, related word adjustments, list validation, and evaluation. Leveraging principles from knowledge organization, thesaurus construction, and digital platform development, the TemaTres web application emerged as the primary tool for constructing this thesaurus. The study's results showed that 2,042 principal words related to the traditional common culture of the Greater Mekong Subregion were compiled and classified into terms for each of the seven deep levels. Each term was accompanied by essential metadata, including broader and narrower terms, related terms, cross-references, and scope notes. This rich dataset empowered semantic search capabilities across diverse applications and web services, providing access to knowledge pertaining to the traditional common culture of the Greater Mekong Subregion and contributing to a deeper understanding of this cultural domain.

영.한 대역 시소러스의 문제점에 관한 연구 (The Problem of word-for-word Translating English Thesaurus Terms into Korean)

  • 오재익
    • 정보관리연구
    • /
    • 제28권3호
    • /
    • pp.46-73
    • /
    • 1997
  • 정보검색 시스템의 검색효율성을 높이기 위해 많은 나라에서 시소러스를 구축하여 이용하고 있다. 그러나 시소러스 구축에는 많은 시간과 비용은 물론 전문성이 요구된다. 그러므로 외국의 시소러스를 번역하여 자국어 시소러스를 구축하는 사례를 빈번하게 찾아 볼 수 있다. 이 방법을 채택하는 경우 짧은 시간에 시소러스를 구축할 수 있다는 장점은 있으나 언어적, 문화적 차이 때문에 의미상의 등가성과 의미관계를 나타내는 계층관계와 연관관계가 상호 일치하지 않는 부분이 있을 것으로 여겨진다. 그러므로 본 연구에서는 1977년에 발행된 "Thesaurus of ERIC descriptors(7th ed. 1977)" 제 7판과 이것을 대역하여 한국 교육개발원에서 발행한 "KEDI 교육시소러스(1981)"의 디스크립터들을 비교 연구하여 번역 시소러스의 구축방법에 대한 문제점을 규명하고자 하였다.

  • PDF

컴포넌트 검색을 지원하는 퍼지 기반 시소러스 구축 (Fuzzy based Thesaurus Construction Supporting Component Retrieval)

  • 김귀정;한정수;송영재
    • 정보처리학회논문지D
    • /
    • 제10D권5호
    • /
    • pp.753-762
    • /
    • 2003
  • 컴포넌트 검색을 위한 많은 방법론이 제시되고 있고 그 중 유사 컴포넌트 검색을 위한 시소러스 개념이 도입되고 있다. 본 논문은 컴포넌트의 효율적인 검색을 위하여 컴포넌트를 구성하는 클래스들을 상속관계에 따라 개념적으로 분류하였고, 시소러스 방법에 퍼지 논리를 적용하여 객체지향 시소러스를 구축하였다. 제안한 방법은 개념들 사이의 범주를 자동으로 표현할 수 있으며, 각 클래스와 범주에 대한 매칭도와 비매칭도를 비교함으로서 클래스 사이의 퍼지 정도를 계산하여 시소러스를 구축하였다. 컴포넌트 검색은 컴포넌트를 구성하는 클래스들을 이용하여 유의어 테이블을 기반으로 후보 컴포넌트들을 검색한 후 퍼지 유사도 측정 방법을 이용하여 우선순위로 검색한다. 또한 시뮬레이션을 통하여 최적의 질의 확장 임계치를 설정함으로서 검색 성능을 크게 향상시켰다.

대등관계 설정의 확장 지침에 관한 연구 (A Study on the Extend Guideline for the Equivalence Relationship in Thesaurus)

  • 남영준
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.1-21
    • /
    • 2004
  • 시소러스가 적정한 검색효율을 유지하기 위해서는 등재된 디스크립터에 대한 지속적인 유지관리가 필수적이다. 시소러스의 규모를 적정하게 유지하기 위해서는 신규용어와 기존용어를 우선적으로 대등관계로 처리해야 한다. 따라서 전통적인 동의어 이외에도 여러 관계에 대한 새로운 대등관계선정기준이 요구된다. 본 연구는 기존의 대등관계 설정기준을 좀 더 세분하여 보다 효율적인 시소러스 역할을 수행할 수 있는 방안을 제시하였다. 대등관계로 설정할 수 있는 기준을 전통적인 동의어 관계를 비롯하여, 유사동의어, 전거어, 대립어 등도 대등관계로 설정될 수 있음을 제안하였다. 본 연구에서 제안한 대등관계는 여섯가지 국면(facet)으로 기준을 정하였으며, 이 기준은 검색효율을 위해 용어 관계의 재정립을 위한 지침으로 활용될 수 있다.

대단위 우리말 온톨리지 구축을 위한 시소러스의 개발 (Constructing a Grand-Scale Korean Thesaurus as a Base for Ontology Development)

  • 최석두;이우범;김이겸;최상기;한상길;이정연
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.147-164
    • /
    • 2006
  • 한국어 정보처리를 위하여 전 분야를 포괄하는 대단위 시소러스를 계획하고 이를 개발하고 있다. 이 시소러스는 현재 현장에서 정보의 색인과 검색용으로 사용되고 있으며 새로운 용어가 추가되면서 계속하여 증식하고 있다. 그런데 정보처리에 대한 새로운 요구가 증가함에 따라 대단위 온톨로지의 개발이 필요하게 되었으며, 이에 시소러스를 온톨로지로 변환할 준비를 하고 있다. 본 고에서는 온톨로지를 만들기 위하여 지금까지 구축한 시소러스의 내용에 대하여 논한다.

ISO 25964-2를 기반으로 한 시소러스와 온톨로지 상호운용성 연구 - 행정부처명을 중심으로 - (Thesaurus and Ontology Based on ISO 25964-2: With a Focus on Administrative Departments Names)

  • 이혜원
    • 한국기록관리학회지
    • /
    • 제17권3호
    • /
    • pp.71-96
    • /
    • 2017
  • 2013년에 ISO 25964-2가 소개되었지만 지금까지 이에 대한 심층적인 분석이나 구체적인 활용 방안을 제시한 연구는 아주 미미하다. 본 연구에서는 ISO 25964-2에서 강조하고 있는 시소러스 상호운용성을 분석하고, 그 활용가능성을 살펴보았다. 구체적으로, 본 연구에서는 ISO 25964-2에서 제안한 개념 통합 방식인 매핑 유형을 분석하였다. 또한 ISO 25964-2의 매핑 유형을 확인하기 위해 온톨로지와의 연계 방안을 모색하고, 마지막으로 시소러스와 온톨로지의 상호운용성을 확인하기 위해 우리나라 행정부처의 기관명을 대상으로 한 온톨로지 모형을 시범적으로 설계하고 구축하였다.

지질용어 시소러스 시스템의 설계 및 구축 (Design and Implementation of Thesaurus System for Geological Terms)

  • 황재홍;지광훈;한종규;연영광;류근호
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.23-35
    • /
    • 2007
  • 최근 정보 검색 분야에서 시맨틱 웹 기술에 따른 인터넷 용어사전과 더불어 시소러스의 필요성이 더욱 중요시되고 있다. 시소러스는 분류와 사전의 결합으로 상위 및 하위개념 사이의 전후관계를 명확히 하기 위해서 공식적으로 조직, 통제된 색인어의 어휘로 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계를 표현한 지식구조의 토픽 맵이다. 하지만 시소러스가 용어의 통제 및 표준화와 더불어 정보를 능률적으로 처리하고 검색하는데 필수적인 수단으로 평가되고 있음에도 불구하고 아직까지 지질분야에서 우리말 시소러스가 없는 실정이다. 시소러스를 구축하기 위해서는 표준화되고 잘 정의된 지침이 필요하다. 이러한 표준화된 지침은 보다 효율적인 정보 관리를 가능하게 할 것이며, 정보 이용자 또한 보다 정확한 정보를 쉽고 편리하게 이용할 수 있게 될 것이다. 본 연구는 지질정보 중 가장 기본이 되는 용어 시소러스 시스템 구축 연구이다. 이를 위해서 첫째, 국내외 지질용어 표준화 동향을 살펴보았다. 둘째, 15개 분야에 대한 지질학적 주제를 정하고 각 주제에 대한 분류체계(안)를 마련하였다. 셋째, 지질용어 시소러스 분류체계를 바탕으로 지질용어 시소러스 명세서를 작성하였다. 마지막으로 이 명세서를 이용하여 인터넷기반 지질용어 시소러스 시스템을 설계하고 구축하였다.

  • PDF

한국 근대 여성 구술 기록물을 통한 시소러스 개발에 관한 연구 (A Study on Thesaurus Development Based on Women's Oral History Records in Modern Korea)

  • 최윤경;정연경
    • 한국기록관리학회지
    • /
    • 제14권1호
    • /
    • pp.7-24
    • /
    • 2014
  • 본 연구의 목적은 한국 근대 여성 구술기록물의 효율적인 주제 접근을 위한 시소러스를 개발하는 것이다. 이를 위해 문헌 연구와 국내외 시소러스 사례 분석을 수행하였고, 구술기록물에 입력된 색인어를 중심으로 시소러스를 구축하였다. 구축 과정은 총 5단계로 1단계는 한국 근대를 산 53명의 여성 구술자의 구술기록물에 입력된 한글 색인어 총 1,784개 추출하여 용어의 특성을 분석하였다. 2단계에서는 수차례에 걸쳐 해당 분야 전문가 회의를 거쳐 시소러스 대상 용어를 선정하였고, 3단계에서는 용어에 대한 등위 계층 연관 관계를 설정하였다. 4단계에서는 웹기반 시소러스 관리시스템을 개발한 후, 용어 및 관계 정보를 입력하였고, 5단계에서는 입력된 용어의 정보와 관계를 전문가 집단이 재검토하였다. 구축된 시소러스는 일반 주제어를 비롯한 지명, 장소명, 인명, 단체명 등 고유명사가 포함된 39개 대주제 영역의 1,076개의 용어로 구성되었으며 추후 추가적인 구술기록물을 바탕으로 확장될 것이다.