• 제목/요약/키워드: thesaurus

검색결과 315건 처리시간 0.026초

디스크립터의 의미기술로서 정의를 통한 애매성 제거 (The Ambiguity Exclusion Using Definitions as Meaning Description of Descriptors)

  • 김지훈
    • 정보관리연구
    • /
    • 제36권3호
    • /
    • pp.97-126
    • /
    • 2005
  • 지금까지 대부분의 시소러스에서 용어의 의미는 주로 관계나 범위주기를 통해 간접적으로 제시되어 왔다. 그러나 시소러스가 양적으로 팽창해짐에 따라, 이들을 통해 용어의 의미를 명확히 파악하는 것이 점차 어렵게 되었다. 이에 일부 시소러스는 사전의 정의를 함께 수록하기도 하였지만, 그 내용이나 형식이 만족스럽지 않은 것으로 인식되어 왔다. 이 연구는 용어의 의미를 제공하는 정의의 필요성을 토대로 표준화된 정의를 시소러스에 통합해 봄으로써, 시소러스가 더욱 발전할 수 있는 가능성을 제시하였다.

신문 시소러스 개발의 이론과 실제 (Newspaper Thesaurus Construction in Theory and Practice)

  • 정영미
    • 한국문헌정보학회지
    • /
    • 제25권
    • /
    • pp.51-82
    • /
    • 1993
  • Effective indexing systems are required to enhance the performance of full-text retrieval systems. The result of the analysis of index terms selected by human indexers without a newspaper thesaurus indicates that controlled indexing language is necessary for effective and consistent indexing of newspaper articles. In this paper, basic principles are established for keyword selection from Korean newspapers and significant problems identified in the process of developing a newspaper thesaurus are discussed in depth.

  • PDF

시소러스를 이용한 신문기사 데이타베이스 색인시스템에 관한 연구 (A study of indexing system based on thesaurus for newspaper database)

  • 한상길
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.125-144
    • /
    • 1994
  • 신문기사 색인을 위한 시소러스에 대한 논의는 오래전부터 있어 왔다. 특히 CTS에 의한 신문제작 전산화 이후 대부분의 신문사가 신문기사 DB구축과 자동색인에 많은 관심을 기울이고 있으나 아직 국내에서는 이렇다할 성과가 없었다. 본 논문은 중앙일보사가 국내 최초로 구축한 JOINS시소러스에 대해서 살펴보고 시소러스를 이용한 신문기사 데이타베이스 온라인 자동색인 및 후통제 수작업색인의 효율성을 비교하고 바람직한 색인방안을 모색해 본다.

  • PDF

파일명의 의미 클러스터링에 의한 윈도우 시소러스 WTPM 설계와 구현 (Design and Implementation of The Windows Thesaurus WTPM using Filename of Semantics Clustering)

  • 김만필;차홍준
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권1호
    • /
    • pp.73-79
    • /
    • 2009
  • 객체지향 프로그래밍 언어를 기반으로 윈도우 사용자의 컴퓨터 파일시스템에 기록된 파일의 의미를 분석한 후, 이를 사용자 편의를 위해 파일명의 의미를 시소러스로 클러스터링 하는 설계를 하고, 파일로 기록된 문자의 의미와 파일확장자를 기반으로, 데이터베이스를 구성하고 참조하여 사용자 작성 파일들을 시소러스의 의미 체계와 통제어로 클러스터링 하여, 윈도우시스템의 화면표시 되는 Icon 파일들을 자동으로 분리하고, 설정하여, Mashup 시각구조로 나타내어 주는 프로세스(WTPM)를 설계하고 구현을 하였다.

  • PDF

객체지향 기법을 이용한 시소러스 관리 시스템의 개발에 관한 연구 (Development of a Thesaurus Management System based on the Object-Oriented Technique)

  • 박계숙
    • 정보관리학회지
    • /
    • 제13권2호
    • /
    • pp.5-18
    • /
    • 1996
  • 시소러스를 구축하기 위해서는 새로운 단어의 입력, 수정, 삭제 및 단어간 관계생성 등의 동적인 변하에 신속 정확히 대용할 수 있도록 시소러스 관리 시스템이 개발되어야 한다. 본 연구에서 개발한 시소러스 관리 시스템은 객체지향적 구조로 데이터베이스를 설계하였으며, GUI화면을 제공하여 이용자 인터페이스를 향상시켰다. 또한 시소러스를 구축하는데 있어서 동일한 영문 용어의 다양한 한글표기로 인한 정보검색 효율 저하 문제를 해결하기 위해 동의어의 확장에 역점을 두었다.

  • PDF

컴포넌트 검색에서 퍼지 시소러스를 이용한 효율적인 질의확장 방법 (Efficient Query Expansion Method using Fuzzy Thesaurus in Component Retrieval)

  • 김귀정;한정수
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.76-82
    • /
    • 2004
  • 본 논문은 사용자 질의가 가지는 특정 클래스로부터 개념적으로 서로 연관있는 컴포넌트를 검색하기 위하여 퍼지 시소러스를 통한 질의 확장 방법을 제안하였다. 사용자 질의는 퍼지 불리언 형태로 표현되며, 퍼지 시소러스에 의한 유의어 테이블에 의해 질의 확장된다. 시소러스에 의한 사용자 질의확장은 용어 불일치 문제를 해결함으로써 검색에 대한 일정한 정확도를 보장하면서 재현율을 향상시킬 수 있게 한다. 질의 확장과정의 효율성을 평가하기 위하여 시뮬레이션을 통한 최적의 검색 효율을 나타내는 임계치를 설정하고 재현율 과 정확도를 비교하였다.

  • PDF

A Method for Information Source Selection using Teasaurus for Distributed Information Retrieval

  • Goto, Shoji;Ozono, Tadachika;Shintani, Toramatsu
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.272-277
    • /
    • 2001
  • In this paper, we describe a new method for selecting information sources in a distributed environment. Recently, there has been much research on distributed information retrieval, that is information retrieval (IR) based on a multi-database model in which the existence of multiple sources is modeled explicitly. In distributed IR, a method is needed that would enable selecting appropriate sources for users\` queries. Most existing methods use statistical data such as document frequency. These methods may select inappropriate ate sources if a query contains polysemous words. In this paper, we describe an information-source selection method using two types of thesaurus. One is a thesaurus automatically constructed from documents in a source. The other is a hand-crafted general-purpose thesaurus(e.g. WordNet). Terms used in documents in a source differ from one another and the meanings of a term differ depending on th situation in which the term is used. The difference is a characteristic of the source. In our method, the meanings of a term are distinguished between by the relationship between the term and other terms, and the relationship appear in the co-occurrence-based thesaurus. In this paper, we describe an algorithm for evaluating a usefulness of a source for a query based on a thesaurus. For a practical application of our method, we have developed Papits, a multi-agent-based in formation sharing system. An experiment of selection shows that our method is effective for selecting appropriate sources.

  • PDF

SKOS를 이용한 신학 시소러스의 온톨로지로의 변환에 관한 연구 (A Study on Converting the Theological Thesaurus to the Ontology by Using SKOS)

  • 유영준
    • 한국도서관정보학회지
    • /
    • 제43권3호
    • /
    • pp.143-163
    • /
    • 2012
  • 개인이 구축한 시소러스를 온톨로지로 구축하기 위해서는 먼저 시소러스를 온톨로지로 변환하기 위해서 적합할 뿐만 아니라 W3C에서 국제표준으로 선택한 SKOS로 기술하는 것이 첫 번째 단계이다. SKOS는 시소러스나 주제명표, 분류체계 등을 온톨로지로 변환하는데 적합한 온톨로지이지만 온톨로지로 기술하려면 RDF/XML과 같은 언어가 필요하다. 그러나 RDF/XML은 읽고 쓰기에 어렵기 때문에 RDFa처럼 HTML에 내장할 수 있거나 훨씬 구조가 쉽고 기술하기도 간편한 Turtle기술 언어도 필요할 수 있다. SKOS로 기술한 것과 더불어 온톨로지 구축 프로그램인 $Prot{\acute{e}}g{\acute{e}}$ 4.2를 사용해서 시험적으로 8개의 클래스와 151개의 용어를 사용해서 온톨로지를 구축하였다. 이 온톨로지에는 시소러스의 기본 개념 관계인 동의관계, 계층관계, 연관관계 이외에도 SKOS에서 제안하는 전이 계층 관계의 사례도 포함시켰다.

과학기술용어(科學技術用語) 시소러스 대역(對譯) 데이터베이스 구축(構築) (A Study on Multi-Lingual Thesaurus Database Construction of Scientific and Technical Terms)

  • 김은식
    • 정보관리연구
    • /
    • 제22권2호
    • /
    • pp.1-28
    • /
    • 1991
  • 본(本) 연구(硏究)는 한글 과학기술용어(科學技術用語)의 표준화(標準化)를 위한 기초자료를 마련하여 국내(國內) 과학기술(科學技術) 데이터베이스의 제작을 촉진하고, 또한 한글 전문용어(專門用語)와 이에 대응하는 영어(英語) 용어(用語) 및 일어(日語) 용어(用語)를 안내해 줌으로써 해외(海外) 데이터베이스 검색시(檢索時)에 편리한 검색(檢索) 툴로서 활용하는 데 목적(目的)이 있다. 과학기술분야(科學技術分野)에서 사용되고 있는 전문용어(專門用語)의 한글 용어, 영어(英語) 용어, 일어(日語) 용어 시소러스에 대한 대역(對譯) 데이터베이스를 구축한 것이다. 시소러스의 이론적인 배경을 고찰하였으며, 과학기술분야(科學技術分野) 전문용어(專門用語)의 수집은 일본과학기술정보(日本科學技術情報)센터가 1987년에 발행한 $\ulcorner$과학기술용어(科學技術用語) 시소러스 영일(英日) 리스트$\lrcorner$$\ulcorner$과학기술용어(科學技術用語) 시소러스 일영(日英) 리스트$\lrcorner$를 근거자료로 하여 일어(日語) 용어(用語) 및 영어(英語) 용어(用語)에 1 대(對) 1로 대응하는 한글 용어로 번역(飜譯)하였다. 과학기술용어(科學技術用語) 시소러스 대역(對譯) 데이터베이스에 수록된 한글 디스크립터는 38,318 용어, 한글 비디스크립터는 2,870용어, 영어(英語) 디스크립터는 38,318 용어, 영어(英語) 비디스크립터는 11,910 용어, 일어(日語) 디스크립터는 38,318 용어, 일어(日語) 디스크립터는 9,789 용어이다.

  • PDF

교육시설(敎育施設)에 관한 문헌연구(文獻硏究) 방법(方法) - 미국 ERIC 자료 활용방법을 중심으로 - (A Study on Methods of Documentary Research on Educational Facilities - Focused on the Utilization of the ERIC -)

  • 박재윤
    • 교육시설
    • /
    • 제1권1호
    • /
    • pp.33-40
    • /
    • 1994
  • This study was taken to increase efficiency in reviewing documents of school facilities from the network of ERIV(Educational Resources and Information Center, USA). Outline of the ERIC network, and the structure, role, function of the ERIC thesaurus are introduced. A thesaurus have developed for information retrieval purpose provides the filing labels which permit information to be stored by one person and retrieved by another. As an information system grows, its thesaurus is systematically built and refined to the point where it represents, in a very special sense, the vocabulary of subject field. The Thesaurus of ERIC Descriptors represents such a vocabulary for the field education. An understanding of its origins, its function and its limitations, is just as important to the teacher, the student of education or the educational researcher as it is for the indexer or custodian of the information pool it represents. If the Thesaurus is understood and used in an appropriate way, it can give all educators not only insight into the ERIC system but also an increased awareness of the language of their field. A great many terms are necessary to describe the many aspects of education, and the task of relating them in even an approximately consistent way is an enormous one. The undertaking should be managed by people who not only know what they are talking about but who also should be able to predict what people in their field are lilely to be talking about in the near future. It should also enlist people who are willing to pay term to another within the system. To engage a large number of these two kinds of people over a long period of time is very likely to cost a great deal of money. There is very little proprietary value in producing such a list of terms, for it can very easily be copied, adapted, updated, etc. Thus, because of its high cost and low proprietary value, it becomes a task likely to be funded only by a government. A government has many ways of spending its money. However, after the decision has been made to spend money to produce an authority list, one must decide how this authority is to be delegated. The history of the development of the ERIC Thesaurus is the history of how this authority was delegated. Scientific research has thrived on efforts to define terms as precisely as possible. It is difficult to say with certainty, however, that solutions to social problems have thrived on a simple diet of scientific research. Contemporary crises demand new and imaginative ways of conceiving problems and talking about them. If this Thesaurus or any other scheme for normalizing or controlling language inhibits in the slightest measure the creative use of language, it is against it use. Only if the principles and details of the Thesaurus are misunderstood can it be used as a constraint on language in a negative sense. Students of education of every kind should see the The-saurus as an opportunity to become increasingly self-conscious about their language and thus about their assumptions and their approaches to educational problems.

  • PDF