• Title/Summary/Keyword: 표제(標題) 색인성(索引性)

Search Result 5, Processing Time 0.02 seconds

Indexability and Information Quantity Analysis in Title and Abstract (표제(標題)와 초록(抄錄)의 색인성(索引性)과 정보량(情報量) 분석(分析))

  • Kim, Jae-Soo;Nam, Young-Joon
    • Journal of Information Management
    • /
    • v.23 no.2
    • /
    • pp.1-13
    • /
    • 1992
  • This study intends to measure the indexibility and the information quantity in title and abstract. The result of analysis was that when the source was title or abstract, result was not good. But when it was the title and abstract, the result was better.

  • PDF

A method for similar-word retrival based on BTI dictionary indexing mechanism (BTI 사전 색인을 이용한 유사단어 검색)

  • 정연수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.291-296
    • /
    • 1994
  • 유사단어의 추정에 있어서 사전 검색에 드는 비용, 즉 사전탐색 횟수는 효율성의 문제와 직결된다. 본 논문에서는 BTI 사전 색인을 이용하여 한 글자의 변형요소가 있는 유사단어들을 효율적으로 거색하는 방법을 제안한다. BTI 방식은 정방향, 역방향 표제어를 모두 저장하는 방법이다. BTI 방식으로 사전 표제어를 색인하여 표제어에 대한 사전 탐색 도중에 사전에 존재하는 prefix와 postifix를 모두 검색할 수 있다. 이러한 정보를 이용하면 유사 단어에 대한 정확한 변형 위치를 결정할 수 있다. BTI 사전 색인은 사전 표제어에 대한 정보없이 유사단어를 추정한 후에 사전 검색을 통하여 확인하는 방법보다 사전 검색에 드는 비용이 적다. 추가적으로 유사단어 후보들에 대한 우선 순위를 정하기 위하여 corpus에서 추출한 각 표제어의 발견 빈도를 이용하였다.

  • PDF

Morphological Processing in an Expanded Dictionary Environment (확장 사전 환경에서의 한국어 형태소 해석과 생성)

  • Cho, Young-Hwan;Cha, Hee-Joon;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.355-368
    • /
    • 1993
  • 형태소 처리의 기본 원칙은 사전의 표제어를 형태소 수준으로 함으로써 사전의 크기를 줄이고, 중복되는 정보의 양을 최소화하는 것이다. 본 논문에서는 형태소 처리를 위한 여러 환경 요소들 중에서 특별히 확장된 사전 표제어를 기본으로 하는 환경을 제안한다. 확장 사전 환경은 어휘에 대한 사전 표제어와 사전 정보의 분리를 기본으로 한다. 기본 사전 표제어에 대하여 어휘의 활용형을 사전 작성의 후처리인 사전 표제어에 대한 색인구조 구성시에 자동으로 확장함으로써 용언의 불규칙 활용과 음운 축약 현상에 대처한다. 확장 사전 환경의 장점은 형태소 해석과 생성시에 필요한 불규칙 활용에 대한 처리를 사전 확장 시간으로 앞당기고, 어절의 부분문자열과 사전 표제어간의 직접 대응성을 제공하여 여러 응용에 쉽게 적용이 가능하다는 것이다.

  • PDF

An Experimental Study on Automatic Indexing for Hangeul Text (한글문헌의 자동색인에 관한 실험적 연구)

  • Ahn, Heyon-Soo
    • Journal of the Korean Society for information Management
    • /
    • v.3 no.2
    • /
    • pp.109-128
    • /
    • 1986
  • The explosive amount of information and various demands for it have led to the development of automatic indexing. Specially, in the HANGEUL data processing, the necessity of automatic indexing has been steadily increased. It is hypothesized that in the HANGEUL text, CHE-ON's only become key words and the CHE-ON is followed by JOSA. Through the morphological analysis the key words were selected from the titles and abstracts in the experimental data which consisted of 20 papers in "Journal of the Korea Society for Information Science."

  • PDF

A Study on the Utility of Relevance/Non-relevance Information in Homogeneous Documents (유사문헌집단에서 적합/부적합정보의 유용성에 관한 연구)

  • Moon, Sung-Been
    • Journal of the Korean Society for information Management
    • /
    • v.32 no.3
    • /
    • pp.277-293
    • /
    • 2015
  • This study examined the relative retrieval effectiveness after relevance feedback between two systems (Title/Abstract and Full-text) using four different sets of relevance judgment. Four relevance levels (not relevant, marginally relevant, relevant, highly relevant) are also used, each of which is determined by referees giving a relevance score to documents. This study also investigated how much the average precision was improved after relevance feedback when "marginally relevant" documents are included in the relevant class with the Title/Abstract system, and with the Full-text retrieval system as well. It is found that the Title/Abstract system benefited from relevance feedback with the marginally relevant documents. In case of the Title/Abstract system, the higher percentage of improvement was consistently obtained when including the marginally relevant documents in the relevance class, however the result was vice versa in case of the Full-text retrieval system. It implied that the marginally relevant documents in the relevant class had caused noises in the Full-text retrieval system.