• 제목/요약/키워드: full-text retrieval system

검색결과 30건 처리시간 0.022초

본문 데이타베이스 연구에 관한 고찰과 그 전망 (Future and Directions for Research in Full Text Databases)

  • 노정순
    • 한국문헌정보학회지
    • /
    • 제17권
    • /
    • pp.49-83
    • /
    • 1989
  • A Full text retrieval system is a natural language document retrieval system in which the full text of all documents in a collection is stored on a computer so that every word in every sentence of every document can be located by the machine. This kind of IR System is recently becoming rapidly available online in the field of legal, newspaper, journal and reference book indexing. Increased research interest has been in this field. In this paper, research on full text databases and retrieval systems are reviewed, directions for research in this field are speculated, questions in the field that need answering are considered, and variables affecting online full text retrieval and various role that variables play in a research study are described. Two obvious research questions in full text retrieval have been how full text retrieval performs and how to improve the retrieval performance of full text databases. Research to improve the retrieval performance has been incorporated with ranking or weighting algorithms based on word occurrences, combined menu-driven and query-driven systems, and improvement of computer architectures and record structure for databases. Recent increase in the number of full text databases with various sizes, forms and subject matters, and recent development in computer architecture artificial intelligence, and videodisc technology promise new direction of its research and scholarly growth. Studies on the interrelationship between every elements of the full text retrieval situation and the relationship between each elements and retrieval performance may give a professional view in theory and practice of full text retrieval.

  • PDF

상이한 적합성 판정과 전문검색시스템의 평가에 관한 연구 (Variations in relevance assessments and evaluation of the performance of full-text retrieval system)

  • 문성빈
    • 정보관리학회지
    • /
    • 제14권2호
    • /
    • pp.123-141
    • /
    • 1997
  • 본 논문에서는 문헌의 전문을 대상으로 얻어진 4개의 상이한 적합성 판정 세트가 전문검색시스템의 검색효율성 평가에 미치는 영향을 살펴보았다. 각 적합성 판정 세트간의 검색효율성에는 주목할 만한 차이가 없는 것으로 밝혀졌다. 이는 적합성 개념에 대한 다양한 관점이 검색효율성의 평가에는 커다란 영향을 미치지 못하고 있음을 암시하는 것이다. 그러나, 적합성 정보를 효과적으로 이용하는 정교한 검색기법인 적합성 피이드백을 통합한 검색실험은 계속 연구되어야 할 과제로 제시하고 있다.

  • PDF

전문데이터베이스의 특성과 정보검색성능 (On the Characteristics and Information Retrieval Performance of Full-Text Databases)

  • 조명희
    • 한국문헌정보학회지
    • /
    • 제17권
    • /
    • pp.339-366
    • /
    • 1989
  • Appearance of full-text online is the most encouraging phenomenon ·during the development of databases. The full-text databases of today is derived from by-product of electronic publication of printed materials. Now, there are also some movements toward electronic production of documents in Korea although not powerful. The present study is designed to examine the characteristics and effective retrieval method of full-text databases now commercially available through various vendors. The outline of this paper IS as follows: First, background and present situation of existing full-text database services through national and worldwide are examined. Second, free-text searching system of full-text databases is compared with controlled vocabulary system. The factors influencing on free-text retrieval performance, searching thesaurus, and hybrid or compromising system, which is using limited controlled vocabulary in conjunction with natural language for the enrichment needed for practical operation of the . system, are examined. Third, user demands through the analysis of preceding studies on 'various types of full-text databases are recognised. Fouth, application of CD-ROM full-text database to the libraries and information centers is examined as prospective resources for them. Finally, some problems and prospect of full-text databases are presented.

  • PDF

웨이브렛 특징과 순위 기반 인식을 이용한 한글 문서 영상 검색 시스템 (A Hangul Document Image Retrieval System Using Rank-based Recognition)

  • 이득용;김우연;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.229-242
    • /
    • 2005
  • 우리는 스캔된 한글 문서 영상에 대한 전문(full-text) 검색 시스템을 구축하였다. 이 시스템은 크게 전처리부, 인식부, 그리고 검색부로 구성되어 있다 검색 알고리즘은 k순위까지의 인식 결과를 이용한다. 이 방법은 검색 성능이 인식 오류에 둔감할 뿐만 아니라, 재현률과 정확률을 사용자가 조절할 수 있는 장점을 갖는다. 객관적인 성능 평가를 위해 KISTI가 제공하는 정보과학회 논문지 영상을 실험에 사용하였다. 인식과 검색 성능을 통하여 시스템이 실용적임을 보였다.

  • PDF

유사문헌집단에서 적합/부적합정보의 유용성에 관한 연구 (A Study on the Utility of Relevance/Non-relevance Information in Homogeneous Documents)

  • 문성빈
    • 정보관리학회지
    • /
    • 제32권3호
    • /
    • pp.277-293
    • /
    • 2015
  • 본 논문에서는 문헌의 적합성수준을 적합성정도에 따라 4그룹(부적합한, 조금 적합한, 적합한, 매우 적합한)으로 나눈 후 서로 다른 심사자가 적합성 판정을 내린 4개의 적합성 판정세트(A, B, C, D)에서 "조금 적합한" 문헌을 부적합문헌으로 분류했을 때와 적합문헌으로 분류하였을 때에, 초록/표제 시스템과 전문검색시스템에서 적합성피드백으로 인한 검색효율성의 증진은 어느 쪽이 더 혜택을 받게 되는 지를 연구하였다. "조금 적합한" 문헌을 적합문헌으로 포함시켰을 때 초록/표제시스템이 전문검색시스템보다 모든 적합성판정세트에서 검색효율성의 증가율이 높았고, 반면에 전문검색시스템에서는 "조금 적합한" 문헌을 적합문헌그룹에서 제외시켰을 때 검색효율성의 증가율이 일관성 있게 높아지는 것을 발견하였다. 이는 전문검색시스템에서는 적합문헌으로 포함된 "조금 적합한" 문헌으로부터 얻어지는 적합성피드백 정보는 잡음의 역할을 하게 되어 검색효율성의 증진에 도움이 안 되고 있음을 암시하고 있다. 특히, 매우 동질적인 문헌을 색인 및 검색대상으로 하고 있는 전문검색시스템에서는 잡음에 의해 초래되는 낮은 정확률을 개선하는 정교한 검색기법에 대한 연구가 지속되어야만 한다.

전문에 대한 검색시스템의 구현 (Implementation of Information Retrieval System for Full-Text)

  • 김대규;정희택;강영만;한순희;조혁현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 추계종합학술대회
    • /
    • pp.337-340
    • /
    • 2000
  • 인터넷을 이용한 정보검색이 일반화되면서, 보다 정확하고 꼭 필요한 정보의 요구가 일반화되었다. 정확한 정보의 제공을 위해, 된 정보에 대한 중심어(keyword) 검색뿐만 아니라 전문(Full-Text)에 대한 검색 요구가 일반화되었다. 본 연구에서는 전문 검색을 위한 설계 방안을 제안한다. 기존에 제안된 전문 검색 방안과 오라클에서 제공하는 interMedia Text를 이용한 전문 검색 방안을 비교한다. 이를 기반으로 정보 검색 시스템에서 구현 방안을 제시한다.

  • PDF

학술논문의 내용구조에 의한 전문검색시스템 구현과 성능평가에 관한 연구 (A Study on the Implementation and Performance Evaluation of Full-text Information Retrieval System based on Scientific Paper′s Content Structure)

  • 이두영;이병기
    • 정보관리학회지
    • /
    • 제15권3호
    • /
    • pp.73-93
    • /
    • 1998
  • 본 연구는 문헌의 내용구조와 이용자의 정보요구는 밀접한 관련성이 있기 때문에 문헌의 본문을 내용 단위구조로 분할하여 색인한다면 기존의 전문데이터베이스 구축방식에 비해 검색효율을 향상시킬 수 있다는 가설을 설정하고 이를 검증하는데 목적이 있다. 이 가설을 검증하기 위하여 먼저 학술논문의 내용구조 모델을 설정하고, 이 모델을 기반으로 컴퓨터 관련분야 70여편의 학술논문을 대상으로 실험용 전문데이터베이스를 구축한 다음, 이에 대한 검색효율을 측정하여 내용구조 기반 전문검색시스템의 성능을 실험적으로 평가하였다.

  • PDF

2-포아송 모형의 전문검색시스템 응용에 관한 연구 (Application of the 2-Poisson Model to Full-Text Information Retrieval System)

  • 문성빈
    • 정보관리학회지
    • /
    • 제16권3호
    • /
    • pp.49-63
    • /
    • 1999
  • 본 연구는 질문용어의 분포가 초록/표제 및 전문으로 표현된 문헌 내에서 2-포아송 분포를 따르고 있는지를 조사하였으며 질문용어의 2-포아송 분포여부가 확률이론에 기반을 둔 이진독립모형과 2-포아송 독립모형에서 초록/표제 및 전문의 검색효율성에 미치는 영향을 비교 분석하였다.

  • PDF

퍼지 논리를 이용한 사용자 중심적인 Full-Text 검색방법에 관한 연구 (Consideration of a Robust Search Methodology that could be used in Full-Text Information Retrieval Systems)

  • 이원부
    • Asia pacific journal of information systems
    • /
    • 제1권1호
    • /
    • pp.87-101
    • /
    • 1991
  • The primary purpose of this study was to investigate a robust search methodology that could be used in full-text information retrieval systems. A robust search methodology is one that can be easily used by a variety of users (particularly naive users) and it will give them comparable search performance regardless of their different expertise or interests In order to develop a possibly robust search methodology, a fully functional prototype of a fuzzy knowledge based information retrieval system was developed. Also, an experiment that used this prototype information retreival system was designed to investigate the performance of that search methodology over a small exploratory sample of user queries To probe the relatonships between the possibly robust search performance and the query organization using fuzzy inference logic, the search performance of a shallow query structure was analyzes. Consequently the following several noteworthy findings were obtained: 1) the hierachical(tree type) query structure might be a better query organization than the linear type query structure 2) comparing with the complex tree query structure, the simple tree query structure that has at most three levels of query might provide better search performance 3) the fuzzy search methodology that employs a proper levels of cut-off value might provide more efficient search performance than the boolean search methodology. Even though findings could not be statistically verified because the experiments were done using a single replication, it is worth noting however, that the research findings provided valuable information for developing a possibly robust search methodology in full-text information retrieval.

  • PDF

문헌의 내용단위구조에 의한 전문검색시스템의 타당성 고찰 (A Study on the Feasibility of Full-Text Information Retrieval System Based on Document Content Structure)

  • 이병기
    • 한국문헌정보학회지
    • /
    • 제32권1호
    • /
    • pp.129-154
    • /
    • 1998
  • 전통적인 전문검색시스템은 전문색인방식을 취하고 있기 때문에 접근점이 많다는 장점이 있으나, 대량의 문헌이 검색되어 부적합 문헌이 검색될 가능성이 높고, 정보요구 상황이나 목적에 따라서 본문의 특정 부분만을 지정하여 탐색할 수 없다는 단점이 있다. 따라서 본고에서는 전문데이터베이스의 본문을 내용단위로 구조화해야 할 이론적 타당성을 검토하였으며, 선행연구에 나타난 학술논문의 내용단위구조를 비교 분석하여 내용단위요소를 추출하고, 실제 한국어로 작성된 180여건의 학술논문에 적용 검토함으로써 표준적인 학술논문의 내용구조 모델을 개발하였다. 그 결과 문헌의 내용단위구조는 이용자의 정보요구 상황이나 목적과 밀접하게 관련되어 있기 때문에 전문데이터베이스 구축이나 전문검색시스템의 설계시에 내용단위로 구조화해야할 필요성을 도출하였다.

  • PDF