• 제목/요약/키워드: Controlled retrieval

검색결과 89건 처리시간 0.019초

이용자 피이드백에 의한 검색질문의 자동 수정에 관한 연구 (An Experiment on Automatic Query Modification In Information Retrieval Using the Relevance Feedback)

  • 신영실
    • 정보관리학회지
    • /
    • 제2권1호
    • /
    • pp.108-135
    • /
    • 1985
  • 이용자와 시스템간에 상호작용이 이루어질수 있는 온라인 정보검색 시스템에서는 검색결과에 대한 이용자의 피이드백을 이용하여 검색질문을 수정함으로써 시스템의 성능을 향상시킬수 있다. 본 논문에서는 샐톤과 우가 제시한 검색질문의 자동수정 모형을 통제된 키이워어드 시스템에 적용시켜 보았다.

  • PDF

On The Full-Text Database Retrieval and Indexing Language

  • Chang, Hye-Rhan
    • 정보관리학회지
    • /
    • 제4권1호
    • /
    • pp.24-46
    • /
    • 1987
  • 최근 원문 데이타베이스의 증가는 주제접근의 새로운 가능성을 제시하였다. 온라인 정보검색은 근본적으로 색인언어와 컴퓨터 기술의 문제이다. 본 연구의 목적은 전통적인 서지 데이타베이스 검색과 비교하여 원문 데이터 베이스 검색의 특징과 성능을 규명하는데 있다. 색인언어에 따른 검색효율, 현재 응용되고 있는 원문 데이타베이스 탐색 시스템, 통제어휘의 새로운 역할 등을 살펴보았다. 이 논문은 또한 원문 데이타베이스의 검색성능 실험에 대한 리뷰를 포함한다.

  • PDF

Interactive Information Retrieval: An Introduction

  • Borlund, Pia
    • Journal of Information Science Theory and Practice
    • /
    • 제1권3호
    • /
    • pp.12-32
    • /
    • 2013
  • The paper introduces the research area of interactive information retrieval (IIR) from a historical point of view. Further, the focus here is on evaluation, because much research in IR deals with IR evaluation methodology due to the core research interest in IR performance, system interaction and satisfaction with retrieved information. In order to position IIR evaluation, the Cranfield model and the series of tests that led to the Cranfield model are outlined. Three iconic user-oriented studies and projects that all have contributed to how IIR is perceived and understood today are presented: The MEDLARS test, the Book House fiction retrieval system, and the OKAPI project. On this basis the call for alternative IIR evaluation approaches motivated by the three revolutions (the cognitive, the relevance, and the interactive revolutions) put forward by Robertson & Hancock-Beaulieu (1992) is presented. As a response to this call the 'IIR evaluation model' by Borlund (e.g., 2003a) is introduced. The objective of the IIR evaluation model is to facilitate IIR evaluation as close as possible to actual information searching and IR processes, though still in a relatively controlled evaluation environment, in which the test instrument of a simulated work task situation plays a central part.

서지 데이터베이스에서의 레코드 필드 선택이 검색 성능에 미치는 영향에 관한 연구 (A Study of the Influence of Choice of Record Fields on Retrieval Performance in the Bibliographic Database)

  • Heesop Kim
    • 한국문헌정보학회지
    • /
    • 제35권4호
    • /
    • pp.97-122
    • /
    • 2001
  • 본 연구에서는 레코드필드 선택이 대규모 서지 데이터베이스 탐색시 미치는 검색 성능에 대하여 관찰하였다. 실험의 구성 요소는 크게 (1) 대규모 상업용 데이터베이스 INSPEC. (2) 관련된 레코드들 (target sets이라고 정의함). (3) 4개의 키워드가 한 세트로 이루어진 4개의 서로 다른 형태의 질의어들 (CT_TF, CT_IDF, UT_TF, UT_IDF), (4) 최적의 질의를 위한 알고리즘, (5) 가능한 모든 경우의 탐색식을 생성해내는 블리언 탐색식 생성기, 그리고 (6) 실제 운영중인 웹 기반의 검색 시스템으로 이뤄졌다. 실험에서의 레코드 필드 선택은 (1) Abstract, (2) Descriptors, (3) Identifiers, (4) 'Subject'(Descriptors + Identifiers). (5) Title. (6) 'All fields'로 정의하여 독립변수로 채택하였다. 검색 성능은 재현율, 정도율을 모두 반영한 Heine의 D측정에 의하여 평가 되었다. 본 연구에서 얻은 주된 결과로는 (1) 필드선택은 검색성능에 중요한 영향을 미치며, (2) 각 검색 성능에서 보여준 순위는 질의어에 따라 민감한 결과를 보였고 (3) 제목(Title)필드 선택이 D측정에서 최적의 결과를 보였다.

  • PDF

텍스트 기반 의료영상 검색의 최근 발전 (Recent Development in Text-based Medical Image Retrieval)

  • 황경훈;이해준;고건;김석균;선용한;최덕주
    • 대한의용생체공학회:의공학회지
    • /
    • 제36권3호
    • /
    • pp.55-60
    • /
    • 2015
  • An effective image retrieval system is required as the amount of medical imaging data is increasing recently. Authors reviewed the recent development of text-based medical image retrieval including the use of controlled vocabularies - RadLex (Radiology Lexicon), FMA (Foundational Model of Anatomy), etc - natural language processing, semantic ontology, and image annotation and markup.

전문데이터베이스의 특성과 정보검색성능 (On the Characteristics and Information Retrieval Performance of Full-Text Databases)

  • 조명희
    • 한국문헌정보학회지
    • /
    • 제17권
    • /
    • pp.339-366
    • /
    • 1989
  • Appearance of full-text online is the most encouraging phenomenon ·during the development of databases. The full-text databases of today is derived from by-product of electronic publication of printed materials. Now, there are also some movements toward electronic production of documents in Korea although not powerful. The present study is designed to examine the characteristics and effective retrieval method of full-text databases now commercially available through various vendors. The outline of this paper IS as follows: First, background and present situation of existing full-text database services through national and worldwide are examined. Second, free-text searching system of full-text databases is compared with controlled vocabulary system. The factors influencing on free-text retrieval performance, searching thesaurus, and hybrid or compromising system, which is using limited controlled vocabulary in conjunction with natural language for the enrichment needed for practical operation of the . system, are examined. Third, user demands through the analysis of preceding studies on 'various types of full-text databases are recognised. Fouth, application of CD-ROM full-text database to the libraries and information centers is examined as prospective resources for them. Finally, some problems and prospect of full-text databases are presented.

  • PDF

추적 가능한 가명 은밀 획득 프로토콜 (Private Pseudonym Retrieval with Controlled Traceability)

  • 양대헌;이경희
    • 정보보호학회논문지
    • /
    • 제16권5호
    • /
    • pp.113-118
    • /
    • 2006
  • 가명을 이용한 시스템에서는 가명을 발급한 기관에게도 사용자의 익명성이 유지되어야 하며, 다만 정책적으로 사용자가 규칙을 어겼을 때는 가명으로부터 사용자의 신원정보를 추적할 수 있어야 한다. 이 논문에서는 m--out-of-n oblivious transfer와 cut-and-choose 기술을 이용하여 추적 가능한 가명 은닉 획득 프로토콜을 제안한다.

해마신경망을 이용한 관심 객체 기반의 효율적인 멀티미디어 검색 시스템의 개발 (The Development of Efficient Multimedia Retrieval System of the Object-Based using the Hippocampal Neural Network)

  • 정석훈;강대성
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.57-64
    • /
    • 2006
  • 본 논문에서는 해마신경망(HCNN:HippoCampal Neural Network)을 이용하여 사용자 친화적인 객체 기반 멀티미디어 검색시스템을 제안한다. 내용 기반 검색(Content-based Retrieval)에 관한 대부분의 기존의 질의 방법은 입력 영상에 의한 질의 또는 컬러(color), 형태(shape), 질감(texture)등과 같은 low-level의 특징을 사용한다. 본 논문에서 제안하는 방법은 MPEG 기반의 압축 비디오 스트림으로부터 장면 전환 검출을 수행하여 샷을 검출한다. 이 샷 프레임에서 컬러 객체의 자동 추출을 위하여 similar colorization과 ACE(Adaptive Circular filter and Edge) 알고리즘을 사용한다. 그리고 이렇게 추출된 특징을 해마 신경망을 통하여 학습한 후 멀티미디어 검색 시스템을 구성한다. 제안하는 해마 신경망은 호감도 조정에 의해서 입력되는 영상패턴의 특징들을 흥분학습과 억제학습을 이용하여 불필요한 특징은 억제시키고 중요한 특징은 흥분학습을 통해 장기기억 시켜서 적응성 있는 실시간 검색 시스템을 구현한다.

Semantic Web과 Semantic Network을 활용한 다국어 상품검색 에이전트 (Multilingual Product Retrieval Agent through Semantic Web and Semantic Networks)

  • 문유진
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.1-13
    • /
    • 2004
  • 상품검색은 고객들이 전자상거래의 접촉을 시작하는 인터페이스로서 매우 중요한 프로세스이다. 또한 전자상거래는 고객들에게 검색 시 쉽게 접근할 수 있는 프로세스를 제공하여야 한다. 특히 World Wide Web에서 상품정보는 광범위한 고객들이 신속하게 팽창하는 정보를 추적하기 위해서 통합과 표준화가 이뤄져야 한다. 상품 카탈로그(catalogue)에 대한 국제 표준화가 다양한 분야와 업종에서 구축되어져 왔는데, 요즈음은 UNSPSC((Universal Standard Products and Services Classification) 코드로의 수렴에 대한 논의가 활발해지고 있다. 이 표준을 채택하여 이 논문은 다국어상품검색 에이전트의 아키텍쳐(architecture)를 설계한다. 이 아키텍쳐는 중앙등록기 모델의 상품 카탈로그 관리를 기반으로 하여 분산처리의 update프로세스를 채택한다. 또한 이 아키텍쳐는 구매자 관점과 공급자 관점을 모두 고려한다. 상품정보의 일관성과 버전 관리는 UNSPSC코드 시스템에 의하여 제어된다. 고객이 사용하기 편리하도록 표준화에 포함되어져 있지 않은 상품명과 다국어 상품명은 Semantic Network, 시소러스(thesaurus)와 Semantic Web의 상품명 온톨로지 등을 활용하여 해결한다. 이를 위한 알고리즘들을 설계하고 또한 구현한다.

  • PDF

Automatic In-Text Keyword Tagging based on Information Retrieval

  • Kim, Jin-Suk;Jin, Du-Seok;Kim, Kwang-Young;Choe, Ho-Seop
    • Journal of Information Processing Systems
    • /
    • 제5권3호
    • /
    • pp.159-166
    • /
    • 2009
  • As shown in Wikipedia, tagging or cross-linking through major keywords in a document collection improves not only the readability of documents but also responsive and adaptive navigation among related documents. In recent years, the Semantic Web has increased the importance of social tagging as a key feature of the Web 2.0 and, as its crucial phenotype, Tag Cloud has emerged to the public. In this paper we provide an efficient method of automated in-text keyword tagging based on large-scale controlled term collection or keyword dictionary, where the computational complexity of O(mN) - if a pattern matching algorithm is used - can be reduced to O(mlogN) - if an Information Retrieval technique is adopted - while m is the length of target document and N is the total number of candidate terms to be tagged. The result shows that automatic in-text tagging with keywords filtered by Information Retrieval speeds up to about 6 $\sim$ 40 times compared with the fastest pattern matching algorithm.