• Title/Summary/Keyword: 검색가중치

Search Result 400, Processing Time 0.024 seconds

A Study of Document Ranking Algorithms in a P-norm Retrieval System (P-norm 검색의 문헌 순위화 기법에 관한 실험적 연구)

  • 고미영;정영미
    • Journal of the Korean Society for information Management
    • /
    • v.16 no.1
    • /
    • pp.7-30
    • /
    • 1999
  • This study is to develop effective document ranking algorithms in the P-norm retrieval system which can be implemented to the Boolean retrieval system without major difficulties by using non-statistical term weights based on document structure. Also, it is to enhance the performance by introducing the rank adjustment process which rearranges the ranks of retrieved documents according to the similarity between the top ranked documents and the rest of them. Of the non-statistical term weight algorithms, this study uses field weight and term pair distance weight. In the rank adjustment process, five retrieval experiments were performed, ranging between the case of using one record for the similarity measurement and the case of using first five records. It is proved that non-statistical term weights are highly effective and the rank adjustment process enhance the performance further.

  • PDF

Improving Retrieval Effectiveness with Multiple Weighting Schemes (다중 가중치 기법을 이용한 검색 효과의 개선)

  • 이준호
    • Journal of the Korean Society for information Management
    • /
    • v.12 no.2
    • /
    • pp.213-223
    • /
    • 1995
  • It has known that different representations of either queries or documents, or different retrieval techniques retrieve different sets of documents. Recent works suggest that significant improvements in retrieval performance can be achieved by combining multiple representations or multiple retrieval techniques. In this paper we propose a simple method for retrieving different documents within a single query representation, a single document representation and a single retrieval technique. We classify the types of documents, and describe the properties of weighting schemes. Then. we explain that different properties of weighting schemes may retrieve different types of documents. Experimental results show that significant improvements can be obtained by combining the retrieval results form different properties of weighting schemes.

  • PDF

Region-Based Image Retrieval System using Spatial Location Information as Weights for Relevance Feedback (공간 위치 정보를 적합성 피드백을 위한 가중치로 사용하는 영역 기반 이미지 검색 시스템)

  • Song Jae-Won;Kim Deok-Hwan;Lee Ju-Hong
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.4 s.42
    • /
    • pp.1-7
    • /
    • 2006
  • Recently, studies of relevance feedback to increase the performance of image retrieval has been activated. In this Paper a new region weighting method in region based image retrieval with relevance feedback is proposed to reduce the semantic gap between the low level feature representation and the high level concept in a given query image. The new weighting method determines the importance of regions according to the spatial locations of regions in an image. Experimental results demonstrate that the retrieval quality of our method is about 18% in recall better than that of area percentage approach. and about 11% in recall better than that of region frequency weighted by inverse image frequency approach and the retrieval time of our method is a tenth of that of region frequency approach.

  • PDF

Development of A Digital Image Signature Based-on MPEG-7 Descriptors (MPEG-7 기반의 Digital Image Signature 개발)

  • Oh, Weon-Geun;Choi, Kyoung-Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.505-508
    • /
    • 2011
  • 본 논문에서는 MPEG-7 비주얼 디스크립터를 기반으로 Digital Image의 효과적인 검색이 가능한 시스템의 개발하였다. MPEG-7에 포함되어 있는 비주얼 디스크립터 툴은 컬러, 텍스처, shape, motion, localization, 얼굴 인식 등을 포함한다. 이들 MPEG-7에서 제공하는 비주얼 디스크립터를 그대로 이용하여 Digital Image의 검색 시스템을 구현하기에는 시스템이 불필요하게 커질 수 있으며 Digital Image의 검색 성능이 그다지 높지 않다는 문제점이 발생한다. 구체적으로는 모든 디스크립터를 이용하여 데이터베이스에 존재하는 모든 Digital Imag에 대한 검색을 수행하기에는 많은 처리시간이 요구된다는 것과 어떠한 디스크립터를 이용해야 정확한 검색이 이루어질지 알 수 없기 때문이다. 이를 위해 본 논문에서는, MPEG-7 비주얼 디스크립터의 특성을 저작권위원회에서 제공받은 데이터베이스를 이용하여 분석하고 이들 디스크립터의 효과적인 결합 기술을 개발하였다. 기존의 디스크립터 결합 방식은 각각의 디스크립터에 동일한 가중치를 부여하고 검색을 수행하는 방식이었으나 본 논문에서는 정보이론을 기반으로 디스크립터의 가중치를 자동으로 부여하는 방식으로 검색 시스템을 구성하였다. 개발된 시스템은 기존의 동일한 가중치를 부여한 시스템에 비해서 데이터베이스에 대한 각 디스크립터의 특성을 반영하여 가중치를 결정하도록 구성하였다.

  • PDF

A Wireless Multimedia Data Retrieval System (무선 멀티미디어 데이터 검색 시스템)

  • Choi, Jin-Seung
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.05a
    • /
    • pp.302-304
    • /
    • 2010
  • 본 논문에서는 유아의 환경 교육을 위한 비디오 검색을 위해 의미 가중치와 의존 가중치를 이용하여 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 의미기반 멀티미디어 데이터베이스 시스템을 제안한다. 환경 교육에 대한 멀티미디어 데이터를 사용자가 키워드 입력을 통해 검색을 하면 제안 시스템의 모바일 에이전트에 의해 의미 가중치를 계산하고 그 정보를 키 프레임의 주석정보로 이용하여 더욱 정확한 데이터가 검색되게 한다. 제안하는 시스템의 프로토타입을 구현하여 테스트 한 결과 약 96.5%의 높은 정확도(precision)를 얻었다.

  • PDF

Query Expansion Using Term Reweighting for Vector Model (벡터모델에서 용어 가중치 재부여를 이용한 질의 확장)

  • 김영천;이재훈;문유미;박병권;이성주
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.23-26
    • /
    • 2001
  • 순수한 부울 검색 시스템은 문서와 질의 사이의 유사도를 나타내는 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정보에 따라 정렬할 수 없다. 부울 검색 시스템의 이러한 단점을 보완하는 방법으로 MMM 모델, Paice 모델, p-norm 모델이 개발되었다. 본 논문에서는 높은 검색 효과를 제공하는 벡터모델에서 용어 가중치 재부여를 이용한 정보검색 모델을 제안한다. 벡터모델에서 용어 가중치 재부여를 이용한 질의 확장 모델의 연산 특성이 MMM, Paice, p-norm 모델보다 우수함을 설명하고, 또한 성능 비교를 통하여 이를 입증한다.

  • PDF

Improving Performance of Web Search using The User Preference in Query Word Senses (질의어 의미별 사용자 선호도를 이용한 웹 검색의 성능 향상)

  • 김형일;김준태
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.8
    • /
    • pp.1101-1112
    • /
    • 2004
  • In this paper, we propose a Web page weighting scheme using the user preference in each sense of query word to improve the performance of Web search. Generally search engines assign weights to a web page by using relevancy only, which is obtained by comparing the query word and the words in a web page. In the information retrieval from huge data such as the Web, simple word comparison cannot distinguish important documents because there exist too many documents with similar relevancy In this paper we implement a WordNet-based user interface that helps to distinguish different senses of query word, and constructed a search engine in which the implicit evaluations by multiple users are reflected in ranking by accumulating the number of clicks. In accumulating click counts, they are stored separately according to senses, so that more accurate search is possible. The experimental results with several keywords show that the precision of proposed system is improved compared to conventional search engines.

Efficient Blog Retrieval System by Topic-based Weighting (주제어 가중치 기법에 의한 효율적인 블로그 검색 시스템)

  • Shin, Hyeon-Il;Yun, Un-Il;Ryu, Keun-Ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.15 no.4
    • /
    • pp.1-9
    • /
    • 2010
  • In the new generation of Web, commonly called "Web 2.0", blogging has facilitated the publishing information or his/her opinion on the web. Various blog retrieval algorithms have been proposed to search for blogs more effectively. However, actually keyword-based searching or link-analysis blog ranking system cannot satisfy the user's requirement. In this paper, we suggest a topic-based weighting blog retrieval system in which the links between blog writings and searching words are considered to improve the search results. Our system extracts topics from each blog and weights them much higher than other guide words. In the comparison with other systems, we see that the proposed topic-base system has better recall rate of search results.

A Ranking method using link & description information in Meta searching (메타검색에서 링크정보와 요약정보를 이용한 검색결과 통합)

  • 양명석;이석형;강남규;윤화묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.118-120
    • /
    • 2002
  • 본 논문은 메타검색엔진 시스템에서 다양한 검색결과를 하나의 검색결과로 통합시켜주는 통합랭킹 방법에 대한 연구이다 검색결과 통합시 메타검색 시스템에서 실질적으로 이용할 수 있는 링크정보와 요약정보를 사용하였다 통해 이루어져 있다. 또한 링크정보와 요약정보에 대한 가중치 값을 변화시키면서 다양한 검색결과들을 얻을 수 있었는데, 요약정보의 가중치를 높여 주었을 때 검색 효율이 좋음을 알 수 있었다.

  • PDF

Optimizing the Weight of Added Terms in Query Expansion (질의확장 검색에서의 추가용어 가중치 최적화)

  • 정영미;이재윤
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.241-246
    • /
    • 2002
  • 전역적 질의확장 검색에서 단어간 공기기반 유사도를 사용할 경우에는 질의에 추가되는 용어에 부여하는 탐색가중치로 질의와의 유사도를 사용하는 것이 일반적이다. 그러나 과연 유사도가 탐색가중치로 최적인가는 의문의 여지가 있다. 추가용어와 질의 사이의 유사도가 가지는 특성을 살펴보고 고정가중치를 부여한 경우와 비교해보았다. 또한 실험집단이나 확장범위의 영향을 덜 받는 최적화된 추가용어 가중치를 찾기 위해 여러 가지 탐색가중치 공식을 실험하였다.

  • PDF