• Title/Summary/Keyword: 검색가중치

Search Result 400, Processing Time 0.037 seconds

A Web Document Filtering System for Animals (웹에서 동물영역 관련문서 필터링)

  • 김상모;김원우;변영태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.57-59
    • /
    • 2000
  • 인터넷에 돌아다니는 정보의 양은 무한정에 가까워지고 있고 이용자는 필요한 정보들을 얻을 수 있게 되었으나 검색 가능한 정보의 양이 폭발적으로 증가함에 따라 이용자는 정보검색을 하는데 있어 어려움이 따랐고, 이는 원하는 정보만을 필터링하여 보여주는 정보검색방법이 필요하게 되었다. 본 연구에서는 웹 사용자들이 정보검색을 하는데 원하는 정보를 정확하게 찾아주기 위해 웹 문서에 대한 TAG 가중치와 관련용어 영역지식의 구축 및 웹 문서 평가작업을 통한 Term의 웹 문서 DF테이블의 구축을 이용한 필터링 방법을 제안하고 그 유효성을 확인하였다.

  • PDF

Improving the performance of natural language information retrieval system by using non-keyword search methods. (자연어 질의 정보 검색 시스템의 비주제어 탐색 방법을 통한 성능 개선)

  • Lee, Seung-Ryul;Kang, Hyun-Kyu;Park, Se-Young;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.374-377
    • /
    • 1994
  • 본 논문에서는 한글 문서 검색 시스템에서 자연어 질의어로 검색할경우, 질의어를 주제어와 참조어로 나누어 재구성하여 검색하는 방법을 제시하였다. 먼저 주제어로 전문검색을 하여 후보 카드들을 추출한 후 비주제어로 다시 본문 탐색을 하여 추출된 카드의 가중치를 재조정함으로써 카드추출의 정확성을 높였다. 이 논문에 제시된 방법의 실험은 한국전자통신연구소 언어정보연구실에서 개발한 멀티미디어 전자 백과 사전의 자연어 검색모듈에서 행하여 졌다. 이 방법으로 별다른 검색속도의 저하나, 저장공간의 추가가 없이 기존의 검색 방법에서보다 약 58%정도의 검색의 정확성이 올라갔다. 본 논문에서 제시한 검색의 방법은 여러가지 응용의 자연어 인터페이스에서 데이타를 검색하는 정보검색의 분야에 적용되어 정확성을 높일 수 있을 것이다.

  • PDF

Contents Based Image Retrieval System Considering Various User Interface (다양한 사용자 인터페이스를 고려한 내용기반 영상 검색시스템)

  • 방상배;이채영;남재열
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2001.06a
    • /
    • pp.257-260
    • /
    • 2001
  • 내용 기반 영상 검색 시스템의 전체 구조를 살펴볼 때 질의영상을 입력하는 입력부, 입력된 질의영 상의 색상 및 형태정보를 분석하여 DB내의 영상과 유사도를 측정하는 검색 엔진부, 그리고 유사도 측정 결과 검색된 영상을 사용자에게 보여주는 출력부로 나눠볼 수 있다. 본 논문에서는 효율적인 검색 결과를 얻기 위해서 입력부에서는 사용자의 편의성을 고려한 인터페이스 설계를 논의하고, 검색엔진부 에서는 질의영상의 한 빈에 대하여 비교영상의 인접한 빈 중 유사도가 높은 빈을 검색한 후 그 위치 가 가까울수록 인접 빈에 높은 가중치를 부여하는 방식을 이용하여 히스토그램 인터섹션이 가지는 장점을 그대로 계승하면서 색상이나 명도, 태도에 약간의 차이가 존재하는 영상들들 효율적으로 검색할 수 있는 검색 기법을 제안하였다. 또한 출력부에서는 검색 시스템의 검색 효율이 뛰어나더라도 그것을 사용자에게 효과적으로 제시되지 못할 경우 일어날 검색 시스템의 효율성 반감을 고려하여 영상 특징 간의 관계성과 전체적인 일견의 효과를 제공할 수 있는 Iandscape 모델을 제안하였다.

  • PDF

Cross Field Searching Model for Field Structured Documents (필드 구조 문서를 위한 교차 필드 검색 모델)

  • 윤보현;왕지현;강현규
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.224-230
    • /
    • 2000
  • 기존의 전문 검색 시스템은 문서를 단지 단어의 연속이라는 제한적 관점에서만 바라보았다. 또한 기존의 필드 검색 시스템은 고정된 필드를 색인 및 검색대상으로 하거나, 문서의 내용이 아닌 메타 정보에 관한 검색만이 가능하였다. 본 논문에서는 내용과 필드 구조를 통합하여 가변 필드 구조 문서를 색인 및 검색하는 모델인 교차 필드 검색 모델을 제안한다. 기존 정보검색 시스템의 기능을 기본으로 제공하면서 필드구조를 색인/검색하기 위한 기능적 요구사항을 제시하고, 내용 및 필드 구조를 색인하면서 동적인 삽입/삭제가 가능한 색인 구조를 제안한다. 아울러 검색시에 문서 가중치를 계산하여 문서를 순위조정하는 분리언 모델, 확장 불리언 모델, 벡터 공간 모델의 변형 모델을 제시한다. 아울러 구현 사례로 STEER-XDS 검색 시스템에 대해 알아본다.

  • PDF

Cross Field Searching Model for Field Structured Documents (필드 구조 문서를 위한 교차 필드 검색 모델)

  • Yun, Bo-Hyun;Wang, Ji-Hyun;Kang, Hyun-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.224-230
    • /
    • 2000
  • 기존의 전문 검색 시스템은 문서를 단지 단어의 연속이라는 제한적 관점에서만 바라보았다. 또한 기존의 필드 검색 시스템은 고정된 필드를 색인 및 검색대상으로 하거나, 문서의 내용이 아닌 메타 정보에 관한 검색만이 가능하였다. 본 논문에서는 내용과 필드 구조를 통합하여 가변 필드 구조 문서를 색인 및 검색하는 모델인 교차 필드 검색 모델을 제안한다. 기존 정보검색 시스템의 기능을 기본으로 제공하면서 필드구조를 색인/검색하기 위한 기능적 요구사항을 제시하고, 내용 및 필드 구조를 색인하면서 동적인 삽입/삭제가 가능한 색인 구조를 제안한다. 아울러 검색시에 문서 가중치를 계산하여 문서를 순위조정하는 불리언 모델, 확장 불리언 모델, 벡터 공간 모델의 변형 모델을 제시한다. 아울러 구현 사례로 STEER-XDS 검색 시스템에 대해 알아본다.

  • PDF

Knowledge-poor Term Translation using Common Base Axis with application to Korean-English Cross-Language Information Retrieval (과도한 지식을 요구하지 않는 공통기반축에 의한 용어 번역과 한영 교차정보검색에의 응용)

  • 최용석;최기선
    • Korean Journal of Cognitive Science
    • /
    • v.14 no.1
    • /
    • pp.29-40
    • /
    • 2003
  • Cross-Language Information Retrieval (CLIR) deals with the documents in various languages by one language query. A user who uses one language can retrieve the documents in another language through CLIR system. In CLIR, query translation method is known to be more efficient. For the better performance of query translation, we need more resources like dictionary, ontology, and parallel/comparable corpus but usually not available. This paper proposes a new concept called the Common Base Axis which is adapted to Korean-English Query translation ann a new weighting method in dictionary based query translation. The essential idea is that we can express Korean and English word in one vector space by Common Base Axis and use it in calculating sense distance for query weighting. The experiments show that Common Base Axis gives us good performance without ontology and is especially good for one word query translation.

  • PDF

An Extended Faceted Classification Scheme and Hybrid Retrieval Model to Support Software Reuse (소프트웨어 재사용을 지원하는 확장된 패싯 분류 방식과 혼합형 검색 모델)

  • Gang, Mun-Seol;Kim, Byeong-Gi
    • The Transactions of the Korea Information Processing Society
    • /
    • v.1 no.1
    • /
    • pp.23-37
    • /
    • 1994
  • In this paper, we design and implement the prototype system, and propose the Extended Faceted Classification. Scheme and the Hybrid Retrieval Method that support classifying the software components, storing in library, and efficient retrieval according to user's request. In order to designs the classification scheme, we identify several necessary items by analyzing basic classes of software components that are to be classified. Then, we classify the items by their characteristics, decide the facets, and compose the component descriptors. According to their basic characteristics, we store software components in the library by clustering their application domains and are assign weights to the facets and its items to describe the component characteristics. In order to retrieve the software components, we use the retrieval-by-query model, and the weights and similarity for easy retrieval of similar software components. As the result of applying proposed classification scheme and retrieval model, we can easily identify similar components and the process of classification become simple. Also, the construction of queries becomes simple, the control of the size and order of the components to be retrieved possible, and the retrieval effectiveness is improved.

  • PDF

Reranking Clusters based on Query Term Position and Context (질의의 위치와 문맥을 반영한 클러스터 기반 재순위화)

  • Jo, Seung-Hyeon;Jang, Gye-Hun;Lee, Kyung-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.471-474
    • /
    • 2010
  • 질의와 질의 주변에 나오는 어휘는 의미적으로 연관되어있다는 가정하에 질의뿐만 아니라 질의 주변에 나오는 문맥 어휘들도 가중치를 높여준다면 검색에 효율을 높일 수 있을 것이다. 본 논문에서는 질의와 질의 주변에 나오는 문맥 어휘들에게 가중치를 주어 질의 어휘의 위치 가중치를 반영한 문서를 표현하고, 위치 가중치가 반영된 문서 벡터들 사이의 유사도를 계산하여 클러스터 기반 재순위화를 하여 성능을 향상시키는 방법을 제안한다. 뉴스 집합인 TREC AP 문서를 이용하여 언어모델, 위치 가중치를 이용한 언어모델, 클러스터 기반 재순위화 모델의 비교실험을 통해 유효성을 검증한다.

Image Retrieval based on Kansei-Processing of compound Visual-Information (복합시각정보의 감성처리기반 이미지 검색)

  • Baek, Sun-Kyoung;Hwang, Kwang-Su;Kim, Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.106-110
    • /
    • 2006
  • 현재 공학분야에서 감성을 소재로 진행되는 연구가 급격히 증가되고 있다. 그 중 상품 디자인과 이미지 검색 그리고 HCI(Human Computer Interaction) 분야에서 감성은 더욱 중요한 토픽이 되고 있다. 본 논문은 감성기반의 지능형 이미지 검색을 위한 감성처리 방법을 제안한다. 기존 연구에서는 단일 시각정보만을 고려하였고 이는 감성에 적합한 검색을 위해서 너무 단편적인 결과를 갖는다. 인간의 감성에 보다 적합한 검색을 위하여 우리는 컬러와 형태가 복합된 이미지에 대한 감성을 처리한다. 이를 위해 첫째, 컬러와 형태의 속성을 공통으로 갖는 대표감성을 정의하고 각 속성에 감성 가중치를 부여한다. 둘째, 사용자의 감성의 적합한 이미지 검색을 위하여 각 이미지의 감성정보량을 측정한다. 이를 이미지 검색에 적용하고, 본 저자의 이전 연구 중 단일 정보만을 고려한 감성기반 검색시스템과 사용자 만족도를 이용하여 비교 평가한다. 제안된 방법은 기존의 단일시각정보만을 고려했던 감성기반 이미지 검색보다 향상된 결과를 얻을 수 있었다. 그리고 복합시각정보에 대한 감성을 동시에 처리할 수 있는 연구로써의 의의를 갖는다.

  • PDF

The System of customized Travel Information based on Ontology (온톨로지를 이용한 맞춤형 여행정보 시스템)

  • Cho Mi-Young;Choi Chang;Kim Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.187-189
    • /
    • 2006
  • 본 논문에서는 지능형 여행 정보 제공을 위해 제주여행 온톨로지를 구축하여 사용자별 맞춤형 여행정보 제공 및 검색을 위한 시스템을 제안하고자 한다. 기존의 일반 검색이 제한된 정보에 대한 키워드 매칭이 라면, 온톨로지 기반 검색은 키워드 검색, 사전에 의한 확장 검색, 지식입력에 의한 검색이 모두 가능하여 좀 더 지능적 검색이라 할 수 있겠다. 이러한 온톨로지 검색의 장정으로는 속성값, 분류, 메타 정보 등 관련된 여행정보를 모두 활용할 수 있다는 것과. 유사어 활용이 가능하다는 것이다. 또한 검색 어휘의 역할에 따른 차등적인 가중치값 등을 적용하여 Many-Answers-Problem 해결할 수 있다. 즉, 가장 관련 있는 정보를 상위에 랭크시켜 사용자의 체감 정확률을 향상시킬 수 있다.

  • PDF