• Title/Summary/Keyword: 검색 가중치

Search Result 401, Processing Time 0.028 seconds

The eight decision which it follows in XML tag classification (XML 태그 분류에 따른 가중치 결정)

  • Jeong, Hye-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.703-706
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

Design of a Extended Fuzzy Information Retrieval System usins Users한 Preference (사용자의 선호도를 반영한 확장 퍼지 정보 검색 시스템의 설계)

  • 김대원;이광형
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.90-93
    • /
    • 2000
  • 정보 검색 시스템의 목표는 사용자가 원하는 정보를 빠른 시간 내에 효율적으로 검색하는 것이다. 이를 위해 불리언 모델, 벡터 모델을 비롯한 기존의 많은 검색 모델들과 퍼지 이론에 기반한 퍼지 검색 모델들이 제안되어져 왔다 그러나 기존의 모델들은 관련 문서를 검색하는 데 있어서 사용자의 선호도를 반영하지 못하는 한계점을 지닌다. 본 논문에서는 기존의 퍼지 검색 모델의 단점을 보완하기 위해서 확장 퍼지 검색 모델을 제안하고 설계하였다. 제안하는 모델은 색인어와 문서 가중치의 유사도를 결정하는데 있어서 사용자의 선호도를 반영할 수 있도록 설계하였다.

  • PDF

Automatic Document Classification by Term-Weighting Method (범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템)

  • 이경찬;강승식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.475-477
    • /
    • 2002
  • 자동 문서 분류는 범주 특성 벡터와 입력 문서 벡터의 유사도 비교에 의해 가장 유사한 범주를 선택하는 방법이다. 문서 분류 시스템을 구현하기 위하여 각 범주의 특성 벡터를 정보 검색 시스템의 역파일 형태로 구축하였으며, 용어 가중치를 계산하는 방법을 달리하여 문서 분류 시스템의 정확도를 실험하였다. 실험 문서는 일간지의 신문기사들을 무작위로 추출한 문서 집합을 대상으로 하였으며, 정보 검색 모델에서 보편적으로 사용되는 TF-lDF 방식이 변형된 방식에 비해 더 나은 성능을 보였다.

  • PDF

Using the Information of Location the Improvement of KRISTAL2000 DBMS Retrieval System (이웃한 어절간의 위치 정보를 이용하여 KRISTAL2000 DBMS 검색 성능 향상)

  • 김광영;서정현;최성필
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.121-123
    • /
    • 2002
  • 인터넷의 발달과 인터넷 이용자수의 급격한 증가로 정보 검색 시스템의 필요성이 커지고 있다. 또한 대용량의 문서에서 사용자가 원하는 정보를 정확하게 찾기가 점점 어려워지고 있다. 대부분의 사용자들이 입력한 질의어에 대해서 이웃한 단어를 찾아주기를 원하는 사용자가 많이 있다. 본 논문에서는 KRISTAL2000 DBMS을 이용하여 이웃하는 어절한의 위치 정보를 이용하여 다양한 가중치 방법에 대해서 실험하고 그 결과 가장 우수한 가중치 계산 방식을 적용하여 KRISTAL2000 DBMS의 성능을 향상시키도록 하였다.

  • PDF

Improving Performance of Search Engine Using Category based Evaluation (범주 기반 평가를 이용한 검색시스템의 성능 향상)

  • Kim, Hyung-Il;Yoon, Hyun-Nim
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.1
    • /
    • pp.19-29
    • /
    • 2013
  • In the current Internet environment where there is high space complexity of information, search engines aim to provide accurate information that users want. But content-based method adopted by most of search engines cannot be used as an effective tool in the current Internet environment. As content-based method gives different weights to each web page using morphological characteristics of vocabulary, the method has its drawbacks of not being effective in distinguishing each web page. To resolve this problem and provide useful information to the users, this paper proposes an evaluation method based on categories. Category-based evaluation method is to extend query to semantic relations and measure the similarity to web pages. In applying weighting to web pages, category-based evaluation method utilizes user response to web page retrieval and categories of query and thus better distinguish web pages. The method proposed in this paper has the advantage of being able to effectively provide the information users want through search engines and the utility of category-based evaluation technique has been confirmed through various experiments.

Term Weighting Method for Natural Language Query Sentence (자연언어 질의 문장의 용어 가중치 부여 기법)

  • Kang, Seung-Shik;Lee, Ha-Gyu;Son, So-Hyun;Moon, Byung-Joo;Hong, Gi-Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

A Study on Weighted Hierarchical Color Clustering Using Color Distribution (컬러 분포를 가중치로 이용한 컬러 클러스터링에 관한 연구)

  • 윤위영;범수균;탁우현;이종환;김경석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.250-252
    • /
    • 1998
  • 내용기반 이미지 검색(Content-based image retrieval)에서 컬러 특징을 표현하기 위해 컬러 히스토그램이 많이 이용되고 있다. 하지만 히스토그램의 고차원적인 성질 때문에 색인구조를 사용한 효율적인 검색이 어렵고, 유사도 계산 단계에서 비용이 많이 든다. 이점을 개선하기 위해서 이미지의 컬러 정보 손실을 최소화하면서 히스토그램의 차원을 낮추는 컬러 클러스터링 방법이 제안되었다. 이 논문은 이미지 검색의 응용 분야에 따른 이미지 데이터의 컬러 분포 특성을 이용한 컬러 클러스터링 방법을 제안한다. 컬러 분포를 가중치로 이용한 계층적 컬러 클러스터링 방법에 대해 알아보고, 두 단계 컬러 히스토그램을 이용한 이미지 검색에 적용하여 컬러 정보 유지 능력을 실험해 본다.

Weight Assignments on Keyfacts for Enhancing Precision in Information Retrieval (정보검색에서 정확률의 향상을 위한 키팩트의 가중치 부여)

  • Kim, Su-Hui;Nam, Hyo-Don
    • Journal of KIISE:Databases
    • /
    • v.27 no.4
    • /
    • pp.627-636
    • /
    • 2000
  • 정보검색에서 궁극적으로 지향하는 바는 질의에 대한 정확률과 재현률을 동시에 높이는 것이다. 이 논문에서는 [중심어, 종속어]로 이루어지는 키팩트를 그 유형에 따라 9가지 형태로 분류하였으며. 이 유형들의 주요도를 반영하여 키팩트의 가중치를 계산하는 방법을 개발하였다. 키팩트 유형들에 주요도 값들을 할당한 방법을 검증하기 위한 실험은 질의문들을 이용하여 평균 재현률을 계산함으로써 수행되었다. 9개의 키팩트 타입에 9가지의 주요도 값을 할당하는 방법을 실험하였고 그 결과를 분석하였다. 이 논문의 결과는 기존의 키워드 기반 정보검색에서 문제시되고 있는 정확률을 키팩트 기반 정보 검색에서 향상할 수 있는 가능성을 시사하고 있다.

  • PDF

Similarity Measure for Semantic-based Retrieval using Domain Knowledge (도메인 지식을 이용한 의미 기반 검색을 위한 유사성 측정)

  • Cho, Mi-Young;Choi, Chang;Kim, Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.347-350
    • /
    • 2007
  • 멀티미디어 데이터 처리 요구가 증가함에 따라 이의 의미적 표현 및 검색에 관한 연구가 활발히 이루어지고 있다. 최근에는 특히 지식 기반의 온톨로지를 이용한 의미적 검색에 초점을 두고 있으며, 구축된 온톨로지를 기반으로 동의어 관계, 반의어 관계 등을 이용하여 질의 확장으로 활용되고 있다. 하지만 이들은 대부분 속성 관계 등을 고려하지 않을 뿐만 아니라 각 관계별 가중치를 고려하지 않고 있다. 이에 본 논문에서는 비디오의 의미적 특징들을 추출하여 온톨로지를 구축한 후 의미 기반 검색을 위하여 관계별 가중치를 고려한 유사성 측정을 제안하고자 한다.

  • PDF

Information Retrieval Model Using Anchor Text Information and Link Information (Anchor Text 정보와 링크 정보를 이용한 정보 검색 모델)

  • 한기덕;정성원;허희근;이교운;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.916-918
    • /
    • 2004
  • 90년대 이전에 정보 검색에 대한 연구는 문서의 내용을 기반으로 한 연구가 주류였으며, 90년대에는 링크를 이용한 연구가 활발하였다. 90년대 말에 Page Rank와 HITS가 링크를 이용한 연구의 대표적 사례이며, 최근에는 문서의 내용과 링크 정보를 같이 이용하는 연구가 많이 발표되고 있다. 본 논문도 문서의 정보와 링크 정보를 이용한 새로운 검색 모델을 제시하고자 한다. 본 논문에서 사용하는 링크 정보는 수집된 문서에서 추출한 Page Rank의 가중치와 한 페이지를 가리키는 링크들의 목록이며, 상용하고자 하는 문서의 정보는 본문 내용과 Anchor Text이다. 링크 정보와 문서 정보를 이용하여 Anchor 벡터와 문서 벡터를 만들고, 각각 질의어 벡터와 Cosine Measure를 하여 값을 구한 후, 더한 값을 해당 문서의 가중치로 하여 검색에 이용한다.

  • PDF