• Title/Summary/Keyword: 검색 성능 평가

Search Result 777, Processing Time 0.055 seconds

User-oriented Paper Search System by Relative Network (상대네트워크 구축에 의한 맞춤형 논문검색 시스템 모델링)

  • Cho Young-Im;Kang Sang-Gil
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.287-289
    • /
    • 2006
  • 이 논문은 사용자의 쿼리와 사용자의 행동양식을 바탕으로 상대네트워크를 구축함으로써 개인화된 논문검색 시스템을 모델링한 것이다. 제안하는 시스템은 사용자가 검색한 논문에서 키워드의 빈도수를 분석하여 개인적 상대네트워크를 구축하게 되는데, 이 네트워크는 다운로드, 열기, 삭제 등과 같은 사용자의 행동으로부터 키워드간 가중치를 조정을 함으로써 구축된다. 시스템의 성능평가를 위해 100명의 사용자들을 대상으로 실험한 결과, 기존의 검색엔진을 사용했을 때보다 성능이 우수하여 사용자 만족도가 높게 나타남을 알 수 있었다

  • PDF

Splitting policies using trajectory clusters in R-tree based index structures for moving objects databases (이동체 데이터베이스를 위한 R-tree 기반 색인구조에서 궤적 클러스터를 사용한 분할 정책)

  • 김진곤;전봉기;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.37-39
    • /
    • 2003
  • 이동체 데이터베이스를 위한 과거 궤적 색인으로 R-tree계열이 많이 사용된다. 그러나 R-tree계열의 색인은 공간 근접성만을 고려하였기 때문에 동일 궤적을 검색하기에는 많은 노드 접근이 필요하다. 이동체 색인의 검색에서 영역 질의와 궤적 질의는 공간 근접성과 궤적 연결성과 같이 상반된 특징으로 인하여 함께 고려되지 않았다. 이동체 색인에서 영역 질의의 성능개선을 위해서는 노드 간의 심한 중복과 사장 공간(Dead Space)을 줄여야 하고, 궤적 질의의 성능 개선을 위해서는 이동체의 궤적 보존이 이루어져야 한다. 이와 같은 요구 조건을 만족하기 위해, 이 논문에서는 R-tree 기반의 색인 구조에서 새로운 분할 정책을 제안한다. 제안하는 색인 구조의 노드 분할 정책은 궤적 클러스터링을 위한 동일 궤적을 그룹화해서 분할하는 공간 축 분할 정책과 공간 활용도를 높이는 시간 축 분할 정책을 제안한다. 본 논문에서는 R-tree기반의 색인 구조에서 변경된 분할 정책을 구현하고, 실험 평가를 수행한다. 이 성능 평가를 통해서 검색성능이 우수함을 보인다.

  • PDF

Design and Performance Evaluation of an Efficient Index Mechanism for Real-Time MMDBMS (실시간 MMDBMS 를 위한 효율적인 색인 기법의 설계 및 성능평가)

  • Min, Young-Soo;Shin, Jae-Ryong;Yoo, Jae-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.61-64
    • /
    • 2001
  • 본 논문에서는 실시간 MMDBMS 를 위한 효율적인 색인 기법을 제안한다. 기존의 주기억장치 트리 기반 색인 구조는 범위 검색을 효과적으로 지원할 수 있지만 한 노드에 대한 접근시간과 평균 접근시간의 차이가 클 수 있기 때문에 실시간 특성을 보장하지 못하는 단점이 있다. 또한 해시 기반 색인 구조는 간단한 검색에서 접근 시간이 매우 빠르고 일정하지만 범위 검색을 지원하지 못하는 단점이 있다. 이러한 두 색인 구조의 단점을 해결하기 위해 본 논문에서는 동적 확장이 가능하며 검색 시간이 빠르고 실시간 특성을 지원할 수 있는 ECBH(Extendible Chained Bucket Hashing)와 범위 검색에 더욱 효과적인 $T^{\ast}$-트리를 상호보완적으로 결합하여 Hyper-TH(Hyper Tree-Hash)라는 실시간 MMDBMS 에 적합한 새로운 색인 기법을 제안하고 구현한다. 그리고 성능 평가를 통해 제안하는 색인 기법의 우수성을 증명한다.

  • PDF

A Quality Value Algorithm based on Text/Non-text Features in Q&A Documents (텍스트/비텍스트 특성기반 질의답변문서의 품질지수 알고리즘)

  • Kim, Deok-Ju;Park, Keon-Woo;Lee, Sang-Hun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.105-108
    • /
    • 2010
  • 쌍방향으로 질문과 답변을 하는 커뮤니티 기반의 지식검색서비스에서는 질의를 통해 원하는 답변을 얻을 수 있지만, 수많은 사용자들이 참여함에 따라 방대한 문서 속에서 검증된 문서를 찾아내는 것은 점점 더 어려워지고 있다. 지식검색서비스에서 기존 연구는 사용자들이 생성한 데이터 즉 추천수, 조회수 등의 비텍스트 정보를 이용하거나 답변의 길이, 자료첨부, 연결어 등의 텍스트 정보 이용하여 전문가를 식별하거나 문서의 품질을 평가하고, 이를 검색에 반영하여 검색성능을 향상시키는 데 활용했다. 그러나 비텍스트 정보는 질의/응답의 초기에 사용자들에 의해 충분한 정보를 확보할 수 없는 단점이 제기 되며, 텍스트 정보는 전체의 문서를 답변의 길이, 자료 첨부등과 같은 일부요인으로 판단해야하기 때문에 품질평가의 한계가 있다고 볼 수 있겠다. 본 논문에서는 이러한 비텍스트 정보와 텍스트 정보의 문제점을 개선하기 위한 품질평가 알고리즘을 제안한다. 제안된 알고리즘을 통한 품질지수는 텍스트/비텍스트 정보와 소셜 네트워크 사용자 중앙성을 고려하여 질문에 적합하고 신뢰성 있는 답변을 랭킹화 함으로써 지식검색문서를 분별하는 지표가 되며, 이는 지식검색서비스의 성능향상에 기여를 할 수 있을 것으로 기대된다.

  • PDF

Performance Evaluation of Fuzzy Thesaurus for Component Retrieval (컴포넌트 검색을 위한 퍼지 시소러스의 성능 평가)

  • 채은주;한정수;김귀정
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.05a
    • /
    • pp.411-415
    • /
    • 2003
  • This paper compared fuzzy thesaurus through query extension with existent thesaurus and direct matching retrieval etc. Performance of fuzzy thesaurus is evaluated by the recall and precision through simulation. An experiment did through assessment that use critical value, query extension, and reusability satisfaction. As a result of the experiment, we knew component retrieval efficiency of fuzzy thesaurus excels.

  • PDF

The Meta Search Agent using Ranking Algorithm with Link Structure Analysis (링크 구조 기반의 순위 알고리즘을 이용한 메타 검색 에이전트)

  • 김형욱;김민구;최경희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.373-375
    • /
    • 2002
  • 하이퍼 텍스트 구조의 특성을 이용한 순위 평가 알고리즘 중의 하나인 HITS 알고리즘은 웹 페이지들의 상호간에 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하여 순위에 따른 결과를 제시한다. 그러나 초기의 HITS 알고리즘은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적인 단점을 가지고 있다. 본 논문에서는 여러 웹 검색 엔진들로부터 얻어진 문서 집합에 수정된 HITS 알고리즘을 수행하는 메타 검색 에이전트를 설계하여 보다 나은 검색 성능을 구하고, 결과의 지역성을 보완한다.

  • PDF

A Study of Personalized Retrieval System Evaluation (개인화 검색시스템 평가에 관한 연구)

  • Kim, Kwang-Young;Choe, Ho-Seop;Jin, Du-Suk;Kim, Jin-Suk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.39-42
    • /
    • 2010
  • 본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색 시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글 테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.

  • PDF

Performance Evaluation of Spatial-match Representation Scheme Supporting Ranking (순위부여를 지원하는 공간배치 표현 기법의 성능평가)

  • 김연중;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.253-255
    • /
    • 1998
  • 멀티미디어 정보 검색 응용에 있어서 관련성 있는 멀티미디어 문서를 검색하기 위해 이미지에 대한 내용-본위 검색이 필수적이다. 이를 위하여 이미지를 몇 개의 인식 가능한 심볼 즉, 아이콘으로 표현하고, 주어진 문서를 대표하는 값으로 받아들여 색인을 한다. 사용자가 이미지에 대한 내용-본위 검색을 요구하면, 질의에 있는 이미지를 아이콘으로 변환한 후, 접근 기법을 통하여 원하는 이미지를 검색한다. 이를 위해 많은 아이코닉 표현 기법이 제안되었다. 본 논문에서는 SRR과 기존의 9DLT방법 및 SMR 방법과 검색효율 면에서 성능 비교를 수행한다. 마지막으로 성능 실험을 통하여 제안한 방법이 기존의 9DLT 및 SMR 방법에 비해 정확률 측면에서 약 0.1 재현율 측면에서 약 0.2 만큼 우수함을 보인다.

Performance Evaluation of XML Document Storage System (XML 문서 저장 시스템의 성능 평가)

  • 박민경;홍의경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.82-84
    • /
    • 2001
  • 최근 정보교환을 위한 표준으로 XML의 활용이 늘어나면서 XML 문서의 저장 및 검색에 관한 연구가 활발히 진행되어 왔다. 본 연구에서는 저장하부구조로서 객체관계 데이터베이스시스템(Odysseus)뿐만 아니라 RDBMS를 이용하여 XML 문서 저장 시스템의 성능을 평가한다. XML 문서가 특정 DTD(Document Type Definition)를 따르게 되면 XML 문서를 파싱하고 그에 맞는 스키마를 설계해야 하는 단점이 있지만 DTD와 결합된 XML 문서는 XML-QL과 같은 질의 언어를 사용하여 휠씬 다양만 질의를 수행할 수 있게 한다. 따라서 DTD 의존적인 XML 문서 저장 시스템을 특정 자료를 통해 설계해 볼 필요가 있다. 여기서는 증권 정보를 이용해서 저장 시스템을 설계하고 대용량 데이터의 검색 시간을 측정함으로써 이 시스템의 성능을 평가한다. 또한 시스템간의 성능을 비교하고 성능 개선을 위한 방법을 제시한다.

  • PDF

The development of a document retrieval system using thesaurus and signature file (시소러스 및 요약화일을 이용한 문서 검색시스템)

  • Jeong, Sang-Cheol;Shin, Dong-Wook
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.400-408
    • /
    • 1994
  • 본 논문에서는 요약화일을 이용하여 복합명사를 효율적으로 처리하며 시소러스를 이용하여 검색하는 한글문서 검색시스템을 제안한다. 본 한글문서 검색 시스템은 한글문서를 대상으로 색인하는 자동색인기와 사용자의 질의를 받아 관련된 문서를 검색하는 검색기로 구성된다. 자동색인기는 우선 한글문서를 대상으로 최장일치 방법으로 명사들을 출출한 후 복합명사의 패턴을 분석하여 복합명사의 가능성이 높은 것들을 복합명사화한다. 두번째로 이들 복합명사들을 1+2SP 방식으로 코딩한 후 요약화일 방법을 이용하여 요약화일을 작성한다. 검색기는 사용자 질의어를 받아 명사들을 추출한 후 시소러스를 이용하여 질의어를 확장한다. 다음 확장된 질의어를 1+2SP 방식으로 코딩한 후 관련된 문서를 검색한다. 본 논문에서는 한국통신에서 만든 코퍼스를 이용하여 제안된 방법의 성능을 평가하였는데 복합명사 처리 및 시소러스 이용방식이 효율적임이 입증되었다. 또한 KAIST에서 개발한 문서검색 시스템보다 동일한 코퍼스로 실험하였을 경우 재현률 및 정확률이 $7{\sim}8%$ 정도 앞서 기존의 시스템보다도 성능이 우수하다는 것이 밝혀졌다.

  • PDF