• Title/Summary/Keyword: 검색 성능 평가

Search Result 777, Processing Time 0.028 seconds

Design and performance Evaluation of Vertically-Parteitioned Parallel Signature File Method) (수직 분할 병렬 요약화일 기법의 설계 및 성능평가)

  • Kim, Jeong-Gi;Yu, Gyeong-Min;Jang, Jae-U
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.1
    • /
    • pp.66-79
    • /
    • 1999
  • 요약화일 기법은 대규모 데이터베이스 응용에서 효율적인 색인 기법으로 알려져 있으며 최근에는 보다 빠른 검색을 위해 병렬 요약화일 기법이 제안되고 있다. 본 논문에서는 효율적으로 병렬 처리를 할 수 있는 수직 분할 병렬 요약화일(Vertically-partitioned Parallel Signature File, VPSF) 기법을 제안한다. 본 VPSF는 동적인 환경에 잘 적응하도록 신장해싱을 이용하며, 검색의 효율성을 위해 프레임 슬라이스 기법을 사용한다. 실행의 편중을 없애기 위해 요약을 수직으로 분할하여 레코드를 프로세싱노드에 저장함으로써 병렬처리를 수행한다. 뿐만 아니라, 본 논문에서는 VPSF의 효율성을 보이기 위해 성능평가 모델을 제시하고, 실제의 레코드 집합을 가지고 실험을 실시하여 검색시간, 부가저장공간, 삽입시간에 대해 성능을 평가한다. 또한 레코드 집합의 분포에 다른 성능을 평가하기 위해 표준편차를 반으로 줄인 반 정규분포와 두 배로 크게 한 정규분포에 대한 성능평가를 실시한다. VPSF기법은 기존의 병렬 요약화일 기법들과 비교할 때, 실제 레코드 집합의 정규분포에서 기존의 Hamming filter 보다 평균 40% 정도 검색성능이 개선된다. 반 정규분포에서는 Hamming filter 보다 약 50% , HPSF보다 약 20% 정도 개선된 검색 성능을 보인다. 뿐만 아니라, 부가 저장공간 및 삽입시간에도 기존의 방법들보다 좋은 성능을 보인다. 일반적으로 VPSF는 데이터베이스의 레코드 크기가 서로 비슷할 때 그리고 데이터베이스의 크기가 클수록 우수한 검색 성능을 보인다.

A Study on the Performance Evaluation of Semantic Retrieval Engines (시맨틱검색엔진의 성능평가에 관한 연구)

  • Noh, Young-Hee
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.22 no.2
    • /
    • pp.141-160
    • /
    • 2011
  • This study suggested knowledge base and search engine for the libraries that have the largescaled data. For this purpose, 3 components of knowledge bases(triple ontology, concept-based knowledge base, inverted file) were constructed and 3 search engines(search engine JENA for rule-based reasoning, Concept-based search engine, keyword-based Lucene retrieval engine) were implemented to measure their performance. As a result, concept-based retrieval engine showed the best performance, followed by ontology-based Jena retrieval engine, and then by a normal keyword search engine.

An Adaptive Peer-to-Peer Search Algorithm to Reform Resource-Directionality (자원 방향성 개선을 위한 적응적 P2P 검색 알고리즘)

  • Kim Boon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.573-576
    • /
    • 2006
  • 기존의 인폼드 검색 모델에서 자원 보유 피어의 검색 결과는 검색 과정에서 선택된 피어들 각각의 라우팅 결정 정보로 저장되는데, 자원 적중률에 따라 다음 피어를 선택할 때 주요 결정 요인으로 작용한다. 이러한 라우팅 결정 정보를 이용하여 검색 트래픽과 검색 성공률 등의 측면에서 기존의 Random Walks 등에 비해 효과적인 성능 평가 결과를 보인 LTO(Leveled The Orienteering) 검색 알고리즘은 검색 과정에서의 라우팅 경로가 편중되어 있어 해당 노드들에 검색 부하 집중 경향을 보인다. 이에 본 논문에서는 검색 적중 빈도에 다라 LTO 검색 알고리즘이 검색 과정상에서 라우트 대상 노드들의 성능을 고려한 적응적 P2P 검색 알고리즘으로 확장 제안한다. 제안한 알고리즘의 성능 평가 결과 노드들의 검색 부하 집중률과 자원 검색 노드의 검색 성공률 측면에서 적절한 타협점에서 동작함을 확인하였다.

  • PDF

A Design and Implementation of Ontology-based Retrieval System for the Electronic Records of Universities (대학 전자기록물을 위한 온톨로지 기반 검색시스템 설계 및 구현)

  • Lee, Jung-Hee;Kim, Hee-Sop
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.3
    • /
    • pp.343-362
    • /
    • 2007
  • The purpose of this study is to design and implement an ontology-based retrieval system for the electronic records of universities and to compare its performance with the existing keyword-based retrieval system. We used OntoStudio 1.4 for implementing an ontology-based retrieval system, and the test collection consisted of the following: (1) 5,099 electronic records of the 'personnel management notification' created by Korea Maritime University, (2) 20 topics (10 short-topics and 10 long-topics), and (3) the relevant assessments were conducted by the group of human experts. 10 university staff participated in the experiment of keyword-based searching and used the same test collection as used in the experiment of ontology-based searching. The ontology-based retrieval system outperformed to the keyword-based retrieval system in terms of Recall and Precision, and the same results showed in the test of the short-topics and long-topics comparison.

An Experimental Study on Retrieval Performance of WWW Search Tools (WWW 탐색도구의 검색성능에 관한 실험적 연구)

  • 이은주;정영미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.59-62
    • /
    • 1997
  • 본 연구는 WWW 탐색도구의 검색성능을 평가하고, 또 검색성능에 영향을 미치는 요인들을 밝혀내기 위하여 수행되었다. 탐색도구의 데이터베이스 구축방식과 색인기법, 탐색기법, 이용자 인터페이스에 관련된 현황분석을 토대로 탐식도구의 검색성능에 영향을 미치는 요인들을 알아보기 위하여 검색실험을 수행하였다. 실험결과의 분석은 각 탐색도구의 검색효율과 검색결과의 중복도 및 유사도, 검색결과의 순위 및 적합성 순위부여 알고리즘. 웹 문서의 수집기법, 탐색도구의 최신성을 기준으로 이루어졌다.

  • PDF

Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model (확률적 정보 검색 모델에서의 유사 적합성 피드백 실험)

  • Cho, Bong-Hyun;Lee, Chang-Kee;An, Joo-Hui;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System (음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가)

  • 김태수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

Noun Extraction System in Information retrieval System of "Mirine" (미리내 검색시스템의 명사추출 시스템)

  • Kim, Young-Kwan;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.89-91
    • /
    • 1999
  • 이 논문은 한국어 정보검색 시스템 "미리내"의 내부 모듈인 색인어 추출 시스템의 성능 평가에 관한 내용이다. 성능 평가를 위해서 99년 ETRI에서 실시한 "형태소분석기 및 태거 비교 분석대회(MATEC99)"의 시험어절을 사용하였다. 정보검색 시스템 "미리내"는 한국어 정보검색을 위해 부산대학교에서 개발한 시스템이다. 한국어 형태소분석 및 태거 대회(MATEC99)를 위해 미리내 검색엔진의 색인어 추출 모듈을 일부 수정하여 명사를 추출하였다. 명사추출기이든 형태소분석기이든 응용프로그램의 특성에 맞춰져서 동작한다. 정보검색의 하위 모듈인 색인어 추출 시스템은 정보검색을 위해 변형된 결과를 출력하므로 성능 비교를 위해 일부 모듈의 수정이 불가피하였다. ETRI에서 실시한 MATEC99는 지금까지 객관적인 평가 기준이 없었던 한국어 형태소분석기, 태거, 명사추출기의 표준화에 중요한 역할을 하였다.

  • PDF

The Performance Evaluation of IHWA Electronic Commerce Search Component System (사용자 훈련 가능한 IHWA 전자상거래 검색 컴포넌트 시스템의 성능평가)

  • 백인천;신재욱;임경수
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.133-136
    • /
    • 2000
  • 수많은 인터넷 쇼핑몰들과 상품검색 시스템이 생겨났지만 사용자가 일하는 상품정보를 얻기 위해 많은 노력이 있어왔다. 각각의 쇼핑몰들의 개성과 가격, 그리고 부가서비스를 비교하는 것 또한 일반 사용자의 입장에서 수많은 몰들을 다 검색한다는 것은 매우 힘든 일이다. 제안된 IHWA(Information Harvest WArehouse) 상품검색 시스템은 정확하고 많은 정보를 사용자들로부터 직접 받아 자체 저장소에 저장할 수 있는 검색 컴포넌트 시스템이다. 본 논문에서는 IHWA 상품 검색 컴포넌트 시스템에 대한 성능평가 및 개선방향을 제안한다.

  • PDF

Retrieval Performance of XML Documents Using Object-Relational Databases (객체-관계형 데이터베이스에 의한 XML문헌의 검색성능 평가)

  • Kim, Hee-Sop
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.2
    • /
    • pp.189-210
    • /
    • 2004
  • The purpose of this study is to evaluate the performance of XML retrieval based on ORDBMSs(Object-Relational Database Management Systems) approach. This paper describes indexing and retrieval methods for XML documents and the methodologies of experiments at INEX(Initiative for the Evaluation of XML retrieval). Like any other traditional information retrieval experiment, the test collection was consists of documents, topics/queries, task, relevance assessments and evaluation. EXIMA$^{TM}$ Supply, a kind of native XML DB based on ORDBMS technologies, is used for this experiment. Although this approach has many benefits, for example, no delay in storing and searching XML documents. but it showed relatively disappointed retrieval performance at INEX 2002. This result may caused since the given topics had to be decomposed and modified to be processed by the XPath processor, and during this modification the original meaning of topics can be changed inevitably and some important information nay pass over.r.