• 제목/요약/키워드: 검색 방법

검색결과 5,284건 처리시간 0.034초

동적분류체계를 사용한 웹 검색엔진의 설계 및 구현 (Design and Implementation of Web Search Engine Using Dynamic Category Hierarchy)

  • 박선;최범기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.747-750
    • /
    • 2003
  • 분류검색 방법은 색인검색 방법과 함께 중요한 요소로서 웹 검색 엔진에서 지원되고 있다. 색인검색 방법에서는 검색결과의 재현율이 높지만 검색결과가 너무 많이 나오기 때문에 원하는 검색결과를 찾아내는 것이 어렵다는 단점이 있다. 또한 능숙한 컴퓨터 사용자는 색인검색을 자주 사용하지만, 컴퓨터에 익숙하지 않은 대부분의 사람들은 분류검색 방법을 사용한다. 이러한 이유 때문에 검색엔진에서 분류검색 방법이 반드시 필요하다. 그러나 분류검색 방법은 찾고자 하는 문서의 해당분류가 애매모호하거나 명확하게 알지 못할 때에는 문서를 찾지 못하는 경우가 빈번히 발생한다. 즉, 검색결과의 정확도는 높으나 재현율이 떨어지는 단점이 있다. 본 논문은 이러한 분류검색에 대한 문제점을 해결하기 위해서 분류와 검색어간의 관계를 퍼지논리를 이용하여 정량적으로 계산하고 이를 바탕으로 분류간의 함의관계를 유도함으로써 동적인 분류체계를 구성하는 새로운 웹 검색엔진을 설계하고 구현하였다. 구현된 검색엔진은 분류간의 함의관계를 유사한 하위분류로서 간주함으로써 분류검색 결과의 재현율을 높일 수 있다.

  • PDF

XML 명세에 기반한 소프트웨어 컴포넌트 검색 (Retrieval of Software Component based on XML Specification)

  • 권태삼;이윤수;윤경섭;왕창중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.501-503
    • /
    • 1999
  • 소프트웨어 컴포넌트의 재사용은 새로운 소프트웨어를 개발하기 위해 이미 개발되어진 컴포넌트나 적절하게 수정된 컴포넌트를 사용하는 것이다. 따라서 컴포넌트 저장소에 저장되어 있는 컴포넌트를 효율적으로 검색할 수 있어야 하며, 검색된 컴포넌트를 적용하여 새로운 소프트웨어를 개발할 수 있어야 한다. 이 논문에서는 컴포넌트 저장소에 XML 기반으로 명세된 컴포넌트들의 검색 방법과 소프트웨어 아키텍쳐 재구성을 위한 구조 검색 방법을 제안한다. 제안한 검색 방법에서 시그니쳐 일치 방법은 컴포넌트 검색의 재현율을 향상시키며, 행위 일치 검색은 컴포넌트 검색의 정확성을 향상시킬 수 있다. 또한, 구조 검색 방법은 소프트웨어 아키택쳐의 재구성을 위해 컴포넌트의 구조적인 관점에서 컴포넌트를 검색할 수 있다.

  • PDF

모양 영상 검색을 위한 효율적인 색인구조와 검색방법 (Efficient Index Structure and Search Mehtod for Shape Image)

  • 장용석;김성재;최병걸;안철웅;김승호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.347-349
    • /
    • 1999
  • 본 논문에서는 대규모 영상 데이터베이스로부터 모양 영상에 대한 검색을 빠르고 효율적으로 수행하기 위해 해싱기법을 변형한 색인구조와 검색방법을 제안한다. 제안된 색인 구조는 이진 모양 영상(binary shape image)의 불변 모멘트 집합(invariant moments set)을 특징 벡터로 사용하여 다차원으로 구성된다. 이 색인 구조를 기반으로 제안된 해싱을 변형한 검색방법은 기존의 방법들에 비해 검색공간을 줄임으로써 검색속도를 높인다. 본 논문에서 제안한 색인구조와 검색방법을 1000개의 이진 모양 영상들에 적용해 본 결과 검색공간이 전체 공간의 10% 미만으로 줄어드는 효과가 있었다.

  • PDF

자연어 질의 정보 검색 시스템의 비주제어 탐색 방법을 통한 성능 개선 (Improving the performance of natural language information retrieval system by using non-keyword search methods.)

  • 이승률;강현규;박세영;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.374-377
    • /
    • 1994
  • 본 논문에서는 한글 문서 검색 시스템에서 자연어 질의어로 검색할경우, 질의어를 주제어와 참조어로 나누어 재구성하여 검색하는 방법을 제시하였다. 먼저 주제어로 전문검색을 하여 후보 카드들을 추출한 후 비주제어로 다시 본문 탐색을 하여 추출된 카드의 가중치를 재조정함으로써 카드추출의 정확성을 높였다. 이 논문에 제시된 방법의 실험은 한국전자통신연구소 언어정보연구실에서 개발한 멀티미디어 전자 백과 사전의 자연어 검색모듈에서 행하여 졌다. 이 방법으로 별다른 검색속도의 저하나, 저장공간의 추가가 없이 기존의 검색 방법에서보다 약 58%정도의 검색의 정확성이 올라갔다. 본 논문에서 제시한 검색의 방법은 여러가지 응용의 자연어 인터페이스에서 데이타를 검색하는 정보검색의 분야에 적용되어 정확성을 높일 수 있을 것이다.

  • PDF

클러스터링과 차원축약 기법을 통합한 영상 검색 시스템 (Combined Image Retrieval System using Clustering and Condensation Method)

  • 이세한;조정원;최병욱
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.53-66
    • /
    • 2006
  • 본 논문에서는 전체 차원으로 데이터베이스 내의 모든 영상에 대해 순차적인 검색을 했을 때의 상세 검색 결과와 동일한 적합성을 유지하면서 검색 속도를 훨씬 더 향상시킬 수 있는 통합 검색 시스템을 제안한다. 통합 검색 시스템은 적합성을 유지하는 서로 다른 두 독립적인 시스템이 병합되어 있다. 하나는 특징 벡터 차원 축약을 이용한 2단계 검색 시스템이고 나머지 하나는 이진 트리 클러스터링을 이용한 2단계 검색 시스템이다. 각각의 방법은 1단계에서 상세 검색에서의 검색 결과를 항상 포함하는 후보 영상들을 추출하고, 추출된 후보 영상들을 대상으로 2단계 검색에서 전체 차원으로 재 검색을 한다 그러므로 각 방법과 통합 검색 방법은 모두 상세 검색을 수행했을 때와 동일한 검색 결과를 얻게 된다. 특징 벡터 차원 축약을 이용한 2단계 검색 방법은 Cauchy- Schwartz 부등식의 성질을 이용하여 특징 벡터를 차원 축약하여 검색에 사용하는 방법이다. 이때 전체 검색 시간을 최소로 하는 최적 차원 축약율이 존재하게 되고, 이를 후보 영상 추출을 위한 1차 검색에 적용하게 된다. 이진 트리 클러스터링을 이용한 2단계 검색 방법은 재귀적인 2-means 클러스터링을 통해 각 클러스터의 반경이 동일하게 동적으로 분할하는 방법이다. 동일한 적합성 유지를 위해 유사도 기준이 보정된 질의를 통해 1단계 검색에서 후보 클러스터를 추출하고, 2단계 검색에서 후보 클러스터 내의 영상을 대상으로 최종 결과 영상들을 얻게 된다. 통합 검색 방법은 위의 두 검색 방법을 통합한 것으로 서로 독립적인 두 방법을 동시에 적용함으로써 검색 시스템의 성능을 훨씬 더 향상시킬 수 있다 제안하는 방법은 상세 검색의 적합성을 유지하면서도 검색 속도를 훨씬 더 향상시킬 수 있음이 실험을 통해 입증되었다.

사이트 검색을 위한 메타 검색 (Metasearch for Website Finding)

  • 이여진;강인호;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.245-252
    • /
    • 2002
  • 여러 검색 엔진이 낸 결과를 결합하여 성능의 향상을 얻고자 하는 정보 검색 방법을 메타 검색(metasearch)이라고 한다. 정보 검색에서의 사용자 요구가 다양화되고 있지만, 기존의 메타 검색에 관한 연구는 이를 제대로 반영하지 못하고 웹 문서를 대상으로 검색(topic relevance task)한 결과를 결합하는 데에만 치중해 있다. 최근에는 사이트 검색(entry page finding task)만을 목적으로 한 시스템도 개발되고 있다. 본 논문에서는 사이트 검색 엔진들의 결과를 결합하는 메타 검색 방법을 제시한다. 웹 문서 검색 결과를 결합시에는 여러 검색 엔진에서 중복(overlap)하여 나타난 문서에 가중치를 두는 방법이 효과적이다. 하지만 이 방법을 그대로 사이트 검색에 적용하면 웹 문서 검색에서와 같은 좋은 결과를 낼 수 없다. 본 논문에서는, 여러 검색 엔진에 중복하여 나타난 문서에 가중치를 두는 것보다는 그 문서가 속한 사이트를 고려하여 사이트 단위로 중복된 정도를 반영하는 것이 사이트 검색 엔진의 견과를 결합하는 데 더 효과적임을 보인다.

  • PDF

웹 검색 환경에서 범주의 동적인 분류 (Dynamic Classification of Categories in Web Search Environment)

  • 최범기;이주홍;박선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권7호
    • /
    • pp.646-654
    • /
    • 2006
  • 분류검색 방법은 색인검색 방법과 함께 중요한 요소로서 웹 검색 엔진에서 지원되고 있다. 사용자가 분류나 색인검색 방법 중 하나를 이용하여 원하는 검색결과를 찾지 못하면 다른 검색방법을 이용하여 찾을 수 있도록 대부분의 검색엔진에서는 두 가지 방법 모두 지원하고 있다. 색인검색 방법에서는 검색결과의 재현율이 높지만 검색결과가 너무 많이 나오기 때문에 원하는 검색결과를 찾아내는 것이 어렵다는 단점이 있다. 분류검색 방법은 찾고자 하는 문서의 해당 분류가 애매모호하거나 명확하게 알지 못할 때에는 문서를 찾지 못하는 경우가 빈번히 발생한다. 즉, 검색결과의 정확도는 높으나 재현율이 떨어지는 단점이 있다. 본 논문은 이러한 문제점을 해결하기 위해서 분류와 검색어간의 관계를 퍼지논리를 이용하여 정량적으로 계산하고 이를 바탕으로 범주간의 함의관계를 유도함으로써 동적인 범주체계를 구성하는 새로운 방법을 제시한다. 이 방법의 장점은 범주간의 합의관계를 유사한 하위범주로 간주함으로써 분류검색 결과의 재현율을 높일 수 있다는 것이다.

XML 문서의 변경을 고려한 XML 전문 검색 역인덱스 (Update conscious and depth insensitive inverted indexes for XML full-text queries)

  • 권국봉;홍동권;김권양
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.81-84
    • /
    • 2004
  • XML 문서는 관계형 테이블과는 달리 문서의 구조가 매우 복잡하고 불규칙하여 부분적인 정보를 최대한 활용하는 전문 검색이 일반적인 구조적 검색보다 더 중요한 역할을 한다. XML 문서는 계층이 있으므로 계층을 사용하는 전문 검색 연산은 계층을 제공함으로써 검색 공간을 줄여서 검색의 정확성과 효율성을 훨씬 더 높일 수 있다. 전문 검색 연산을 효과적으로 지원하기 위한 방법으로는 역인덱스를 (inverted index) 사용하는 것이 가장 일반적인 방법이다. 지금까지의 전문 검색을 위한 XML 문서의 구조 정보를 표현, 저장하는 방법들은 문서의 내용이 변경되지 않는 정적 문서(static documents)만을 고려하여 왔다. 이 방법들은 문서가 동적으로 변화할 경우 저장된 문서의 구조 정보 중에서 많은 부분을 다시 표현해야 하는 비효율적인 면이 있다. 본 논문은 XML 문서의 동적인 변화를 지원하면서 동시에 복잡한 XML 전문 검색을 지원하기 위한 방법으로 경로 스트링을 사용하는 효율적인 역 인덱스 구축 기법을 제안하고 제안하는 방법이 복잡한 문서의 검색과 문서의 동적인 변화를 효율적으로 검색할 수 있음을 보인다.

  • PDF

오디세우스/parallel-OOSQL: 오디세우스 객체 관계형 데이터베이스 관리 시스템을 사용한 병렬 정보 검색 시스템 (ODYSSEUS/Parallel-OOSQL: A Parallel Information Retrieval System Using the Odysseus Object-Relational Database Management System)

  • 류재준;이재길;이민재;황규영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2002
  • 인터넷의 성장과 함께 전자적인 형태로 표현되는 정보의 양이 급격하게 증가함에 따라, 문서를 병렬적으로 검색하는 병렬 정보 검색이 많은 양의 문서에 대한 빠른 검색을 지원하는 것에 있어 더욱 중요한 역활을 하고 있다. 병렬 정보 검색 시스템을 구현하기 위해서는 역 색인을 분활하고 분활된 역 색인을 병렬적으로 검색하는 것이 필요하다 역 색인을 분활하는 방법으로는 다음과 같은 두 가지 방법이 있다: 1) 문서 식별자를 기반으로 하는 분활 방법과 2) 키워드 식별자를 기반으로 하는 분활 방법. 그러나 각 방법은 단점들을 가지고 있다. 본 논문에서는 정보 검색 기능이 밀결합된 데이터베이스 관리 시스템인 오디세우스를 사용하여 병렬 정보 검색 시스템을 설계하고 구현한다. 첫째로, 기존의 역 색인 분할 방법을 분석하고 각 분말 방법의 단점들을 보완할 수 있는 혼합 분활 방법을 제안한다. 둘째로, 많은 양의 문서에 대해 성능 저하의 원인이 되는 대형 포스팅을 분할 하는 방법을 제안한다. 마지막으로 제안된 시스템의 유용성을 보이기 위해 실험을 수행한다. 예제 데이터베이스로서는 이백만 건의 웹 페이지를 사용한다. 실험 결과, 질의 저리 시간이 역 색인 분말의 블록의 개수에 근사하게 비례하여 줄어들고 시스템이 좋은 확장성을 가짐을 보인다.

  • PDF

지능형 정보검색을 위한 지식 기반 시소러스 (A Knowledge Based Thesaurus for Intelligent Information Retrieval)

  • 정정호;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.12-14
    • /
    • 1998
  • 지식구조로 시소러스를 이용하는 기존의 정보검색 시스템들이 사용자에게 만족할 만한 검색결과를 제시하지 못하고 있다. 이것은 기존의 정보검색 시스템들이 이용하고 있는 시소러스 구조가 사람의 지식구조와 다르고, 시소러스를 이용하는 검색 방법이 사람의 검색 방법과 차이가 있기 때문이다. 본 논문에서는 어떤 분야의 인간 전문가가 해당분야에 관한 전문지식이 없는 일반인이 필요로 하는 정보를 찾아주는 방법을 모델링한 지능형 정보검색 시스템을 개발하기 위하여 인간 전문가의 지식구조를 모방한 시소러스 구조를 설계하였고, 인간 전문가의 검색 방법을 모방한 검색 방법을 고안하였다. 설계된 시소러스 구조에는 인간 전문가의 지식구조 내에 표현되어 있는 여러 종류의 관계들이 포함되어있고, 고안된 검색방법은 관련도를 사용자의 질의어와 확장된 색인어 사이의 관계의 종류를 추론한 결과와 거리 단계를 고려하여 평가한다.

  • PDF