• 제목/요약/키워드: 불리언 검색

검색결과 37건 처리시간 0.019초

내용기반 음악검색 시스템의 비교 분석 (A Comparative Analysis of Content-based Music Retrieval Systems)

  • 노정순
    • 정보관리학회지
    • /
    • 제30권3호
    • /
    • pp.23-48
    • /
    • 2013
  • 본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

재사용 부품 검색 시스템에서 객체기반 시소러스를 이용한 패싯 질의의 확장 (Facet Query Expansion with an Object-Based Thesaurus in Reusable Component Retrieval Systems)

  • 최재훈;김기헌;양재동;이동길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권2호
    • /
    • pp.168-179
    • /
    • 2000
  • 패싯기반 재사용 부품 검색 시스템에서 사용자가 검색하고자 하는 부품들의 특징은 일반적으로 패싯 질의에 의해 명시된다. 본 논문에서는 객체기반 시소러스를 이용하여 사용자의 검색 요구를 명확히 표현할 수 있는 확장된 패싯 질의를 정형화하며, 이 질의를 평가할 수 있는 부품 검색 시스템을 설계하고 구현한다. 시스템의 정확한 검색을 위해 사용자 질의는 검색하고자 하는 부품들의 특징을 구체적으로 명시할 수 있어야 한다. 그러나, 기존의 패싯 질의는 단지 사용자에 의해 직접 입력된 패싯 값들의 나열로만 표현되기 때문에 구체적인 사용자 의도를 자연스럽게 표현할 수 없다는 단점을 가지고 있다. 본 논문에서 정형화되는 확장된 패싯 질의는 이 단점을 보완하기 위해 퍼지 불리언 연산자와 객체기반 시소러스를 이용한다. 전자는 패싯 질의와 관련 부품에 대한 퍼지 연관 정도를 논리적으로 표현할 수 있게 하며, 후자는 사용자가 구체적인 의미의 패싯 값들을 질의에 쉽게 이용할 수 있도록 한다. 즉, 사용자는 시소러스 질의를 통해 자신의 의도와 의미적으로 일치하는 패싯 값들을 그 퍼지 관련 정도와 함께 시소러스로부터 효과적으로 탐색할 수 있으며, 사용자가 요구할 경우 검색 시스템은 이들을 이용하여 퍼지 패싯 질의를 자동으로 구성할 수도 있다.

  • PDF

질의로그 데이터에 기반한 특허 및 상표검색에 관한 연구 (Analysis of Korean Patent & Trademark Retrieval Query Log to Improve Retrieval and Query Reformulation Efficiency)

  • 이지연;백우진
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.61-79
    • /
    • 2006
  • 본 연구는 특허 및 상표 검색 개선을 위한 방법을 제안하고자 하는 목적에서 출발하였다. 이를 위해 193일간 한국 특허정보원의 특허기술정보서비스를 이용한 17,559명의 이용자가 작성한 100,016개의 질의문에 대한 로그 데이터를 분석하였다. 개별적인 질의로그 분석 이외에, 2,202개의 복수 질의문을 이용한 탐색세션을 분석함으로써 검색 개선을 위한 추가적인 단서를 발견하였다. 분석결과에 의하면, 특허 및 상표검색은 일반적인 웹 검색의 유형과 유사한데, 특히 질의문의 길이가 짧다는 측면에서 매우 흡사하다. 그러나 특히 및 상표검색의 경우, 일반 웹 검색보다 불리언 연산자를 많이 사용하고 있었다. 복수 질의문 분석을 통해 이용자들이 질의문을 재작성하는데 도움이 될 수 있는 탐색기능을 제안할 수 있었다. 복수의 질의문으로 구성된 탐색세션을 분석한 결과, 이용자들은 질의문을 재작성하기 위하여 부연하기, 특정화하기, 일반화하기, 교체하기, 중단하기와 같은 방법을 사용하고 있음을 알 수 있었다.

한국어 웹 정보검색 시스템의 정확도 향상을 위한 연관 피드백 에이전트 (Relevance Feedback Agent for Improving Precision in Korean Web Information Retrieval System)

  • 백준호;최준혁;이정현
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1832-1840
    • /
    • 1999
  • 기존의 한국어 웹 정보 검색 시스템은 대부분이 불리언 검색 시스템이므로 사용자가 원하는 정보를 한 번의 질의에 의해 얻기가 매우 어렵다. 또한 생략이 빈번하고 링크가 많은 웹 문서의 특성상 기존의 역문헌 빈도에 의한 키워드 선정은 중의성의 문제를 가중시켜 부적절한 키워드가 추출된다. 따라서 원하는 정보를 얻을 때까지 사용자는 질의어의 수정을 반복한다. 본 논문에서는 이러한 문제를 해결하기 위해 연관 피드백(Relevace Feedback) 에이전트 시스템을 설계하고 구현하였다. 연관 피드백 에이전트 시스템은 사용자의 선호 키워드에 대한 적합 문서를 추출하여 선호 키워드를 선호 DB 테이블로 저장하였다가 사용자가 추후에 검색할 때 사용자 질의에 연관 키워드를 추가하여 검색한다. 이 결과로 사용자의 질의 수정의 횟수를 줄이고 검색 효율을 향상시킬 수 있었다.

  • PDF

불리언 질의 구성 알고리즘의 시간복잡도 분석 (Time Complexity Analysis of Boolean Query Formulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.709-719
    • /
    • 1997
  • 알고리즘의 성능은 여러 측면에서 측정할 수 있다 하나의 질의 구성(Quvery Formulaiton)알고리즘이 개발되었다고 가정할때, 이 알고리즘 검색 성능의 효과과성 (재현율과 정확율)이 다른 알고리즘에 비해 우수하다하였도 질의 작성 시간적인 측면, 즉 효율성에서 다른 알고리즘에 뒤진다면 모든 면에서 우수하다고 평가하기 어렵다.본 연구에서는 질의나무(Query tree)라고 불리는 자동 질의 재구성 알고리즘과 다른 2개의 알고리즘(DNF method,Dilon's method)을 이론적 측면과 실시간 측정에 Sun SparcsStation 2를 이용하여 비교하여 보았다. 3가지 Test set 인 CACM,CISI,그리고 Medlars을 이용하여 실험한 질과 질의나무 알고리즘이 이론적, 실시간 측면 모두에서 가장빠른 알고리즘이라는 결과가 나왔다.

  • PDF

탐색결과에 근거한 자연어질의 자동확장 및 응용에 관한 연구 고찰 (The Pragmatics of Automatic Query Expansion Based on Search Results of Natural Language Queries)

  • 노정순
    • 정보관리학회지
    • /
    • 제16권2호
    • /
    • pp.49-80
    • /
    • 1999
  • 본 연구는 자연어 비불리언 탐색에서 탐색결과에 근거하여 질의를 수정, 확장, 결합하여 검색효과를 향상시키는 시스템들을 개념모델별로 성능을 고찰하고, 성능에 영향을 끼치는 요소들을 분석하여, 이론적인 개념의 틀을 제시하였다. 용어의 가중치기법, 문헌의 순위화방법, 용어선정알고리즘, 질의확장에 사용된 문헌수와 용어수, 적합성판정정보의 출처 및 척도, 배움표본의 크기, 부적합문헌정보의 사용여부, 용어확장방법, 질의의 크기, DB의 종류와 크기 등에 의해 영향을 받는 것으로 분석되었다.

  • PDF

웹기반 대화형 에이전트 (A Web-based Conversational Agent)

  • 이승익;오성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권5호
    • /
    • pp.530-540
    • /
    • 2003
  • 인터넷 사이트의 정보량이 증가함에 따라 효율적인 정보제공의 필요성이 커지고 있으나, 대부분의 사이트에서 제공하는 핵심어의 불리언 조합에 기반을 둔 정보검색기법은 사용자의 의도를 제대로 표현하기 어렵기 때문에 지나치게 많거나 의도하지 않은 검색결과를 얻기 쉽다는 문제가 있다. 이 논문에서는 자연어 대화를 통하여 사용자에게 보다 정확하고 친절하게 정보를 제공할 수 있는 대화형 에이전트를 제안한다. 이 에이전트는 자연어 질의에 유한상태 오토마타를 적용하여 사용자의 질의의도를 파악하고 이를 답변지식의 구조적 패턴매칭에 활용함으로써, 어순변화에 강건하고 질의의도에 부합하는 답변을 제공한다. 제안한 시스템의 유용성과 가능성을 알아보기 위하여 간단한 웹 페이지를 소개하는 문제에 적용한 결과, 에이전트가 정확하고 친근하게 응답하는 것을 확인할 수 있었다.