• 제목/요약/키워드: 질의어 확장

검색결과 168건 처리시간 0.027초

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색 (Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion)

  • 윤성희;장혜진
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.235-248
    • /
    • 2004
  • 웹 문서 정색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

멀티미디어 데이터베이스에서 SMIL을 이용한 질의어 확장 및 프리젠테이션 시스템의 구현 (Query Language Extension and Implementation of MM Presentation System using SMIL in MMDB)

  • 이중화;이종환;유영호;김경석
    • 정보처리학회논문지D
    • /
    • 제8D권1호
    • /
    • pp.44-53
    • /
    • 2001
  • 멀티미디어 데이터베이스 시스템에서 멀티미디어 데이터를 질의하고 결과를 어떻게 프리젠테이션 할 것인가 하는 것은 매우 중요하다. 또한 질의 결과를 다양한 응용에서 사용하기 위해서는 보다 일반화된 형태로 질의결과를 제공해야 한다. 본 논문에서는 W3C의 권고안인 SMIL에서 제공하는 멀티미디어 프리젠테이션의 기능적 요소들을 질의어에서 지원하도록 함으로써 보다 일반화된 형태로 질의어를 확장하고, 또한 다양한 응용에서 사용하도록 하기 위해서 질의 결과를 SMIL 형태로 제공하도록 한다.

  • PDF

지식기반 의미 메타 검색엔진 (Knowledge-based Semantic Meta-Search Engine)

  • 이인근;손세호;권순학
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.737-744
    • /
    • 2004
  • 웹으로부터 사용자가 원하는 정보에 잘 부응하는 정보를 추출하는 것은 검색엔진이 갖추어야 할 기본적 요소라 할 수 있다. 그러나 질의어와의 패턴 매칭 방식에 의존하는 기존의 대부분의 검색엔진은 질의어가 갖는 애매성으로 인하여 사용자의 요구에 부합하는 검색결과를 제공하기가 쉽지 않다는 단점을 지니고 있다. 이를 극복하기 위하여 본 논문에서는 다음과 같은 5가지 과정, 즉, (i) 질의어 형성, (ii) 질의어 확장, (iii) 검색, (iv) 순위 재생성 및 (v) 지식베이스로 구성되는 지식기반 의미 메타 검색엔진의 기본 구조를 제안한다 영어로 구현된 웹 문서에 대한 모의실험을 통하여 본 논문에서 제안된 지식기반 의미 메타 검색엔진이 기존의 검색엔진(구글)을 사용하여 얻은 결과보다 좋은 결과를 보임을 확인할 수 있었다.

퍼지 논리를 이용한 질의어 확장과 문서 분류 (Query Extending and Document Classification Using Fuzzy Logic)

  • 은희주;이기영;김용성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.195-197
    • /
    • 1999
  • 본 연구에서는 인터넷 상의 많은 문서들 중에서 사용자에게 보다 적합한 문서를 제공하기 위해 퍼지 관계성을 이용하여 검색 결과 집합의 문서에서 추출한 키워드간의 유사클래스를 생성한다. 또한, 기존의 키워드 직접 매칭에 의한 검색 방법의 단점이라 할 수 있는 의미적 관계를 가지는 문서에 대한 검색 방법도 제안한다. 생성된 유사 클래스는 사용자의 질의를 확장하여 사용자의 관심도를 보다 많이 반영하게 되고, 그 질의어가 포함된 단어나 구의 발생 빈도수가 높은 문서에 대해 의미적으로 서로 연결시켜 분류한다. 본 연구에서 제안한 알고리즘에 의해 문서를 사용자 관심 정도로 분류, 카테고리를 생성하여 검색 효율을 증대시키고 사용자의 요구에 적합한 결과를 제공하고자 한다.

  • PDF

한국어 대화체 문장 분석을 이용한 메타 정보검색 (Meta Information Retrieval using Sentence Analysis of Korean Dialogue Style)

  • 박인철
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권10호
    • /
    • pp.703-712
    • /
    • 2003
  • 오늘날 통신의 발전에 따라 인터넷상에 존재하는 정보의 양이 많아지고, 필요한 정보를 효율적으로 찾아내는 정보 검색 시스템의 중요성이 크게 대두되고 있다. 대부분의 정보 검색 시스템에서는 단순한 키워드나 키워드를 이용한 불리언 질의어를 바탕으로 필요한 문서를 검색해 내고 있다. 그러나, 키워드를 이용한 정보 검색은 사용자의 편의성 및 주어진 질의어에 대한 이해의 정확성 측면에서 우리가 일상생활에서 사용하는 대화체 문장을 이용한 질의어에 비해 많은 어려움을 가지고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 한국어 대화체 문장의 정보 검색을 위한 메타질의어처리시스템을 설계하고 구현한다. 본 논문에서 제안한 한국어 대화체 문장 분석을 이용한 정보 검색은 주어진 질의어에 대해 형태소 분석과 구문 분석 및 시소러스를 이용한 질의어의 확장을 통해 사용자가 원하는 질의어를 포함하는 새로운 질의어를 형성해 내며, 질의어에 포함된 중의성도 부분적으로 해결할 수 있었다.

  • PDF

시맨틱 콘텐츠 검색을 위한 질의 확장 시스템 (Query Expansion System for Semantic Contents Retrieval)

  • 이무훈;최의인
    • 디지털융복합연구
    • /
    • 제10권10호
    • /
    • pp.307-312
    • /
    • 2012
  • 최근 논리적으로 표현된 지식 베이스를 사용하는 키워드 기반 검색에서 보다 더 정확한 결과를 제공하기 위해 시맨틱 검색 방법에 대한 연구가 진행되고 있다. 대부분의 사용자는 정형화된 질의어와 스키마를 사용하는 것 보다 사용자 키워드의 의미를 해석해서 사용한다. 본 논문에서는 시맨틱 검색을 위한 사용자 질의 확장을 제안한다. 제안 시스템에서는 지식 베이스와 연관 검색어를 활용한 사용자 질의 확장 콤포넌트와 사용자 질의 해석 결과를 조정하기 위한 콤포넌트를 제공한다. 마지막으로 논문에서 제안한 사용자 질의 의미 해석 기법의 검증을 위해 프로토타입 시스템의 실험 결과를 설명한다.

용어 발생 유사도와 퍼지 추론을 이용한 질의 용어 확장 및 가중치 재산정 (Query Term Expansion and Reweighting using Term Co-Occurrence Similarity and Fuzzy Inference)

  • 김주연;김병만
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권9호
    • /
    • pp.961-972
    • /
    • 2000
  • 본 논문에서는 사용자의 적합 피드백을 기반으로 적합 문서들에서 발생하는 용어들과 초기 질의어간의 발생 빈도 유사도 및 퍼지 추론을 이용하여 용어의 가중치를 산정하는 방법에 대하여 제안한다. 피드백 문서들에서 발생하는 용어들 중에서 불용어를 제외한 모든 용어들을 질의어로 확장될 수 있는 후보 용어들로 선택하고, 발생 빈도 유사성을 이용한 초기 질의어-후보 용어의 관련 정도, 용어의 IDF, DF 정보를 퍼지 추론에 적용하여 후보 용어의 초기 질의어에 대한 최종적인 관련 정도를 산정 하였으며, 피드백 문서들에서의 가중치와 관련 정도를 결합하여 후보 용어들의 가중치를 산정 하였다. 본 논문에서는 성능을 평가하기 위하여 KT-set 1.0과 KT-set 2.0을 사용하였으며, 성능의 상대적인 평가를 위하여 Dec-Hi 방법, 용어 분포 유사도를 이용한 방법, 퍼지 추론을 이용한 방법들을 정확률-재현률을 사용하여 평가하였다.

  • PDF

이동체 관리 시스템을 위한 이동체 질의어 설계 (Moving Object Query Language Design for Moving Object Management System)

  • 이현아;이혜진;김동호;김진석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.148-150
    • /
    • 2003
  • 최근 부각되고 있는 이동체 위치 중심의 서비스는 이동체 데이터를 효율적으로 관리하기 위한 이동체 데이터베이스를 요구하고 있으며, 이러한 이동체 데이터베이스에서는 데이터의 효율적인 저장. 관리, 질의, 표현, 가공을 위하여 이동체 질의어가 지원되어야 한다. 이동체 질의어는 LBS 뿐만 아니라 Telematics. ITS, 물류 관련 이동체 관리 시스템 등과 같이 특화된 서비스를 제공하기 위하여 필요한 데이터를 획득할 수 있는 질의구문을 포함하고 있어야 한다. 이 논문에서는 이동체 관련 서비스에서 요구하는 구문을 지원 할 수 있는 이동체 질의어를 정의하고, SQL2의 문법을 확장하여 이동체 질의 구문의 구조를 설계한다. 이동체 질의어는 사용자가 이동체 데이터베이스의 복잡한 스키마 구조를 이해하지 않더라도 원하는 데이터를 검색하기 위한 질의문을 쉽게 작성할 수 있도록 해준다.

  • PDF

시소러스 및 요약화일을 이용한 문서 검색시스템 (The development of a document retrieval system using thesaurus and signature file)

  • 정상철;신동욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.400-408
    • /
    • 1994
  • 본 논문에서는 요약화일을 이용하여 복합명사를 효율적으로 처리하며 시소러스를 이용하여 검색하는 한글문서 검색시스템을 제안한다. 본 한글문서 검색 시스템은 한글문서를 대상으로 색인하는 자동색인기와 사용자의 질의를 받아 관련된 문서를 검색하는 검색기로 구성된다. 자동색인기는 우선 한글문서를 대상으로 최장일치 방법으로 명사들을 출출한 후 복합명사의 패턴을 분석하여 복합명사의 가능성이 높은 것들을 복합명사화한다. 두번째로 이들 복합명사들을 1+2SP 방식으로 코딩한 후 요약화일 방법을 이용하여 요약화일을 작성한다. 검색기는 사용자 질의어를 받아 명사들을 추출한 후 시소러스를 이용하여 질의어를 확장한다. 다음 확장된 질의어를 1+2SP 방식으로 코딩한 후 관련된 문서를 검색한다. 본 논문에서는 한국통신에서 만든 코퍼스를 이용하여 제안된 방법의 성능을 평가하였는데 복합명사 처리 및 시소러스 이용방식이 효율적임이 입증되었다. 또한 KAIST에서 개발한 문서검색 시스템보다 동일한 코퍼스로 실험하였을 경우 재현률 및 정확률이 $7{\sim}8%$ 정도 앞서 기존의 시스템보다도 성능이 우수하다는 것이 밝혀졌다.

  • PDF

정보검색시스템의 확률 및 벡터모델에 대한 질의 확장 검색 성능 평가 (Extended Query Search Performance Evaluations for Vector Model and Probabilistic Model of Information System)

  • 전유정;변동률;박순철
    • 한국산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.36-42
    • /
    • 2004
  • 본 논문은 벡터모델과 확률모델의 성능 비교에 관한 연구이다. 벡터모델로써는 잠재적 의미를 적용한 검색 결과를 찾기 위해 사용되는 LSI 모델을 이용하였다. 확률모델로써는 현재 상용화 단계에 있는 콘도르 정보검색 시스템을 적용하였다. 각 모델 시스템의 검색 성능 비교를 위한 실험은 사용자가 입력한 원래 질의어에 관한 검색 결과를 바탕으로 성능을 비교한 후에, 사전적 의미를 적용한 확장 질의어에 대한 검색 결과를 추가하여 비교하였다. 본 연구에서는 입력된 질의어와 관련된 용어를 추가하여 검색하였을 경우, 확률모델에 비해 벡터모델에서 성능이 대부분의 질의어에 대해서 향상됨을 보인다.

  • PDF