• 제목/요약/키워드: 질의어 확장

검색결과 168건 처리시간 0.029초

한영 교차언어 정보검색에서 질의 변환 및 질의 확장 방법 (Query Translation and Query Expansion Method in Korean-to-English Cross-Language Information Retreival)

  • 김백일;서희철;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.235-242
    • /
    • 2002
  • 본 논문은 한영 교차언어 정보검색을 위한 질의 변환 방법과 질의 확장에 대해서 기술하고 있다. 한영 교차언어 정보 검색은 한국어 질의와 관련된 영어 문서를 검색하는 것을 말하며, 한국어 질의를 영어 질의로 변환하는 방법을 사용했다. 이를 위해 한국어 단어들에 대한 영어 대역어들의 공기 정보를 이용하며, 공기 정보로는 상호 정보를 사용했다. 또한 한국어와 영어의 연어 사전을 사용하여 성능을 향상시켰다. 추가적인 검색 성능 향상을 위한 방법으로, 기존 연구에서 많이 사용된 적합성 피드백에 의한 지역적 질의 확장 대신, 영어 워드넷을 확장하여 구축한 한영 이중언어 시소러스를 사용하여 질의 확장을 하는 전역적 질의 확장을 시도하였다. 실험결과, 정확률의 향상보다는 재현율의 향상 정도가 더 컸으며, 긴 질의보다 짧은 질의를 확장한 경우가 성능이 높았다.

  • PDF

한.중 교차언어 검색에서 시소러스를 이용한 질의 확장 (Query Expansion Using Thesaurus for Korean to Chinese Cross- Language Text Retrieval)

  • 김풍;강인수;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.538-540
    • /
    • 2003
  • 본 논문은 한.중 교차언어 검색을 위한 효과적인 질의 확장에 대해 기술하고 있다. 한.중 교차언어 검색은 한국어 질의로 중국어 문서를 검색하는 것이고 본 논문에서는 대역어 사전을 이용하여 한국어 질의를 중국어 질의로 변환하는 방식을 사용한다. 질의 확장을 위한 방법으로 중국어 시소러스인“동의사사림”을 사용하였다. 그리고 동의어들과 주변 단어간의 상호 정보를 비교함으로서 재현률과 정확률을 높였다. 실험을 통하여 검증한 결과 사전만 사용하여 변환하는 방법에 비하여 검색 성능이 향상되었다.

  • PDF

XML 문서와 데이터베이스 통합을 위한 SQL 의 확장 (Extension of SQL for Integrating XML Document with Database)

  • 이찬구;정원일;이충호;김종훈;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.84-86
    • /
    • 2000
  • XML은 다양한 정보이 표현이 가능하고 이들 정보의 구조적 표현이 가능하여 많은 연구 분야에서 사용되고 있다. 이러한, XML 문서의 효율적인 검색과 저장 관리를 위하여 데이터베이스 시스템을 이용한 연구가 활발히 진행되고 있으나 기존의 연구들은 XML 문서에 대한 질의 수행을 위해 SQL 과 독립된 질의 언어를 정의함으로써 데이터베이스와 통합된 질의를 제공하지 못한다. 본 논문에서는 XML 문서와 데이터베이스의 통합된 질의를 위하여 XML 문서의 엘리먼트를 자료형으로 정의하는 DDL 구문의 추가와 질의어에서 이들 자료형에 대한 연산을 지원하는 DML 의 확장을 한다. 제안한 질의어는 SQL을 이용하여 XML 문서에 대한 질의를 처리함으로써 XML 문서와 데이터베이스의 통합된 질의를 가능하게 한다.

  • PDF

내용분석을 통한 향산된 링크기반 검색 (Improved Link-based Retrival with Content Analysis)

  • 이경희;김민수;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.151-153
    • /
    • 2004
  • 정보검색이 발달함에 따라 인터넷 환경에서의 정보 검색은 하이퍼링크 정보를 분석하여 이용하는 추세에 있다. 최근에는 주어진 주제어나 질의어에 대해 가장 적합한 검색 방법을 결정하기 위해 하이퍼텍스트 기반 링크 구조를 분석하는 알고리즘이 늘어나고 있는 실정이다. Bharat〔2〕은 HITS 알고리즘의 문제점을 지적하고 이를 개선하기 위한 방법을 제안하였다. 본 논문에서는 Bharat이 제시한 확장 질의어를 만드는 방법에 대한 문제점 제기와 이 문제에 대한 개선 안을 제시하고자 한다.

  • PDF

다중 문서에서 구조 정보를 이용한 XML 조인 질의 처리 (XML Join Query Processing using Structured Information from Multiple Documents)

  • 정성호;김병곤;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.100-102
    • /
    • 2002
  • XML 문서에 대한 다양한 질의를 위해서 W3C에서는 XQL, XML-QL, XML-GL, XQUERY와 같은 질의어를 제안하였다. 이들 질의어는 다양한 질의 유형의 분류와 표현은 가능하나, 조인 질의의 경우 단순 조인 질의만을 지원할 뿐, XML 문서의 구조나 텍스트 정보의 유사성을 이용한 보다 다양한 조인 질의에 대한 연구가 미비하였다. 본 논문에서는 다중 문서에 대한 조인 질의를 체계적이고 효과적으로 표현하기 위해, 문서에 대한 조인 질의를 여러 타입으로 분류하였다. 또한 효율적인 질의처리를 위하여 다양한 일반 조인 질의 및 정보검색 기능을 지원하는 유사성 조인 연산자(similarity join operator), 순수 구조 기반 조인을 지원하는 구조 조인 연산자(structured join operator)를 지원하도록 XML 질의어인 QUILT를 확장하였다. 특히, 구조 정보만을 이용한 질의시 구조의 깊이(depth)정보를 이용하여 사용자의 요구에 맞게 질의 검색 범위를 설정하고, XML 문서에 대한 질의 문을 좀더 간결하게 표현할 수 있도록 설계하였다.

  • PDF

SMIL 2.0을 기반으로 하는 확장 데이터베이스 질의어 설계 (Design of Extended Database Query language Based on SMIL 2.0)

  • 이중화;문경희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.153-156
    • /
    • 2005
  • 지금까지 질의 결과에 대한 프리젠테이션은 일반적으로 외부 툴이나 리포트 작성기를 통해 이루어지고 있는데, 프리젠테이션을 작성하는 방법이나 저장 방법 등이 표준화되어 있지 않기 때문에 다른 응용에서 질의 결과를 사용하는 데 많은 어려움이 따른다. 따라서 멀티미디어 데이터를 질의하는 질의어에서 표준화된 방법으로 프리젠테이션을 정의할 수 있는 방법이 필요하다. 본 논문에서는 W3C (World Wide Web Consortium) 의 멀티미디어 프리젠테이션 표준인 SMIL (Synchronized Multimedia Integration Language) 2.0 을 기반으로 SQL을 확장하여 멀티미디어 데이터에 대한 사용자가 질의와 질의결과에 대한 프리젠테이션 작성을 원활히 할 수 있도록 한다.

  • PDF

영어외래어의 음역어 자동변환을 이용한 검색 시스템 (A Retrieval System Using the Automatic Transition of the English-Adopted Words into Transliterations)

  • 이미란;김양택;전홍태;윤성대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1073-1076
    • /
    • 2002
  • 정보 검색시 질의어가 외래어일 경우에 검색의 재현율은 급격하게 감소된다. 이는 외래어에서 나오는 음역어의 불일치와 영어외래어, 한글음역어는 같은 색인으로 처리가 되지 않기 때문이다. 따라서 본 논문에서는 영어외래어를 한글음역어로 자동 변환시키고, 자동 변환시에는 영어음소에 해당하는 발음값을 한글음소로 모두 변환시킨 다음 조합하였다. 조합된 음역어들은 다시 동치부류 DB에 저장되어, 질의어 검색시 검색어가 동치부류 색인어로 확장되어 검색된다. 제안한 검색시스템의 성능을 평가하기 위해서 재현율을 측정하였다.

  • PDF

사용자 어휘지능망을 이용한 의미적 정보검색 (Semantic Information Retrieval using User-Word Intelligent Network)

  • 김창환;임지희;최호섭;윤화묵;옥철영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.157-160
    • /
    • 2006
  • 웹 자원이 방대함에 따라, 사용자가 원하는 정보를 얼마나 정확하게 제시하느냐가 정보검색시스템 성능을 판단하는 기준이 된다. 그러나 동형이의어만을 질의어로 이용한 검색 결과는 동형이의어 각 의미에 관련된 문서가 혼재되어 있거나, 특정 의미에 관련된 문서가 집중적으로 나타나는 현상을 볼 수 있다. 이에 본 논문에서는 한국어 사용자 어휘지능망(U-WIN)의 관계정보를 이용하여 질의어의 모호성을 해결하고 의미적 정보검색의 기반을 마련하고자 한다. 우선, 전문분야에 주로 사용되는 동형이의어와 보편적으로 사용하는 동형의어를 구번하여 질의어로 선정하고, '질의어+상위어' 형태의 확장 질의어에 대해 두 개의 포탈사이트(Google, Naver)를 대상으로 웹 문서를 검색하여 정확률이 각각 81.5%(Naver), 65.5%(Google)로 나타났다.

  • PDF

컴포넌트 검색에서 퍼지 시소러스를 이용한 효율적인 질의확장 방법 (Efficient Query Expansion Method using Fuzzy Thesaurus in Component Retrieval)

  • 김귀정;한정수
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.76-82
    • /
    • 2004
  • 본 논문은 사용자 질의가 가지는 특정 클래스로부터 개념적으로 서로 연관있는 컴포넌트를 검색하기 위하여 퍼지 시소러스를 통한 질의 확장 방법을 제안하였다. 사용자 질의는 퍼지 불리언 형태로 표현되며, 퍼지 시소러스에 의한 유의어 테이블에 의해 질의 확장된다. 시소러스에 의한 사용자 질의확장은 용어 불일치 문제를 해결함으로써 검색에 대한 일정한 정확도를 보장하면서 재현율을 향상시킬 수 있게 한다. 질의 확장과정의 효율성을 평가하기 위하여 시뮬레이션을 통한 최적의 검색 효율을 나타내는 임계치를 설정하고 재현율 과 정확도를 비교하였다.

  • PDF

분할 저장 시스템에 적합한 XPath 질의 처리기 설계 (Design of XPath Query Processor in Decomposition Storage System)

  • 고영기;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.52-54
    • /
    • 2002
  • 인터넷에서 XML은 고유의 확장성과 문서 관계성의 우수성을 활용하여 새로운 정보 공유 환경의 표준으로 자리잡고 있으며 XML문서 안의 정보 검색을 위해서 XPath 질의어가 널리 사용 중이다. 따라서, XML 문서를 데이터베이스에 효율적으로 저장하고 검색하는 연구들이 진행되고 있다. 본 연구는 관계형 데이터베이스(RDBMS)를 통하여 XML문서를 저장하고 검색할 수 있게 하기 위해 XPath 질의어에 적합하도록 하부 저장 스키마를 설계하였다. 그리고, XPath 질의를 SQL문으로 변화시켜 수행함으로써 XML 데이터에 대한 접근을 허용하였다. 더욱이 SQL문 수행 후의 결과를 효율적으로 DOM 형식의 XML 문서를 생성시킴으로써 문서의 재 조작을 가능하게 하였다.

  • PDF