• 제목/요약/키워드: 질의어 변환

검색결과 69건 처리시간 0.025초

한영 교차언어 정보검색에서 질의 변환 및 질의 확장 방법 (Query Translation and Query Expansion Method in Korean-to-English Cross-Language Information Retreival)

  • 김백일;서희철;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.235-242
    • /
    • 2002
  • 본 논문은 한영 교차언어 정보검색을 위한 질의 변환 방법과 질의 확장에 대해서 기술하고 있다. 한영 교차언어 정보 검색은 한국어 질의와 관련된 영어 문서를 검색하는 것을 말하며, 한국어 질의를 영어 질의로 변환하는 방법을 사용했다. 이를 위해 한국어 단어들에 대한 영어 대역어들의 공기 정보를 이용하며, 공기 정보로는 상호 정보를 사용했다. 또한 한국어와 영어의 연어 사전을 사용하여 성능을 향상시켰다. 추가적인 검색 성능 향상을 위한 방법으로, 기존 연구에서 많이 사용된 적합성 피드백에 의한 지역적 질의 확장 대신, 영어 워드넷을 확장하여 구축한 한영 이중언어 시소러스를 사용하여 질의 확장을 하는 전역적 질의 확장을 시도하였다. 실험결과, 정확률의 향상보다는 재현율의 향상 정도가 더 컸으며, 긴 질의보다 짧은 질의를 확장한 경우가 성능이 높았다.

  • PDF

온톨로지 기반의 시맨틱 검색 시스템에 대한 연구 (A Study on Ontology-Based Semantic Search System)

  • 허선영;김은경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.463-466
    • /
    • 2007
  • 현재 웹 서비스에서 주로 사용하고 있는 키워드 기반 검색은 사용자의 의도와는 상관없는 정보까지 검색하는 경우가 많아서, 실제로 원하는 정보를 찾는데 많은 시간과 노력을 요구한다는 단점이 있다. 이러한 단점을 보완하기 위해서 최근 시맨틱 웹이라는 개념이 등장하였으며, 본 논문에서는 검색 결과의 신뢰성을 향상시키기 위해 온톨로지를 기반으로 시맨틱 검색시스템을 설계하였다. 본 논문에서 설계한 온톨로지 기반의 시맨틱 검색 시스템은 기능적으로 크게 두 부분으로 구성되어 있다. 즉, 자료 수집을 하는 로봇 에이전트와 온톨로지를 기반으로 자료를 검색하는 시맨틱 검색 엔진으로 구성된다. 로봇 에이전트는 자율적으로 웹을 순회하면서 자료를 수집하고 필터링하여 메타데이터 저장소로 가져오는 역할을 한다. 시맨틱 검색 엔진은 사용자의 검색 폼으로부터 전달된 정보 검색 요구사항을 기초로 시맨틱 질의어로 변환한 후, 온톨로지 저장소를 활용하여 검색한다. 시맨틱 검색 엔진은 사용자가 입력한 검색어를 시맨틱 질의어로 변환해 주는 질의처리 모듈과 사용자의 의도를 추론하여 보다 향상된 검색을 가능하게 해주는 추론(Inference) 모듈, 온톨로지를 보관해주는 온톨로지 저장소 등으로 구성된다. 본 논문에서 설계한 온톨로지 기반의 시맨틱 검색 시스템은 키워드 기반 검색에 비해 사용자가 원하는 정보를 찾는데 소요되는 시간과 노력을 줄여 주고, 사용자의 의도에 적합한 정보를 제공할 것으로 기대된다.

  • PDF

TV-Anytime 메타데이터 검색을 위한 XQuery 엔진 (An XQuery Engine for searching TV-Anytime metadata)

  • 박종현;김병규;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.551-553
    • /
    • 2003
  • TV-Anytime은 국제 표준으로 자리잡아가고 있는 차세대 디지털 방송용 메타데이터로서 사용자가 직접 원하는 방송을 검색하고 선택하여. 선택한 멀티미디어 데이터를 저장하였다가 시간과 장소에 구애받지 않고 사용할 수 있도록 하는 것을 목표로 하고 있다. 이러한 TV-Anytime 메타데이터를 효율적으로 사용하기 위해서 TV-Anytime 메타데이터를 검색하기 위한 검색엔진은 필수적이다. 본 논문에서는 TV-Anytime 메타데이터가 XML 형식을 따른다는 점을 고려 하여 XML 데이터를 검색하기 위한 표준 질의어인 XQuery를 TV-Anytime 메타데이터의 검색을 위한 질의어로 사용하여 XQuery엔진을 설계하고 구현하였다. 본 논문에서 구현한 XQuery엔진은 XQquery를 검색어로 사용하기 때문에 디지털방송 환경에서 시스템 간의 상호 운용성을 높이고, 보다 풍부한 질의를 가능하도록 한다. 또한 XQuery엔진은 DB에 엘리먼트 단위로 분할되어 저장된 TV-Anytime 메타데이터를 효율적으로 검색할 수 있도록 XQuery를 SQL로 변환하는 기능을 수행한다.

  • PDF

과도한 지식을 요구하지 않는 공통기반축에 의한 용어 번역과 한영 교차정보검색에의 응용 (Knowledge-poor Term Translation using Common Base Axis with application to Korean-English Cross-Language Information Retrieval)

  • 최용석;최기선
    • 인지과학
    • /
    • 제14권1호
    • /
    • pp.29-40
    • /
    • 2003
  • 교차언어 정보검색은 다국어 정보검색의 일부분으로 질의어에서 사용하는 언어와 검색대상인 문서의 언어가 서로 다른 경우의 정보검색을 의미한다. 교차언어 정보검색의 성능 향상을 위해서는 양질의 언어자원이 대량으로 필요한 경우가 많기 때문에 이를 해결하기 쉽지 않다. 본 논문에서는 사전에 기반한 대역어 후보 선정 시, 가중치를 부여해 질의어를 변환하는 방식을 제안한다. 가중치 계산에 이용되는 의미거리는 영어 명사와 한국어 명사를 같은 벡터 공간에 표현하고, 두 벡터간의 관계를 이용해 거리를 계산한다. 서로 다른 두 언어의 명사를 한 공간에 표현하기 위해 "공통 기반축"의 개념을 제시하고, 구축 방법을 제안한다. 고급 자원인 온톨로지를 확보하지 않고, 제안하는 방법으로 우수한 정보검색 결과를 얻을 수 있다는 것을 실험을 통해 보여준다.을 통해 보여준다.

  • PDF

자료 저장소 랩퍼에서 XML 뷰 기반의 XML 스키마 관리 시스템 (An XML Schema Manager based on the XML View in a Storage Wrapper)

  • 정무장;박진수;정채영;이미영;강현석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.22-24
    • /
    • 2002
  • 미디에이터 기반의 데이터베이스 통합 방법론에서 랩퍼는 미디에이터에게 지역 데이터베이스의 스키마들 전달해야 한다. 여기서는 지역 데이터베이스의 스키마를 XML 스키마로 변환하여 미디에이터에게 전달하는 랩퍼 시스템에서의 스키마 관리기에 대하여 논한다. 이를 위하여 관계형 모델의 지역 데이터베이스에서, 지역 데이터베이스 스키마를 XML 스키마로 변환할 때 고려할 사항을 논한다 그리고 XML 질의어인 XQuery로 XML 뷰 정의 언어를 사용할 때, XQuery로 표현된 XML 뷰를 XML Schema로 표현된 XML 스키마로 변환하는 방법을 제시한다.

  • PDF

웹에서 캐쉬를 이용한 XML 질의 처리: 구현 및 성능 평가 (Cache-Answerability of XML Queries on the Web: Implementation and Performance Evaluation)

  • 박정기;강현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.133-135
    • /
    • 2003
  • 데이터베이스 기반의 웹 응용을 위한 캐슁 기법이 최근 많이 연구되고 있다. 자주 제기되는 질의의 결과를 캐쉬해두면 반복 질의를 위한 재사용은 물론 관련 질의의 처리에 이용될 수 있다. 웹 상에서 데이터 교환의 표준으로 XML이 등장한 이래 현재 웹 응용들은 네트워크 상의 원격 XML 소스로부터 데이터 검색을 수행하는 경우가 많아졌는데 이의 효율적인 지원을 위해 검색 결과를 캐쉬하는 것은 유용하다. 본 논문은 웹에서 XML 질의를 관련 XML 캐쉬를 이용하여 처리하는 기법의 구현 및 성능 평가에 관한 것이다. XML 질의로 XQuery, XPath, XQL 등과 같은 모든 XML 질의어의 핵심 요소인 경로 표현식을 대상으로 하였고, XML 캐쉬는 XML 실체뷰를 고려하였고, 캐쉬를 이용한 XML 질의 변환 알고리즘은 [12]에 제시된 것을 대상으로 하였다. [12]의 질의 변환 알고리즘을 지원하는 프로토타입 XML 저장 시스템이 관계 DBMS를 이용하여 구현되어 실제 웹에서의 성능 실험에 이용되었다. 성능 실험 결과 웹에서 캐쉬를 이용한 XML 질의 처리의 효율성을 확인하였다.

  • PDF

관계형 데이터베이스에서 XML 뷰 기반의 질의 처리 모델 (A Query Processing Model based on the XML View in Relational Databases)

  • 정채영;최규원;김영옥;김영균;강현석;배종민
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.221-232
    • /
    • 2003
  • 본 논문은 XML 기반의 데이터베이스 통합 방법론 중에서 관계형 데이터베이스 모델에 대한 랩퍼 시스템의 질의어 처리에 대하여 논한다. 관계형 데이터베이스의 내용은 W3C에서 제안된 XML Schema로 표현되며, 사용자는 XML Schema에 대하여 XML 질의어인 XQuery로써 질의를 한다. 그리고, 개발된 랩퍼 시스템은 사용자가 정의한 XML 뷰를 지원한다. XML 뷰 정의 언어는 XQuery이다. 이러한 환경에서 본 논문은 새로운 XML 질의 처리 모델을 제시한다. XML 뷰와 사용자 질의어의 합성 알고리즘, XQuery를 SQL로 변환하는 알고리즘, 그리고 XML 문서 생성을 위한 템플릿 구성 알고리즘을 제시한다.

관계형 데이타베이스에서 지식관리에 의한 질의 최적화 (Query Optimization with Knowledge Management in Relational Database)

  • 남인길;이두한
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.634-644
    • /
    • 1995
  • 본 논문에서는 세 가지 종류의 지식을 적절하게 표현하여 데이타베이스 시스템에 저장하고 이를 사용하여 질의를 의미적으로 등가이며 보다 처리 효율이 뛰어난 질의로 변환하는 기법을 제시하였다. 또한 제안된 지식을 사용하여 필수적인 성분이나 연산이 부분적으로 생략된 단순화된 질의를 완전한 질의로 변환할 수 있는 기법을 제시하여 사용자로 하여금 보다 단순화된 질의를 사용할 수 있는 환경을 제공하였다. 단순화된 질의로부터 변환과 최적화를 위해 다루는 지식은 크게 세 가지로 대별되는데, 의미적 무결성 규정과 도메인 무결성 규정을 포함하는 의미적 지식과 관계형 데이타베이스 에서의 릴레이션간의 물리적 관계를 표현하는 구조적 지식 그리고 속성의 도메인 정보 를 유지하는 도메인 정의이다. 제안된 시스템에서는 이들 지식을 사용하여 질의어의 조건 절에 있는 불필요하거나 중복적인 제한연산(restrictions)이나 조인연산(join) 을 제거하거나 다른 효율적인 연산으로의 대체, 혹은 보다 나은 효율을 위해 부가적인 제한연산이나 조인연산을 추가하여 질의 최적화를 이루게 된다.

  • PDF

분산 객체 관계 데이터베이스 시스템을 이용한 분산 XQuery 질의 처리기 설계 및 구현 (Design and Implementation of Distributed XQuery Query Processor using Distributed ORDBMSs)

  • 이재민;장건업;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.55-59
    • /
    • 2007
  • 최근 컴퓨팅 환경은 인터넷 환경의 웹을 기반으로 한 분산 컴퓨팅 환경으로 변화하고 있다. 그에 따라 XML 문서의 사용과 XML 문서의 양이 급속하게 증가하였으며, 언제나 쉽게 필요한 XML 문서에 접근할 수 있어야 한다. 또한 다양한 형태로 분산 저장된 XML 문서에서 원하는 데이터를 추출하고 변환하며, 단편화된 XML 데이터를 통합하는 작업들이 필요하게 된다. 따라서 XML 문서를 분산 객체 관계 데이터베이스 시스템에 효율적으로 저장하는 시스템을 개발하고, 분산 저장된 XML 문서에서 사용자가 필요한 정보를 검색할 수 있도록 하기 위해 XQuery 질의어를 지원하는 연구가 필요하다. 본 논문에서는 분산 객체 관계 데이터베이스 시스템에 저장된 XML 데이터를 접근할 수 있도록 하기 위해 XPath를 분산 SQL로 변환하여 실행하는 분산 XPath 의 처리기를 확장하여 XQuery를 분산 SQL로 변환하여 실행하는 분산 XQuery 질의 처리기를 설계 및 구현하였다.

  • PDF

XML 문서 관리 시스템의 순환적 DTD 구조 저장 기법 및 질의 변환 전략 (Method of storing nested DTD structure and Query translation strategy in XML Repository system)

  • 김정은;신판섭;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.299-301
    • /
    • 2000
  • XML은 문서의 구조를 독립적으로 작성할 수 있어 문서의 체계적인 구조화가 가능하다. 이러한 이유로 최근, XML 문서를 구조화하여 데이터베이스에 저장, 관리하는 XML 문서 관리 시스템 연구가 활발하다. XML 문서 관리 시스템은 XML의 구조 정보를 효과적으로 표현하기 위해 여러 가지 기법을 사용하고 있다. 그러나, 기존의 방법들은 XML 문서 구성에 따라 저장 스키마가 유동적이거나 문서 정보 검색의 제약을 가지고 있을 뿐만 아니라, DTD의 문서 구조가 순환 관계와 같이 복잡한 형태를 지닐 때, 그 구조를 적절히 반영하지 못하거나, 구조를 반영하더라도 검색 시, 모든 요소를 순차적으로 탐색해야 하는 등의 문제점을 지니고 있다. 따라서 본 연구에서는 XML의 내용이나 구성에 영향받지 않는 저장 스키마를 설계하고 정보검색의 제약을 해결가능한 경로 정보를 제안한다. 또한 순환 관계를 갖는 DTD의 구조 정보를 비 순환 구조 부분과 순환 구조 부분으로 분리, 정의하고 질의처리 시, 입력되는 XML-QL을 SQL로 변환하기 위하여 XML-QL의 패턴을 분류하고 이에 따른 중간 단계의 SQL을 정의하여 질의어 변환기법을 제안한다.

  • PDF