• Title/Summary/Keyword: 규칙 기반 질의 처리

Search Result 73, Processing Time 0.027 seconds

A Rewriting Algorithm for Inferrable SPARQL Query Processing Independent of Ontology Inference Models (온톨로지 추론 모델에 독립적인 SPARQL 추론 질의 처리를 위한 재작성 알고리즘)

  • Jeong, Dong-Won;Jing, Yixin;Baik, Doo-Kwon
    • Journal of KIISE:Databases
    • /
    • v.35 no.6
    • /
    • pp.505-517
    • /
    • 2008
  • This paper proposes a rewriting algorithm of OWL-DL ontology query in SPARQL. Currently, to obtain inference results of given SPARQL queries, Web ontology repositories construct inference ontology models and match the SPARQL queries with the models. However, an inference model requires much larger space than its original base model, and reusability of the model is not available for other inferrable SPARQL queries. Therefore, the aforementioned approach is not suitable for large scale SPARQL query processing. To resolve tills issue, this paper proposes a novel SPARQL query rewriting algorithm that can obtain results by rewriting SPARQL queries and accomplishing query operations against the base ontology model. To achieve this goal, we first define OWL-DL inference rules and apply them on rewriting graph pattern in queries. The paper categorizes the inference rules and discusses on how these rules affect the query rewriting. To show the advantages of our proposal, a prototype system based on lena is implemented. For comparative evaluation, we conduct an experiment with a set of test queries and compare of our proposal with the previous approach. The evaluation result showed the proposed algorithm supports an improved performance in efficiency of the inferrable SPARQL query processing without loss of completeness and soundness.

Design of a Question-answering System Based on SPARQL (SPARQL 기반의 질의응답 시스템 설계)

  • Ahn, HyeokJu;Lee, SungHee;Kim, HarkSoo
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.153-155
    • /
    • 2014
  • 사용자가 질의한 내용에 대한 결과를 찾기 위해 본 논문은 DBPedia에서 제공해주는 트리플 구조를 TDB에 저장하고, 사용자 질의 문장에서 트리플을 찾은 뒤 해당 문장의 규칙을 추론하여 SPARQL 쿼리를 생성한 뒤, 마지막으로 Fuseki를 이용해 결과를 출력하는 Q&A시스템을 제안한다. SPARQL 쿼리를 생성함에 있어 질의의 정답을 찾아내는 타겟이 있다는 점과 한국어의 조사와 부사부분에서 쿼리가 변형될 수 있다는 점을 통해 유동적인 쿼리를 생성한다. 그리고 DBPedia에 없는 단어가 질의에서 나타날 수 있기 때문에 이를 정제해주는 작업 또한 필요하다. 한국어는 어절순서가 고정적이지 않다는 점, 조사, 부사에 의해 문장의 의미가 변형되는 또 다른 부분을 파악하여 앞으로 시스템을 개발함에 있어 정확률을 상승시킬 예정이다.

  • PDF

Query Analysis Using Information Extraction (정보추출을 이용한 질의분석)

  • Jung, Han-Min;Min, Kyung-Koo;Sung, Won-Kyung;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.290-295
    • /
    • 2004
  • 본 논문에서는 네비게이션 도메인 상에서의 자연어 질의를 분석하기 위한 방법으로 정보추출을 이용한다. 목적지향성 대화문을 처리하기 위해 도입한 정보추출은 미리 정의된 필드들의 값을 채우는 방식으로 대화를 이끌 수 있도록 한다. Lexico-semantic pattern 기반의 언어처리와 추출/필터링/랭킹 규칙들을 사용하여 강건하면서도 애매성 처리가 용이한 정보추출 기법을 이용한다. 네비게이션 도메인 상에서의 실험은 목적지까지의 이동을 위한 사용자와의 대화집합 256개에 대해 문장레벨 97%의 정확율을 보여준다.

  • PDF

The extensible mapping rules for ontology integration (온톨로지 통합을 위한 변환 규칙의 확장)

  • Kim Sun-Kyung;Kim Byung-Gon;Lee Jae-Ho;Lim Hae-Chull
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.115-117
    • /
    • 2006
  • 웹에 대한 사용자의 다양한 요구와 더불어 시맨틱 웹에 대한 연구가 활발하게 이루어지고 있다. 이러한 연구 중에 대표적인 예가 바로 온톨로지의 구축에 대한 연구이다. ICS-FORTH는 온톨로지 구축을 위한 대표적인 시스템으로 SWIM을 이용한 분산된 환경에서의 독립된 온톨로지 즉, 관계형 데이터베이스와 XML로 된 온톨로지의 통합이 가능하도록 하였다. 또한, 통합된 온톨로지를 RDF/S를 기반으로 하는 뷰의 형태로 사용자에게 제공하여 추론이 가능한 질의 처리가 가능하도록 하였다. 이에 따라, 본 논문에서는 W3C에서 제안한 OWL을 통합의 대상으로 통합의 범위를 확장하기 위한 기법을 제안한다. 제안한 기법은 RDF/S를 확장한 다양한 관계의 기술이 가능하기 때문에 사용자가 RQL 형태의 질의를 미들웨어에서 처리할 수 있는 형태로의 변환하는 기존 기법의 확장된 형태이다. 이러한 확장을 통하여 기존 온톨로지 통합의 범위를 확장하여 보다 많은 사용자의 다양한 요구에 대응할 수 있다.

  • PDF

A Korean Community-based Question Answering System Using Multiple Machine Learning Methods (다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템)

  • Kwon, Sunjae;Kim, Juae;Kang, Sangwoo;Seo, Jungyun
    • Journal of KIISE
    • /
    • v.43 no.10
    • /
    • pp.1085-1093
    • /
    • 2016
  • Community-based Question Answering system is a system which provides answers for each question from the documents uploaded on web communities. In order to enhance the capacity of question analysis, former methods have developed specific rules suitable for a target region or have applied machine learning to partial processes. However, these methods incur an excessive cost for expanding fields or lead to cases in which system is overfitted for a specific field. This paper proposes a multiple machine learning method which automates the overall process by adapting appropriate machine learning in each procedure for efficient processing of community-based Question Answering system. This system can be divided into question analysis part and answer selection part. The question analysis part consists of the question focus extractor, which analyzes the focused phrases in questions and uses conditional random fields, and the question type classifier, which classifies topics of questions and uses support vector machine. In the answer selection part, the we trains weights that are used by the similarity estimation models through an artificial neural network. Also these are a number of cases in which the results of morphological analysis are not reliable for the data uploaded on web communities. Therefore, we suggest a method that minimizes the impact of morphological analysis by using character features in the stage of question analysis. The proposed system outperforms the former system by showing a Mean Average Precision criteria of 0.765 and R-Precision criteria of 0.872.

Efficient Classification of User's Natural Language Question Types using Word Semantic Information (단어 의미 정보를 활용하는 이용자 자연어 질의 유형의 효율적 분류)

  • Yoon, Sung-Hee;Paek, Seon-Uck
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.4 s.54
    • /
    • pp.251-263
    • /
    • 2004
  • For question-answering system, question analysis module finds the question points from user's natural language questions, classifies the question types, and extracts some useful information for answer. This paper proposes a question type classifying technique based on focus words extracted from questions and word semantic information, instead of complicated rules or huge knowledge resources. It also shows how to find the question type without focus words, and how useful the synonym or postfix information to enhance the performance of classifying module.

Active Documents: Another Kind of Program Implying Intention of Form Designers (능동문서: 서식설계자의 의도가 내장된 프로그램)

  • Nam, Chul-Ki;Bae, Jae-Hak;Yoo, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.353-356
    • /
    • 2003
  • 인터넷 기반의 많은 응용이 문서중심의 컴퓨팅 모델로 전환되고 있다. 문서는 문서설계자의 의도를 함축하고 있으며 이는 업무처리 과정의 자동화에 적극적으로 활용될 수 있다. 이러한 무서의 본질 파악을 통해 본 논문에서는 문서를 실행 가능한 컴퓨터 프로그램의 시각으로 접근한다. 이를 위해 서식, 데이터, 규칙 그리고, 질의로 구성되는 능동문서 모델을 제시한다. 모델의 각 요소는 문서의 재사용성과 상호 운영성을 위해 XML로 일관되게 표현된다. 능동문서는 사용자 인터페이스를 제공하는 수동적인 역할뿐만 아니라 문서설계자가 의도하는 문서처리 절차와 업무규칙을 기계가 읽고 추론하여 처리할 수 있는 문서이다. 이를 통해 문서와 기계가 상호작용을 할 수 있으며 다른 응용 프로그램과 협력할 수도 있다. 이러한 능동문서의 적용 가능함을 보이기 위해 기업가거래(B2B) 시스템에서 구매주문 처리의 예를 보였다. 요컨대 본 논문에서 제시한 능동문서는 지식표현 및 처리기능이 내장되어 있는 바, 문서중심의 지능적인 응용프로그램 개발을 가속화하는 토대를 마련할 수 있을 것으로 기대한다.

  • PDF

Contextualized Embedding- and Character Embedding-based Pointer Network for Korean Coreference Resolution (문맥 표현과 음절 표현 기반 포인터 네트워크를 이용한 한국어 상호참조해결)

  • Park, Cheoneum;Lee, Changki;Ryu, Jihee;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.239-242
    • /
    • 2018
  • 문맥 표현은 Recurrent neural network (RNN)에 기반한 언어 모델을 학습하여 얻은 여러 층의 히든 스테이트(hidden state)를 가중치 합(weighted sum)을 하여 얻어낸 벡터이다. Convolution neural network (CNN)를 이용하여 음절 표현을 학습하는 경우, 데이터 내에서 발생하는 미등록어를 처리할 수 있다. 본 논문에서는 음절 표현 CNN 기반의 포인터 네트워크와 문맥 표현을 함께 이용하는 방법을 제안하고, 이를 상호참조해결에 적용한다. 실험 결과, 질의응답 데이터셋에서 CoNLL F1 57.88%로 규칙기반에 비하여 11.09% 더 좋은 성능을 보였다.

  • PDF

A Study on Techniques for Semantic Search based on Defense Software Component Grid (국방 컴포넌트그리드 기반의 시맨틱 검색 기술의 연구)

  • Her, Yun;Kim, Su-Kyoung;Choi, Ho-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.877-878
    • /
    • 2009
  • 본 연구는 국방 소프트웨어 컴포넌트그리드 환경의 자산저장소를 지원하는 시맨틱 검색 시스템을 설계하고 개발하는데 바탕을 두고 있다. 컴포넌트그리드 환경의 자산저장소의 중요한 특성은 재사용성과 상호운용성 그리고 유용성을 보장하는 것이다. 이러한 특성을 만족하는 시맨틱 검색 시스템을 개발하기 위해서는 기반 기술에 대한 심도 있는 기초 연구가 필요하다. 본 논문에서는 이러한 기술들 중 현재 연구 중인 몇 가지를 소개하고 적용 방법을 제안하고자 한다. 이러한 기술로는 사례기반추론을 이용한 소프트웨어 개발 경험재사용 연구, 유사한 컴포넌트들의 추출을 위한 의미기반의 유사도 연구, 그리고 사용자 질의의 추론과 매칭을 위한 추론규칙 연구 등이 있다. 본 연구에서는 다양한 형태의 산출물들의 저장 및 검색을 위한 기술들을 조사하고 이를 연구하여 향후 컴포넌트그리드 환경의 자산저장소의 시맨틱 검색을 제공하기 위한 기초로 활용할 예정이다.

Design of A Page Modification Detector for Meta-search Engines (메타 검색엔진을 위한 페이지 변경 탐지기 설계)

  • 박상위;오정석;이상호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.205-207
    • /
    • 2001
  • 웹 상의 HTML 문서들은 수시로 변경되고 있으며, 정보를 검색하는 웹사이트 또한 예외는 아니다. 다수의 웹 검색엔진들의 결과를 통합하는 메타 검색엔진은 각 검색엔진의 정보 변경에 민감해야 된다. 본 논문은, 수시로 변경되는 검색엔진들의 HTML 문서 정보를 메타 검색 엔진에 반영하기 위해, 자동적으로 검색엔진들의 질의 형태 변경과 검색 엔진의 검색 결과 HTML 문서의 구조 변경 탐지는 질의 결과가 반복되는 HTML 태그(tags) 문서 구조를 패턴(pattern)으로 이용한다. 패턴 발견 알고리즘은 문자열에서 규칙적으로 발생하는 패턴을 찾아내는 Jaak Vilo 알고리즘을 기반으로 HTML 문서를 처리할 수 있도록 확장하였다. 발견된 HTML 문서 패턴과 기존의 검색 엔진 HTML 페이지의 구조적 패턴 정보를 비교하여 문서 구조 변경을 탐지한다.

  • PDF