• Title/Summary/Keyword: 질의분석

Search Result 2,689, Processing Time 0.03 seconds

Keyword Extraction Using Syntactic Information of Question (질의문의 구문정보를 이용한 키워드 추출)

  • 양수정;서영훈
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.11a
    • /
    • pp.190-194
    • /
    • 2003
  • 자연언어 질의문에서 추출된 키워드들은 정답추출에 미치는 비중이 다른 경우가 많지만 키워드들에 대해 상대적인 가중치를 부여하기가 어렵다. 본 논문에서는 이러한 문제점을 해결하기 위하여 질의 문장의 구문 정보를 이용하여 중심키워드와 일반키워드들로 구분하였으며 이를 기반으로 키워드들 간의 가중치 부여 방법을 제안한다. 질의문 코퍼스로부터 질문 유형을 분석하여 구문을 추출하고 추출된 구문정보를 이용하여 질의문에서 키워드들을 추출한다. 이렇게 얻어진 키워드들을 이용하여 다량의 문서들 속에서 중심키워드와 일반키워드들 간의 불린 검색을 통해 질의문의 정답이 포함되었을 가능성이 큰 단락을 추출하고, 질의문과 추출된 단락간의 유사도 측정을 통해 단락을 순위화 한다. 본 논문에서 제안하는 시스템은 질의문의 정답이 포함된 단락추출에 대한 정확도를 향상시킬 것으로 기대된다.

  • PDF

Organization of Multidimensional File Structures Defending on a Query Pattern (질의패턴에 따른 다차원 파일구조의 구성방법)

  • Lee, Jung-A;Lee, Jong-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.97-100
    • /
    • 2007
  • 본 논문에서는 다차원 파일구조를 주어진 질의 패턴에 의해 최적으로 구성할 수 있는 방법을 제시한다. 지금까지의 다차원 파일구조는 응용 시스템에서 주어지는 질의의 패턴을 고려하지 않고 다차원 파일구조를 구성하는 애트리뷰트들의 클러스터링 정도를 동일하게 취급하였다. 그러나 다차원 파일구조를 이용하는 대부분의 응용 시스템에서 구성 애트리뷰트들 사이의 액세스 정도를 크게 다르게 하는 질의 패턴을 보인다. 따라서 본 논문에서는 다차원 파일구조의 응용 시스템에서 주어지는 질의 정보를 이용하여 각 구성 애트리뷰트들 사이의 클러스터링 정도를 각각 다르게 반영함으로써 최적이 되는 다차원 파일구조를 구성하는 방안을 제시한다. 먼저 질의처리의 성능이 질의 패턴에 주어진 질의 영역의 모양과 다차원 파일구조의 도메인 공간의 분할 상태를 나타내는 페이지 영역의 모양 사이의 유사성에 따라 크게 영향 받음을 보이고, 이러한 특성을 이용하여 수학적 분석을 통하여 제안된 기법의 이론적인 배경을 증명한다.

  • PDF

Weighting and Query Structuring Scheme for Disambiguation in CLTR (교차언어 문서검색에서 중의성 해소를 위한 가중치 부여 및 질의어 구조화 방법)

  • Jeong, Eui-Heon;Kwon, Oh-Woog;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.175-182
    • /
    • 2001
  • 본 논문은 사전에 기반한 질의변환 교차언어 문서검색에서, 대역어 중의성 문제를 해결하기 위한, 질의어 가중치 부여 및 구조화 방법을 제안한다. 제안하는 방법의 질의 변환 과정은 다음의 세 단계로 이루어진다. 첫째, 대역어 클러스터링을 통해 먼저 질의어 단어의 적합한 의미를 결정짓고, 둘째, 문맥정보와 지역정보를 이용하여 후보 대역어들간의 상호관계를 분석하며, 셋째, 각 후보 대역어들을 연결하여, 후보 질의어를 만들고 각각에 가중치를 부여하여 weighted Boolean 질의어로 생성하게 된다. 이를 통해, 단순하고 경제적이지만, 높은 성능을 낼 수 있는 사전에 의한 질의변환 교차언어 문서검색 방법을 제시하고자 한다.

  • PDF

Answer Extraction in Record Sentence using Guinness Record Adverb and Answer-Type (기네스 기록 부사와 정답 유형을 이용한 기록문장에서의 정답 추출)

  • Oh Su-Hyun;Ahn Young-Min;Lee Chung-Hee;Seo Young-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.1-3
    • /
    • 2006
  • 본 논문에서는 기네스 기록과 같은 기록정보 즉, 기록적 가치가 있는 문장에 대한 질의가 들어왔을 경우기록 부사와 정답 유형을 이용하여 정답을 추출하는 시스템에 대해 기술한다. 기록정보는 역사적이고 사실적인 내용으로, 기록부사틀 포함하는 문장을 말한다. 기록부사는 기록정보 내에서 쓰이며 어떤 사실의 기록에 대해 뜻을 명확하게 나타내어주는 한 요소이고, 이것은 해당문장이 기록문장임을 나타내준다. 이는 질의-응답 시스템에서 정답 추출의 중요한 단서로 사용될 수 있다. 질의-응답 시스템은 크게 질의를 분석하는 부분과 정답 문서를 찾는 부분으로 나뉘며, 질의 분석을 통하여 기록부사로 지역정보 그리고 정답유형을 결정한 후 이를 이용하여 후보 문서를 검색, 추출하고 정의문 규칙과 개체명 태깅에 의하여 정답을 추출하게 된다.

  • PDF

A design and implementation of query processor for travel information retrieval system (관광 정보 검색을 위한 자연언어 질의 해석 시스템 구현)

  • Kim, Myong-Cheol;Seo, Kwang-Jun;Jeon, Kyong-Hun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.449-458
    • /
    • 1992
  • 본 논문은 관광정보검색용 한국어 자연언어 질의 해석 시스템의 모델 정립 및 구현에 대한 것이다. 본 자연언어 질의 해석 시스템은 질의로 부터 정보 검색 시스템의 검색어들을 추출한다. 이를 위하여 1만 단어 수준의 중형사전을 구축하였으며, 불용어 사전, 전거어 사전, 유사어 사전, 복합명사 사전을 구축하였다. 사전의 어휘를 추출하기 위해서 한국어 대화체 문장에 대한 자료수집과 분석을 하였으며, 관광 정보 검색 시스템의 텍스트를 분석하였다. 200여 자연언어 질의 문장으로 실험한 결과는 비교적 좋았다.

  • PDF

Greedy Query Optimization Performance Analysis for Join Continuous Query over Data Streams (데이터 스트림 환경에서의 조인 연속 질의의 그리디 질의 최적화 성능 분석)

  • Park, Hong-Kyu;Lee, Won-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.361-364
    • /
    • 2006
  • 최근에 제한된 데이터 셋보다 센서 데이터 처리, 웹 서버 로그나 전화 기록과 같은 다양한 트랜잭션 로그 분석 등과 관련된 데이터 스트림 처리에 더 많은 관심이 집중되고 있으며, 특히 데이터 스트림의 질의 처리에 대한 관심이 증가하고 있다. 본 논문에서는 질의 중에서 2 개 이상의 스트림을 조인하는 조인 연속 질의를 처리하는 방법과 성능에 대해서 연구한다. 각 조인의 비용을 스트림의 입력 속도와 조인 선택도를 이용한 조인 비용 모델로 정의하고 그리디 알고리즘을 이용하여 최적화하는 기법을 제안하고 실험을 통해 다양한 스트림 환경에서 최적화 알고리즘이 어떤 성능을 보이는 지를 알아본다.

  • PDF

Design and Performance Analysis of MapReduce-based kNN join Query Processing Algorithm (맵리듀스 기반 kNN join 질의처리 알고리즘의 설계 및 성능평가)

  • Kim, TaeHoon;Lee, HyunJo;Chang, JaeWoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.733-736
    • /
    • 2014
  • 최근 대용량 데이터에 대한 효율적인 데이터 분석 기법이 활발히 연구되고 있다. 대표적인 기법으로는 맵리듀스 환경에서 보로노이 다이어그램을 이용한 k 최근접점 조인(VkNN-join) 알고리즘이 존재한다. VkNN-join 알고리즘은 부분집합 Ri에 연관된 부분집합 Sj만을 후보탐색 영역으로 선정하여 질의를 처리하기 때문에 질의처리 시간을 감소시킨다. 그러나 VkNN-join은 색인 구축 비용이 높으며, kNN 연산 오버헤드가 큰 문제점이 존재한다. 이를 해결하기 위해, 본 논문에서는 대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘을 제안한다. 제안하는 알고리즘은 시드 기반의 동적 분할을 통해 색인구조 구축비용을 감소시킨다. 또한 시드 간 평균 거리를 기반으로 후보 영역을 선정함으로써, 연산 오버헤드를 감소시킨다. 아울러, 성능 평가를 통해 제안하는 기법이 질의처리 시간 측면에서 기존 기법에 비해 우수함을 나타낸다.

Design and Implementation of a query Processor Supporting the ODMG-93 Standard (오디세우스 객체지향 멀티미디어 DBMS를 위한 ODMG-93 표준을 지원하는 질의 처리기의 설계 및 구현)

  • 이민재;유치헌;한욱신;황규영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.361-363
    • /
    • 1999
  • 객체지향 데이터베이스 관리 시스템(OODBS)을 위한 표준의 중요성이 증가함에 따라, Object Database Management Group(ODMG)에서 제안된 ODMG-93 명세는 사실상의 업계 표준으로 자리잡고 있다. 많은 OODBMS들이 ODMG-93을 채택하고 있지만, 일부 시스템만이 실제 명세를 따르고 있다. 특히, 대부분의 시스템은 OODBMS의 가장 중요한 부분 중 하나인 ODMG-93 객체 질의 언어(OQL)에 대한 지원이 미흡한 실정이다. 본 논문에서는 OQL을 지원하기 위한 질의 처리기를 설계하고 구현한다. 우선, OQL을 지원하기 위한 요구 사항을 분석한다. 다음으로 분석된 요구사항에 따라 질의 처리기를 구현한다. 구현된 질의 처리기는 OQL의 가장 중요한 기능인 경로식, 메소드 호출, 명시적 조인, 객체 생성, 다형성 등을 지원한다.

  • PDF

Analyzing of Hangul Search Query Spelling Error Patterns and Developing Query Spelling Correction System Based on User Logs (한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 질의어 오타 교정 시스템 구축)

  • Jeon, Hee-Won;Huang, Daniel;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.15-21
    • /
    • 2010
  • 본 논문은 검색 서비스 기능 중에 빼놓을 수 없는 기능인 한글 검색 질의어(query) 교정 시스템을 '야후!'에서 구축하며 분석한 한글 오타 패턴 그리고 사용자 로그를 기반으로 설계한 질의어 교정 서비스에 대한 설명을 하고 있다. 이 교정 서비스는 현재 '야후! 코리아'에 적용되어 있으며, 한글을 고려한 키스트 로크를 기반으로 한 설계 방식 그리고 동적으로 에러모델을 구축하는 방법을 소개하고 있으며 또한 구축된 모델의 성능을 다른 검색 서비스와 비교한 결과를 소개한다.

  • PDF

A Problem Analysis of Skyline Queries using Space Partitioning Techniques (공간 분할 방법을 사용하는 Skyline 질의 방법의 문제점 비교 분석)

  • Ihm, Sun-Young;Park, Eun-Young;Park, Young-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1382-1384
    • /
    • 2012
  • 최근 대용량 혹은 복잡한 데이터에서의 빠른 검색을 돕는 Skyline 질의 처리에 대한 관심이 높아지고 있으며, 많은 응용프로그램에서 사용되고 있다. Skyline 질의는 데이터베이스의 튜플들을 공간상으로 표현하여 질의 처리를 할 수 있는 데, 이 때 빠른 처리를 위하여 공간 분할 기법이 사용된다. 본 논문에서는 공간 분할 기법을 사용한 Skyline 질의 방법들을 소개하고 문제점을 분석한다. 또한, 문제점 해결 방안을 함께 제시하며 기대 효과를 예측한다.