• 제목/요약/키워드: 규칙 기반 질의 처리

검색결과 73건 처리시간 0.026초

맵리듀스 환경에서 규칙 기반 분류화를 이용한 궤적 데이터 주행 시간 예측 알고리즘 (Travel Time Prediction Algorithm for Trajectory data by using Rule-Based Classification on MapReduce)

  • 김재원;이현조;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.798-801
    • /
    • 2014
  • 여행 정보 시스템(ATIS), 교통 관리 시스템 (ITS) 등 궤적 기반 서비스에서, 서비스 품질을 향상시키기 위해서는 주어진 궤적 질의에 대한 정확한 주행시간을 예측하는 것이 필수적이다. 이를 위한 대표적인 공간 데이터 분석 기법으로는 데이터 분류에서 높은 정확도를 보장하는 규칙 기반 분류화 기법이 존재한다. 그러나 기존 규칙 기반 분류화 기법은 단일 컴퓨터 환경만을 고려하기 때문에, 대용량 공간 데이터 처리에 적합하지 않은 문제점이 존재한다. 이를 해결하기 위해, 본 연구에서는 맵리듀스 환경에서 규칙 기반 분류화를 이용한 궤적 데이터 주행 시간 예측 알고리즘을 개발하고자 한다. 제안하는 알고리즘은 첫째, 맵리듀스를 이용하여 대용량 공간 데이터를 병렬적으로 분석함으로써, 활용도 높은 궤적 데이터 규칙을 생성한다. 이를 통해 대용량 공간 데이터 기반의 규칙 생성 시간을 감소시킨다. 둘째, 그리드 구조 기반의 지도 데이터 분할을 통해, 사용자 질의처리 시 탐색 성능을 향상시킨다. 즉, 주행 시간 예측을 위한 규칙 그룹을 탐색 시 질의를 포함하는 그리드 셀만을 탐색하기 때문에, 질의처리 성능이 향상된다. 마지막으로 맵리듀스 구조에 적합한 질의처리 알고리즘을 설계하여, 효율적인 병렬 질의처리를 지원한다. 이를 위해 맵 함수에서는 선정된 그리드 셀에 대해, 질의에 포함된 도로 구간에서의 주행 시간을 병렬적으로 측정한다. 아울러 리듀스 함수에서는 출발 시간 및 구간별 주행 시간을 바탕으로 맵 함수의 결과를 병합함으로써, 최종 결과를 생성한다. 이를 통해 공간 빅데이터 분석을 통한 주행 시간 예측 기법의 처리 시간 및 결과 정확도를 향상시킨다.

개념 기반 질의-응답 시스템에서 개념 규칙을 이용한 해답 추출 (Answer Extraction using Concept Rules in Concept-based Question-Answering System)

  • 강유환;안영민;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-188
    • /
    • 2005
  • 본 논문에서는 개념 기반 질의-응답 시스템에서 개념 규칙을 이용하여 해답을 추출하는 방법에 대하여 기술한다. 개념 기반 질의-응답 시스템은 질의문의 각 유형별 개념 정보를 이용하여 질의문을 분석하고 해답을 추출하는 시스템이다. 질의문의 키워드들을 개념에 따라 분류하고, 질의 유형별로 공통적으로 나타나는 개념들을 이용하여 개념 프레임을 정의한다. 또한, 개념 정보와 해답이 들어 있는 문장과 문단에서 공통적으로 나타나는 구문 특성을 이용하여 해답 추출을 위한 규칙을 작성한다. 개념 규칙은 형태 정보와 구문 정보를 포함하며, 질의 유형별로 따로 작성한다. 작성된 규칙을 이용하여 문서로부터 해답이 들어 있는 문장과 문단을 추출한 후 질의문의 해답 유형에 해당하는 개체를 해답 후보로 제시한다. 실험 결과 개념 규칙을 이용한 해답 추출의 정확도가 매우 높게 나타났다.

  • PDF

다중 언어 인명 검색에 관한 연구 (A Study on a Multilingual name Retrieval)

  • 조영화;송재용;류근호
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2271-2280
    • /
    • 1998
  • 이 논문은 로마자 표기 한글 인명의 효율적 검색 방안의 제시와 규칙기반 다중 언어 인명 검색 시스템의 설계에 관한 것이다. 기존의 서지 정보 검색 시스템이나 논문 검색 시스템에서 사람마다 제각기 표기되고 있는 로마자표기 한글 인명을 효율적으로 검색하는데 상당한 어려움이 따랐다. 예를 들어, 한글 인명 "홍길동"의 로마자 표기는 "Hong, gildong", "Gildong Hong", "Hong Kil dong", "Hong kil-dong"등 철자나 표기 양식이 매우 다양하다.이 논문에서는 이렇게 다양하게 표기되는 로마자 표기 한글 인명을 효율적으로 검색하기 위해 규칙기반을 이용한 질의 확장법을 제안하고 질의분류기, 예외처리기, 질의확장기, 질의실행기, 예외규정집, 규칙기반으로 구성된 다중 언어 인명 검색 시스템을 설계한다. 또한 인명생성기의 구현과 실행을 통해 규칙기반 질의 확장법의 효율적 검색 가능성을 보이도록 한다.

  • PDF

객체 지향 질의 처리에서 의미적 재작성 규칙에 관한 연구 (Semantic Rewrite Rules at Object Oriented Query processing)

  • 이홍로;곽훈성;류근호
    • 한국정보처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.443-452
    • /
    • 1995
  • 객체 지향 데이타베이스 시스템은 복잡한 데이타 관리 기능에 대한 응용을 제공하 는 효과적인 해결책으로써 제안되어왔다. 질의 처리와 같은 문제점에 대한 연구와 이 러한 요구를 입증하는 것은 형식적인 객체지향 질의 모델이 없어서 진척되지 못하고 있다. 본 논문은 집단화 상속성에 기반한 질의 모델을 정의하며, 질의의 대수 표현에 서 재작성 규칙을 보존하는 동등성에 적용할 수 있는 의미적 재작성 규칙을 개발한다. 이질의 모델을 의미적으로 분석하여 논리적으로 최적화하고, 질의의 대수식들은 등가 보존 재작성 규칙에 의하여 최적화될 수 있다.

  • PDF

패턴정보에 의한 OQL 질의 처리 기법 (A Study on OQL Query Processing Techniques by Pattern Information)

  • 김효진;이준상
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2001년도 추계산학기술 심포지엄 및 학술대회 발표논문집
    • /
    • pp.224-229
    • /
    • 2001
  • 컴퓨터나 데이터베이스에 대한 지식이 없는 사용자들도 데이터베이스에 저장되어 있는 정보를 쉽게 얻을 수 있도록 도와줄 수 있도록 하는 것이 데이터베이스 시스템을 위한 자연어 인터페이스이다. 이 논문은 이 자연어 인터페이스를 고려한 차세대 데이타베이스, 객체 지향 데이타베이스를 바탕으로 질의어 처리를 OQL(Object Query Language)명령문으로 구축 기법을 연구하고자 한다. 여기서 질의어 처리는 한국어 인터페이스를 바탕으로 하며, 질의를 패턴별로 분해, 프레임 변환, 객체 지향 데이타베이스를 위한 OQL 명령문으로 구축한다. 질의의 효과적인 변환을 위해 프레임 기반 질의 분해 기법을 제안하였으며, 이 기법은 분해된 질의구 별로 변환과정을 수행하여, 질의 처리의 성능을 향상시킨다. 질의 프레임을 생성하기 위해 변환규칙을 사용하여 규칙 베이스를 구축하는 기법을 연구하였다.

객체 데이터베이스를 이용한 바이오 XML 저장시스템 (The Bio-XML Storage System Using Object Database Systems)

  • 김태경;이경희;임정곤;정태성;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.235-237
    • /
    • 2004
  • 본 논문은 객체 데이터베이스 속성을 적용하여 데이터베이스 스키마를 생성하고 XML문서를 저장하는 기법을 제안한다 기존의 관계형 데이터베이스는 트리 기반의 XML 문서를 플랫한 테이블에 저장하므로 모델 불일치 문제가 발생한다. 또한, 문서를 검색할 때 고비용의 조인 연산이 필요하다. 하지만 객체 데이터베이스의 집합값 속성과 객체참조 속성은 트리 기반의 IDA 문서를 저장할 때 모델 측면에서 자연스럽다. 집합간 속성과 객체참조 속성은 Uを질의에 자주 사용되는 경로질의 및 순서를 이용하는 질의를 처리할 때게도 유리하다. 본 논문에서는 객체 데이터베이스의 집합값 속성과 객체참조 속성을 이용하여 XML 문서를 저장하기 위한 2가지의 DTD의존적 스키마 설계 기법인 i) 기본 규칙, ii) 인라인 규칙을 제시한다. 다양한 XML 문서에 대해 각각의 규칙에 따른 클래스 수, 저장 공간, 그리고 질의처리 시간을 비교 분석하였다.

  • PDF

2-패스 색인 기법과 규칙 기반 질의 처리기법을 이용한 고속, 고성능 질의 응답 시스템 (A Fast and Powerful Question-answering System using 2-pass Indexing and Rule-based Query Processing Method)

  • 김학수;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.795-802
    • /
    • 2002
  • 본 논문은 2-패스 점수 부여 방법에 기초한 정답 후보 색인기를 이용하여 고속, 고정밀의 질의 응답을 실현하는 한국어 질의 응답 시스템을 제안한다. 제안한 정답 후보 색인기의 색인 과정은 다음과 같다. 먼저, 대상 문서에 포함된 모든 정답 후보들을 추출한다. 그리고, 2-패스 점수 부여 방법을 이용하여 각 정답 후보와 밀접하게 연관된 주변 내용어들에게 점수를 부여한다. 마지막으로 데이터베이스에 각 정답과 점수가 부여된 내용어들을 역파일 형태로 저장한다. 사용자의 질의에 포함된 의도(질의 유형)을 파악하기 위해서는 수동으로 구축된 lexico-syntactic 패턴을 이용한다. 이러한 색인 방법과 질의 처리 방법을 이용하여, 제안된 질의 응답 시스템은 빠른 응답 시간을 보장하고 정확률을 향상시킨다.

질의 기반 사용자 감정상태 예측 (Query-based User Emotion Prediction)

  • 민혜진;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.211-214
    • /
    • 2014
  • 본 연구에서는 질의를 기반으로 사용자의 감정상태를 예측하는 방법을 제안한다. 제안방법은 자극-감정 규칙베이스 구축, 규칙확률 값 기반 질의 랭킹, 질의 랭킹 기반 사용자 감정예측의 단계로 구성된다. 방법의 적절성을 검증하기 위하여 힘들다와 심심하다에 대한 결과로 사용자평가를 실시하였다. 힘들다의 결과에서는 힘들다 정도에 대한 점수가 높은 질의들을 지속적으로 검색하는 사용자들을 힘들다라고 판단할 수 있다고 분석되었다. 심심하다의 결과에서는 방법 간 유의미한 차이를 보이지 않았으나, 특정 개별질의의 지속적인 패턴을 분석하는 것이 좀 더 높은 점수를 얻은 것으로 평가되었다.

  • PDF

챗봇 프레임워크 성능 향상을 위한 점진적 학습 기법 (Incremental Learning for Performance Enhancement of Chatbot Framework)

  • 박상현;박진욱;조수헌;현제혁;황진성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.283-284
    • /
    • 2019
  • 규칙 기반의 챗봇(Chatbot)은 개발자가 미리 지정한 키워드와 패턴을 통해 사용자의 의도(Intent)를 파악하기 때문에, 챗봇을 응용한 어플리케이션에서는 제한적인 활용도를 보인다. 본 논문에서는 위 문제를 해결하기 위해, 프레임워크 기반의 한글 자연어 처리 챗봇 성능 향상을 위한 점진 학습(Incremental Learning)을 제안한다. DialogFlow는 규칙 기반의 챗봇 프레임워크로서, 사용자 질의 패턴에 대한 사전 학습이 치명적이다. 제안하는 점진 학습 기법은 사용자 질의가 미리 학습되어 있지 않은 경우에도, 유사도 기반으로 질의의 의도를 결정할 수 있다. 이때 entity 조합과 기존에 학습된 질의들과의 유사도를 통해 의도를 결정하여, 프레임워크를 점진적으로 학습한다. 이를 적용하여 연세대학교 정보들을 제공하는 챗봇을 개발하고, 실험을 통해 제안된 점진 학습 기법은 기존 시스템보다 다양한 종류의 질의 처리가 가능하고, 더욱 빠른 응답 속도를 나타내는 것을 확인하였다. 또한 사용자가 증가함에 따라 점진 학습을 통해 성능이 더욱 증가하는 자가 학습 모형으로서의 우수함을 확인하였다.

  • PDF

의문의 초점을 고려한 자연어 기반의 정보검색 시스템 (Natural language based Information Retrieval System considering the focus of the question)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF