• 제목/요약/키워드: Rule Extraction

검색결과 198건 처리시간 0.026초

정의형 질의응답 시스템을 위한 정답 패턴 (Answer Pattern for Definitional Question-Answering System)

  • 서영훈;신승은
    • 한국콘텐츠학회논문지
    • /
    • 제5권3호
    • /
    • pp.209-215
    • /
    • 2005
  • 본 논문에서는 정의형 질의응답 시스템을 위한 정답 패턴에 대하여 기술한다. 정의형 질의응답 시스템은 정의형 질의에 대한 정답으로 단답형 정답이 아닌 서술형 정답을 제공하기 때문에, 정답 추출 방법이 일반적인 단답형 정답 추출 방법과 다르다. 정의형 정답 패턴을 이용한 정의형 정답 추출은 의미 분석없이 정확한 정의형 정답을 추출할 수 있다. 정의형 정답 패턴은 정확한 정답 추출을 위해 정답 패턴과 패턴별 제약 규칙, 우선순위로 구성된다. 정의형 정답 학습 코퍼스로부터 정답 패턴을 추출하고, 각각의 정답 패턴에 대한F-measure에 따라 최적화하여 패턴별 제약 규칙을 구성한다. 마지막으로 정확률과 정답 패턴 구문 구조를 이용하여 우선순위를 결정한다. 제안한 정의형 정답 패턴을 이용한 정의형 정답 추출은 실험 코퍼스에 대해 정확률 0.8207, 재현율 0.9268, F-measure 0.8705를 보였다. 이것은 제안한 방법이 정의형 질의응답 시스템에 효율적으로 사용될 수 있음을 의미한다.

  • PDF

XRML 기반 비교쇼핑몰의 구조와 배송비 산정에 관한 실증분석 (Architecture of XRML-based Comparison Shopping Mall and Its Performance on Delivery Cost Estimation)

  • 이재규;강주영
    • 한국경영과학회지
    • /
    • 제30권2호
    • /
    • pp.185-199
    • /
    • 2005
  • With the growth of internet shopping malls, there is increasing interest in comparison shopping mall. However most comparison sites compare only book prices by collecting simple XML data and do not provide .the exact comparison Including precise shipping costs. Shipping costs vary depending on each customer's address, the delivery method, and the category of selected goods, so rule based system is required in order to calculate exact shipping costs. Therefore, we designed and implemented comparison shopping mall which compares not only book prices but also shipping costs using rule based inference. By adopting the extensible Rule Markup language (XRML) approach, we proposed the methodology of extracting delivery rules from Web pages of each shopping mall. The XRML approach can facilitate nearly automatic rule extraction from Web pages and consistency maintenance between Web pages and rule base. We developed a ConsiderD system which applies our rule acquisition methodology based on XRML. The objective of the ConsiderD system is to compare the exact total cost of books including the delivery cost over Amazon.com, BarnesandNoble.com, and Powells.com. With this prototype, we conducted an experiment to show the potential of automatic rule acquisition from Web pages and illustrate the effect of delivery cost.

규칙에 기초한 마스크 레이아웃 변환 시스템의 설계 및 구현 (Design and Implementation of Rule-based Mask Layout Transformation System)

  • 이재황;전주식
    • 전자공학회논문지A
    • /
    • 제30A권9호
    • /
    • pp.46-58
    • /
    • 1993
  • Owing to the nature of locality in mask layouts, it appears that most mask layout problems can be solved by transforming a part of the given mask layout into a better layout segment continuously toward a global suboptimal solution. This notion of local transformation addresses major weak points of existing mask layout processing systems, which lack both extensibility and unifiability. This paper attempts to elaborate upon developing a new rule-based mask layout transformation system wherein most of the mask layout problems can be solved under the unified framework of local mask layout transformation. The rule-based mask layout transformation system is applicable to various mask layout problems such as net extraction, mask layout compaction, mask layout editing, and design rule checking. The experimental results show that the rule-based expert system approach is an efficient means of solving those mask layout problems, and thus confronting major drawbacks of existing layout processing systems.

  • PDF

함수근사와 규칙추출을 위한 클러스터링을 이용한 강화학습 (Reinforcement Learning with Clustering for Function Approximation and Rule Extraction)

  • 이영아;홍석미;정태충
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1054-1061
    • /
    • 2003
  • 강화학습의 대표적인 알고리즘인 Q-Learning은 상태공간의 모든 상태-행동 쌍(state-action pairs)의 평가값이 수렴할 때까지 반복해서 경험하여 최적의 전략(policy)을 얻는다. 상태공간을 구성하는 요소(feature)들이 많거나 요소의 데이타 형태가 연속형(continuous)인 경우, 상태공간은 지수적으로 증가하게 되어, 모든 상태들을 반복해서 경험해야 하고 모든 상태-행동 쌍의 Q값을 저장하는 것은 시간과 메모리에 있어서 어려운 문제이다. 본 논문에서는 온라인으로 학습을 진행하면서 비슷한 상황의 상태들을 클러스터링(clustering)하고 새로운 경험에 적응해서 클러스터(cluster)의 수정(update)을 반복하여, 분류된 최적의 전략(policy)을 얻는 새로운 함수근사(function approximation)방법인 Q-Map을 소개한다. 클러스터링으로 인해 정교한 제어가 필요한 상태(state)는 규칙(rule)으로 추출하여 보완하였다. 미로환경과 마운틴 카 문제를 제안한 Q-Map으로 실험한 결과 분류된 지식을 얻을 수 있었으며 가시화된(explicit) 지식의 형태인 규칙(rule)으로도 쉽게 변환할 수 있었다.

데이터마이닝 로드맵 개발과 수처리 응집제 제어를 위한 데이터마이닝 적용 (Development of Datamining Roadmap and Its Application to Water Treatment Plant for Coagulant Control)

  • 배현;김성신;김예진
    • 한국정보통신학회논문지
    • /
    • 제9권7호
    • /
    • pp.1582-1587
    • /
    • 2005
  • 본 논문은 정수장에서 사용하는 응집제의 종류를 결정하기 위한 시스템 개발에 관한 내용이다. 정수장은 여러 단위 처리장으로 구성되며, 불순물을 제거하기 위하여 혼화지에서 응집제를 주입하여 침전을 시킨다. 현재까지 응집제 결정을 위해 Jar-test를 이용하는데, 이 방법은 사람의 주관적인 판단에 의존하므로 실험 오차가 발생할 수 있다. 특히 정수장의 자동화를 위한 시스템 개발에서 가장 큰 걸림돌로 작용하고 있다. 본 논문은 이러한 문제점을 해결하기 위하여 로드맵에 기초한 데이터마이닝 기법을 이용하여 응집제를 선택할 수 있는 제어기를 개발하였다. 제어 규칙은 클러스터링 기법으로 도출하였는데, 군집의 초기 값과 개수는 통계적 지수 값을 사용하여 결정하였다.

EM 알고리즘에 의한 뉴로-퍼지 시스템의 퍼지 규칙 생성 (Fuzzy rule Extraction of Neuro-Fuzzy System using EM algorithm)

  • 김승석;곽근창;유정웅;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.170-173
    • /
    • 2002
  • 본 논문에서는 여러 분야에서 널리 응용되고 있는 적응 뉴로-퍼지 시스템(ANFIS)에서의 효과적인 퍼지 규칙 생성방법을 제안한다. ANFIS의 성능 개선을 위해 구조동정을 수행함에 있어서 전제부 파라미터는 EM(Expectation-Maximization) 알고리즘을 적용하였으며, 파라미터학습은 Jang에 의한 하이브리드 방법을 적용한다. 여기서 초기의 중심과 분산을 구하기 위해 FCM(Fuzzy c-means) 클러스터링 기법을 사용하였다. 이렇게 함으로서 적은 규칙 수를 가지면서도 효율적인 퍼지 규칙을 얻을 수 있도록 하였다. 이들 방법의 유용함을 보이고자 Box-Jenkins의 가스로 데이터에 적용하여 제안된 방법이 이전의 연구보다 좋은 결과를 보임을 보이고자 한다

  • PDF

Environment for Translation Domain Adaptation and Continuous Improvement of English-Korean Machine Translation System

  • Kim, Sung-Dong;Kim, Namyun
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제12권2호
    • /
    • pp.127-136
    • /
    • 2020
  • This paper presents an environment for rule-based English-Korean machine translation system, which supports the translation domain adaptation and the continuous translation quality improvement. For the purposes, corpus is essential, from which necessary information for translation will be acquired. The environment consists of a corpus construction part and a translation knowledge extraction part. The corpus construction part crawls news articles from some newspaper sites. The extraction part builds the translation knowledge such as newly-created words, compound words, collocation information, distributional word representations, and so on. For the translation domain adaption, the corpus for the domain should be built and the translation knowledge should be constructed from the corpus. For the continuous improvement, corpus needs to be continuously expanded and the translation knowledge should be enhanced from the expanded corpus. The proposed web-based environment is expected to facilitate the tasks of domain adaptation and translation system improvement.

Korean Coreference Resolution with Guided Mention Pair Model Using Deep Learning

  • Park, Cheoneum;Choi, Kyoung-Ho;Lee, Changki;Lim, Soojong
    • ETRI Journal
    • /
    • 제38권6호
    • /
    • pp.1207-1217
    • /
    • 2016
  • The general method of machine learning has encountered disadvantages in terms of the significant amount of time and effort required for feature extraction and engineering in natural language processing. However, in recent years, these disadvantages have been solved using deep learning. In this paper, we propose a mention pair (MP) model using deep learning, and a system that combines both rule-based and deep learning-based systems using a guided MP as a coreference resolution, which is an information extraction technique. Our experiment results confirm that the proposed deep-learning based coreference resolution system achieves a better level of performance than rule- and statistics-based systems applied separately

퍼지 균등화와 유전알고리즘에 의한 자동적인 퍼지 규칙 생성 (An Automatic Fuzzy Rule Extraction using Fuzzy Equalization and GA)

  • 곽근창;김승석;유정웅;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.121-125
    • /
    • 2001
  • 본 논문에서는 자동적인 퍼지 규칙 생성을 위해 퍼지 균등화(Fuzzy Equalization)와 유전알고리즘(Genetic Algorithm)을 이용한 TSK 퍼지 시스템의 구축을 다룬다. Pedrycz에 의해 제안된 퍼지 균등화 방법은 수치적인 데이터로부터 확률분포함수를 구축한 후 전체공간상에서 이들을 적절히 표현할 수 있는 소속함수를 생성한다. 이렇게 구축된 각 입력에 대한 소속함수는 유전알고리즘에 의해 입력공간이 분할되며 결론부 파라미터는 최소자승법에 의해 추정되어 진다. 제안된 방법은 그리드 분할로 인해 규칙의 수가 증가하는 문제를 해결하고 학습데이터와 검증데이터에 의해 타당한 입력공간분할과 퍼지 규칙을 생성할 수 있다. 시뮬레이션의 예로서 Box-Jenkins의 가스로 데이터의 모델링에 적용하여 제안된 방법의 유용성을 알 수 있다.

  • PDF

The HCARD Model using an Agent for Knowledge Discovery

  • Gerardo Bobby D.;Lee Jae-Wan;Joo Su-Chong
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제14권3호
    • /
    • pp.53-58
    • /
    • 2005
  • In this study, we will employ a multi-agent for the search and extraction of data in a distributed environment. We will use an Integrator Agent in the proposed model on the Hierarchical Clustering and Association Rule Discovery(HCARD). The HCARD will address the inadequacy of other data mining tools in processing performance and efficiency when use for knowledge discovery. The Integrator Agent was developed based on CORBA architecture for search and extraction of data from heterogeneous servers in the distributed environment. Our experiment shows that the HCARD generated essential association rules which can be practically explained for decision making purposes. Shorter processing time had been noted in computing for clusters using the HCARD and implying ideal processing period than computing the rules without HCARD.

  • PDF