• Title/Summary/Keyword: 연관 규칙 생성

Search Result 192, Processing Time 0.053 seconds

Automatic Error Detection of Morpho-syntactic Errors of English Writing Using Association Rule Analysis Algorithm (연관 규칙 분석 알고리즘을 활용한 영작문 형태.통사 오류 자동 발견)

  • Kim, Dong-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.3-8
    • /
    • 2010
  • 본 연구에서는 일련의 연구에서 수집된 영작문 오류 유형의 정제된 자료를 토대로 연관 규칙을 생성하고, 학습을 통해서 효용성이 검증된 연관 규칙을 활용해서 영작문 데이터의 형태 통사 오류를 자동으로 탐지한다. 영작문 데이터에서 형태 통사 오류를 찾아내는 작업은 많은 시간과 자원이 소요되는 작업이므로 자동화가 필수적이다. 기존의 연구들이 통계적 모델을 활용한 어휘적 오류에 치중하거나 언어 이론적 틀에 근거한 통사 처리에 집중하는 반면에, 본 연구는 데이터 마이닝을 통해서 정제된 데이터에서 연관 규칙을 생성하고 이를 검증한 후 형태 통사 오류를 감지한다. 이전 연구들에서는 이론적 틀에 맞추어진 규칙 생성이나 언어 모델 생성을 위한 대량의 코퍼스 데이터와 같은 다량의 지식 베이스 생성이 필수적인데, 본 연구는 적은 양의 정제된 데이터를 활용한다. 영작문 오류 유형의 형태 통사 연관 규칙을 생성하기 위해서 Apriori 알고리즘을 활용하였다. 알고리즘을 통해서 생성된 연관 규칙 중 잘못된 규칙이 생성될 가능성이 있으므로, 상관성 검정, 코사인 유사도와 같은 규칙 효용성의 통계적 검증을 활용해서 타당한 규칙만을 학습하였다. 이를 통해서 축적된 연관 규칙들을 영작문 오류를 자동으로 탐지하는 실험에 활용하였다.

  • PDF

An Association Rules Mining System based-on SQL (SQL을 이용한 연관 규칙 탐사 시스템)

  • 전수정;김영지;우용태
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.89-94
    • /
    • 2000
  • 본 논문에서는 연관 규칙 탐사 시스템을 설계하고 구현하였다. 본 시스템은 관계형 데이터베이스의 표준 질의어를 이용하여 사용자가 제시한 질의 조건을 만족하는 항목집합에 대해 다양한 형태의 연관규칙을 탐사하기 위한 시스템이다. 질의처리 모듈에서는 사용자가 제시한 조건을 만족하는 질의를 동적으로 구성하여, 연관 규칙 탐사를 위해 사용되는 대상 트랜잭션 데이타베이스의 범위를 조절할 수 있다. 연관 규칙을 발견하기 위한 후보 항목집합을 생성하기 위해 연관 규칙 탐사 알고리즘을 사용하였다. 연관 규칙 알고리즘에서는 한 트랜잭션 데이타에 대해 생성될 수 있는 후보 항목집합을 배열을 이용하여 처리하는 효율적인 방법을 제안하였다.

  • PDF

A Method Mining RFID Data Using Generation Meta-Rules (메타 규칙 생성에 의한 RFID 데이터 마이닝 기법)

  • Kim, Young-Hee;Lee, Chang-Yeol;Kang, En-Young;Kim, Ung-Mo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.145-148
    • /
    • 2006
  • RFID 데이터에 대한 연관 규칙을 효율적으로 생성하기 위해서는 단일 개념 레벨에서 연관 규칙을 찾는 방법과는 달리 다단계 개념 레벨에서 의미 있는 정보를 발견할 수 있다. 이로부터 연관 규칙을 생성하게 되면 최상위 레벨의 정보를 통해 하위 레벨의 객체 이동 정보나 위치 정보, 상태 정보를 빠르게 획득 가능하다. 또한, 다차원 레벨을 갖는 연관 규칙 마이닝을 수행할 때 메타 규칙의 생성은 제한적이고 유용한 규칙만을 효율적으로 생성 가능하도록 할 수 있다. 따라서, 생성된 메타 규칙을 이용하여 많은 양의 데이터에서 질의를 효과적으로 수행 할 수 있을 뿐만 아니라, 데이터베이스의 저장 효율을 높이고, 객체간의 숨겨진 연관 관계를 발견하는데 있어 효율적인 방법이다.

  • PDF

Frequent Closed Itemset Mining by Using a Space Compression and Efficient Search Technique (공간 압축 및 효율적 탐사 기법을 이용한 빈발 폐쇄 항목집합 마이닝)

  • 박귀정;한영우;이수원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.392-394
    • /
    • 2003
  • 연관 규칙 마이닝은 일반적으로 않은 빈발항목집합과 연관 규칙을 생성하며, 생성된 연관 규칙은 상호 포함관계에 있거나 중복되는 경우가 많다. 이는 효과적인 마이닝 뿐 아니라 마이닝의 활용 효용성을 떨어뜨린다. 이를 해결하기 위하여 연관 규칙 마이닝과 동일한 성능을 가지며 생성되는 규칙의 수를 줄일 수 있는 빈발 폐쇄 항목집합 마이닝이 제안되었다. 본 연구에서는 연관규칙 마이닝 방법 중 가장 우수한 성능을 가지는 ARCS 알고리즘을 개선한 빈발 폐쇄 항목집단 마이닝을 제안한다.

  • PDF

Creation of Association Rules using Transaction Clustering (트랜잭션 클러스터링을 이용한 연관규칙 생성)

  • Kim, Eui-Chan;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.15-18
    • /
    • 2005
  • 데이터베이스로부터 유용한 정보를 얻기 위해서 데이터마이닝을 사용하는데 많은 데이터들을 다루기 위해서는 좀 더 나은 성능의 데이터마이닝 기법이 필요하다. 연관규칙을 생성하는 기존의 Apriori 알고리즘은 많은 데이터베이스 접근과 많은 조인 횟수로 인하여 수행 속도의 저하를 가져오게 된다. 이를 개선하기 위하여 본 논문에서는 새로운 클러스터링 방법을 이용하여 클러스터링을 수행하고 각 클러스터의 연관규칙을 생성하게 된다. 본 연구의 방법을 이용하게 되면 기존 연관규칙 알고리즘으로 찾지 못했던 규칙도 생성가능하다.

  • PDF

Finding negative association rules with Boolean Analyzer (Boolean Analyzer를 이용한 역 연관규칙의 발견)

  • Lee, Jong-In;Park, Sang-Ho;Kang, Yun-Hee;Park, Sun;Lee, Ju-Hong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.187-189
    • /
    • 2003
  • 연관 규칙이 구매한 항목에 관심을 가져 구매 항목간의 규칙을 생성하는 것이라면 역 연관규칙은 구매하지 않은 항목에도 관심을 가짐으로써 더욱 효과적으로 데이터 마이닝을 하려는 시도이다. 역 연관규칙을 찾기 위한 기존의 방법들은 규칙의 일부분만 찾거나. 연관규칙을 찾는 알고리즘보다 더 복잡한 알고리즘의 사용으로 역 연관규칙을 찾는데 어려움이 있다. 이에 본 논문에서는 ITEM들 사이의 dependency를 이용하는 Boolean Analyzer를 사용하여 보다 간단한 과정으로 역 연관규칙을 생성하는 방법을 제시하고, 실험을 통하여 Boolean Analyzer로 역 연관규칙을 찾고 다른 알고리즘과 비교를 통해 보다 다양한 규칙을 찾을 수 있음을 보여준다.

  • PDF

Target Marketing using Inverse Association Rule (역 연관규칙을 이용한 타겟 마케팅)

  • 황준현;김재련
    • Journal of Intelligence and Information Systems
    • /
    • v.9 no.1
    • /
    • pp.195-209
    • /
    • 2003
  • Making traditional plan of target marketing based on association rule has brought restriction to obtain the target of marketing. This paper is to present inverse association rule as a new association rule for target marketing. Inverse association rule does not use information about relation between items that customers purchase, but use information about relation between items that customers do not purchase. By adding inverse association rule to target marketing, we generate new marketing strategy to look for new target of marketing. There are three steps to apply the marketing strategy proposed by this Paper to target marketing. Firstly, a database is converted to an inverse database. Although inverse association rules can be generated from a database, it is easier to explain inverse association rule in an inverse database than in a database. Secondly, association rules and inverse association rules are generated from inverse database. Finally, two types of rules which are created in the previous steps are applied to target marketing. From new marketing rule, this paper is to show direct marketing about target item and indirect marketing about another item associated with target item to sell target item. The reason is that sales of the item associated with target item have an influence on sales of target item.

  • PDF

Processing Multi-Valued Attributes in Association Rules for Data Mining (데이터 마이닝을 위한 연관규칙의 다중 값 속성 처리방법)

  • 김산성;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.340-342
    • /
    • 2002
  • 다중 값이란 속성 값이 집합인 것을 말한다. 즉, 관계형 데이터베이스에서 자료 유형이 집합인 속성을 의미한다. 이러한 다중 값 속성 처리는 기존 데이터마이닝 기술 자체로는 처리한 수 없으며 후처리나 선처리 과정을 이용하여 처리하고 있다. 전처리나 후처리 과정을 통해 처리할 경우 수행과장에 있어 많은 시간이 소요되고 혹은 타당하지 않은 규칙이 생성되는 문제점을 가지고 있다. 특히 연관화 기법 특성상 분석하고자 할 항목이 증가할수록 연관성의 수가 지수(exponential)단위이기 때문에 이를 해결하는데는 상당한 어려움이 따르게 된다. 본 논문에서는 관계형 데이터베이스 테이블 구조에서 데이터 마이닝의 수행을 위한 전처리나 후처리의 과정을 고려하지 않음으로 위에서 언급된 문제점들을 해결하고자 한다. 특히 데이터 변환 작업 없이 정량적(Quantitative)연관 규칙과 연관 규칙(Market Basket Analysis)의 혼합 형태의 규칙을 생성할 수 있게끔 알고리즘을 확장하여 보다 효율적인 규칙이 생성될 수 있도록 한다. 마지막으로 Each Movie 데이터를 사용하여 확장한 알고리즘의 다중 값 속성 처리 방법의 효율성과 타탕성을 검증한다.

  • PDF

A study on association rule creation by marginally conditional variables (주변 조건부 변수에 의한 연관성 규칙 생성에 관한 연구)

  • Cho, Kwang-Hyun;Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.1
    • /
    • pp.121-129
    • /
    • 2012
  • Association rule mining searches for interesting relationships among items in a given database. Currently, study of the constraint-based association rules are underway by many researchers. When we create relation rule, we can often find a lot of rules. Of this rules, we can find rule that direct relativity by marginally conditional variables (intervening variable, external variable) does not exist. In such a case, this association rule can be considered insignificant. In this study, we want to study for association rules creation using marginally conditional variable. The result of this study can find meaningless association rules. Also, we can understand more exactly the relationships between variables.

A Measure for Improvement in Quality of Association Rules in the Item Response Dataset (문항 응답 데이터에서 문항간 연관규칙의 질적 향상을 위한 도구 개발)

  • Kwak, Eun-Young;Kim, Hyeoncheol
    • The Journal of Korean Association of Computer Education
    • /
    • v.10 no.3
    • /
    • pp.1-8
    • /
    • 2007
  • In this paper, we introduce a new measure called surprisal that estimates the informativeness of transactional instances and attributes in the item response dataset and improve the quality of association rules. In order to this, we set artificial dataset and eliminate noisy and uninformative data using the surprisal first, and then generate association rules between items. And we compare the association rules from the dataset after surprisal-based pruning with support-based pruning and original dataset unpruned. Experimental result that the surprisal-based pruning improves quality of association rules in question item response datasets significantly.

  • PDF