Search | Korea Science

Proposition of causal association rule thresholds (인과적 연관성 규칙 평가 기준의 제안)

Park, Hee Chang
- Journal of the Korean Data and Information Science Society
- /
- v.24 no.6
- /
- pp.1189-1197
- /
- 2013
Data mining is the process of analyzing a huge database from different perspectives and summarizing it into useful information. One of the well-studied problems in data mining is association rule generation. Association rule mining finds the relationship among several items in massive volume database using the interestingness measures such as support, confidence, lift, etc. Typical applications for this technique include retail market basket analysis, item recommendation systems, cross-selling, customer relationship management, etc. But these interestingness measures cannot be used to establish a causality relationship between antecedent and consequent item sets. This paper propose causal association thresholds to compensate for this problem, and then check the three conditions of interestingness measures. The comparative studies with basic and causal association thresholds are shown by numerical example. The results show that causal association thresholds are better than basic association thresholds.
https://doi.org/10.7465/jkdi.2013.24.6.1189 인용 PDF KSCI

Study on the Learning Effect of Mathematical Patterns Using LOGO Programming (LOGO 프로그래밍을 이용한 초등학교 수학 규칙성의 학습효과 연구)

Kim, Gil-Hyun;Kim, Kap-Su
- 한국정보교육학회:학술대회논문집
- /
- 2006.01a
- /
- pp.115-120
- /
- 2006
제 7차 교육과정부터 규칙성 영역의 학습이 도입되고 중요하게 다뤄지고 있지만, 학생들이 규칙성을 찾거나 도형 패턴을 나타내는 데 어려움을 겪고 있기 때문에, 본 논문에서는 규칙성을 LOGO 프로그래밍 언어를 통해 학습하고 그 효과를 분석하였다. 수학적 패턴의 유형은 생성방식에 따라서 (1) 반복패턴, (2) 대칭패턴, (3) 증가패턴, (4) 회전패턴, (5) 혼합패턴의 다섯 가지이다. 논 논문에서는 규칙성 영역에 대한 LOGO 수업의 효과를 분석하기 위해서, 각각 패턴에 대하여 평가 문항을 만든 후 수업전과 LOGO를 통한 수업 후에 평가를 실시하여 분석하였다. 사전평가 M 4.74에서 LOGO 수업을 실시 한 후에 평가에서 M 5.22로 LOGO 수업의 효과가 유의미(p<.05, p=0.016)하게 나타났다. 특히, 도형패턴에서 높은 향상도를 나타냈다.
PDF

Development of a Dialogue State Tracking System utilizing the Results of Rule and Statistics-based System and Evaluation using User Simulator (규칙 및 통계 기반 시스템의 결과를 활용하는 대화 상태 추적 시스템의 개발 및 사용자 시뮬레이터를 이용한 평가)

Shin, Chang-Uk;Chang, Du-Seong;Cha, Jeong-Won
- Annual Conference on Human and Language Technology
- /
- 2020.10a
- /
- pp.518-523
- /
- 2020
본 논문에서는 목적 지향 대화 시스템을 위한 대화 상태 추적 시스템과 사용자 시뮬레이터를 설계 및 제안한다. 사용자 시뮬레이터는 작성된 대화 상태 추적 시스템을 평가하기 위한 용도로 사용된다. 본 논문에서 제안하는 대화 상태 추적 시스템은 대화 기록과 함께 사전에 학습된 대화 기록 및 규칙/통계 기반 추론 시스템의 추론 결과를 입력으로 받는다. 그리고 입력된 발화 기록 중 마지막 사용자 발화의 사용자 목표와 개체명 그리고 다음 시스템 발화의 화행을 추론한다. 또한, 작성된 대화 상태 추적기의 성능을 평가하고 분석하기 위해, 주어진 환경에서 시스템과 대화를 수행하며 대화 시스템의 성능을 평가하는 사용자 시뮬레이터를 구현 및 적용하였다. 본 연구에서 수행된 실험과 분석을 통해, 규칙 및 통계 기반의 기반 시스템을 이용해 목표 시스템의 성능 개선이 가능함을 보인다. 또한, 제안하는 사용자 시뮬레이터는 규칙과 통계를 이용해 평가 코퍼스 없이 여러 상황에 대해 대화 시스템의 성능을 평가할 수 있다.
PDF

Using Genetic Algorithms for Intrusion Detection Systems (유전자알고리즘을 적용한 침입탐지시스템)

양지홍;김명준;한명묵
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.10c
- /
- pp.517-519
- /
- 2002
침입탐지 시스템은 정밀성자 적응성, 그리고 확장성을 필요로 한다. 이와 같은 조건을 포함하면서 복잡한 Network 환경에서 중요하고 기밀성이 유지되어야 할 리소스를 보호하기 위해, 우리는 더욱 구조적이며 지능적인 IDS(Intrusion Detection Systems) 개발의 필요성이 요구되고 있다. 본 연구는 데이터 마이닝(Data mining)을 통해 입 패턴, 즉 침입 규칙(Rules)을 생성한다. 데이터 마이닝 기법 중 분류(Classification)에 초점을 맞추어 분석과 실험을 하였으며, 사용된 데이터는 KDD데이터이다. 이 데이터를 중심으로 침입 규칙을 생성하였다. 규칙생성에는 유전자알고리즘(Genetic Algorithm : GAs)을 적용하였다. 즉, 오용탐지(Misuse Detection) 기법을 실험하였으며, 생성된 규칙은 침입데이터를 대표하는 규칙으로 비정상 사용자와 정상 사용자를 분류하게 된다. 규칙은 "Time Based Traffic Model", "Host Based Traffic Model", "Content Model" 이 세 가지 모듈에서 각각 상이한 침입 규칙을 생성하게 된다. 본 시스템에서 도출된 침입 규칙은 430M Test data set에서 테스트한 결과 평균 약94.3%의 성능 평가 결과를 얻어 만족할 만한 성과를 보였다.의 성능 평가 결과를 얻어 만족할 만한 성과를 보였다.
PDF

A Noun Extractor based on Dictionaries and Heuristic Rules Obtained from Training Data (학습데이터를 이용하여 생성한 규칙과 사전을 이용한 명사 추출기)

Jang, Dong-Hyun;Myaeng, Sung-Hyon
- Annual Conference on Human and Language Technology
- /
- 1999.10d
- /
- pp.151-156
- /
- 1999
텍스트로부터 명사를 추출하기 위해서 다양한 기법이 이용될 수 있는데, 본 논문에서는 학습 데이터를 이용하여 생성한 규칙과 사전을 이용하는 단순한 모델을 통해 명사를 효과적으로 추출할 수 있는 기법에 대하여 기술한다. 사용한 모델은 기본적으로 명사, 어미, 술어 사전을 사용하고 있으며 명사 추정은 학습 데이터를 통해 생성한 규칙을 통해 이루어진다. 제안한 방법은 복잡한 언어학적 분석 없이 명사 추정이 가능하며, 복합명사 사전을 이용하지 않고 복합 명사를 추정할 수 있는 장점을 지니고 있다. 또한, 명사추정의 주 요소인 규칙이나 사전 등록어의 추가, 갱신 등이 용이하며, 필요한 경우에는 특정 분야의 텍스트 분석을 위한 새로운 사전의 추가가 가능하다. 제안한 방법을 이용해 "제1회 형태소 분석기 및 품사 태거 평가대회(MATEC '99')"의 명사 추출기 분야에 참가하였으며, 본 논문에서는 성능평가 결과를 제시하고 평가결과에 대한 분석을 기술하고 있다. 또한, 현재의 평가기준 중에서 적합하지 않은 부분을 규정하고 이를 기준으로 삼아 자체적으로 재평가한 평가결과를 제시하였다.
PDF

A Study on the Knowledge Base Development of Expert System for Naval Combat System (해군 전투체계 지원용 전문가시스템의 지식베이스 개발에 관한 연구(구축함 중심))

김화수;이정훈
- Proceedings of the Korea Inteligent Information System Society Conference
- /
- 2002.11a
- /
- pp.183-192
- /
- 2002
본 논문에서는 구축함의 대공방어분야에 대한 업무를 IDEF0기능 모델링 방법을 통해 체계적으로 분석하였으며 미국방성의 산하기구인 DARPA에서 연구한 CPOF(Command Post Of Future) 의사결정 모델을 토대로 구축함의 대공방어분야에서 상황평가 단계에 대한 의사결정 과정을 심도 깊게 분석하였다. 또한 구축함의 대공방어분야에서 분석된 업무수행 절차를 토대로 상황평가 단계에서 의사결정과정에 따른 필요한 규칙집합을 식별하고 규칙집합 내부의 규칙들을 효과적으로 추출하기 위하여 규칙집합들에 대한 정의, 규칙에 입력되는 데이터, 규칙집합의 결과값, 규칙집합간의 상호관계를 분석하였다. 이러한 도메인 지식개발은 장차 해군 전투체계 지원용 전문가시스템을 개발하는데 중요한 기회기반이 될 것이다.
PDF

Condition Evaluation Using Shared Predicates of Active Rule (능동규칙의 공유 술어를 이용한 조건 평가)

이기욱
- Journal of the Korea Society of Computer and Information
- /
- v.8 no.1
- /
- pp.1-6
- /
- 2003
As the condition evaluation of the active rules is performed whenever an event occurs, the performance of the system is influenced greatly depending on the conditions Processing method. Therefore, a study on evaluating the conditions of active rules becomes a very important element for enhancing the performance of active database. and the processing time of the calculation generated from the conditions must be minimized in order to improve the Performance. In this paper, the tree processing system which can effectively Process the join and selection operations is proposed. The experimental results show that tree processing system has the lower evaluation cost for the conditions processing of the active rules than the existing methods.
PDF

Spam-mail Filtering System Using Naive Bayesian Classifier and Message Rule (나이브 베이지안 분류자와 메세지 규칙을 이용한 스팸메일 필터링 시스템)

조한철;조근식
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.04b
- /
- pp.223-225
- /
- 2002
인터넷의 급속한 성장과 함께 E-Mail은 대표적인 통신수단의 하나가 되어버렸다. 편리하다는 점을 이용해서 엄청난 양의 스팸메일이 매일같이 쏟아져 오고 , 그 문제점의 심각성에 정보통신부에서 정보통신망 이용촉진 및 정보보호 등에 관한 법률이라는 새로운 법률까지 생겨났다. 본 논문에서는 이 법률에서 요구하는 '광고'라는 문구를 걸러내는 등의 메시지 규칙을 갖는 시스템과 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(Naive Baesian Classifier)를 결합한 스팸 메일 필터링 시스템(Spam-mail Fitering System)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 작성할 필요없이 학습한 데이터를 갖고 자동으로 스팸메일을 분류할 수가 있다. 들어온 메일은 메시지 규칙 기반 필터가 먼저 적용되고, 메세지 규칙 기반 필터에서 분류되지 않으면 나이브 베이지안 필터에서 분류된다. 실험에서는 제안된 시스템의 성능을 평가하기 위해서 메시지 규칙을 사용한 시스템 및 나이브 베이지만 분류자 시스템과 비교 평가하였다. 또한 임계치를 변경함으로써 제안된 시스템의 성능을 높일 수있도록 하였다.
PDF

Generating Adaptive Fuzzy Classification Rules using An Efficient Evolutionary Algorithm (효율적인 진화알고리즘을 이용한 적응형 퍼지 분류 규칙 생성)

Ryu, Joung-Woo;Kim, Sung-Eun;Kim, Myung-Won
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.11b
- /
- pp.769-771
- /
- 2005
데이터 특성이 연속적이고 애매할 때 퍼지규칙으로 분류 규칙을 표현하는 것은 매우 유용하고 효과적이다. 그러나 일반적으로 정확하지 않은 데이터 특성에 대해서 소속함수를 결정한다는 것은 어려운 일이다. 본 논문에서는 진화알고리즘을 이용하여 효과적인 퍼지 분류 규칙을 자동으로 생성하는 방법을 제안한다. 제안한 방법에서 규칙의 정확성과 이해성을 고려하여 최적화된 소속함수를 생성하기 위해 진화알고리즘을 사용한다. 먼저 지도 군집화로 진화를 위한 초기 소속함수를 생성한다. 진화알고리즘은 전역적 최적 해를 찾는데 효과적이다. 그러나 시간에 대한 효율성이 낮다. 특히 모델 최적화 문제에서는 개체 평가 단계에서 많은 시간이 소요된다. 따라서 본 논문에서는 전체 데이터를 여러 개의 부분 데이터들로 나누고 개체들은 전체 데이터 대신 매번 부분 데이터를 임의적으로 선택하여 개체를 평가함으로써 수행 시간을 단축시킬 수 있는 진화 방법을 제안한다. 제안한 퍼지 분류 규칙 생성 방법의 타당성을 검증하기 위한 실험 데이터로 UCI에서 제공하는 데이터들을 사용하였으며, 실험 결과는 기존 방법에 비해 평균적으로 더 효과적임을 확인하였다.
PDF

Document Classification using Weighted Associative Classifier (가중치가 부여된 연관 규칙을 이용한 문서 분류)

김흥남;이기성;조근식
- Proceedings of the Korean Information Science Society Conference
- /
- 2003.10a
- /
- pp.154-156
- /
- 2003
인터넷의 급속한 성장과 더불어 많은 정보와 데이터들을 인터넷을 통하여 얻을 수 있게 되었으며 많은 단체들이 문서들을 웹을 통하여 이용 가능하게 만들고 있다. 이에 따라 다양한 정보와 데이터를 효과적으로 분류하고 검색하는 문서 분류 (Document Classification)에 대한 알고리즘이 다양한 분야에서 널리 연구되어 왔으며 본 논문에서 초점을 두고 있는 전자 도서관 (Digital Library) 분야에서도 활발히 연구되어지고 있다. 하지만 기존의 전자 도서관의 문서 분류 알고리즘들은 문서들의 각 단락의 비중을 고려하지 않은 채 단어들의 발생 빈도에 초점을 두어 많은 잡음 단어 (Noise Term)를 포함하고 그로 인하여 분류 성능이 떨어졌다. 본 논문에서는 문서 단락의 중요도에 따라 다른 .가중치를 부여하여 단어 지지도 (Term Support)가 높은 단어들을 추출하고 그 단어들로 연관 규칙 (Association Rules)을 이용하여 분류 규칙을 생성하는 방법을 제안한다. 제안된 방법의 성능평가를 위해 문서 분류에 널리 쓰이는 나이브 베이지안 분류자 (Na$\square$ve Bayesian Classifier) 및 기존의 단순 연관 규칙 분류자 (Associative Classifier)와 비교 평가하였다. 그 결과, 각 가중치가 부여된 연관 규칙 분류 방법이 나이브 베이지안 분류 방법과 단순 연관 규칙 분류 방법보다 높은 성능을 보였다.
PDF

Search Result 1,017, Processing Time 0.027 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)