• Title/Summary/Keyword: 규칙

Search Result 8,247, Processing Time 0.04 seconds

시간 연관규칙의 유지를 위한 점진적인 마이닝 기법 (An Incremental Mining Technique for Maintenance for Temporal Association Rules)

  • 백옥현;이준욱;김영균;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.178-180
    • /
    • 2001
  • 실세계의 여러 응용에서 데이터베이스의 크기는 계속적으로 증가되어 왔으며, 이러한 데이터베이스 내에서 유용한 지식을 찾아내기 위한 다양한 연구가 진행되어 왔다. 데이터베이스는 시간이 흐름에 따라 동적으로 변환된다. 현재의 연구는 이러한 데이터베이스에서 효과적으로 규칙을 발견하는데 초점이 모아지고 있다. 그러나, 이런 변화에 따라서 기존에 발견되었던 규칙들은 더 이상 유효하지 않을 수 있기 때문에 이전에 발견되었던 규칙들은 유효한지 검증되어야 한다. 데이터베이스가 증가할 때마다 전체를 다시 탐색해서 규칙을 찾는 것은 효과적인 방법이 아니므로, 점진적으로 규칙을 유지할 수 있는 알고리즘이 필요하다. 이 논문에서는 이전에 발견되었던 규칙이 물리적으로 저장되었고 그 후에 데이터베이스가 업데이트된 것을 고려하여 규칙, 특히 시간 연관규칙을 점진적으로 유지할 수 있는 기법을 제시한다.

  • PDF

퍼지 연관규칙과 연관규칙의 성능 평가 (Performance Estimation of Fuzzr Quantitative Association Rules and Crisp Quantitative Association Rules)

  • 손영경;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.235-237
    • /
    • 2002
  • 연관규칙(association rule)이란 데이터 베이스에 존재하는 속성들 사이에 유사성 또는 패턴을 기술하는 것으로, 사용자에게 데이터에 관한 유용한 조보를 줄 수 있다. 그러나, 지금가지의 연관규칙은 이진 (boolean) 데이터 베이스에 존재하는 연관규칙의 발견에 대해서 주로 연구되어 왔으며, 정량적(수치적, quantitative) 속성을 갖는 데이터에 대한 연관규칙의 연구는 미비하였다. 그 이유는 정량적 속성을 갖는 데이터를 기호적(nominal) 속성값으로 바꾼 후 연관규칙 보다 성능이 우수함을 보이고 있다. 또한 본 논문에서는 퍼지 연관규칙에서 소속함수(항목, 아이템, 속성값)의 모양과 개수를 데이터 분포에 대한 통계적 특성을 나타내는 히스토그램을 이용하여 소속함수를 자동 생성하는 효율적인 연관규칙 추출방법을 제안한다

  • PDF

정보이론에 기반한 연관 규칙들의 새로운 중요도 측정 방법 (A New Importance Measure of Association Rules Using Information Theory)

  • 이창환;배주현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.37-42
    • /
    • 2014
  • 연관 규칙들을 이용한 분류학습은 최근 활발히 연구되는 분야의 하나이다. 이러한 연관 규칙을 이용한 분류에는 연관 규칙들에 대한 수치적 중요도를 계산하는 것이 중요하다. 본 논문에서는 정보 이론을 사용한 H measure 라는 새로운 규칙 중요도 기법을 제안한다. 구체적으로 Hellinger 변량을 이용하여 연관규칙의 중요도를 계산한다. 제안된 H measure 의 다양한 특성들을 분석하였으며 또한 이러한 H measure를 이용한 분류학습의 성능을 다른 규칙 measure를 이용한 분류학습의 성능과 비교하였다.

신경망 규칙 추출에서 규칙 결합의 bottom-up 접근 방법 (Bottom-up Approach of Rule Rewriting in Neural Network Rule Extraction)

  • 이은헌;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.916-919
    • /
    • 2018
  • 심층신경망 모델은 우수한 성능을 갖고 있음에도 불구하고 모델이 어떤 판단 과정을 통해 결론을 내렸는지 파악하기 어렵다. 그에 따라 판단에 대한 근거가 중요한 분야에서는 심층신경망 모델을 적용한 실제 사례를 찾기 어렵다. 인공신경망 모델을 해석하기 어렵다는 문제를 해결하기 위해 내부 구조를 이용하여 규칙을 추출하는 decompositional 접근법이 제안되었으나 기존의 연구는 대부분 은닉층이 1개인 다층 퍼셉트론 모델에서 규칙을 생성하는 것을 가정하고 있다. 오늘날 사용하는 심층신경망 모델은 일반적으로 여러 은닉층을 가지고 있기 때문에 기존의 접근법을 그대로 적용할 경우 규칙 불확실성에 따라 잘못된 규칙을 추출하는 문제가 발생한다. 본 논문은 decompositional 접근법에 존재하는 규칙 불확실성 문제를 완화하고 깊이가 깊은 심층신경망 모델에 규칙을 추출하는 방법을 제안한다. 제안한 접근법은 실제 활성화 값을 통해 지식을 추출하며, 이를 통해 규칙 불확실성 문제를 완화할 수 있었다.

규칙 기반 라우팅 구성 장애 진단 알고리즘에 관한 연구 (A Study on the Algorithm for Rule-based Routing Configuration Fault Diagnosis)

  • 황태인;조강홍;정진욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.528-531
    • /
    • 2000
  • 이 논문에서는 시스템의 라우팅 구성 장애를 진단하기 위한 규칙과 알고리즘을 제시하였다. 라우팅 구성 장애 관리를 위하여 네트워크 구성 관리 규칙, 라우팅 구성 장애 진단 규칙을 제안하였으며 후향 추론 알고리즘을 기반으로 이런 규칙간의 상호 연동을 위하여 메타 규칙을 적용하였다. 제안한 규칙과 알고리즘을 시나리오에 기반하여 규칙, Blackboard, 목표의 변화 과정을 보여줌으로써 실험 결과를 제시하였다. 시스템의 TCP/IP 네트워크 구성 관리와 관련하여 시스템에서 발생할 수 있는 네트워크 장애들 중에서 라우팅 구성 장애를 진단하기 위한 규칙 및 추론 알고리즘을 제안함으로써 이질적이고 급변하는 네트워크 환경에 쉽게 대처할 수 있는 시스템 개발을 위한 방법론을 제시하고자 한다

  • PDF

제한된 언어집합과 온톨로지를 활용한 반자동적인 규칙생성 방법 연구 (Methodology for semi-autonomous rule extraction based on Restricted Language Set and ontology)

  • 손미애;최윤규
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.297-306
    • /
    • 2007
  • 지능정보시스템 구축에 있어서 자동화가 어려운 단계중의 하나인 규칙 습득을 위해 활용되는 방법중의 하나가 제한된 언어집합 기법을 이용하는 것이다. 그러나 제한된 언어집합 기법을 이용해 규칙을 생성하기 위해서는 규칙을 구성하는 변수와 그 값들에 대한 정보가 사전에 정의되어 있어야 하는데, 유동성이 큰 웹 환경에서 예상 가능한 모든 변수와 그 값을 사전에 정의하는 것이 매우 어렵다. 이에 본 연구에서는 이러한 한계를 극복하기 위해 제한된 언어집합 기법과 온톨로지를 이용한 규칙 생성 방법론을 제시하였다. 이를 위해 지식의 습득 대상이 되는 특정 문장은 문법구조 분석기를 이용해 파싱을 수행하며, 파싱된 단어들을 이용해 규칙의 구성 요소인 변수와 그 값을 식별한다. 그러나 규칙을 내포한 자연어 문장의 불완전성으로 인해 변수가 명확하지 않거나 완전히 빠져 있는 경우가 흔히 발생하며, 이로 인해 온전한 형식의 규칙 생성이 어렵게 된다. 이 문제는 도메인 온톨로지의 생성을 통해 해결하였다. 이 온톨로지는 특정 도메인을 구성하고 있는 개념들간의 관계를 포함하고 있다는 점에서는 기존의 온톨로지와 유사하지만, 규칙을 완성하는 과정에서 사용된 개념들의 사용빈도를 기반으로 온톨로지의 구조를 변경하고, 결과적으로 더 정확한 규칙의 생성을 지원한다는 점에서 기존의 온톨로지와 차별화된다. 이상의 과정을 통해 식별된 규칙의 구성요소들은 제한된 언어집합 기법을 이용해 구체화된다. 본 연구에서 제안하는 방법론을 설명하기 위해 임의의 인터넷 쇼핑몰에서 수행되는 배송관련 웹 페이지를 선정하였다. 본 방법론은 XRML에서의 지식 습득 과정의 효율성 제고에 기여할 수 있을 것으로 기대된다.

  • PDF

변형 규칙 기반 한국어 품사 태거의 개선 (Improvement of Transformation Rule-Based Korean Part-Of-Speech Tagger)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.216-221
    • /
    • 1996
  • 변형 규칙 기반 품사 태거는 태깅 규칙을 코퍼스로부터 자동 학습할 수 있고, 견고하며 태깅 결과를 이해하고 분석하기가 쉽다는 장점을 갖는다. 이에 최근 한국어 특성을 고려한 변형 규칙 기반 한국어 품사 태거가 개발되었다. 하지만 이 시스템은 오류 어절의 어휘 정보를 사용하지 않으므로 수정 가능 오류에 대한 변형 규칙이 제대로 학습되지 못하며, 변형 규칙 적용 과정에 새로운 오류를 발생시킨다는 문제점이 있다. 이에 본 논문은 오류 어절의 어휘 정보를 참조할 수 있는 세부변형 규칙 추출을 이용한 변형 규칙 기반 한국어 품사 태거의 개선 방안을 제안한다. 어휘 정보를 참조할 수 있는 세부 변형 규칙의 형태는 특정 문맥 C에서 어절 W의 어절 태그 ${\alpha}$를 어절 태그 ${\beta}$로 변형한다와 같다. 제안된 방법은 약 10만 어절 크기의 학습 코퍼스에서 57개의 세부 규칙을 학습하였고, 2만 어절 크기의 실험코퍼스에 적용한 결과 95.6%의 정확도를 보임으로써 기존의 변형 규칙 기반 품사 태거의 정확도를 약 15.4% 향상시켰다.

  • PDF

목록규칙에 있어서의 표목부의 변천에 대한 연구- 한국목록규칙과 영미계목록규칙을 중심으로 - (A Study on the Process of Changes of Headings in the Cataloging Rules)

  • 정옥경
    • 한국문헌정보학회지
    • /
    • 제30권3호
    • /
    • pp.85-108
    • /
    • 1996
  • 본 논문은 목록규칙에 있어서의 목록의 접근점인 표목의 변천과정에 대하여 고찰하였으며, 한국목록규칙과 영미계목록규칙에 나타난 표목부의 변천, 온라인 환경에서의 접근점과 미래 목록규칙에 대하여 연구하였다. 기본표목의 개념이 다양함에도 불구하고 오늘날 온라인 환경에서 기본표목의 개념이 상실되어 가고 있는데 한국목록규칙, 영미목록규칙 제21장, MARC포맷 그리고 KORMARC포맷의 표목부가 목록환경의 변화에 맞도록 개정되어야 할 필요가 있다. 이러한 목록규칙의 개정은 하이퍼텍스트와 하이퍼미디어에 근거한 계속적인 실질적 연구가 필요하고 미래 목록규칙에 통합되어야 할 것이다.

  • PDF

연관 규칙 분석 알고리즘을 활용한 영작문 형태.통사 오류 자동 발견 (Automatic Error Detection of Morpho-syntactic Errors of English Writing Using Association Rule Analysis Algorithm)

  • 김동성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2010
  • 본 연구에서는 일련의 연구에서 수집된 영작문 오류 유형의 정제된 자료를 토대로 연관 규칙을 생성하고, 학습을 통해서 효용성이 검증된 연관 규칙을 활용해서 영작문 데이터의 형태 통사 오류를 자동으로 탐지한다. 영작문 데이터에서 형태 통사 오류를 찾아내는 작업은 많은 시간과 자원이 소요되는 작업이므로 자동화가 필수적이다. 기존의 연구들이 통계적 모델을 활용한 어휘적 오류에 치중하거나 언어 이론적 틀에 근거한 통사 처리에 집중하는 반면에, 본 연구는 데이터 마이닝을 통해서 정제된 데이터에서 연관 규칙을 생성하고 이를 검증한 후 형태 통사 오류를 감지한다. 이전 연구들에서는 이론적 틀에 맞추어진 규칙 생성이나 언어 모델 생성을 위한 대량의 코퍼스 데이터와 같은 다량의 지식 베이스 생성이 필수적인데, 본 연구는 적은 양의 정제된 데이터를 활용한다. 영작문 오류 유형의 형태 통사 연관 규칙을 생성하기 위해서 Apriori 알고리즘을 활용하였다. 알고리즘을 통해서 생성된 연관 규칙 중 잘못된 규칙이 생성될 가능성이 있으므로, 상관성 검정, 코사인 유사도와 같은 규칙 효용성의 통계적 검증을 활용해서 타당한 규칙만을 학습하였다. 이를 통해서 축적된 연관 규칙들을 영작문 오류를 자동으로 탐지하는 실험에 활용하였다.

  • PDF

지식의 규칙형태 저작을 위한 규칙편집기 (Rule Editor for Representing Knowledge using a Rule-Format)

  • 고영철;장민수;손주찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.577-580
    • /
    • 2004
  • 본 논문은 지식의 규칙 표현을 위한 저작도구인 규칙편집기에 대하여 기술한다. 지식표현방법은 인간의 일상언어와 컴퓨터와의 표현구조를 고려하여 결정된다[2]. 이러한 지식표현방법에는 규칙, 프레임, 의미망, 그래프 등이 있다[2]. 본 논문에서는 지식을 규칙의 형태로 표현하고자 한다. 또한, 표현하고자 하는 지식의 영역은 비즈니스 도메인으로 한정한다. 비즈니스 지식이란 기업의 업무처리에 필요한 제반 지식인 업무처리 절차, 규정 등을 의미하며, 현재 대부분의 기업이 운영하는 기존 응용 시스템은 프로그램 소스의 일부분으로 비즈니스 규칙을 포함하고 있다. 기존 응용 시스템은 경영 상황 및 업무의 변경 등에 따른 비즈니스 지식의 잦은 수정 요구로 시스템의 유지 관리에 많은 비용과 수고가 필요하다. 이러한 문제점의 해결을 위하여 응용 프로그램에서 비즈니스 지식을 분리하여 관리하는 비즈니스 지식처리기술이 기업 응용 프로그램 개발에 도입되고 있다. 코드 속에서 분리된 비즈니스 지식은 규칙의 형태로 표현되고, 이들 규칙은 독립된 지식베이스에서 관리된다. 본 논문에서는 코드에서 분리된 비즈니스 지식을 규칙의 형태로 표현하기 위한 규칙편집기 개발과 개발된 편집기의 기능 및 특징에 대하여 기술한다.

  • PDF