• 제목/요약/키워드: 발생 가능한 규칙의 수

검색결과 174건 처리시간 0.02초

관심 항목의 발생 가능한 규칙의 수를 고려한 연관성 평가기준 (Association rule thresholds considering the number of possible rules of interest items)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.717-725
    • /
    • 2012
  • 데이터 마이닝은 데이터베이스로부터 쉽게 드러나지 않는 의미 있는 정보를 생성하는 기법이다. 이 중에서 연관성 규칙은 일반적으로 발생 여부를 나타내는 자료를 이용하여 지지도, 신뢰도, 향상도 등을 수치화함으로써 항목들 간의 관련성을 나타낸다. 기존의 연관성 규칙은 발생 빈도의 크기를 고려하지 않음으로써 정보 손실에 의한 오류를 범할 수 있다. 이를 위해 본 논문에서는 발생 가능한 규칙의 수를 고려한 연관성 평가 기준들을 제안하고 예제를 통하여 기존 연구와 비교한 후, 본 논문에서 제안한 연관성 평가 기준의 유용성을 살펴보았다. 실제 데이터를 통하여 분석한 결과, 기존의 연관성 규칙 평가 기준은 관심항목 수와 트랜잭션의 수를 2배로 하여도 지지도와 신뢰도, 향상도의 값이 동일한 반면에 본 논문에서 제안한 평가 기준은 발생 가능한 규칙의 수를 고려하기 때문에 각각의 평가 기준의 값들이 트랜잭션의 수에 따라 다르다는 것을 알 수 있었다. 또한 본 논문에서 제안하는 평가 기준이 기존의 연관성 규칙 평가 기준에 비해 좀 더 정확한 정보를 제공하는 것을 알 수 있다. 특히 본 논문에서 제안한 신뢰도의 범위가 기존 연관성 평가 기준에 비해 크므로 좀 더 비교 가능한 정보를 제공하는 동시에 향상도의 비교를 용이하게 한다고 할 수 있다.

우선순위 디폴트 규칙 시스템의 의미론 (Semantics of Prioritized Default Rule System)

  • 유희준;배민오;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.241-243
    • /
    • 2003
  • 지능형 정보 에이전트 시스템에서 사용되는 디폴트 규칙 시스템의 결론 집합을 생성하기 위한 추론 과정에서 불일치를 발생할 수 있는 새로운 오순 상황을 제시하고, 이를 해결할 수 있는 새로운 의미론을 정의한다. 확장 논리 프로그램은 추론된 결과 집합에서 같은 심벌이 양의 부호와 음의 부호를 동시에 가진 형태로 존재하는 경우에 모순이 발생하게 된다. 막장 논리 프로그램에 기반을 둔 디폴트 추론 시스템에서도 이런 모순을 가지게 되며, 이 문제를 해결하기 위한 방법이 정의되어 있다. 하지만, 비단조 추론을 하는 디폴트 규칙 시스템에서는 이런 문제 외에도 모순이 발생하게 된다. 하지만, 기존의 연구에서는 이러한 문제를 해결하는 방범이 고려되지 않았다. 최근에 들어서 디폴트 규칙 시스템은 지능형 에이전트에 내재되면서 에이전트간의 협상과 업데이트 등에 많이 사용되고 있다. 만일, 에이전트 내에서 규칙 시스템이 모순 상황이 발생하는 경우 예기치 않은 손실이 발생하게 된다. 따라서 결론 집합을 일관성 있게 추론하는 것은 지능형 에이전트 시스템의 신뢰성을 높이기 위해서 반드시 필요한 사항이다. 더욱이 에이전트 시스템의 사용분야가 지속적으로 늘어나는 상황에서 기존에 제안된 모순 이외에 각 분야에서 특성에 따라서 발생 가능한 모순이 발생하게 되며, 이 문제를 해결하는 것이 중요한 문제이다. 본 논문에서는 기존에 정의된 모순 외에 발생 가능한 문제점을 제시하고 이를 해결하기 위한 새로운 규칙 시스템의 의미론을 정의하였다.

  • PDF

상대적 규칙 정확도의 균형화에 의한 연관성 측도의 개발 (Development of association rule threshold by balancing of relative rule accuracy)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1345-1352
    • /
    • 2014
  • 데이터마이닝 기법 중에서 연관성 규칙은 연관성 평가 기준을 기반으로 하여 데이터베이스에 포함되어 있는 항목들 간의 관련성을 탐색하는 기법이다. 일반적인 연관성 규칙 기법과는 달리 역의 연관성 규칙은 하나의 항목집합이 발생하지 않으면 다른 항목집합도 발생하지 않는다는 규칙을 찾아내는 것이다. 이러한 역의 연관성 규칙을 일반적인 연관성 규칙과 함께 생성하면 기업체에서 특정 제품을 판매하기 위해서는 그 제품만의 마케팅뿐만 아니라 더 나아가 어떤 제품의 마케팅이 필요한 지에 대한 정보를 파악할 수 있다. 이를 위해 본 논문에서는 이러한 두 종류의 연관성 규칙에 적용 가능한 균형화된 기여 상대적 규칙 정확도를 연관성 평가 기준으로 제안하고자 한다. 또한 Piatetsky-Shapiro (1991)가 제안한 흥미도 측도가 가져야 할 조건들을 점검한 후, 예제를 통하여 제안된 측도와 연관성 규칙에 적용 가능한 의학진단분야의 평가 측도들의 유용성을 비교하였다. 그 결과, 기여 상대적 정확도와 역의 기여 상대적 정확도의 크기가 다르게 나타나면 연관성의 정도를 명확하게 설명하기가 어려우므로 이들 두 측도를 동시에 고려한 균형화된 기여 상대적 규칙 정확도를 이용하는 것이 가장 바람직하다는 사실을 확인하였다.

HBase를 이용한 분산 시맨틱 웹 데이터 저장소에 대한 연구 (A Study on Distributed Semantic Web Data Repository Using HBase)

  • 조대웅;김명호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.111-114
    • /
    • 2012
  • 실시간으로 발생되는 대량의 데이터를 효율적으로 저장하기 위한 연구는 분산/병렬 처리를 위한 하둡 및 NoSQL과 관련한 빅 데이터 처리 기술을 통해 진행 중에 있다. 하지만 시맨틱 웹 분야에서 발생되는 대량의 데이터를 처리하기 위한 모델은 현재 연구가 진행되고 있지 않다. 본 논문에서는 시맨틱 웹 환경에서 발생되는 대량의 온톨로지 데이터를 빅 데이터 처리가 가능한 NoSQL 분야인 HBase 데이터베이스에 분산 저장할 수 있는 매핑 규칙을 제안한다. 이와 같은 매핑 규칙을 통해 시맨틱 웹 환경에서도 대량으로 발생될 수 있는 데이터들을 효율적으로 분산 저장 할 수 있다.

음의 연관성 규칙 생성을 위한 음의 기여 순수 신뢰도의 제안 (Negatively attributable and pure confidence for generation of negative association rules)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.939-948
    • /
    • 2012
  • 데이터 마이닝 기법들 중에서 가장 많이 활용되고 있는 연관성 규칙은 방대한 데이터베이스에서 항목간의 관계를 흥미도 측도에 의해 명확히 수치화함으로써 그들간의 관련성을 표시해주는 기법이다. 양의 연관성 규칙 마이닝이 임의의 한 항목이 발생하면 다른 항목도 발생한다는 규칙을 생성하기 위한 기법인 반면에, 음의 연관성 규칙은 어느 항목이 발생하면 다른 항목은 발생하지 않는다는 규칙을 찾아내는 기법이다. 음의 연관성 규칙은 양의 연관성 규칙의 활용과 마찬가지로 고객의 구매 경향 및 마케팅 정책을 제시할 수 있고 교차판매와 매장 진열 등과 같이 타겟 마케팅에 활용 가능하다. 양의 연관성 규칙에 음의 연관성 규칙을 추가하게 되면 어떤 제품을 판매하기 위해서는 그 제품만 마케팅 하는 것뿐만 아니라 더 나아가 그 제품이 아닌 어느 제품을 마케팅 하는것이 필요한지를 판단할 수 있다. 본 논문에서는 기존의 음의 신뢰도의 단점을 보완할 수 있는 음의 기여 순수 신뢰도를 제안한 후, 이에 대해 흥미도 측도가 가져야 할 조건들을 조사하였으며, 예제 데이터를 활용하여 음의 기여 순수 신뢰도의 유용성을 고찰하였다.

항공여객운송에서의 탑승거부와 여객보상기준 (Denied Boarding and Compensation for Passengers in the EU Air Transport Legal Framework and Cases)

  • 서지민
    • 항공우주정책ㆍ법학회지
    • /
    • 제34권1호
    • /
    • pp.203-234
    • /
    • 2019
  • 본 논문에서는 탑승거부와 관련한 EC 261/2004 규칙의 규정 및 그에 관한 판결들을 검토해 보았다. 항공여객운송 분쟁과 관련하여 빈번히 발생하는 탑승거부는 그 의미가 EC 261/2004 규칙상으로 그리 명확한 것은 아니지만, 앞서 살펴본 EU 판결들에서 어느 정도 그 범위에 관한 해석기준을 제시되어 있다. 일반적으로 탑승거부는 초과예약으로 인해 발생한 경우를 상정하는 것이 기존의 관점이었지만, 일련의 EU 판례에 따라 EC 261/2004 규칙상의 탑승거부에 다양한 경우의 탑승거부 사례들이 포함되게 되었다. 즉, 탑승거부의 개념과 범위가 포괄적으로 확대되고 보다 적극적인 항공소비자 보호가 실현될 수 있을 것으로 보인다. 이와 같은 관점에서 논문의 결론으로서 몇 가지 시사점들을 제시해 보고자 한다. 첫째, EC 261/2004 규칙상 탑승거부의 개념에는 초과예약으로 인해 발생한 탑승거부만이 아닌 다양한 경우의 탑승거부 사례들이 포함될 필요가 있다. 이는 EC규칙이 항공소비자의 권리보호를 제정목적으로 하고 있다는 점, 초과예약에 의한 탑승거부만을 규칙에서 의미하는 탑승거부만으로 볼 경우 항공여객의 권리구제가 훼손될 수 있다는 점, EC항공여객보상규칙 제2조 j호의 문면상 초과예약에 의한 탑승거부만으로는 결코 한정시킬 수 없다는 점 등의 이유 때문이다. 둘째, 탑승거부와 관련하여, 항공사의 초과예약도 없었고 항공사의 별도 과실이나 귀책사유도 발견되지 않은 경우, 여기서 그 원인의 본질에 EC 261/2004 규칙상의 특별한 사정이 존재하고 있는 경우에는 그 특별한 사정의 판단을 적절하게 고려할 필요가 있다. Finnair 판결에서는 파업과 같은 특별한 사정으로 인해 결항이 발생하였고, 연결항공편의 일정 조정은 불가피한 것이었음에도, 그러한 과정에서 탑승거부가 발생하였다. 여기서 항공운송인의 과실 내지는 귀책을 명확하게 찾을 수 없었다는 점이 중요하다. 법원은 이 경우에도 운송인의 보상책임을 인정하고 있는데, 결항의 원인이 항공운송인이 모든 합리적인 조치를 취했어도 피할 수 없었던 파업에 의해 발생한 것이라면 특별한 사정의 판단이 적용되어야 할 필요성이 있다. 셋째, EC 261/2004 규칙상 탑승거부와 결항의 경우에는 여객에게 금전보상이 이루어지고, 항공지연의 경우에는 금전보상이 아니라 대체항공편과 같은 항공사의 적절한 지원책만이 제공되고 있다. 만약 제1항공편과 제2항공편으로 연결항공에 의한 환승이 포함되어 있는 항공일정이 있을 때, 천재지변에 의해 제1항공편이 지연되었다. 지연은 되었으나 가까스로 여객은 제2항공편에 탑승게이트에 도착하였다. 이 경우의 문제는 어떻게 해결하여야 하는지가 문제이다. 제1항공편의 지연은 천재지변으로 특별한 사정에 해당하여 항공사는 면책을 주장할 수 있지만, 제2항공편의 탑승거부도 그렇게 주장할 수 있는지 명확하지 않다. Finnair 판결의 취지를 따르면, 제2항공편의 탑승거부에 대한 항공운송인의 보상의무가 가능할 수 있는데, 항공운송인이 아무런 과실과 귀책이 없는 경우에도 보상이 가능한 것인지 의문이다. 또한 동일한 원인으로 발생한 지연과 탑승거부에 대해 이처럼 다른 보상기준이 적용될 수 있는지도 문제이다. 향후의 EU사법재판소 판례가 EC 261/2004 규칙의 해석과 적용상 이러한 문제를 어떠한 방식으로 접근할 것인지 기대된다.

제한된 언어집합과 온톨로지를 활용한 반자동적인 규칙생성 방법 연구 (Methodology for semi-autonomous rule extraction based on Restricted Language Set and ontology)

  • 손미애;최윤규
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.297-306
    • /
    • 2007
  • 지능정보시스템 구축에 있어서 자동화가 어려운 단계중의 하나인 규칙 습득을 위해 활용되는 방법중의 하나가 제한된 언어집합 기법을 이용하는 것이다. 그러나 제한된 언어집합 기법을 이용해 규칙을 생성하기 위해서는 규칙을 구성하는 변수와 그 값들에 대한 정보가 사전에 정의되어 있어야 하는데, 유동성이 큰 웹 환경에서 예상 가능한 모든 변수와 그 값을 사전에 정의하는 것이 매우 어렵다. 이에 본 연구에서는 이러한 한계를 극복하기 위해 제한된 언어집합 기법과 온톨로지를 이용한 규칙 생성 방법론을 제시하였다. 이를 위해 지식의 습득 대상이 되는 특정 문장은 문법구조 분석기를 이용해 파싱을 수행하며, 파싱된 단어들을 이용해 규칙의 구성 요소인 변수와 그 값을 식별한다. 그러나 규칙을 내포한 자연어 문장의 불완전성으로 인해 변수가 명확하지 않거나 완전히 빠져 있는 경우가 흔히 발생하며, 이로 인해 온전한 형식의 규칙 생성이 어렵게 된다. 이 문제는 도메인 온톨로지의 생성을 통해 해결하였다. 이 온톨로지는 특정 도메인을 구성하고 있는 개념들간의 관계를 포함하고 있다는 점에서는 기존의 온톨로지와 유사하지만, 규칙을 완성하는 과정에서 사용된 개념들의 사용빈도를 기반으로 온톨로지의 구조를 변경하고, 결과적으로 더 정확한 규칙의 생성을 지원한다는 점에서 기존의 온톨로지와 차별화된다. 이상의 과정을 통해 식별된 규칙의 구성요소들은 제한된 언어집합 기법을 이용해 구체화된다. 본 연구에서 제안하는 방법론을 설명하기 위해 임의의 인터넷 쇼핑몰에서 수행되는 배송관련 웹 페이지를 선정하였다. 본 방법론은 XRML에서의 지식 습득 과정의 효율성 제고에 기여할 수 있을 것으로 기대된다.

  • PDF

변형 규칙 기반 한국어 품사 태거의 개선 (Improvement of Transformation Rule-Based Korean Part-Of-Speech Tagger)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.216-221
    • /
    • 1996
  • 변형 규칙 기반 품사 태거는 태깅 규칙을 코퍼스로부터 자동 학습할 수 있고, 견고하며 태깅 결과를 이해하고 분석하기가 쉽다는 장점을 갖는다. 이에 최근 한국어 특성을 고려한 변형 규칙 기반 한국어 품사 태거가 개발되었다. 하지만 이 시스템은 오류 어절의 어휘 정보를 사용하지 않으므로 수정 가능 오류에 대한 변형 규칙이 제대로 학습되지 못하며, 변형 규칙 적용 과정에 새로운 오류를 발생시킨다는 문제점이 있다. 이에 본 논문은 오류 어절의 어휘 정보를 참조할 수 있는 세부변형 규칙 추출을 이용한 변형 규칙 기반 한국어 품사 태거의 개선 방안을 제안한다. 어휘 정보를 참조할 수 있는 세부 변형 규칙의 형태는 특정 문맥 C에서 어절 W의 어절 태그 ${\alpha}$를 어절 태그 ${\beta}$로 변형한다와 같다. 제안된 방법은 약 10만 어절 크기의 학습 코퍼스에서 57개의 세부 규칙을 학습하였고, 2만 어절 크기의 실험코퍼스에 적용한 결과 95.6%의 정확도를 보임으로써 기존의 변형 규칙 기반 품사 태거의 정확도를 약 15.4% 향상시켰다.

  • PDF

가중치가 부여된 연관 규칙을 이용한 문서 분류 (Document Classification using Weighted Associative Classifier)

  • 김흥남;이기성;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.154-156
    • /
    • 2003
  • 인터넷의 급속한 성장과 더불어 많은 정보와 데이터들을 인터넷을 통하여 얻을 수 있게 되었으며 많은 단체들이 문서들을 웹을 통하여 이용 가능하게 만들고 있다. 이에 따라 다양한 정보와 데이터를 효과적으로 분류하고 검색하는 문서 분류 (Document Classification)에 대한 알고리즘이 다양한 분야에서 널리 연구되어 왔으며 본 논문에서 초점을 두고 있는 전자 도서관 (Digital Library) 분야에서도 활발히 연구되어지고 있다. 하지만 기존의 전자 도서관의 문서 분류 알고리즘들은 문서들의 각 단락의 비중을 고려하지 않은 채 단어들의 발생 빈도에 초점을 두어 많은 잡음 단어 (Noise Term)를 포함하고 그로 인하여 분류 성능이 떨어졌다. 본 논문에서는 문서 단락의 중요도에 따라 다른 .가중치를 부여하여 단어 지지도 (Term Support)가 높은 단어들을 추출하고 그 단어들로 연관 규칙 (Association Rules)을 이용하여 분류 규칙을 생성하는 방법을 제안한다. 제안된 방법의 성능평가를 위해 문서 분류에 널리 쓰이는 나이브 베이지안 분류자 (Na$\square$ve Bayesian Classifier) 및 기존의 단순 연관 규칙 분류자 (Associative Classifier)와 비교 평가하였다. 그 결과, 각 가중치가 부여된 연관 규칙 분류 방법이 나이브 베이지안 분류 방법과 단순 연관 규칙 분류 방법보다 높은 성능을 보였다.

  • PDF

IDS를 위한 규칙 기반의 경보데이터 상관성 모델 설계 (Design of Rule-based Alert Correlation Model for IDS)

  • 홍지연;엄남경;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1859-1862
    • /
    • 2003
  • 기존의 IDS는 침입 가능성이 있는 데이터에 대해 많은 양의 경보데이터를 발생시키고 이를 모두 로그의 형태로 저장한다. 이 때 대량의 로그 기록이 생성되는데, 이 대량의 로그가 기록된 데이터는 관리자가 실제로 위협적인 침입을 식별하고, 침입 행위에 신속하게 대응하는 것을 어렵게 한다. 따라서 이 논문에서는 IDS가 발생시킨 대량의 경보데이터를 규칙 기반 방법론을 적용하여 침입탐지에 필요한 데이터만 추출하여 로그에 기록함으로써 관리자가 IDS 관리를 효율적으로 할 수 있는 모델을 제시한다. 이 모델은 실시간으로 갱신되는 규칙에 의해 경보데이터 중 불필요한 것은 제거하고, 유사한 것은 통합함으로써 신속한 침입 탐지를 가능케 한다.

  • PDF