• 제목/요약/키워드: 연관규칙분석

검색결과 345건 처리시간 0.042초

연관 규칙 마이닝에서의 평가기준 표준화 방안 (Standardization for basic association measures in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.891-899
    • /
    • 2010
  • 연관성 규칙은 방대한 양의 데이터베이스 속에 있는 각 항목들 간의 관련성을 수치화함으로써 두개 이상의 항목간의 관련성을 나타내는 기법으로 데이터 마이닝 분야에서 가장 많이 활용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 가장 기본적인 평가기준에는 지지도, 신뢰도, 향상도 등이 있으며, 이들을 이용하여 연관성 규칙을 생성하게 된다. 이 때 사용되는 향상도는 그 값의 범위가 지지도나 신뢰도와는 다르므로 지지도나 신뢰도의 범위를 동일하도록 하기 위해 표준화할 필요가 있으며, 지지도와 신뢰도도 하나의 후항변수에 대해 여러 개의 전항변수들이 있는 경우 이들 중 어느 것이 후항변수와 가장 연관성이 있는지를 객관적으로 비교하기 위해서도 표준화가 필요하다. 본 논문에서는 각 항목집합의 주변 발생확률을 고려하여 객관적이고도 정확한 연관성 정도를 파악하기 위해 연관성 평가기준을 표준화하는 방안에 대해 연구하고자 한다. 또한 흥미도 측도의 세 가지 조건의 충족 여부를 점검해 본 후, 구체적인 예제를 통하여 기존의 연관성 평가기준과 표준화된 연관성 평가기준을 비교 분석하고자 한다.

상품군 연관망 기반의 상품가치 평가모형 (Product Value Evaluation Models based on Itemset Association Chain)

  • 장용식
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.1-17
    • /
    • 2010
  • 연관분석에 의한 연관규칙은 상품 간 연관성을 나타내고 있으며, 교차판매와 상품진열 등의 마케팅 전략에 활용되고 있다. 그러나, 교차판매 효과를 반영하는 더 실질적인 상품가치를 평가한다면, 상품구색과 이윤극대화 등의 기업 의사결정에 더 유용하게 활용될 수 있을 것이다. 본 연구는 단일상품 간의 연관망과 상품군 간의 연관망 기반에서 상품의 순수가치, 이득가치, 손실가치로 구성되는 유효가치를 바탕으로 상품의 가치를 평가하는 수학적 모형을 제시하고, 두 모형에 대해 각각 예시를 통한 평가과정을 기술하였다. 이 경우, 상품군은 단일상품을 포함하기 때문에 상품군 간 연관망 기반에서의 상품가치 평가모형은 단일상품 기반의 평가모형을 포함하고 있다. 모형의 실질적인 유용성을 보이기 위하여, 국내 한 온라인 쇼핑몰의 과거 1년 간 의류 관련 거래데이터 표본을 이용하여 상품분류군 간의 연관규칙을 발견하고 상품분류별 유효가치를 평가하는 실험을 하였다. 표본은 총 106개 상품분류와 48,044건의 거래 데이터로 이루어져 있다. 먼저, SPSS Clementine 12.0을 이용하여 상품분류군 간 18개의 연관규칙을 발견하였다. 한편, 순수가치와 연관규칙을 바탕으로 이득가치, 손실가치를 계산하고 유효가치를 평가하는 JAVA 어플리케이션을 구현하였다. 유효가치 평가의 실험결과, 순수가치보다 큰 유효가치를 갖는 상품분류가 있는 반면, 순수가치 보다 작은 유효가치를 갖는 상품분류를 확인하였다. 본 연구는 상품 연관망에서 일차적인 관계만을 고려한 유효가치를 평가하였다. 향후, 다단계 연관성의 교차판매 효과를 반영하는 고차적인 평가모형 연구는 보다 효과적인 유효가치 평가를 가능케할 것이다.

의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템 (TF-IDF Based Association Rule Analysis System for Medical Data)

  • 박호식;이민수;황성진;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.145-154
    • /
    • 2016
  • u-Health에 대한 관심과 IT 기술의 발전에 따라 의료 정보를 적극적으로 활용하고자 하는 요구가 커지고 있으며, 이에 대해 텍스트 형태의 의료 정보 데이터에 연관규칙 기법을 적용하여 질병과 증상과의 관계를 추론하는 시스템에 대한 연구들이 이루어지고 있다. 그러나 일반적인 연관규칙 기법을 의료 정보 데이터에 그대로 적용할 경우, 이전에는 새로운 연관규칙들보다 일반적이며 의미없는 연관규칙들이 많이 생성되는 문제가 발생한다. 또한 필터링으로 인해 빈번하게 함께 발생하지는 않지만 의학적으로 의미있는 항목들의 연관 규칙을 발견할 수 없다는 한계점을 가지게 된다. 본 논문에서는 의료데이터 특성을 고려하여 빈번한 항목과 빈번하지 않지만 의학적으로 의미 있는 항목들을 대상으로 연관규칙을 구성하여 의료 전문가의 의사 결정에 도움을 주기 위한 시스템을 제안한다. 제안 시스템은 의료 기록 데이터에서 용어들을 TF-IDF기반으로 가중치를 부여하고 기존 FP-Growth 알고리즘을 확장하여 TF-IDF 가중치를 고려한 빈번하게 발생하거나 빈번하지 않지만 의미 있는 연관규칙을 구성한다. 특정 질의 데이터가 입력되면 해당 데이터에 나타난 연관 규칙들의 유사도를 의학분야 온톨로지를 이용하여 평가하여 해당 데이터의 내용과 관련된 후보 질병들을 추론한다. 추론된 후보 질병명은 의료 전문가에게 의사 결정의 참고 자료로 제공된다. 실제 임상 진료 및 처방 기록 데이터에 대해 제안 시스템을 적용해 본 결과, 본 제안 시스템을 통해 도출한 연관 규칙이 기존 FP-Growth 알고리즘을 적용했을 때 보다 더 구체적인 질병과 증상과의 관계들을 포함함을 확인할 수 있었다. 또한 본 제안 시스템은 자유형식의 의료 및 병리데이터를 마이닝하고 후보 질병들을 가중치 기반으로 보여주므로, 의료 기록 정보로부터 질병 관련 새로운 정보를 획득하고 의료진의 의사 결정에 도움을 주는 시스템으로 활용될 수 있다.

데이터마이닝 기법을 활용한 건설 중대 재해요인 간 연관성 분석 (Affinity Analysis Between Factors of Fatal Occupational Accidents in Construction Using Data Mining Techniques)

  • 임지선;한상욱;강영철;강상혁
    • 한국건설관리학회논문집
    • /
    • 제22권5호
    • /
    • pp.29-38
    • /
    • 2021
  • 정부와 기업이 건설업의 산업재해를 줄이기 위해 지속적으로 노력하고 있지만, 재해는 크게 줄어들지 않고 있다. 본 연구는 건설 재해에 영향을 미치는 요인들 간의 연관성을 정량적으로 규명하고자 하였다. 산업안전공단에서 공개한 중대재해 사례 1,197건을 대상으로, 데이터마이닝 기법 중 하나인 연관성 분석을 이용하여 연구를 수행하였다. 산업안전공단에서 제공하는 데이터와 외부 변수를 포함하여 재해 발생 형태, 건설업종, 작업내용, 기인물, 체감온도, 사고 시간대, 추락높이의 변수로 아이템을 구성하여 분석하였으며, 떨어짐 재해와 그 외의 재해로 구분하여 연관규칙을 도출하였다. 떨어짐 재해의 경우 향상도가 1.38 이상인 64개의 연관규칙을 도출하였으며, 떨어짐을 제외한 재해의 경우 향상도가 1.54 이상인 59개의 연관규칙을 도출하였다. 도출된 연관규칙을 재해요인 간의 연관성에 초점을 두고 해석한 후, 고찰에서 연구의 한계와 건설재해 요인 간의 관련성을 파악할 때 연관성 분석 기법을 적용함에 있어 유의사항을 제시하였다. 본 연구는 건설 재해에 영향을 미치는 요인들 간의 연관성을 정량적인 수치로 제시하여 추후 근로자들과 현장관리자가 건설현장에서 적절한 안전대책을 마련하는 기초자료를 제공하였다는 점에서 의미를 찾을 수 있다.

침입탐지 감사자료 분석을 위한 연관규칙 생성 기술 (Generating Technology of the Association Rule for Analysis of Audit Data on Intrusion Detection)

  • 소진;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (중)
    • /
    • pp.1011-1014
    • /
    • 2002
  • 최근 대규모 네트워크 데이터에 대한 패턴을 분석하기 위한 연구에 대하여 관심을 가지고 침입탐지 시스템을 개선하기 위해 노력하고 있다. 특히, 이러한 광범위한 네트워크 데이터 중에서 침입을 목적으로 하는 데이터에 대한 탐지 능력을 개선하기 위해 먼저, 광범위한 침입항목들에 대한 탐지 적용기술을 학습하고, 그 다음에 데이터 마이닝 기법을 이용하여 침입패턴 인식능력 및 새로운 패턴을 빠르게 인지하는 적용기술을 제안하고자 한다. 침입 패턴인식을 위해 각 네트워크에 돌아다니는 관련된 패킷 정보와 호스트 세션에 기록되어진 자료를 필터링하고, 각종 로그 화일을 추출하는 프로그램들을 활용하여 침입과 일반적인 행동들을 분류하여 규칙들을 생성하였으며, 생성된 새로운 규칙과 학습된 자료를 바탕으로 침입탐지 모델을 제안하였다. 마이닝 기법으로는 학습된 항목들에 대한 연관 규칙을 찾기 위한 연역적 알고리즘을 이용하여 규칙을 생성한 사례를 보고한다. 또한, 추출 분석된 자료는 리눅스 기반의 환경 하에서 다양하게 모아진 네트워크 로그파일들을 분석하여 제안한 방법에 따라 적용한 산출물이다.

  • PDF

연관규칙 분석을 통한 건설공사 분쟁유형과 분쟁원인의 연관성 분석에 관한 연구 (Association Rules Analysis Between the Types and Causes of Disputes in Construction Projects)

  • 장세림;김한수
    • 한국건설관리학회논문집
    • /
    • 제23권5호
    • /
    • pp.3-14
    • /
    • 2022
  • 건설공사는 이해관계자들 간에 클레임(claim)이 발생할 가능성이 높은 특징을 지니고 있다. 클레임 그 자체가 분쟁은 아니지만, 당사간에 이견이나 갈등으로 인해 상호간 합의가 이루어지지 않으면 이는 분쟁으로 발전하게 될 가능성이 높다. 발주자와 건설사 간에 분쟁이 발생하게 되면 양측 모두에게 부정적인 영향을 끼치며, 건설분쟁을 최소화 하거나 선제적으로 대응하기 위해서는 발주자의 역할이 더욱 중요하다. 본 연구의 목적은 연관규칙 분석(Association Rules Analysis)을 바탕으로 분쟁유형과 분쟁원인의 연관성을 도출하고 주요 특징 및 발주자 관점의 시사점을 제시하는데 있다. 본 연구를 통해 분쟁유형과 분쟁원인간의 연관성을 파악할 수 있었으며 연관성이 높은 규칙을 도출할 수 있었다. 또한 연관규칙 분석을 통해 분쟁유형과 분쟁원인의 연관성을 도출함으로서 단순한 기술통계(빈도수)에 의존하는 것과 비교하여 보다 체계적인 분석을 실시하였다. 사례 분석을 통해 발주자 관점의 시사점으로 분쟁원인을 해소하기 위한 방향도 제시하였다. 본 연구의 결과를 통해 분쟁유형과 분쟁원인의 연관성에 대한 이해를 높일 수 있으며 건설공사의 분쟁을 선제적으로 대응하는데 유용하게 활용될 수 있다.

연관규칙을 응용한 SCORM 기반 학습 컨텐츠 (SCORM Based Recommendation of Learning Contents using Association Rule Mining)

  • 현영순;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 제36회 하계학술대회 논문집 D
    • /
    • pp.2909-2911
    • /
    • 2005
  • 본 논문에서는 SCORM을 기반으로 하는 LMS 상에 수많은 컨텐츠들이 있을 경우, 적은 노력으로도 원하는 컨텐츠에 접근할 수 있도록 도움을 주는 컨텐츠 추천 기법을 제안하였다. 이 기법은 각 학습자별로 컨텐츠 이용도 성향을 분석한 후 분석된 결과를 바탕으로 사용자에게 현재 이용하고 있는 컨텐츠와 가장 연관성이 높다고 판단되는 컨텐츠를 연관규칙을 응용한 방법을 이용하여 추천한다.

  • PDF

트리거와 점진적 갱신기법을 이용한 연관규칙 탐사의 능동적 후보항목 관리 모델 (An Active Candidate Set Management Model on Association Rule Discovery using Database Trigger and Incremental Update Technique)

  • 황정희;신예호;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.1-14
    • /
    • 2002
  • 연관규칙 탐사는 지지도와 신뢰도를 바탕으로 연관성 있는 강한 항목들을 탐사한다. 탐사된 연관규칙은 장바구니 분석 등과 같이 전자 상거래 및 대형 소매점 등의 판매 패턴에 대한 분석에 유용하게 적용될 수 있다. 이와 같은 연관규칙 탐사는 대규모로 축적되어 트랜잭션 데이터를 대상으로 하는 기법으로서 대규모 데이터에 대한 반복적 스캔연산을 수반한다. 그러므로 매우 높은 연산 부하를 안고 있으며 이로 인해 동적 환경에서 실시간 제한사항을 탐사에 대한 시도를 하지 못하고 있다. 따라서 이 논문에서는 연관규칙 탐사의 비 실시간적 제한사항을 위하여 트리거와 점진적 갱신 기법을 이용한 능동적 후보항목 관리 모델을 제안하였다. 아울러 제안 모델을 구현하기 위해 점진적 갱신 기법을 이용한 능동적 후보항목 관리 모델을 제한하였다. 아울러 제안 모델을 구현하기 위해 점진적 갱신 연산의 구현 모델을 제시하고 이의 구현 및 실험을 통해 성능 특성을 분석하였다.

공간 연관규칙을 이용한 대형할인점의 입지 분석 (Analyzing the Location Decision of the Large-Scale Discount Store Using the Spatial Association Rules Mining)

  • 이용익;홍성언;김정엽;박수홍
    • 대한지리학회지
    • /
    • 제41권3호
    • /
    • pp.319-330
    • /
    • 2006
  • 본 연구의 목적은 1990년대부터 급속히 증가한 대형할인점에 대하여 입지영향인자를 추출하여 의사결정에 객관성을 확보하고 대량의 데이터베이스를 이용하여 숨겨진 유용한 정보를 입지 선정에 활용하는 것이다. 이를 위해 대형할인점이 입점하는데 미치는 인구학적 변수, 경제학적 변수 그리고 주변환경적 변수에 대한 다양한 인자를 통계자료를 수집하고 연구대상 지역의 공간 자료를 구축하여 공간 연관성 분석을 실시하여 공간 연관규칙을 추출하였다. 결과의 검증을 위해 추출된 규칙과 대형할인점의 매출액을 이용한 적용성 여부를 상호 비교하였다. 검증 결과 추출된 공간 연관규칙이 해당 대형할인점에 많이 부합할수록 매출액도 많은 것으로 나타났다. 본 연구를 통해 공간 연관규칙을 활용하여 객관적이고 매출에 이익을 주는 대형할인점의 최적입지 선정을 기대할 수 있다.

시간연관규칙과 분류규칙을 이용한 비정상행위 탐지 기법 (Anomaly Detection using Temporal Association Rules and Classification)

  • 이헌규;이양우;김룡;서성보;류근호;박진수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1579-1582
    • /
    • 2003
  • 점차 네트워크상의 침입 시도가 증가되고 다변화되어 침입탐지에 많은 어려움을 주고 있다. 시스템에 새로운 침입에 대한 탐지능력과 다량의 감사데이터의 효율적인 분석을 위해 데이터마이닝 기법이 적용된다. 침입탐지 방법 중 비정상행위 탐지는 모델링된 정상행위에서 벗어나는 행위들을 공격행위로 간주하는 기법이다. 비정상행위 탐지에서 정상행위 모델링을 하기 위해 연관규칙이나 빈발에피소드가 적용되었다. 그러나 이러한 기법들에서는 시간요소를 배제하거나 패턴들의 발생순서만을 다루기 때문에 정확하고 유용한 정보를 제공할 수 없다. 따라서 이 논문에서는 이 문제를 해결할 수 있는 시간연관규칙과 분류규칙을 이용한 비정상행위 탐지 모델을 제안하였다. 즉, 발생되는 패턴의 주기성과 달력표현을 이용, 유용한 시간지식표현을 갖는 시간연관규칙을 이용해 정상행위 프로파일을 생성하였고 이 프로파일에 의해 비정상행위로 간주되는 규칙들을 발견하고 보다 정확한 비정상행위 판별 여부를 결정하기 위해서 분류기법을 적용하였다.

  • PDF