• 제목/요약/키워드: Association Rules Mining

검색결과 307건 처리시간 0.024초

음의 순수 연관성 규칙 평가 기준의 제안 (Proposition of negatively pure association rule threshold)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.179-188
    • /
    • 2011
  • 연관성 규칙은 방대한 데이터베이스에서 항목간의 관계를 명확히 수치화 함으로써 그들간의 관련성을 표시해주는 기법으로 데이터 마이닝 기법들 중에서 가장 많이 활용되고 있다. 어느 항목이 발생하면 다른 항목도 발생한다는 규칙을 발견하기 위한 기법이 연관성 규칙이라면 음의 연관성 규칙 마이닝은 어느 항목이 발생하면 다른 항목도 발생하지 않는다는 규칙을 찾아내는 기법이다. 기존의 연관성 규칙에 음의 연관성 규칙을 추가하게 되면 어떤 제품을 판매하기 위해서는 그 제품만 마케팅 하는 것 뿐 만 아니라 더 나아가 그 제품이 아닌 어느 제품을 마케팅 하는 것이 필요한지를 판단할 수 있다. 본 논문에서는 음의 연관성 규칙의 단점을 보완할 수 있는 음의 순수 연관성 규칙의 측도들을 제시하고 흥미도 측도가 가져야 할 조건들을 조사하였으며, 예제 데이터를 활용하여 음의 순수 연관성 규칙의 유용성에 대해 살펴보았다.

가중연관규칙 탐사를 이용한 재활훈련운동과 근육 활성의 연관성 분석 (Analysis on Relation between Rehabilitation Training Movement and Muscle Activation using Weighted Association Rule Discovery)

  • 이아름;박용군;권대규;김정자
    • 전자공학회논문지CI
    • /
    • 제46권6호
    • /
    • pp.7-17
    • /
    • 2009
  • 효과적인 재활 시스템을 구상하는데 있어서 훈련 데이터의 정교한 분석은 다음 단계 훈련을 위한 피드백 자료로서 매우 중요하다. 현재 다양한 생체 역학적 실험을 통해 인간의 운동 능력을 평가하고 이로부터 생성된 데이터의 분석을 위한 객관적이고 신뢰성 있는 연구결과들이 발표되고 있다. 그러나 대부분의 기존 연구들은 기초 통계적인 방법에 근거한 정량분석만을 수행함으로써, 획득된 정보를 임상에 적용 하는데 있어서는 충분한 신뢰성을 보장할 수 없다. 데이터마이닝은 대용량 데이터에 들어있는 숨겨진 규칙과 패턴을 탐사함으로써 임상 데이터에 숨어있는 의미 있는 정보추출에 성공적으로 사용되고 있으며, 특히 임상 연구 분야에서는 훌륭한 의사 결정 지원 시스템으로서 점점 그 사용이 증가되고 있다. 본 연구에서는 신뢰성 있는 자세 제어 능력(Postural control ability) 평가를 위해서 측정된 훈련 데이터에 가중연관규칙 탐사를 적용하여 자세 훈련 유형에 따른 근육 활성 패턴과의 연관성을 분석, 효율적인 재활 훈련 규칙을 탐사하였다. 탐사된 규칙은 재활 및 임상 전문가의 의사결정에 더욱 정성적이고 유용한 선험적 지식으로 사용 될 수 있으며, 이를 근거로 환자 맞춤형 최적의 재활 훈련 모델을 구상하기 위한 지표로서 사용될 수 있다.

데이터마이닝을 활용한 성공적 노후 예측 키워드 분석 (An Analysis on the Predictor Keyword of Successful Aging: Focused on Data Mining)

  • 홍서연
    • 한국콘텐츠학회논문지
    • /
    • 제20권3호
    • /
    • pp.223-234
    • /
    • 2020
  • 본 연구는 Hong(2019)의 연구에서 도출된 한국 노인의 성공적인 노후에 영향을 주는 예측 키워드 32개를 중심으로 데이터마이닝의 Apriori 알고리즘을 활용하여 연관관계 규칙을 분석하였다. 그리고 한국 노인의 성공적 노후에 영향을 주는 예측변수들의 규칙 및 패턴을 파악하기 위한 지표로 지지도, 신뢰도, 향상도를 활용하였다. 본 연구의 분석은 R version 3. 5. 1 프로그램으로 분석을 실시하였으며, arulesViz 패기지와 visNetwork 패키지로 시각화하였다. 연구결과 한국 노인들의 성공적인 노후와 연관성이 높은 예측변수는 '취미', '봉사', '준비', '운동'으로 나타났다. 그리고 한국 노인의 성공적 노후를 고려할 때 가장 우선적으로 고려해야 할 변수는 '취미' 이며 그 다음 '봉사', 준비', 운동'의 순으로 고려해야 한다는 결과를 얻었다.

효율적인 클러스터링을 이용한 관심 정보 추출을 위한 웹 마이닝 (Web Mining for Discovering Interesting Information using Effective Clustering)

  • 김성학;안병태
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.251-260
    • /
    • 2008
  • 인터넷의 전자상거래에서 대규모 정보 저장소에 있는 원하는 정보를 신속하게 검색하기란 어렵다. 대부분의 전자상거래 사이트에 있어서 정보를 제공하는 방법으로는 통계적 분석이나 분류별 지향의 간단한 과정을 통해 생성된다. 그러나 이러한 것은 생성 정보들 사이의 다양한 상호관계를 표현할 수 없고 사용자의 정확한 구매 패턴을 반영하기 어렵다. 본 논문에서는 전자상거래에서 효과적인 클러스터링을 이용한 다양한 관심정보 추출을 위한 효율적인 웹 마이닝을 제안한다. 이러한 방법은 분류별 항목에서 순차 패턴과 상관 규칙을 이용하여 생성 정보들 사이의 보다 적합한 상관관계를 구성하고 제안된 방법을 통해 효율적인 실험 결과를 나타낸다. 그리고 효과적인 클러스터링을 이용하여 신속한 검색을 제안한다.

  • PDF

데이터마이닝 기법을 이용한 비정상행위 탐지 방법 연구 (Anomaly Detection Scheme Using Data Mining Methods)

  • 박광진;유황빈
    • 정보보호학회논문지
    • /
    • 제13권2호
    • /
    • pp.99-106
    • /
    • 2003
  • 네트워크 환경에서의 다양한 침입은 심각한 위험을 초래 할 수 있기 때문에 침입을 효과적으로 탐지하기 위해 데이터마이닝 기법을 발전시켜 왔다. 비정상행위 탐지 기술은 순수 데이터로 학습한 후, 비정상행위를 탐지하기 때문에 정교한 정상행위 패턴 생성이 필수적이다. 순수한 학습 데이터의 생성은 시간과 비용이 많이 드는 단점이 있다. 따라서 네트워크 상의 데이터에 대한 특징을 파악하는 것이 중요하다. 본 논문에서는 데이터마이닝의 연관규칙 및 클러스터링기법을 비정상행위 탐지에 적용하였고, 패킷내의 판정 요소에 정보이론 척도를 적용하여 불필요한 데이터를 필터링하는 방법을 제시하였다. 또한 가변길이 트랜잭션을 네트워크상의 분석 단위를 정의하는 기준으로 제시하여 행위 패턴 생성에 보다 묘사성이 높음을 보였다.

모바일과 의료서비스 간의 새로운 융합 가능성에 관한 연구 (A Study on the Possible New Fusion between Mobile and Healthcare Service)

  • 신용재;김진화;이재범
    • 한국IT서비스학회지
    • /
    • 제11권sup호
    • /
    • pp.27-39
    • /
    • 2012
  • As many applications are possible now in mobile environment with the trend of mobile convergence, diverse applications in healthcare industry are also possible in mobile devices. Though lots of researches on mobile and health services are introduced, they are limited to specific area or techniques. This study shows possible directions of fusion between mobile technologies and health services in the future using a data mining technique called association rule analysis. The data used in this study is collected from web pages containing key words related to mobile technologies and health services. The analysis shows that current cases of fusion between monitoring based telemedicine and patients. It also shows another case of fusion between mobile hospital and medical screen charts. These show that fusion between mobile technologies and health services already began in industry. Association rules are found between well-being, city, diet, and sleep. The association rules containing security and privacy, though their associations are not so strong, also show that security and privacy of patient information should be protected in the future. The results show that the fusion of mobile technologies and health services is expected to provide health services to more users and larger areas. It is also expected to create new diverse business models in the future.

동시 비 발생 빈도를 고려한 유사성 측도의 연관성 규칙 평가 기준 활용 방안 (Association rule thresholds of similarity measures considering negative co-occurrence frequencies)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1113-1121
    • /
    • 2011
  • 최근 여러 분야에서 다양한 데이터 마이닝 방법들을 현업에 적용하고 있는 추세이다. 가장 많이 활용되고 있는 데이터 마이닝 기법 중의 하나인 연관성 규칙은 대용량 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화하여 그들 간의 연관 정도를 나타내는 기법이다. 의미 있는 연관성 규칙을 생성하기 위해 지지도, 신뢰도, 향상도 등의 측도가 가장 기본적으로 활용되고 있다. 본 논문에서는 군집 분석이나 다차원 분석법에서 많이 활용되고 있는 유사성 측도들 중에서 동시 비 발생 빈도를 고려한 유사성 측도를 연관성 평가 기준으로 제안한 후, 예제를 통하여 기존의 신뢰도 및 지지도와 비교함으로써 그 유용성을 알아보았다. 모의실험 결과를 종합해볼 때, 동시 발생 빈도 또는 동시 비 발생 빈도가 증가하면 본 논문에서 고려한 모든 유사성 측도들은 지지도 및 신뢰도와 마찬가지로 증가하며, 불일치 계수의 값이 증가하면 이 측도들은 감소하게 된다는 사실을 알 수 있었다. 또한 이들 유사성 측도들은 지지도 및 신뢰도와 매우 유의한 상관관계가 있는 것으로 나타났으며, 전항과 후항이 바뀌더라도 값의 변화가 없기 때문에 신뢰도 보다 더 바람직한 연관성 규칙 평가 기준이라고 할 수 있다.

도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델 (Data Bias Optimization based Association Reasoning Model for Road Risk Detection)

  • 류성은;김현진;구병국;권혜정;박찬홍;정경용
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.1-6
    • /
    • 2020
  • 본 연구에서는 도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델을 제안한다. 이는 사용자의 개인적 특성과 주변 환경 데이터를 수집하고 교통사고 방지 서비스를 제공하기 위한 연관분석 기반의 마이닝 모델이다. 이는 다양한 상황 변수들로 구성된 트랜잭션 데이터를 생성한다. 생성된 정보를 바탕으로 연관 패턴 분석을 통해 각 트랜잭션 내 변수들의 유의미한 연관관계를 도출한다. 분류된 범주형 데이터의 편향성을 고려하여 최적화된 지지도 및 신뢰도 값으로 가지치기를 진행한다. 추출된 상위 연관규칙을 바탕으로 사용자에게 개인 특성과 주행 도로 상황에 대한 위험 탐지모델을 제공한다. 이는 데이터 편향성 문제를 극복하고 데이터간 연관성을 고려하여 잠재적인 도로 사고를 예방하는 교통 서비스가 가능하다. 성능 평가는 제안하는 방법이 정확도에서 0.778, Kappa 계수에서 0.743로 우수하게 평가된다.

DHP 연관 규칙 탐사 알고리즘을 위한 효율적인 해싱 메카니즘 (An Efficient Hashing Mechanism of the DHP Algorithm for Mining Association Rules)

  • 이형봉
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.651-660
    • /
    • 2006
  • Apriori 알고리즘에 기반 한 연관 규칙 탐사 알고리즘들은 후보 빈발 항목 집합의 계수 관리를 위한 자료구조로 해시 트리를 사용하고, 많은 시간이 그 해시 트리를 검색하기 위해 소요된다. DHP 연관 규칙 탐사 알고리즘은 해시 트리에 대한 검색 시간을 절약하기 위해 검색 대상인 후보 빈발 항목 집합의 개수를 최대한 줄이고자 노력한다. 이를 위해 사전에 예비 후보 빈발 항목 집합에 대한 간편 계수를 실시한다. 이 때, 예비 계수에 필요한 계산 부담을 줄이기 위해 아주 간단한 직접 해시 테이블 사용을 권고한다. 이 논문에서는 DHP 연관 규칙 탐사 알고리즘의 단계 2에서 사전 전지를 위해 사용되는 직접 해시 테이블 $H_2$와 모든 단계에서 후보 빈발 항목 집합의 계수를 위해 사용되는 해시 트리 $C_k$에 적용될 수 있는 효율적인 해싱 메카니즘을 제안하고 검증한다. 검증 결과 일반적인 단순 제산(mod) 연산 방법을 사용했을 때보다 제안 방법을 적용했을 경우 최대 82.2%, 평균 18.5%의 성능 향상이 얻어지는 것으로 나타났다.

전자상거래에서 연관규칙과 순차패턴을 이용한 온라인 마이닝 (On-Line Mining using Association Rules and Sequential Patterns in Electronic Commerce)

  • 김성학
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권7호
    • /
    • pp.945-952
    • /
    • 2001
  • 인터넷 사용 인구의 증가로 전자상거래는 새로운 상거래 형태로 빠르게 발전하고 있으며, 대다수 인터넷 쇼핑몰들은 사용자에게 더 많은 정보와 편리한 사용자 인터페이스를 제공함으로써 보다 많은 고객을 확보하려고 노력하고 있다. 편리한 인터페이스 중의 하나는 상품을 추천해주는 서비스이며, 이를 위해서는 쇼핑몰에서의 구매정보, 행동 그리고 장바구니 등 사용자로부터 특정 행동패턴을 추출하고 분석하는 방법이 필요하다. 이러한 방법 중에서 상품간의 연관성 추출을 위하여 주로 연관규칙과 순차패턴이 이용되고 있는데, 대부분의 온라인 전자상거래에서는 사용자의 정보 또는 구매이력을 가지고 카테고리를 중심으로 수행하고 있다. 그러나 이는 단일한 구매패턴에 의한 연관성만을 나타낼 뿐이며, 상품 각각에 대한 연관성을 찾아보기 힘들다. 또한 단일 구매패턴은 계산 비용이 작기는 하지만 사용자의 구매패턴을 정확하게 반영하기 어렵다. 따라서 본 논문에서는 이러한 문제를 해결하기 위하여 카테고리 독립적이고 단일 항목간의 구조화를 통하여 항목간의 연계성을 갖는, 다중 구매패턴을 고려하는 마이닝 방법을 제안한다.

  • PDF