• 제목/요약/키워드: 연관규칙분석

검색결과 345건 처리시간 0.039초

전략적 중요도를 고려한 연관규칙의 발견: WARM (Association Rule Discovery Considering Strategic Importance: WARM)

  • 최덕원
    • 정보처리학회논문지D
    • /
    • 제17D권4호
    • /
    • pp.311-316
    • /
    • 2010
  • 본 논문은 가중치를 고려한 연관규칙탐사 알고리즘(WARM)을 제시한다. 각 전략적 요소항목에 가중치를 부여하는 것과, 각 전략요소 항목별로 원시 자료값을 정규화하는 것이 이 논문에서 제시하는 알고리즘의 중요한 내용을 구성하고 있다. 본 논문은 TSAA 알고리즘을 확장 발전 시킨 연구로서 전략적 중요도를 반영하는 항목으로는 각 품목의 이익기여도, 마케팅 가치, 고객만족도 등을 사용하였다. 한 대형할인점의 실제 거래자료를 사용하여 알고리즘의 성능을 검사하였으며, Apriori, TSAA 및 WARM의 세 가지 알고리즘을 사용한 탐사결과를 비교 분석하였다. 분석의 결과 세 가지 알고리즘은 연관분석 행태에 있어서 각각 독특한 탐사행태를 보이는 것으로 나타났다.

상이한 특성을 갖는 아이템 그룹에 대한 가중 연관 규칙 탐사 (Weighted Association Rule Discovery for Item Groups with Different Properties)

  • 김정자;정희택
    • 한국정보통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.1284-1290
    • /
    • 2004
  • 장바구니 분석에서, 가중 연관 규칙 탐사는 특정 상품에 대한 아이템의 중요도를 반영함으로써 더 많은 이익을 주는 정보를 규칙으로 탐사하였다. 그러나 트랜잭션을 구성하는 아이템들이 한 개 이상의 서로 다른 그룹으로 나누어진다면, 각 그룹의 특성을 반영하는 서로 다른 측정 방법으로 평가되어야 하므로 기존의 가중연관규칙 탐사 방법을 적용할 수가 없다. 본 논문에서는 이를 해결하기 위해서 가중 연관 규칙의 새로운 탐사 방법을 제안하였다. 먼저 각 아이템들은 유사한 특성에 따라 서브 그룹으로 나누고, 아이템 중요도(아이템 가중치)는 서브 그룹에 포함된 아이템들 단위로 계산한다 이때 적용되는 여러 가중 인자들은 아이템의 특성을 반영하는 아이템 그룹별로 재 정의하였다. 제안하는 방법은 네트워크 보안 데이터에 적용하여 위험을 일으키는 요소에 대한 위험 규칙 집합을 생성함으로써 네트워크 위험관리의 정성평가와, 규칙 생성 시 적용된 가중치와 같은 여러 통계인자들에 의해서 위험도를 계산함으로써 정량평가를 가능하게 하였다. 또한 데이터 아이템들이 상이하게 구별될 수 있는 특성을 만족하는 마켓 데이터의 새로운 응용분야에 넓게 적용될 수 있다.

네트워크 침입 탐지를 위한 Coverage와 Exclusion 기반의 새로운 연관 규칙 마이닝 (A New Association Rule Mining based on Coverage and Exclusion for Network Intrusion Detection)

  • 김태연;한경현;황성운
    • 사물인터넷융복합논문지
    • /
    • 제9권1호
    • /
    • pp.77-87
    • /
    • 2023
  • 네트워크 침입 탐지 작업에 다양한 연관 규칙 마이닝 알고리즘을 적용하는 데에는 두 가지 중요한 문제가 있다. 생성된 규칙 집합의 크기가 너무 커서 IoT 시스템에서 활용하기 어렵고, 거짓 부정/긍정 비율을 제어하기 어렵다. 본 연구에서는 coverage와 exclusion이라는 새로 정의된 척도에 기반을 둔 연관 규칙 마이닝 알고리즘을 제안한다. Coverage는 한 클래스의 트랜잭션에서 패턴이 발견되는 빈도를 나타내고, exclusion은 다른 클래스의 트랜잭션에서 패턴이 발견되지 않는 빈도를 나타낸다. 우리는 KDDcup99라는 공개 데이터 세트를 사용하여 가장 유명한 알고리즘인 Apriori 알고리즘과 실험적으로 제안된 알고리즘을 비교한다. Apriori와 비교하여 제안된 알고리즘은 정확도를 완전히 유지하면서 생성되는 규칙 집합 크기를 최대 93.2%까지 줄인다. 또한, 제안된 알고리즘은 생성된 규칙의 거짓 부정/긍정 비율을 매개변수별로 완벽하게 제어한다. 따라서 네트워크 분석가는 두 가지 문제를 해결함으로써 제안한 연관 규칙 마이닝을 네트워크 침입 탐지 작업에 효과적으로 적용할 수 있다.

서열 분석을 위한 연관 규칙 탐사 (Association Rule Discovery for Sequence Analysis)

  • 김정자;이도헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.91-93
    • /
    • 2001
  • 최근 지놈(Genome) 프로젝트를 통해 핵산, 단백질 서열 정보가 밝혀짐에 따라 분자 수준의 유전자 정보를 다루는 기법들이 활발히 연구되면서 방대한 서열 정보를 데이터 베이스화하고, 부족하기 위한 효과적인 도구와 컴퓨터 알고리즘의 개발을 필요로 하고 있다. 본 논문에서는 여러 단백질에 공통적으로 존재하는 서열 정보간에 존재하는 연관성을 탐사하기 위한 서열 연관 규칙 알고리즘을 제안한다. 원자 항목을 취급하였던 기존 알고리즘과는 달리 중복을 반영해야 하는 서열 데이터의 특성을 고려하여야 한다. 실험을 단백질 서열 데이터를 대상으로 수행하였다. 먼저 여러 서열에 빈발하게 발생하는 부 서열 집합을 찾고, 부 서열 집합들간에 존재하는 관련성을 탐사한다. 본 연구의 결과는 탐사된 규칙으로부터 다른 단백질의 구조와 기능을 예측할 수 있고, 이 정보는 필요로 하는 생물학적 분석을 방향을 제시할 것이다. 이는 생물학적 실험 대상의 후부조합을 최소화함으로써 많은 시간과 노력 비용을 절감할 수 있다.

  • PDF

상관관계와 카이-제곱 분석에 기반한 긍정과 부정 연관 규칙 알고리즘 (Mining Positive and Negative Association Rules Algorithm based on Correlation and Chi-squared analysis)

  • 김나희;윤성대
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.223-226
    • /
    • 2009
  • Recently, Mining negative association rules has received some attention and proved to be useful. Negative association rules are useful in market-basket analysis to identify products that conflict with each other or products that complement each other. Several algorithms have been proposed. However, there are some questions with those algorithms, for example, misleading rules will occur when the positive and negative rules are mined simultaneously. The chi-squared test that based on the mature theory and Correlation Coefficient can avoid the problem. In this paper, We proposed the algorithm PNCCR based on chi-squared test and correlation is proposed. The experiment results show that the misleading rules are pruned. It suggests that the algorithm is correct and efficient.

  • PDF

연관 규칙 생성 알고리즘 기반의 개인화 의류 추천 시스템 (A Personalized Clothing Recommender System Based on the Algorithm for Mining Association Rules)

  • 이종현;이석훈;김장원;백두권
    • 한국시뮬레이션학회논문지
    • /
    • 제19권4호
    • /
    • pp.59-66
    • /
    • 2010
  • 이 논문에서는 온톨로지로 표현한 트랜잭션으로부터 연관 규칙을 생성하고 이를 기반으로 추론을 수행하여 개인화 의류 추천을 제공하는 시스템을 제안한다. Onto-Apriori 알고리즘을 이용한 연관 규칙 생성은 유행에 따른 구매성향 변동을 능동적으로 분석할 수 있다. 생성된 규칙은 온톨로지에 메타 노드로 표현하고 이를 기반으로 추론함으로써 사용자의 질의에 맞는 추천 항목을 찾아낼 수 있다. 시스템을 평가하기 위하여 추론 소요시간과 추천 정확도 2가지 요소를 기준으로 시뮬레이션을 수행하여 유효성을 증명하였다.

상대 지지도를 이용한 의미 있는 희소 항목에 대한 연관 규칙 탐사 기법 (Mining Association Rules on Significant Rare Data using Relative Support)

  • 하단심;황부현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.577-586
    • /
    • 2001
  • 최근의 데이타베이스 연구 분야에서는 대규모의 데이타베이스에 저장된 데이타를 분석하여 데이타베이스에 존재하지만 쉽게 드러나지 않는 암시적인 지식을 탐사하는 기술인 데이타마이닝이 각광받 고 있다. 본 논문에서는 이러한 데이타 마이닝의 기법 중의 하나인 연관 규칙 탐사 기법온 연구하며 비록 데이타베이스에서 희소하게 나타나는 데이타이지만 임의의 데이타와 높온 비율로 동시에 나타나는 의미 있는 희소 데이타를 고려한 연관 규칙 탐사 기법을 제안한다. 또한 이러한 희소 항목의 탐사에 대하여 기 존의 연판 규칙 탐사 알고리즘과 제안한 알고리즘의 성능을 비교하여 평가한다.

  • PDF

복수 데이터베이스에서 링크를 이용한 연관 규칙 탐사 (Mining Association Rules in Multiple Databases using Links)

  • 배진욱;신효섭;이석호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권8호
    • /
    • pp.939-954
    • /
    • 1999
  • 데이타마이닝 분야에서는 대용량의 트랜잭션 데이타베이스와 같은 하나의 데이타베이스로부터 연관 규칙을 찾는 연구가 많이 수행되어왔다. 그러나, 창고형 할인매장이나 백화점 같이 고객 카드를 이용하는 판매점의 등장으로, 단지 트랜잭션에 대한 분석 뿐만이 아니라, 트랜잭션과 고객과의 관계에 대한 분석 또한 요구되고 있다. 즉, 두 개의 데이타베이스로부터 연관 규칙을 찾는 연구가 필요하다. 이 논문에서는 두 데이타베이스 사이에 링크를 생성하여 연관 항목집합을 찾는 알고리즘을 제안한다. 실험 결과, 링크를 이용한 알고리즘은 고객 데이타베이스가 메모리에 거주가능한 크기라면 시간에 따른 분석에 유용함을 보여주었다.Abstract There have been a lot of researches of mining association rules from one database such as transaction database until now. But as the large discount store using customer card emerges, the analysis is not only required about transactions, but also about the relation between transactions and customer data. That is, it is required to search association rules from two databases. This paper proposes an efficient algorithm constructing links from one database to the other. Our experiments show the algorithm using link is useful for temporal analysis of memory-resident customer database.

개인화를 위한 추천시스템 알고리즘에 관한 연구

  • 강현철;한상태;신연주
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.307-311
    • /
    • 2003
  • 개인화된 추천시스템(recommendation system)은 자동화된 정보 필터링 기술을 적용하여 고객의 취향에 맞는 아이템(상품, 기사, 컨텐츠 등)을 추천하는 시스템이다. 이러한 추천시스템에서 가장 중요한 것은 고객의 특성을 정확히 파악하여 가장 적절한 아이템을 추천해 줄 수 있는 능력이라고 할 수 있다. 본 연구에서는 추천시스템을 위해 제안된 여러 알고리즘들을 소개하고 그 특징들을 비교하였으며, 연관성규칙발견과 군집분석을 이용한 추천시스템 알고리즘을 실제 자료에 적용하여 그 결과를 살펴보았다.

  • PDF

Incremental scan 방식을 이용한 사용자 웹페이지 추천 (User Web Page Recommendation Using incremental scan)

  • 강귀영;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.247-249
    • /
    • 2001
  • 한 사이트 내에서 제공되는 정보가 많아질수록 사용자는 많은 실패를 거친 후 자신이 원하는 정보에 도달하게 된다. 사용자가 어떤 사이트에 자주 찾아오도록 하기 위해서는 적은 노력으로도 원하는 정보에 도달할 수 있도록 도움을 주는 웹 페이지 추천 기법이 필요하다. 기존의 연관규칙이나 순차패턴 기법은 모든 규칙을 찾으므로 필요한 개수 이상의 연산을 한다. 연산 개수가 많아지면 연산 시간이 길어져 갱신되는 데이터베이스를 매번 적용시켜 계산하기가 어렵다. 제안하는 기법은 현재 사용자의 경로 정보를 기준으로 데이터베이스를 변형시키고, 기존 사용자의 경로정보가 저장된 데이터베이스를 검색하여 경로 정보의 패턴을 분석한다. 분석된 결과 중 가장 연관성이 높다고 판단되는 웹 페이지를 현재 사용자에게 추천한다.

  • PDF