• Title/Summary/Keyword: 연관 규칙 마이닝

검색결과 286건 처리시간 0.026초

신경망에 기반한 개인화 기술 (A Personalization Technology Based on Neural Networks)

  • 김종수;도영아;류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.28-30
    • /
    • 2001
  • 현 인터넷상에서 취향에 맞는 항목(상품) 정보를 사용자에게 추천해 주는 개인화 기술은 대부분 특정 사용자와 유사한 선호도를 갖는 다른 사용자들의 특정 항목에 대한 선호도를 바탕으로 항목의 선호도를 추정하는 협력적 추천 기술을 적용하고 있다. 이중 최근접 이웃 방법은 적용하기가 용이한 반면 항목간의 가중치를 고려하지 못함으로써 추천의 정확도가 크게 떨어지는 문제점이 있다. 연관규칙 방법은 다른 항목에 대한 선호도 자료로부터 데이터 마이닝 기법을 적용하여 항목 선호에 대한 연관규칙을 추출하고 그 규칙을 사용하여 어떤 항목의 선호도를 추정한다. 따라서 항목들 간의 중요도가 연관규칙의 지지도나 신뢰도 등으로 나타난다고 할 수 있으나, 단순히 항목들간의 연관관계 즉 표면적인 연관관계에 의하여 선호도를 결정함으로써 항목들간의 어떤 내용적인 공통성 또는 어떤 상위개념에 의한 선호도가 고려되지 않음으로써 역시 정확도가 떨어지는 문제점이 있다. 본 논문에서는 추천의 정확도를 향상시키기 위한 신경망 추천 방법에 대해 분석하고, 내용기반 추천과 협력적 추천을 병합한 신경망 추천 방법을 제안한다. 또한, 다른 협력적 추천 방법과의 비교를 통하여 본 추천 방법의 장점과 성능의 우수함을 보인다.

  • PDF

클러스터링과 특성분석을 이용한 구간 데이터에서 다차원 연관 규칙 마이닝 (Mining of Multi-dimensional Association Rules over Interval Data using Clustering and Characterization)

  • 임승환;권용석;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.60-64
    • /
    • 2010
  • 비 트랜잭션 데이터를 대상으로 연관 규칙을 도출하기 위해서, 데이터의 속성들을 구간화하는 기법들이 활발하게 연구되었다. 이러한 기존의 연구들은 구간화 단계에서 구간 범위의 변화에 따른 연관 규칙의 신뢰도 변화를 반영하지 않고, 구간화 단계와 연관 규칙을 도출하는 단계들을 독립적으로 수행하였다. 이로 인해 속성들의 구간이 부적절하게 설정되고, 이 결과 높은 신뢰도를 갖는 연관 규칙들이 최종 결과에서 누락된다. 따라서 본 논문에서는 속성들을 구간화하는 단계와 연관 규칙들을 도출하는 단계를 병합하여 동시에 수행함으로써, 가장 신뢰도가 높은 연관규칙들을 도출할 수 있는 구간을 설정하는 방안을 제안한다. 이를 위해서 연관 규칙의 우변의 속성들을 대상으로 계층적 클러스터링을 수행하고, 각 클러스터들에 대해서 특성 분석을 수행한다. 실험 결과, 제안하는 기법은 기존의 기법들에 비해서 높은 신뢰도를 갖는 연관 규칙들을 발견하는 것으로 나타났다.

데이타 마이닝을 사용한 방학 중 학습방법과 학업성취도의 관계 분석 (Effective Studying Methods during a School Vacation: A Data Mining Approach)

  • 김혜숙;문양세;김진호;노웅기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.40-51
    • /
    • 2007
  • 학업성취도 향상을 위해 정규 수업 이외에도 과외, 학원수강, 교육방송 시청 등 다양한 교육이 이루어지고 있다. 본 논문에서는 방학 중 학습방법과 생활습관이 학업성취도 변화에 미치는 영향을 분석하기 위한 데이타 마이닝 접근법을 제안한다. 우선, 학업성취도에 영향을 미치는 방학중의 학습방법과 생활습관에 대한 다양한 요소를 도출한다. 다음으로, 마이닝 기법 중 의사결정트리와 연관 규칙을 사용하기 위한 데이타 변환 및 분석 방법을 제안한다. 마지막으로, 설문조사를 통해 수집한 현실의 구체적 데이터에서 의사결정트리를 생성하고 연관 규칙을 추출하는 방법을 제안한다. 중학생들에 대한 설문조사를 분석한 결과, 의사결정트리의 경우 네 가지 의미있는 결과를 도출하였다. 첫째, 상위권 학생들의 경우 학원수강이 성적을 향상시키는 것으로 나타났다. 둘째, 대부분 학생들의 경우 인터넷 학습사이트 이용은 성적을 하락시키는 것으로 나타났다. 셋째, 성적 변화에 큰 영향을 미칠 것으로 예상했던 과외는 실제로 큰 영향을 미치지 못하는 것으로 나타났다. 넷째, 다양한 학습방법의 병행은 오히려 성적 하락의 요인이 되는 것으로 파악되었다. 다음으로, 연관 규칙 추출 결과, 방학 중 활동 사이에는 특이한 규칙이 없는 것으로 나타났다. 본 논문에서 제시한 데이타 마이닝 접근법 및 결과는 학생들의 방학 중 생활 지도나 학습 계획 수립에 많은 도움이 될 수 있다고 사료된다.

실시간 연관규칙 탐사를 위한 능동적 후보항목 관리 모델 (An Active Candidate Set Management Model for Realtime Association Rule Discovery)

  • 신예호;류근호
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.215-226
    • /
    • 2002
  • 미디어의 발달과 생활 패턴의 변화를 토대로 새롭게 나타나고 있는 다양한 판매 패턴들을 분석하는데 있어 단일한 분석 방법을 적용하는 것은 효과적이지 못하다. 특히 신선 식품이나 기념일 주변에서 집중적인 매출이 발생하는 품목들은 제한된 시간 내에 판매를 최대로 해야 하는 시간적 제약을 갖는다. 그러나 기존의 연관규칙 탐사 기법은 대규모 거래 데이터베이스로부터 반복적 스캔 연산을 통해 연관규칙 탐사를 수행하기 때문에 제한된 시간안에서 빈번히 필요로 하는 패턴을 분석하기에는 비효율적이기 때문이다. 따라서 이 논문에서는 시간 제약을 갖는 특수한 판매 패턴에 대한 실시간 연관규칙 탐사가 가능하도록 하기 위해 트리거와 저장 프로시져를 이용한 점진적 후보항목 관리 모델을 제안한다. 아울러 이 논문에서는 제안 모델의 구현 및 실험을 통해 그 성능 특성의 분석도 수행한다. 특히 이 논문에서 제안하는 방법은 이중 해쉬 기법을 이용함으로써 연산의 성능을 향상시킨다.

연관 규칙을 이용한 적응적 고객 관계 관리 전략 (Adaptive Customer Relation Management Strategies using Association Rules)

  • 한기태;정경용;백준호;김종훈;류중경;이정현
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.84-86
    • /
    • 2008
  • 회사들이 정보를 효율적으로 이용할 수 있도록 제어하고 필터링하는 일을 도와주는 고객 관계 마케팅이 등장하였으며, 더 나아가 고객이 원하는 제품을 예측하고 추천해 주기 위해 데이터 마이닝을 적용하고 있다. 본 논문에서는 데이터 마이닝의 연관 규칙을 이용한 적응적 고객 관계 관리 전략을 제안하였다. 제안된 방법으로는 연관 규칙을 이용하여 후보 고객 집합으로 빈발 고객을 구성하고 연관 고객들의 규칙을 생성한다. 생성된 연관 규칙의 향상도에 따라서 하이퍼 그래프 분할을 이용하여 구매 고객들의 효율적인 특성을 분석한다. 따라서 고객들에 대한 교차 판매와 격상 판매의 전략들을 도출하게 된다.

  • PDF

전자상거래 상에서의 실시간 데이터 마이닝 활용 모델 (Real-time Data Mining application Model In Electronic Commerce)

  • 김고은;옥지웅;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.155-158
    • /
    • 2007
  • 현재 전자상거래는 우리의 생활과 밀접히 연관되어 있다. 최근 인터넷을 기반으로 전자조달, 수출입 브로커 등과 같은 유형의 B2B 전자상거래가 활발히 이루어지고 있으며, 소비자를 대상으로 하는 전자상거래 또한 점차 확산되는 시장을 형성하고 있다. 국제적으로도 전자상거래 시장 규모가 급속도로 증가할 것이라는 전망은 자명한 사실이다. 전자상거래에 대한 의존도가 높아지면서 관리해야 하는 데이터의 양 또한 급속도로 증가하고 있다. 본 논문에서는 실시간으로 유입되는 데이터를 효율적으로 활용하기 위챈 실시간 데이터 마이닝 활용 모델을 제안한다. 이 실시간 데이터 마이닝 모델은 지속적으로 유입되는 데이터의 규칙화를 통해 저장 공간의 효율성을 극대화하고 중요도 분석을 통한 총체적인 접근 방법을 시도함으로써 전자상거래 상에서 유용하게 쓰일 수 있는 활용 모델이다. 이 실시간 데이터 마이닝 모델의 바탕은 데이터 마이닝의 기법인 SEMMA를 따르며, 그 특징에 따라 규칙 추출과 의사 결정 나무 기법을 이용하여 전자상거래 상에서 유용하게 사용될 수 있는 모델을 제시하고자 한다.

  • PDF

연관 규칙과 협력적 여과 방식을 이용한 추천 시스템 (Recommender System using Association Rule and Collaborative Filtering)

  • 이기현;고병진;조근식
    • 지능정보연구
    • /
    • 제8권2호
    • /
    • pp.91-103
    • /
    • 2002
  • 기존의 인터넷 웹사이트에서는 사용자의 만족을 극대화시키기 위하여 사용자별로 개인화 된 서비스를 제공하는 협력적 필터링 방식을 적용하고 있다. 협력적 여과 기술은 비슷한 선호도를 가지는 사용자들과의 상관관계를 기반으로 취향에 맞는 아이템을 예측하여 특정 사용자에게 추천하여준다. 그러나 협력적 필터링은 추천을 받기 위해서 특정 수 이상의 아이템에 대한 평가를 요구하며, 또한 전체 사용자에 대해 단지 비슷한 선호도를 가지는 일부 사용자 정보에 의지하여 추천함으로써 나머지 사용자 정보를 무시하는 경향이 있다. 그러나 나머지 사용자 정보에도 추천을 위한 유용한 정보가 숨겨져 있다. 우리는 이러한 숨겨진 유용한 추천 정보를 발견하기 위하여 본 논문에서는 협력적 여과 방식과 함께 데이터 마이닝(Data Mining)에서 사용되는 연관 규칙(Association Rule)을 추천에 사용한다. 연관 규칙은 한 항목 그룹과 다른 항목 그룹 사이에 존재하는 연관성을 규칙(Rule)의 형태로 표현한 것이다. 이와 같이 생성된 연관 규칙은 개인 구매도 분석, 상품의 교차 매매(Cross-Marketing), 카탈로그 디자인, 염가 매출품(Loss Leader)분석, 상품 진열, 구매 성향에 따른 고객 분류 다양하게 사용되고 있다. 그러나 이런 연관 규칙은 추천 시스템에서 잘 응용되지 못하고 있는 실정이다. 본 논문에서 우리는 연관 규칙을 추천 시스템에 적용해, 항목그룹 사이에 연관성을 유도함으로써 추천에 효율적으로 사용할 수 있음을 보였다 즉 전체 사용자의 히스토리(History) 정보를 기반으로 아이템 사이의 연관 규칙을 유도하고 협력적 여과 방식과 함께 보조적으로 연관 규칙을 추천을 위해 사용함으로써 추천 시스템에 효율성을 높였다.

  • PDF

데이터 마이닝을 활용한 효소 대사물의 분석 (Enzyme Metabolite Analysis Using Data Mining)

  • 정희택;박춘구
    • 한국전자통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.969-982
    • /
    • 2016
  • 최근 천연물로부터 신약 후보물질을 개발하려는 연구가 활발히 이루어지고 있다. 인체 내에서 천연물은 주로 효소에 의해 대사된다. 본 연구는 화합물의 인체내 대사반응과 주로 관련된 효소에 의한 대사반응의 특징을 연관규칙마이닝을 활용하여 분석한다. 화합물이 인체 내에서 효소 대사반응과 관련된 데이터를 BRENDA(: BRaunschweig ENzyme DAtabase)로부터 수집하였다. 수집된 데이터를 효소대사반응의 기본 틀에 근거하여, 대사물들을 기질대사물, 생성대사물, 억제대사물, 그리고 활성대사물들로 구분한다. 이러한 대사물들로 이루어진 기질대사물 트랜잭션, 생성대사물 트랜잭션, 그리고 모든 대사물들을 포함한 효소반응트랜잭션들을 구성하였다. 또한 종 정보를 반영한 6개의 트랜잭션들로 구성하였다. 연관규칙 마이닝을 활용하여 6개의 트랜잭션에서 빈발대사물 및 패턴을 분석하였다. 또한 대사물들 사이의 관련성을 분석하였다. 그 결과 효소대사반응에 참여하는 대사물들의 분포와 패턴을 식별할 수 있었다. 더욱이 기질에만 속하는 순수 기질대사물들을 식별하였고 이들 대부분이 아주 낮은 지지도임을 확인할 수 있었다. 연구결과는 순수 기질대사물은 효과적인 대사변환 예측 모델 개발에 활용될 수 있다.

연관규칙 마이닝에서 랜덤화를 이용한 프라이버시 보호 기법에 관한 연구 (On the Privacy Preserving Mining Association Rules by using Randomization)

  • 강주성;조성훈;이옥연;홍도원
    • 정보처리학회논문지C
    • /
    • 제14C권5호
    • /
    • pp.439-452
    • /
    • 2007
  • 본 논문에서는 랜덤화 기법을 이용한 프라이버시 보존형 데이터 마이닝(PPDM) 기술에 대하여 논한다. 계산 효율성 때문에 실용화 되지 못하고 있는 안전한 다자간 계산(SMC) 기반 PPDM은 현재의 컴퓨팅 환경에서는 실용성 없는 다분히 이론적인 것이다. 그래서 우리는 실용적인 PPDM 기술에 집중하여 가장 널리 사용되고 있는 랜덤화 기법에 대한 연구 결과를 소개한다. 특히, 랜덤화를 이용한 실용적인 PPDM 분야에서 가장 중요한 프라이버시 측도 개념을 심도 있게 분석하였으며, 연관규칙 마이닝에서의 프라이버시 보호 기술에 초점을 맞춘다. Evfimievski 등이 제안한 select-a-size 범주에 속하는 새로운 랜덤화 작용소인 binomial-selector 개념을 제안하고, 적절한 파라미터를 찾기 위한 시뮬레이션 결과를 제시한다. 기존의 cut-and-paste 랜덤화 작용소는 아이템 집합이 큰 경우에는 매우 비효율적이며 복원된 지지도의 분산이 크다는 단점을 지니고 있다. 여기에서 제안하는 binomial-selector 랜덤화 작용소는 cut-and-paste 작용소가 갖는 단점들을 보완한다.

시간 연관규칙의 유지를 위한 점진적인 마이닝 기법 (An Incremental Mining Technique for Maintenance for Temporal Association Rules)

  • 백옥현;이준욱;김영균;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.178-180
    • /
    • 2001
  • 실세계의 여러 응용에서 데이터베이스의 크기는 계속적으로 증가되어 왔으며, 이러한 데이터베이스 내에서 유용한 지식을 찾아내기 위한 다양한 연구가 진행되어 왔다. 데이터베이스는 시간이 흐름에 따라 동적으로 변환된다. 현재의 연구는 이러한 데이터베이스에서 효과적으로 규칙을 발견하는데 초점이 모아지고 있다. 그러나, 이런 변화에 따라서 기존에 발견되었던 규칙들은 더 이상 유효하지 않을 수 있기 때문에 이전에 발견되었던 규칙들은 유효한지 검증되어야 한다. 데이터베이스가 증가할 때마다 전체를 다시 탐색해서 규칙을 찾는 것은 효과적인 방법이 아니므로, 점진적으로 규칙을 유지할 수 있는 알고리즘이 필요하다. 이 논문에서는 이전에 발견되었던 규칙이 물리적으로 저장되었고 그 후에 데이터베이스가 업데이트된 것을 고려하여 규칙, 특히 시간 연관규칙을 점진적으로 유지할 수 있는 기법을 제시한다.

  • PDF