• 제목/요약/키워드: 연관규칙 분석

검색결과 346건 처리시간 0.023초

Neural Feature Association Rule을 이용한 효모 단백질-단백질 상호작용의 예측 (Prediction of Yeast Protein-Protein Interactions by Neural Feature Association Rule)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.277-279
    • /
    • 2005
  • 단백질들은 서로 다른 단백질들과 상호작용하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질들 간의 상호작용 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이터가 산출된 후게놈시대(post-genomic era)에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터들에서 속성들 간의 연관규칙 학습을 통해 잠재적 단백질 상호작용들을 예측하기 위한 연관규칙 기반의 상호작용 예측 방법을 제시한다. 단백질들 간의 상호작용 예측을 위해 고려되는 각 단백질의 다수의 속성차원은 정보이론 기반의 속성선택 알고리즘을 이용하여 효율적으로 줄이며 상호작용의 속성집합을 이용하여 신경망을 훈련시키고 이렇게 훈련된 신경망에서 속성들 간의 연관규칙을 디코딩하여 연관규칙 기반의 상호작용 예측에 활용한다. 연관속성 발굴을 통한 상호작용 예측을 위한 마이닝 방법으로는 연관규칙 발견 알고리즘을 사용하였으며 예측 정확도를 높이기 위하여 신경망 예측 모델의 학습 결과를 디코딩한 규칙들이 추가적으로 사용하였다. 논문에서 제안한 방법을 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 평균 약 $94.5\%$의 예측 정확도를 보였다.

  • PDF

연관 규칙을 이용한 방학 중의 생활 습관 분석 (Association Rule-based Analysis to Living Style during Vacation)

  • 김혜숙;문양세;노희영;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.108-112
    • /
    • 2006
  • 본 논문에서는 학생들의 방학 중 생활 습관을 분석하기 위해 연관규칙을 사용한 접근법을 제안한다. 이를 위해, 우선 학생들이 할 수 있는 방학 중의 생활 습관에 대한 다양한 요소를 도출한다. 다음으로, 연관규칙를 적용하기 위한 데이터 변환 및 분석 방법을 제안한다. 마지막으로, 설문조사를 통해 수집한 현실의 구체적 데이터에서 연관규칙을 추출한다. 그 결과, 학원수강을 하는 학생들은 국어, 영어, 수학 세과목 모두를 수강한다는 일반적인 규칙을 얻을 수 있었다.

  • PDF

확장된 공간 연관 규칙 탐사기법 (Extended Method of Discovery of Spatial Association Rules)

  • 하단심;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.83-86
    • /
    • 2000
  • 공간 데이터가 증가함에 따라 이를 효율적으로 저장하고 분석할 수 있는 기술이 필요하게 되었다. 공간 데이터 마이닝은 데이터베이스에서 유용한 지식을 추출하는 기술로, 기존의 데이터 마이닝 방법에 공간의 개념을 추가하여 확장함으로써 공간 패턴, 공간 객체들의 연관 관계 둥을 얻을 수 있다. 본 논문에서는 공간 데이터 마이닝의 기법 중의 하나인 공간 연관 규칙 탐사 기법을 제안한다. 제안하는 방법은 공간 관계를 포함한 공간 연관 규칙뿐만 아니라 공간 객체의 비공간 속성도 함께 고려함으로써 보다 확장되고 다양한 공간 연관 규칙을 탐사할 수 있다.

  • PDF

연관 규칙 분석 알고리즘을 활용한 영작문 형태.통사 오류 자동 발견 (Automatic Error Detection of Morpho-syntactic Errors of English Writing Using Association Rule Analysis Algorithm)

  • 김동성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2010
  • 본 연구에서는 일련의 연구에서 수집된 영작문 오류 유형의 정제된 자료를 토대로 연관 규칙을 생성하고, 학습을 통해서 효용성이 검증된 연관 규칙을 활용해서 영작문 데이터의 형태 통사 오류를 자동으로 탐지한다. 영작문 데이터에서 형태 통사 오류를 찾아내는 작업은 많은 시간과 자원이 소요되는 작업이므로 자동화가 필수적이다. 기존의 연구들이 통계적 모델을 활용한 어휘적 오류에 치중하거나 언어 이론적 틀에 근거한 통사 처리에 집중하는 반면에, 본 연구는 데이터 마이닝을 통해서 정제된 데이터에서 연관 규칙을 생성하고 이를 검증한 후 형태 통사 오류를 감지한다. 이전 연구들에서는 이론적 틀에 맞추어진 규칙 생성이나 언어 모델 생성을 위한 대량의 코퍼스 데이터와 같은 다량의 지식 베이스 생성이 필수적인데, 본 연구는 적은 양의 정제된 데이터를 활용한다. 영작문 오류 유형의 형태 통사 연관 규칙을 생성하기 위해서 Apriori 알고리즘을 활용하였다. 알고리즘을 통해서 생성된 연관 규칙 중 잘못된 규칙이 생성될 가능성이 있으므로, 상관성 검정, 코사인 유사도와 같은 규칙 효용성의 통계적 검증을 활용해서 타당한 규칙만을 학습하였다. 이를 통해서 축적된 연관 규칙들을 영작문 오류를 자동으로 탐지하는 실험에 활용하였다.

  • PDF

연관 규칙과 협력적 여과 방식을 이용한 추천 시스템 (Recommender System using Association Rule and Collaborative Filtering)

  • 이기현;고병진;조근식
    • 지능정보연구
    • /
    • 제8권2호
    • /
    • pp.91-103
    • /
    • 2002
  • 기존의 인터넷 웹사이트에서는 사용자의 만족을 극대화시키기 위하여 사용자별로 개인화 된 서비스를 제공하는 협력적 필터링 방식을 적용하고 있다. 협력적 여과 기술은 비슷한 선호도를 가지는 사용자들과의 상관관계를 기반으로 취향에 맞는 아이템을 예측하여 특정 사용자에게 추천하여준다. 그러나 협력적 필터링은 추천을 받기 위해서 특정 수 이상의 아이템에 대한 평가를 요구하며, 또한 전체 사용자에 대해 단지 비슷한 선호도를 가지는 일부 사용자 정보에 의지하여 추천함으로써 나머지 사용자 정보를 무시하는 경향이 있다. 그러나 나머지 사용자 정보에도 추천을 위한 유용한 정보가 숨겨져 있다. 우리는 이러한 숨겨진 유용한 추천 정보를 발견하기 위하여 본 논문에서는 협력적 여과 방식과 함께 데이터 마이닝(Data Mining)에서 사용되는 연관 규칙(Association Rule)을 추천에 사용한다. 연관 규칙은 한 항목 그룹과 다른 항목 그룹 사이에 존재하는 연관성을 규칙(Rule)의 형태로 표현한 것이다. 이와 같이 생성된 연관 규칙은 개인 구매도 분석, 상품의 교차 매매(Cross-Marketing), 카탈로그 디자인, 염가 매출품(Loss Leader)분석, 상품 진열, 구매 성향에 따른 고객 분류 다양하게 사용되고 있다. 그러나 이런 연관 규칙은 추천 시스템에서 잘 응용되지 못하고 있는 실정이다. 본 논문에서 우리는 연관 규칙을 추천 시스템에 적용해, 항목그룹 사이에 연관성을 유도함으로써 추천에 효율적으로 사용할 수 있음을 보였다 즉 전체 사용자의 히스토리(History) 정보를 기반으로 아이템 사이의 연관 규칙을 유도하고 협력적 여과 방식과 함께 보조적으로 연관 규칙을 추천을 위해 사용함으로써 추천 시스템에 효율성을 높였다.

  • PDF

스퀀스 연관규칙을 이용한 개인화 웹 마이닝 설계 (Design of a Personalized Web Mining System Using a Sequence Association Rule)

  • 윤종찬;윤성대
    • 한국멀티미디어학회논문지
    • /
    • 제10권9호
    • /
    • pp.1106-1116
    • /
    • 2007
  • 최근 들어 웹을 이용한 e-Commerce의 거래는 그 크기나 복잡도면에서 급속도로 확산되고 있다. 그러므로 웹사이트의 설계나 웹 서버 설계 등이 복잡해지고 있다. 또한 웹 사용자가 많은 웹 이동경로를 이용하기 때문에 웹 사용자에 대한 데이터를 분석하는 일이 쉽지 않다. 기존 논문에서는 연관 규칙 탐사는 항목들간의 상관성을 찾아내는 것으로 기존의 연관 규칙 탐사 알고리즘들은 상관성이 높은 모든 항목들을 찾아낸다. 그러나 사용자들은 종종 자신이 관심 있는 연관 규칙들만을 찾길 원한다. 하지만 기존의 알고리즘을 그대로 사용하여 찾아낸 모든 연관 규칙들 중에서 원하는 규칙들만을 찾아내는 것은 매우 비효율적이다. 본 논문에서는 웹 사용자의 이동경로의 사용자 패턴을 데이터마이닝 기법 중 하나인 연관규칙을 이용하여 사용자에게 맞는 이동경로를 구한 후 모든 경로를 이어주기 위해 시차 연관규칙을 이용하여 각 노드들을 이어주는 시스템을 제안한다. 제안한 시스템은 시차 연관규칙 기법을 통해 웹 사용자의 이동 경로를 사용자의 특성에 맞는 개인화 또는 고객 세분화된 사이트를 구축 가능하게 제안한다.

  • PDF

연관규칙 분석에 기초한 POS 데이터 분석 시스템 (POS Data Analysis System based on Association Rule Analysis)

  • 안경찬;문창배;김병만;신윤식;김현수
    • 한국산업정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.9-17
    • /
    • 2012
  • 현재 전자상거래를 통한 상품추천 서비스가 많이 연구 되고 서비스되어지고 있다. 정보기술의 발달로 소규모 상점에서도 POS가 많이 보급되어 있지만 전자상거래에 비해 상품추천 서비스가 많이 이뤄지고 있지 않는 실정이다. 이러한 맥락에서 본 연구에서는 데이터마이닝 알고리즘을 POS 판매데이터에 접목하여 연관분석을 이용한 상품추천서비스 시스템을 구현하였다. 또한, 본 연구에서는 기존에 없는 서비스인 소멸규칙 및 새로운규칙, 상승 및 하향규칙을 제안하였다. 상품판매데이터를 이용하여 연관 분석한 결과는 고객에게 적용하여 상품추천서비스를 가능하게 하고 이와 더불어 소멸규칙 및 새로운규칙, 상승 및 하향규칙을 파악하여 경영자에게 경영 의사결정 정보로 제공해 주어 고객의 요구 변화에 신속한 대응이 가능하도록 하였다.

데이터 마이닝을 위한 연관규칙의 다중 값 속성 처리방법 (Processing Multi-Valued Attributes in Association Rules for Data Mining)

  • 김산성;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.340-342
    • /
    • 2002
  • 다중 값이란 속성 값이 집합인 것을 말한다. 즉, 관계형 데이터베이스에서 자료 유형이 집합인 속성을 의미한다. 이러한 다중 값 속성 처리는 기존 데이터마이닝 기술 자체로는 처리한 수 없으며 후처리나 선처리 과정을 이용하여 처리하고 있다. 전처리나 후처리 과정을 통해 처리할 경우 수행과장에 있어 많은 시간이 소요되고 혹은 타당하지 않은 규칙이 생성되는 문제점을 가지고 있다. 특히 연관화 기법 특성상 분석하고자 할 항목이 증가할수록 연관성의 수가 지수(exponential)단위이기 때문에 이를 해결하는데는 상당한 어려움이 따르게 된다. 본 논문에서는 관계형 데이터베이스 테이블 구조에서 데이터 마이닝의 수행을 위한 전처리나 후처리의 과정을 고려하지 않음으로 위에서 언급된 문제점들을 해결하고자 한다. 특히 데이터 변환 작업 없이 정량적(Quantitative)연관 규칙과 연관 규칙(Market Basket Analysis)의 혼합 형태의 규칙을 생성할 수 있게끔 알고리즘을 확장하여 보다 효율적인 규칙이 생성될 수 있도록 한다. 마지막으로 Each Movie 데이터를 사용하여 확장한 알고리즘의 다중 값 속성 처리 방법의 효율성과 타탕성을 검증한다.

  • PDF

빅데이터 추천시스템을 위한 과립기반 연관규칙 마이닝 (Granule-based Association Rule Mining for Big Data Recommendation System)

  • 박인규
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.67-72
    • /
    • 2021
  • 연관규칙 마이닝은 여러 테이블에 숨겨진 패턴들의 관계를 나타내주는 방법이다. 요즈음에는 연관규칙 마이닝에 보다 세부적인 의미를 추가하기 위하여 과립화 논리를 이용하고 있다. 또한 기존의 데이터를 이용하여 추천하는 기존의 시스템과는 달리 과립화 연관규칙에서는 신규 가입자나 신규상품에 대한 추천의 경우도 가능하다. 따라서 연관규칙의 과립화의 정성적인 크기를 결정하는 것이 추천 시스템의 성능을 좌우한다. 본 논문에서는 관람자가 평가한 영화에 대한 관계를 파악하기 위하여 퍼지논리와 샤논 엔트로피 개념을 이용하여 관람자와 영화데이터에 대한 과립화 방법을 제안한다. 연구는 관람자와 영화간의 연관규칙의 함의에 결정적인 역할을 하는 데이터의 과립화의 크기를 결정하는 부분과 이러한 과립화를 이용하여 관람자와 영화간의 연관규칙을 추출하는 두 번째 부분으로 구성되어 있으며 넷플릭스의 MovieLens데이터를 이용하여 분석하였다. 최종적으로 도출된 연관규칙의 의미와 추천의 정확도 및 고려해야하는 함의를 제시하였다.

실시간 연관규칙 탐사를 위한 능동적 후보항목 관리 모델 (An Active Candidate Set Management Model for Realtime Association Rule Discovery)

  • 신예호;류근호
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.215-226
    • /
    • 2002
  • 미디어의 발달과 생활 패턴의 변화를 토대로 새롭게 나타나고 있는 다양한 판매 패턴들을 분석하는데 있어 단일한 분석 방법을 적용하는 것은 효과적이지 못하다. 특히 신선 식품이나 기념일 주변에서 집중적인 매출이 발생하는 품목들은 제한된 시간 내에 판매를 최대로 해야 하는 시간적 제약을 갖는다. 그러나 기존의 연관규칙 탐사 기법은 대규모 거래 데이터베이스로부터 반복적 스캔 연산을 통해 연관규칙 탐사를 수행하기 때문에 제한된 시간안에서 빈번히 필요로 하는 패턴을 분석하기에는 비효율적이기 때문이다. 따라서 이 논문에서는 시간 제약을 갖는 특수한 판매 패턴에 대한 실시간 연관규칙 탐사가 가능하도록 하기 위해 트리거와 저장 프로시져를 이용한 점진적 후보항목 관리 모델을 제안한다. 아울러 이 논문에서는 제안 모델의 구현 및 실험을 통해 그 성능 특성의 분석도 수행한다. 특히 이 논문에서 제안하는 방법은 이중 해쉬 기법을 이용함으로써 연산의 성능을 향상시킨다.