• 제목/요약/키워드: Sequential Rule Mining

검색결과 21건 처리시간 0.023초

연관규칙과 퍼지 인공신경망에 기반한 하이브리드 데이터마이닝 메커니즘에 관한 연구 (A Study on the Hybrid Data Mining Mechanism Based on Association Rules and Fuzzy Neural Networks)

  • 김진성
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2003년도 춘계공동학술대회
    • /
    • pp.884-888
    • /
    • 2003
  • In this paper, we introduce the hybrid data mining mechanism based in association rule and fuzzy neural networks (FNN). Most of data mining mechanisms are depended in the association rule extraction algorithm. However, the basic association rule-based data mining has not the learning ability. In addition, sequential patterns of association rules could not represent the complicate fuzzy logic. To resolve these problems, we suggest the hybrid mechanism using association rule-based data mining, and fuzzy neural networks. Our hybrid data mining mechanism was consisted of four phases. First, we used general association rule mining mechanism to develop the initial rule-base. Then, in the second phase, we used the fuzzy neural networks to learn the past historical patterns embedded in the database. Third, fuzzy rule extraction algorithm was used to extract the implicit knowledge from the FNN. Fourth, we combine the association knowledge base and fuzzy rules. Our proposed hybrid data mining mechanism can reflect both association rule-based logical inference and complicate fuzzy logic.

  • PDF

하이브리드 데이터마이닝 메커니즘에 기반한 전문가 지식 추출 (Extraction of Expert Knowledge Based on Hybrid Data Mining Mechanism)

  • 김진성
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.764-770
    • /
    • 2004
  • This paper presents a hybrid data mining mechanism to extract expert knowledge from historical data and extend expert systems' reasoning capabilities by using fuzzy neural network (FNN)-based learning & rule extraction algorithm. Our hybrid data mining mechanism is based on association rule extraction mechanism, FNN learning and fuzzy rule extraction algorithm. Most of traditional data mining mechanisms are depended ()n association rule extraction algorithm. However, the basic association rule-based data mining systems has not the learning ability. Therefore, there is a problem to extend the knowledge base adaptively. In addition, sequential patterns of association rules can`t represent the complicate fuzzy logic in real-world. To resolve these problems, we suggest the hybrid data mining mechanism based on association rule-based data mining, FNN learning and fuzzy rule extraction algorithm. Our hybrid data mining mechanism is consisted of four phases. First, we use general association rule mining mechanism to develop an initial rule base. Then, in the second phase, we adopt the FNN learning algorithm to extract the hidden relationships or patterns embedded in the historical data. Third, after the learning of FNN, the fuzzy rule extraction algorithm will be used to extract the implicit knowledge from the FNN. Fourth, we will combine the association rules (initial rule base) and fuzzy rules. Implementation results show that the hybrid data mining mechanism can reflect both association rule-based knowledge extraction and FNN-based knowledge extension.

Finding associations between genes by time-series microarray sequential patterns analysis

  • Nam, Ho-Jung;Lee, Do-Heon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.161-164
    • /
    • 2005
  • Data mining techniques can be applied to identify patterns of interest in the gene expression data. One goal in mining gene expression data is to determine how the expression of any particular gene might affect the expression of other genes. To find relationships between different genes, association rules have been applied to gene expression data set [1]. A notable limitation of association rule mining method is that only the association in a single profile experiment can be detected. It cannot be used to find rules across different condition profiles or different time point profile experiments. However, with the appearance of time-series microarray data, it became possible to analyze the temporal relationship between genes. In this paper, we analyze the time-series microarray gene expression data to extract the sequential patterns which are similar to the association rules between genes among different time points in the yeast cell cycle. The sequential patterns found in our work can catch the associations between different genes which express or repress at diverse time points. We have applied sequential pattern mining method to time-series microarray gene expression data and discovered a number of sequential patterns from two groups of genes (test, control) and more sequential patterns have been discovered from test group (same CO term group) than from the control group (different GO term group). This result can be a support for the potential of sequential patterns which is capable of catching the biologically meaningful association between genes.

  • PDF

연관규칙을 이용한 잠재성장모형의 개선방법론 (A Methodology for Improving fitness of the Latent Growth Modeling using Association Rule Mining)

  • 조영빈;전재훈;최병우
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.217-225
    • /
    • 2019
  • 대표적인 종단자료 분석방법인 잠재성장모형(Latent Growth Modeling)은 무조건적 모형과 조건적 모형으로 구분한다. 잠재성장모형의 무조건적 모형 성장궤적은 선형으로 가정하여 분석하는 경우가 많다. 본 연구는 선형 성장궤적으로 가정하여 모형 적합도가 미달하는 경우 연관규칙기법을 이용하여 모형 적합도를 제고하는 방법론을 제안한다. 방법론은 연관규칙 마이닝의 순차패턴(Sequential Pattern)을 사용한다. 이를 위하여 종단자료를 분위별로 나누고, 각 분위에 속한 종단자료의 기간 변화를 산출한 뒤 이를 순차 패턴 화하였다. SPSS AMOS를 이용하여 한국고용정보원의 2001년부터 6년간 조사한 청년 패널 자료로 효과성을 검증하였다. 기존 단순선형함수를 가정할 때와 비교하여 모형 적합도가 상승하는 것을 확인할 수 있었다.

데이터마이닝을 이용한 설계변경의 효율향상 - B전자의 사례를 중심으로 - (Raise the efficiency of engineering changes using Data mining - B Electronics Case -)

  • 박승헌;이석환
    • 대한안전경영과학회지
    • /
    • 제9권3호
    • /
    • pp.135-142
    • /
    • 2007
  • The authors used association rules and patterns in sequential of data mining in order to raise the efficiency of engineering changes. The association rule can reduce the number of engineering changes since it can estimate the parts to be changed. The patterns in sequential can perform engineering changes effectively by estimating the parts to be changed from sequence estimation. According to this result, unnecessary engineering changes are eliminated and the number of engineering changes decrease. This method can be used for improving design quality and productivity in company managing engineering changes and related information.

잠재성장모형의 무조건적 모델 추정을 위한 데이터 기반 방법론 (A Data Based Methodology for Estimating the Unconditional Model of the Latent Growth Modeling)

  • 조영빈
    • 디지털융복합연구
    • /
    • 제16권6호
    • /
    • pp.85-93
    • /
    • 2018
  • 대표적인 종단자료 분석방법인 잠재성장모형(Latent Growth Modeling)은 무조건적 모델과 조건적 모델로 구분되는데, 이중 무조건적 모델은 초기값과 기울기를 추정하여 적합도가 높은 모델을 추정해야 한다. 그렇지만 기존 잠재성장모형에는 종단자료의 형태가 단순선형함수 등 특정 함수가 아닐 경우 기울기를 추정하는 체계적인 방법론이 없었다. 본 연구에서는 뮤조건적 모델의 기울기를 추정하는데 연관규칙(Association Rule Mining)의 순차패턴(Sequential Pattern)을 사용하였다. 데이터는 한국고용정보원의 2001년~2006년에 조사한 청년 패널 데이터를 사용하였다. 제안한 방법론은 기존 단순선형함수를 가정할 때와 비교하여 적합도가 상승하는 것을 확인할 수 있었으며, 기울기 추정 과정을 시각화할 수 있는 부수적인 장점이 있었다.

포스퀘어 사용자의 집단적 활동 군집화: 서울시 사례 (Clustering Foursquare Users' Collective Activities: A Case of Seoul)

  • 서일정;조재희
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.55-63
    • /
    • 2020
  • 본 연구는 서울시에서 발생한 포스퀘어 사용자의 체크인 데이터를 이용하여 위치 기반 소셜 네트워크 사용자의 집단적 활동 군집을 발견하는 방법을 제안하였다. 집단적 활동 군집을 발견하기 위하여 순차 규칙 마이닝을 통해 활동의 순차 규칙을 생성하고, 그 규칙을 기반으로 활동 네트워크를 구성하였다. 활동 네트워크를 분석하여 네트워크의 구조와 허브 활동을 확인하였고 군집 분석을 실시하여 활동 군집을 분류하였다. 본 연구는 위치 기반 소셜 네트워크 사용자의 활동에 대한 전환 패턴을 분석한 이전 연구들과 달리 연속적인 여러 활동의 전체적인 구조와 군집을 분석하는 데 초점을 맞추었다. 본 연구에서 제안한 방법을 이용하여 파악할 수 있는 허브 활동과 활동 군집은 위치 기반의 서비스나 마케팅에 활용할 수 있을 것이다. 또한 바이러스 감염과 관련된 업무나 도시 정책과 같이 공공부문에서 사용할 수도 있을 것이다.

변형된 FP-Tree를 기반한 상품 추천 시스템 (The Goods Recommendation System based on modified FP-Tree Algorithm)

  • 김종희;정순기
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.205-213
    • /
    • 2010
  • 연관규칙 마이닝 기법 중에 하나인 FP-트리 알고리즘을 이용하는 추천시스템이 시도되고 있다. 본 논문에서는 트랜�Ъ� 데이터베이스로부터 빈발 2-항목집합만을 추출하여 연관규칙을 생성하는 변형된 FP-알고리즘을 사용하는 추천시스템을 제안하였다. 제안된 추천시스템은 전처리 모듈, 학습 모듈, 추천 모듈 및 평가 모듈로 구성되었다. 제안된 추천시스템의 실험을 통하여 상품 추천의정확률과 재현율과 F-Measure와 성공률과 추천실행시간을 수행하였으며, 순차패턴 마이닝 기법을 사용하는 추천시스템과의 성능을 비교분석 하였다. 순차패턴 마이닝기법을 사용하는 추천시스템과 학습 성능, 추천 성능을 비교한 결과 학습 성능은 5배 이상 향상되었으며, 추천 성능은 20%이상 향상 되었다. 결론적으로, 순차패턴 추천시스템과 같은 데이터를 가지고 실험하여 추천시스템 성능의 타당성에는 보다 나은 시스템임을 입증 하였다.

가중치 기반의 순차패턴 탐사를 이용한 추천서비스에 관한 연구 (A Study of Recommending Service Using Mining Sequential Pattern based on Weight)

  • 조영성;문송철;안연식
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권6호
    • /
    • pp.711-719
    • /
    • 2014
  • 유비쿼터스 컴퓨팅 환경하에서 전자상거래 대규모가 대형화되고 취급되는 항목제품들도 다종 다양해지고 있는 것이 현실이다. 이러한 유비쿼터스 상거래 시스템은 편리하고 신속하게 제공되어야 하고 다이나믹한 환경에서 실시간성과 민첩성이 요구되고 있다. 데이터마이닝에서 추출한 지식을 적극적으로 활용하는 기법들이 전자상거래에서 구매 촉진을 증진시키는 마케팅 전략으로 활용되고 있다. 본 연구에서는 유비쿼터스 컴퓨팅 환경 하에 지능형 모바일 단말기를 이용한 추천을 위한 가중치기반 순차패턴 탐사를 이용한 추천서비스f를 제안하였다. 본 연구에서는 추천의 정확성을 향상시키고 구매력이 높은 항목제품 및 서비스를 추천하기 위해서 FRAT 세분화 기법을 이용한 가중치기반 순차패턴 탐사를 이용한 추천서비스를 제안하였다. 성능평가를 위해 현업에서 사용하는 인터넷 화장품 쇼핑몰의 데이터를 기반으로 데이터 셋을 구성하여 기존의 방법과 비교 실험을 통해 성능을 평가하여 효용성과 타당성을 입증하였다. 유비쿼터스 상거래에서 시간과 장소에 제약을 받지 않는 모바일 웹앱을 이용한 추천서비스를 위해서 이전방법보다 개선된 방법으로 추천서비스를 구현하였다.

구매의도 생성 순서와 구매실현 순서의 역전 현상을 감안한 확장된 순차분석 방법론 (An Investigation on Expanding Traditional Sequential Analysis Method by Considering the Reversion of Purchase Realization Order)

  • 김민석;김남규
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제22권3호
    • /
    • pp.25-42
    • /
    • 2013
  • Recently various kinds of Information Technology services are created and the quantities of the data flow are increase rapidly. Not only that, but the data patterns that we deal with also slowly becoming diversity. As a result, the demand of discover the meaningful knowledge/information through the various mining analysis such as linkage analysis, sequencing analysis, classification and prediction, has been steadily increasing. However, solving the business problems using data mining analysis does not always concerning, one of the major causes of these limitations is there are some analyzed data can't accurately reflect the real world phenomenon. For example, although the time gap of purchasing the two products is very short, by using the traditional sequencing analysis, the precedence relationship of the two products is clearly reflected. But in the real world, with the very short time interval, the precedence relationship of the two purchases might not be defined. What was worse, the sequence of the purchase intention and the sequence of the purchase realization of the two products might be mutually be reversed. Therefore, in this study, an expanded sequencing analysis methodology has been proposed in order to reflect this situation. In this proposed methodology, the purchases that being made in a very short time interval among the purchase order which might not important will be notice, and the analysis which included the original sequence and reversed sequence will be used to extend the analysis of the data. Also, to some extent a very short time interval can be defined as the time interval, so an experiment were carried out to determine the varying based on the time interval for the actual data.