• 제목/요약/키워드: Pattern Mining

검색결과 621건 처리시간 0.025초

혼합 데이터 마이닝 기법인 불일치 패턴 모델의 특성 연구 (Characteristics on Inconsistency Pattern Modeling as Hybrid Data Mining Techniques)

  • 허준;김종우
    • Journal of Information Technology Applications and Management
    • /
    • 제15권1호
    • /
    • pp.225-242
    • /
    • 2008
  • PM (Inconsistency Pattern Modeling) is a hybrid supervised learning technique using the inconsistence pattern of input variables in mining data sets. The IPM tries to improve prediction accuracy by combining more than two different supervised learning methods. The previous related studies have shown that the IPM was superior to the single usage of an existing supervised learning methods such as neural networks, decision tree induction, logistic regression and so on, and it was also superior to the existing combined model methods such as Bagging, Boosting, and Stacking. The objectives of this paper is explore the characteristics of the IPM. To understand characteristics of the IPM, three experiments were performed. In these experiments, there are high performance improvements when the prediction inconsistency ratio between two different supervised learning techniques is high and the distance among supervised learning methods on MDS (Multi-Dimensional Scaling) map is long.

  • PDF

Detecting smartphone user habits using sequential pattern analysis

  • Lu, Dang Nhac;Nguyen, Thu Trang;Nguyen, Thi Hau;Nguyen, Ha Nam;Choi, Gyoo Seok
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제7권1호
    • /
    • pp.20-22
    • /
    • 2015
  • Recently, the study of smart phone user habits has become a highly focused topic due to the rapid growth of the smart phone market. Indeed, sequential pattern analysis methods were efficiently used for web-based user habit mining long time ago. However, by means of simulations, it has been observed that these methods might fail for smart phone-based user habit mining. In this paper, we propose a novel approach that leads to a considerably increased performance of the traditional sequential pattern analysis methods by reasonably cutting off each chronological sequence of user logs on a device into shorter ones, which represent the sequential user activities in various periods of a day.

A Comparison of Clustering Algorithm in Data Mining

  • Lee, Yung-Seop;An, Mi-Young
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권4호
    • /
    • pp.725-736
    • /
    • 2003
  • To provide the information needed to make a decision, it is important to know the relationship or pattern between variables in database. Grouping objects which have similar characteristics of pattern is called as cluster analysis, one of data mining techniques. In this study, it is compared with several partitioning clustering algorithms, based on the statistical distance or total variance in each cluster.

  • PDF

이동 시퀀스의 빈발도를 이용한 최적 이동 패턴 탐사 기법 (A Method for Optimal Moving Pattern Mining using Frequency of Moving Sequence)

  • 이연식;고현
    • 정보처리학회논문지D
    • /
    • 제16D권1호
    • /
    • pp.113-122
    • /
    • 2009
  • 기존의 패턴 탐사 기법들은 제한된 시간 및 공간영역에서 발생하는 다양한 이동 패턴들 중 단순히 사용자 요구에 적합할 것으로 추정되는 불특정한 빈발 이동 패턴만을 탐사하기 때문에 특정지점들 간의 최적 이동 경로나 정해진 시간 내의 스케줄링 경로 탐색과 같은 복합적인 시간 및 공간 제약 조건을 갖는 최적 이동 패턴을 탐사하는 문제에는 적용하기 어렵다. 이에 본 논문에서는 방대한 이동 객체의 이력 데이터 집합으로부터 복합적인 시간 및 공간 제약을 갖는 최적 이동 패턴을 탐사하는 문제를 보이고, 적용 가능한 위치 기반 서비스로서 최적 이동 경로에 해당하는 패턴을 탐색하기 위한 새로운 패턴 탐사 기법인 STOMP-F를 제안한다. 제안된 기법은 특정한 지점들 사이를 이동한 객체의 패턴들 중 객체가 가장 빈번하게 이동한 경로를 탐색하여 최적 경로로 결정하는 패턴 빈발도를 이용한 탐색 방법으로, 최적 이동 패턴 탐사 과정의 이동 시퀀스 생성 단계에서 객체의 위치 값과 공간영역 간의 위상 관계를 고려하여 이동 객체의 위치 속성에 대한 최하위 수준에서의 공간 일반화를 통해 보다 효율적으로 패턴 탐사를 수행할 수 있다. 제안 방법을 Dijkstra 알고리즘과 $A^*$ 알고리즘을 대상으로 실험 평가한 결과 $A^*$ 알고리즘의 휴리스틱 가중치에 따라 차이는 있으나 연산 처리 시간을 기준으로 타 알고리즘들 보다 효과적임을 알 수 있다.

비트맵을 사용한 닫힌 빈발 시퀀스 마이닝 (Mining Frequent Closed Sequences using a Bitmap Representation)

  • 김형근;황환규
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.807-816
    • /
    • 2005
  • 순차 패턴 탐사에 대한 연구는 대용량의 데이터베이스에서 사용자에 의해 주어지는 최소 지지도를 만족하는 빈발 시퀀스를 찾는 문제를 다룬다. 하지만 현재까지 이루어진 순차 패턴 탐사 방법은 빈발 시퀀스들의 길이가 길어지거나 최소 지지도가 상대적으로 낮게 주어진 상황에서는 생성되는 시퀀스가 기하급수적으로 많아져서 성능이 급격히 저하되는 문제점을 가지고 있다. 본 논문에서는 이 문제를 해결하기 위해서 모든 빈발 시퀀스의 정보를 포함하며 그 수가 현저히 적은 닫힌 빈발 시퀀스를 찾는 방법을 제안한다. 제안하는 알고리즘은 효율적으로 가지치기를 수행하기 위해서 깊이우선 탐색 방법으로 후보 시퀀스를 생성하고 데이터베이스를 비트맵으로 표현하여 비트 연산으로 지지도를 효율적으로 계산한다. 또한, 비트맵으로 표현된 시퀀스 특성을 이용하여 가지치기할 시퀀스를 적은 연산 비용으로 찾을 수 있다. 이런 장점을 통하여 제안한 방법이 지금까지 제안된 알고리즘보다 훨씬 빨리 닫힌 빈발 시퀀스를 찾는 것을 성능 실험을 통하여 확인하였다.

Applications of artificial intelligence and data mining techniques in soil modeling

  • Javadi, A.A.;Rezania, M.
    • Geomechanics and Engineering
    • /
    • 제1권1호
    • /
    • pp.53-74
    • /
    • 2009
  • In recent years, several computer-aided pattern recognition and data mining techniques have been developed for modeling of soil behavior. The main idea behind a pattern recognition system is that it learns adaptively from experience and is able to provide predictions for new cases. Artificial neural networks are the most widely used pattern recognition methods that have been utilized to model soil behavior. Recently, the authors have pioneered the application of genetic programming (GP) and evolutionary polynomial regression (EPR) techniques for modeling of soils and a number of other geotechnical applications. The paper reviews applications of pattern recognition and data mining systems in geotechnical engineering with particular reference to constitutive modeling of soils. It covers applications of artificial neural network, genetic programming and evolutionary programming approaches for soil modeling. It is suggested that these systems could be developed as efficient tools for modeling of soils and analysis of geotechnical engineering problems, especially for cases where the behavior is too complex and conventional models are unable to effectively describe various aspects of the behavior. It is also recognized that these techniques are complementary to conventional soil models rather than a substitute to them.

분산형 FP트리를 활용한 병렬 데이터 마이닝 (Parallel Data Mining with Distributed Frequent Pattern Trees)

  • 조두산;김동승
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 V
    • /
    • pp.2561-2564
    • /
    • 2003
  • Data mining is an effective method of the discovery of useful information such as rules and previously unknown patterns existing in large databases. The discovery of association rules is an important data mining problem. We have developed a new parallel mining called Distributed Frequent Pattern Tree (abbreviated by DFPT) algorithm on a distributed shared nothing parallel system to detect association rules. DFPT algorithm is devised for parallel execution of the FP-growth algorithm. It needs only two full disk data scanning of the database by eliminating the need for generating the candidate items. We have achieved good workload balancing throughout the mining process by distributing the work equally to all processors. We implemented the algorithm on a PC cluster system, and observed that the algorithm outperformed the Improved Count Distribution scheme.

  • PDF

서비스 패턴 마이닝을 위한 컨텍스트 온톨로지 및 트리거 규칙 설계 (Context Ontology and Trigger Rule Design for Service Pattern Mining)

  • 황정희
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권3호
    • /
    • pp.291-299
    • /
    • 2012
  • 유비쿼터스 컴퓨팅은 환경 및 사용자의 상황을 필요로 하는 곳에 센서 노드들을 부착해 환경 정보를 수집하여 사용자에게 적합한 서비스를 제공하는 기술이다. 수시로 변화하는 사용자의 환경과 상황에 따라 서비스 내용도 새롭게 갱신될 수 있는 지능적인 시스템이 필요하다. 본 논문에서는 사용자의 위치와 행동에 따른 지능적인 서비스 제공을 위한 컨텍스트 온톨로지 설계, 그리고 사용자의 행동과 연관된 서비스 패턴을 지능적으로 마이닝 하기 위한 트리거 규칙 정의와 트리거 시스템의 통합 구조인 능동 마이닝 아키텍쳐를 제안한다. 제안된 시스템은 사용자의 시간에 따른 위치 및 객체와의 연관성을 고려하여 사용자의 행동과 서비스 패턴을 지능적으로 마이닝 하기 위한 기반이 된다.

Temporal Classification Method for Forecasting Power Load Patterns From AMR Data

  • Lee, Heon-Gyu;Shin, Jin-Ho;Park, Hong-Kyu;Kim, Young-Il;Lee, Bong-Jae;Ryu, Keun-Ho
    • 대한원격탐사학회지
    • /
    • 제23권5호
    • /
    • pp.393-400
    • /
    • 2007
  • We present in this paper a novel power load prediction method using temporal pattern mining from AMR(Automatic Meter Reading) data. Since the power load patterns have time-varying characteristic and very different patterns according to the hour, time, day and week and so on, it gives rise to the uninformative results if only traditional data mining is used. Also, research on data mining for analyzing electric load patterns focused on cluster analysis and classification methods. However despite the usefulness of rules that include temporal dimension and the fact that the AMR data has temporal attribute, the above methods were limited in static pattern extraction and did not consider temporal attributes. Therefore, we propose a new classification method for predicting power load patterns. The main tasks include clustering method and temporal classification method. Cluster analysis is used to create load pattern classes and the representative load profiles for each class. Next, the classification method uses representative load profiles to build a classifier able to assign different load patterns to the existing classes. The proposed classification method is the Calendar-based temporal mining and it discovers electric load patterns in multiple time granularities. Lastly, we show that the proposed method used AMR data and discovered more interest patterns.

순차 패턴 마이닝 기법을 이용한 개인 맞춤형 TV 프로그램 스케줄러 (A Personalized Automatic TV Program Scheduler using Sequential Pattern Mining)

  • 표신지;김은희;김문철
    • 방송공학회논문지
    • /
    • 제14권5호
    • /
    • pp.625-637
    • /
    • 2009
  • 방송 프로그램 콘텐츠들의 증가와 콘텐츠 접근 방법의 다양화로 따라 사용자는 기존의 단순한 방송 시청 환경에서 보다 복합적인 환경에서 다양한 콘텐츠를 접할 수 있게 되었다. 따라서 사용자는 익숙지 않은 다양한 콘텐츠들 중에서 자신이 시청하기 원하는 콘텐츠를 찾고 그것들을 원하는 시간에 시청하기 위해 전보다 많은 노력을 기울이게 되었다. 또한 사용자는 대체로 자신만의 일관성 있는 시청 패턴으로 프로그램을 시청한다. 본 논문에서는 사용자의 개인적인 시청 특성을 발견하여 사용자의 수고를 줄이고 프로그램 시청의 편의성을 제공하기 위해 순차 패턴 마이닝 기법을 이용하여, 개인 맞춤형 TV 프로그램 스케줄러를 제안한다. 이를 위해 개인 맞춤형 TV 프로그램 스케줄 추천 시스템을 제안하였으며, 사용자들의 TV 프로그램 시청 기록을 바탕으로 TV시청 환경에 적합한 순차 패턴 마이닝 기법을 제안하였다. 또한 개인 사용자의 암시적인 선호도를 추출하여 TV 프로그램 추천에 적용, 개인 맞춤형 TV 프로그램 스케줄을 구성하여 추천할 수 있도록 하였다. 이러한 TV 프로그램 스케줄 추천 시스템은 향후 IPTV의 VoD 특성을 고려한 프로그램 스케줄 추천 시스템으로 확장 가능하다.