• 제목/요약/키워드: Sequence Mining

검색결과 164건 처리시간 0.024초

구매의도 생성 순서와 구매실현 순서의 역전 현상을 감안한 확장된 순차분석 방법론 (An Investigation on Expanding Traditional Sequential Analysis Method by Considering the Reversion of Purchase Realization Order)

  • 김민석;김남규
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제22권3호
    • /
    • pp.25-42
    • /
    • 2013
  • Recently various kinds of Information Technology services are created and the quantities of the data flow are increase rapidly. Not only that, but the data patterns that we deal with also slowly becoming diversity. As a result, the demand of discover the meaningful knowledge/information through the various mining analysis such as linkage analysis, sequencing analysis, classification and prediction, has been steadily increasing. However, solving the business problems using data mining analysis does not always concerning, one of the major causes of these limitations is there are some analyzed data can't accurately reflect the real world phenomenon. For example, although the time gap of purchasing the two products is very short, by using the traditional sequencing analysis, the precedence relationship of the two products is clearly reflected. But in the real world, with the very short time interval, the precedence relationship of the two purchases might not be defined. What was worse, the sequence of the purchase intention and the sequence of the purchase realization of the two products might be mutually be reversed. Therefore, in this study, an expanded sequencing analysis methodology has been proposed in order to reflect this situation. In this proposed methodology, the purchases that being made in a very short time interval among the purchase order which might not important will be notice, and the analysis which included the original sequence and reversed sequence will be used to extend the analysis of the data. Also, to some extent a very short time interval can be defined as the time interval, so an experiment were carried out to determine the varying based on the time interval for the actual data.

대용량 순차 데이터베이스에서 근사 순차패턴 탐색 (Mining Approximate Sequential Patterns in a Large Sequence Database)

  • 금혜정;장중혁
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.199-206
    • /
    • 2006
  • 순차패턴 탐색은 다양한 응용 분야에서 매우 중요한 데이터 마이닝 작업으로 간주된다. 그러나 기존의 순차패턴 탐색 방법들은 길이가 긴 순차패턴이나 노이즈 정보를 다수 포함한 데이터베이스에 대한 마이닝에서는 한계가 있다. 해당 방법들은 매우 짧고 사소한 패턴들은 탐색하지만 다수의 순차 정보들에서 공유되는 중요 패턴들을 분석하는데 어려움을 겪는다. 본 논문에서는 이러한 문제를 해결하기 위한 방법으로 대용량 데이터베이스에 대한 근사 순차패턴 탐색 방법을 제안한다. 근사 순차패턴은 다수의 순차 정보들에서 근사적으로 공유되는 순차패턴을 의미한다. 제안된 방법은 두 과정으로 구분된다. 하나는 유사도에 따라 분석 대상 순차 정보들을 몇 개의 군집으로 나누는 과정이며, 다른 하나는 다중 정렬 방식을 적용하여 각 군집으로부터 대표 패턴을 찾는 과정이다. 이를 위해서 다수의 순차 정보들을 하나로 표현할 수 있는 가중치 순차패턴을 제시하며, 다수의 순차 정보들은 가중치 순차패턴 형태로 통합된다. 이렇게 통합된 정보를 가진 각 가중치 순차패턴을 이용하여 여러 순차 정보와 근사한 하나의 대표 패턴을 생성한다. 끝으로, 다양한 실험을 통해서 제안된 방법의 유용성을 검증한다.

스마트 공장에서 의사결정 모델을 이용한 순차 마이닝 기반 제조공정 (Sequence Mining based Manufacturing Process using Decision Model in Cognitive Factory)

  • 김주창;정호일;유현;정경용
    • 한국융합학회논문지
    • /
    • 제9권3호
    • /
    • pp.53-59
    • /
    • 2018
  • 본 논문에서는 스마트 공장에서 의사결정 모델을 이용한 순차 마이닝 기반 제조공정을 제안한다. 제안하는 모델은 소규모의 제조공정에서 순차 마이닝 의사결정 모델을 적용하여 제조 효율을 높이는 방법이다. 제조 단계 중 제품 제조 과정에서 나타나는 데이터를 입력 변수들로 구성하고, 시간당 제조량과 불량률을 출력 변수로 구성한다. t-검정을 통해 유의수준이 높은 변수만을 사용하여 GSP 알고리즘과 REPTree 알고리즘을 이용한 규칙과 모델을 생성한다. 의미있는 순차 규칙과 의사결정 모델은 정확도, 민감도, 특이성, 예측도를 통해 유의미함을 확인한다. 결과적으로, 실제 제조에 적용한 결과 불량률은 0.38%가 개선되었고, 시간당 제조량은 평균 1.89/h 증가되었다. 이는 소규모 제조 공정에서 데이터 마이닝 분석을 통한 제조 효율을 높이기 위한 의미있는 결과를 나타낸다.

STMP/MST와 기존의 시공간 이동 패턴 탐사 기법들과의 성능 비교 (A Comparison of Performance between STMP/MST and Existing Spatio-Temporal Moving Pattern Mining Methods)

  • 이연식;김은아
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.49-63
    • /
    • 2009
  • 시공간 이동 패턴 탐사는 특성상 방대한 시공간 데이터의 분석 및 처리 방법에 따라 패턴 탐사의 성능이 좌우된다. 기존의 시공간 패턴 탐사 기법들[1-10]이 가진 패턴 탐사 수행 시간이나 패턴 탐사 시 사용되는 메모리양이 증가하는 문제를 해결하기 위해 일부 기법에서 몇 가지 방법을 제시하였으나 아직 미비한 실정하다. 이에 선행 연구로 방대한 시공간 이동 데이터 집합으로부터 순차적이고 주기적인 빈발 이동 패턴을 효과적으로 추출하기 위한 STMP/MST 탐사 기법[11]을 제안하였다. 제안된 기법은 해시 트리 기반의 이동 시퀀스 트리를 생성하여 빈발 이동 패턴을 탐사함으로써 탐사 수행 시간을 최소화하고, 상세 수준의 이력 데이터들을 실세계의 의미있는 시간 및 공간영역으로 일반화하여 탐사 시 소요되는 메모리양을 감소시킬 수 있다. 본 논문에서는 이러한 STMP/MST 탐사 기법의 효율성을 검증하기 위해서 탐사 대상 데이터양과 최소지지도를 기준으로 기존의 시공간 패턴 탐사 기법들과 탐사 수행 성능을 비교하고 분석한다.

  • PDF

Comprehensive Coordinated Control Strategy of Virtual Synchronous Generators under Unbalanced Power Grid

  • Wang, Shuhuan;Han, Li;Chen, Kai
    • Journal of Power Electronics
    • /
    • 제19권6호
    • /
    • pp.1554-1565
    • /
    • 2019
  • When grid voltage is unbalanced, the grid-connected output current and power of Virtual Synchronous Generators (VSGs) are distorted and quadratic. In order to improve the power quality of a grid connected to a VSG when the grid voltage is unbalanced, a comprehensive coordinated control strategy is proposed. The strategy uses the positive sequence current reference command obtained by a VSG in the balanced current control mode to establish a unified negative sequence current reference command analytical expression for the three objectives of current balance, active power constant and reactive power constant. In addition, based on the relative value of each target's volatility, a comprehensive wave function expression is established. By deriving the comprehensive wave function, the corresponding negative sequence current reference value is obtained. Therefore, the VSG can achieve the minimum comprehensive fluctuation under the premise that the three targets meet the requirements of grid connection, and the output power quality is improved. The effectiveness of the proposed control strategy is verified by simulation and experimental results.

시퀀스 빈발도와 가중치를 이용한 최적 이동 패턴 탐사 (Optimal Moving Pattern Mining using Frequency of Sequence and Weights)

  • 이연식;박성숙
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.79-93
    • /
    • 2009
  • 사용자들의 특성에 맞게 개인화되고 세분화된 위치 기반 서비스를 개발하기 위한 목적으로 시공간 상에서 발생하는 이동 객체의 다양한 패턴들 중 의미있는 유용한 패턴을 추출하기 위한 시공간 패턴 탐사가 필요하다. 이에 본 논문에서는 방대한 이동 객체의 이력 데이터로부터 패턴 탐사를 통해 실세계에 적용 가능한 위치 기반 서비스의 개발에 대한 응용으로, STOMP(F)[25]에서 정의한 최적의 이동 패턴을 탐사하는 문제들을 기반으로 시간 및 공간 제약을 갖는 패턴을 추출하기 위한 새로운 탐사 기법인 STOMP(FW)를 제안한다. 제안된 기법은 패턴 빈발도 만을 이용한 기존 연구(STOMP(F)[25])에 가중치(거리, 시간, 비용 등)를 복합적으로 이용하는 패턴 탐사 방법으로, 특정한 지점들 사이를 이동한 객체의 이동 패턴들 중 패턴 빈발도가 특정 임계치 이상이고 가중치가 가장 적게 소요되는 이동 패턴을 최적 경로로 결정하는 방법이다. 제안된 방법의 패턴 탐사는 경험적인 이동 이력을 사용함으로써 기존의 최적 경로 탐색 기법들($A^*$, Dijkstra 알고리즘)이나 빈발도 만을 이용한 방법들 보다 접근하는 노드 수가 상대적으로 적어 보다 빠르고 정확하게 최적 패턴을 탐색할 수 있음을 보인다.

  • PDF

맵리듀스 프레임웍 상에서 맵리듀스 함수 호출을 최적화하는 순차 패턴 마이닝 기법 (Sequential Pattern Mining with Optimization Calling MapReduce Function on MapReduce Framework)

  • 김진현;심규석
    • 정보처리학회논문지D
    • /
    • 제18D권2호
    • /
    • pp.81-88
    • /
    • 2011
  • 시퀀스(sequence) 데이터가 주어졌을 때 그 중에서 빈번(frequent)한 순차 패턴을 찾는 순차 패턴 마이닝(sequential pattern mining)은 여러 어플리케이션(application)에 사용되는 중요한 데이터마이닝 문제이다. 순차 패턴 마이닝은 웹 접속 패턴, 고객 구매 패턴, 특정 질병의 DNA 시퀀스를 찾는 등 광범위한 분야에서 사용된다. 본 논문에서는 맵리듀스(MapReduce) 프레임웍 상에서 맵리듀스 함수 호출을 최적화하는 순차 패턴 마이닝 알고리즘을 개발하였다. 이 알고리즘은 여러 대의 기계에 데이터들을 분산시켜 병렬적으로 빈번한 순차 패턴을 찾는다. 실험적으로 다양한 데이터를 이용하여 파라미터 값을 변화시켜가며 제안된 알고리즘의 성능을 종합적으로 확인하였다. 그리고 실험 결과를 통해 제안된 알고리즘은 기계 수에 대해 선형적인 속도 개선을 보인다는 것을 확인하였다.

Research on a Multi-Objective Control Strategy for Current-source PWM Rectifiers under Unbalanced and Harmonic Grid Voltage Conditions

  • Geng, Yi-Wen;Liu, Hai-Wei;Deng, Ren-Xiong;Tian, Fang-Fang;Bai, Hao-Feng;Wang, Kai
    • Journal of Power Electronics
    • /
    • 제18권1호
    • /
    • pp.171-184
    • /
    • 2018
  • Unbalanced and distorted grid voltages cause the grid side current of a current source PWM rectifier to be heavily distorted. They can also cause the DC-link current to fluctuate with a huge amplitude. In order to enhance the performance of a current-source PWM rectifier under unbalanced and harmonic grid voltage conditions, a mathematical model of a current-source PWM rectifier is established and a flexible multi-objective control strategy is proposed to control the DC-link current and grid-current. The fundamental positive/negative sequence, $5^{th}$ and $7^{th}$ order harmonic components of the grid voltage are first separated with the proposed control strategy. The grid current reference are optimized based on three objectives: 1) sinusoidal and symmetrical grid current, 2) sinusoidal grid current and elimination of the DC-current $2^{nd}$ order fluctuations, and 3) elimination of the DC-current $2^{nd}$ and $6^{th}$ order fluctuations. To avoid separation of the grid current components, a multi-frequency proportional-resonant controller is applied to control the fundamental positive/negative sequence, $5^{th}$ and $7^{th}$ order harmonic current. Finally, experimental results verify the effectiveness of proposed control strategy.

Voltage Distortion Suppression for Off-grid Inverters with an Improved Load Current Feedforward Control

  • Geng, Yiwen;Zhang, Xue;Li, Xiaoqiang;Wang, Kai;Yuan, Xibo
    • Journal of Power Electronics
    • /
    • 제17권3호
    • /
    • pp.716-724
    • /
    • 2017
  • The output voltage of an off-grid inverter is influenced by load current, and the voltage harmonics especially the 5th and 7th are increased with nonlinear loads. In this paper, to attenuate the output voltage harmonics of off-grid inverters with nonlinear loads nearby, a load current feedforward is proposed. It is introduced to a voltage control loop based on the Positive and Negative Sequence Harmonic Regulator (PNSHR) compensation to modify the output impedance at selective frequencies. The parameters of the PNSHR are revised with the output impedance of the off-grid inverter, which minimizes the output impedance of the off-grid inverter. Experimental results verify the proposed method, showing that the output voltage harmonics caused by nonlinear loads can be effectively suppressed.

생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝 (Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences)

  • 강태호;유재수
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.155-162
    • /
    • 2008
  • DNA 염기 서열이나 단백질 아미노산 서열과 같은 생물학적 서열 데이터들은 일반적으로 많은 수의 항목들을 가지고 있다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 수 백개의 항목으로 이루어진 연속된 서열들이 존재한다. 이들 서열들에서 빈번하게 발생하는 연속 서열을 검색하는 것은 생물학적 서열 분석에서 중요한 부분을 차지하고 있다. 이전에는 순차 패턴을 효과적으로 발견하고자 하는 많은 연구들이 수행되었으며 대부분의 기존 순차패턴 마이닝 기법들은 Apriori 알고리즘을 기반으로 한다. PrefixSpan 알고리즘은 Apriori 기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로 부터 서열 패턴을 확장해나가는 방식이다. 따라서 길이가 긴 연속 서열을 포함하는 생물학적 데이터서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 길이가 긴 생물학적 데이터 서열들로부터 빈번하게 발생하는 연속 서열들을 검색하기에는 효율적이지 않다. 본 논문에서는 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색성능이 보다 우수함을 보인다.