• 제목/요약/키워드: 순차 규칙 마이닝

검색결과 33건 처리시간 0.029초

다차원 순차패턴 마이닝을 위한 효율적 알고리즘 (An Efficient Algorithm for Multi-dimensional Sequential Pattern Mining)

  • 이순신;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.214-216
    • /
    • 2004
  • 순차패턴 마이닝은 데이터들 속에서 어떤 순차 관계가 들어 있는 패턴을 찾는 것이다. 순차 패턴은 다양한 분야에서 중요하게 쓰인다. 예를 들어, 소비자가 구입한 물품들 간의 순차적인 관계성은 다음에 구입할 물건을 예측하는데 쓰일 수 있다. 또한 방문 웹 페이지의 순차 패턴은 사용자가 방문하고자 하는 다음 페이지를 예측하는데 중요할 수 있다. 본 논문에서는 다차원 순차패턴을 마이닝하는 새로운 효율적인 알고리즘의 구현에 대해 설명한다 다차원 순차 패턴 마이닝은 속성-값(attribute-value) 기술을 포함하는 순차 패턴의 연관 규칙을 찾는 것이다. 다음의 두 가지의 현존하는 효율적 알고리즘을 융합하였다. 순차패턴 마이닝을 위한 PrefixSpan 알고리즘과 비 순차패턴 마이닝을 위한 StarCubing 알고리즘. 새로운 알고리즘은 다차원 데이터를 마이닝 하는 StarCubing알고리즘의 효율성을 이용하므로 다차원 순차 데이터를 마이닝 하는데 효율적일 것이다. 실험결과는 제안한 알고리즘이 특히 작은 최소지지도와 작은 cardinality에서 Seq-Dim과 Dim-Seq 같은 현존하는 알고리즘보다 나은 성능임을 보여준다.

  • PDF

연관규칙기반 Pattern Miner의 설계 및 구현

  • 김지현;성유진;박종수;지원철
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1998년도 추계학술대회 논문집
    • /
    • pp.381-384
    • /
    • 1998
  • 방대한 양의 데이터들 속에 존재하는 일관된 흐름이나 경향을 파악해 내는 데이터 마이닝에 대한 관심이 확산되고 있다. 특히 항목들 상호간의 연관성을 나타내는 연관 규칙과 시간 개념이 포함되어 항목들 사이의 순서를 찾아내는 순차 패턴의 탐사는 데이터 마이닝에서 중요한 역할을 하고 있다. 본 논문에서는 트랜잭션 데이터베이스에서 연관 규칙과 순차 패턴을 탐사하는 시스템의 설계 및 구현에 관하여 기술한다. 연관 규칙을 위해 Aproiri, DHP를, 순차패턴을 위해 AprioriAll등 기존에 연구된 대표적인 알고리즘들을 사용하였고, Windows NT상에서 Visual C++과 JAVA언어로 구현하였다. 편리한 사용자 환경 구축을 위해, 데이터의 입력 형식으로 텍스트 타입과 MDB(Microsoft Access)형태를 모두 처리할 수 있게 하였고, 출력형식은 스프레드시트이다. 입력 데이터로 실험 데이터와 통계청의 DB 이용 로그 데이터에 대하여 본 시스템 을 수행하였다.

  • PDF

순차패턴 마이닝을 이용한 상병의 연관성 분석

  • 진종식;박희준;이정현;김윤년;윤경일;엄흥섭
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.614-618
    • /
    • 2007
  • 데이터 마이닝 기법 중 순차 패턴 마이닝(Sequential Pattern Mining)은 연관 규칙에 시간의 개념을 추가하여 시간의 흐름에 따른 항목(item)들의 상호 연관성을 찾아내는 것이다. 본 연구의 목적은 순차적인 상병의 발생 가능성이 높은 상병 군의 패턴을 찾아내어 이를 모형화함으로써 차후에 발생된 상병을 예방하고 이를 통하여 환자와의 관계를 관리하여 보다 나은 의료서비스를 제공하는데 있다.

  • PDF

단계 선형 배치 트리를 이용한 순차 패턴 추출 (Mining Sequential Patterns Using Multi-level Linear Location Tree)

  • 최현화;이동하;이전영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.70-72
    • /
    • 2003
  • 대용량 데이터베이스로부터 순차 패턴을 발견하는 문제는 지식 발견 또는 데이터 마이닝(Data Mining) 분야에서 주요한 패턴 추출 문제이다. 순차 패턴은 추출 기법에 있어 연관 규칙의 Apriori 알고리즘과 비슷한 방식을 사용하며 그 과정에서 시퀀스는 해쉬 트리 구조를 통해 다루어 진다. 이러한 해쉬 트리 구조는 항목들의 정렬과 데이터 시퀀스의 지역성을 무시한 저장 구조로 단순 검색을 통한 다수의 복잡한 포인터 연산수행을 기반으로 한다. 본 논문에서는 이러한 해쉬 트리 구조의 단정을 보완한 다단게 선형 배치 트리(MLLT, Multi-level Linear Location Tree)를 제안하고, 다단계 선형 배치 트리를 이용한 효율적인 마이닝 메소드(MLLT-Join)를 소개한다.

  • PDF

스마트 공장에서 의사결정 모델을 이용한 순차 마이닝 기반 제조공정 (Sequence Mining based Manufacturing Process using Decision Model in Cognitive Factory)

  • 김주창;정호일;유현;정경용
    • 한국융합학회논문지
    • /
    • 제9권3호
    • /
    • pp.53-59
    • /
    • 2018
  • 본 논문에서는 스마트 공장에서 의사결정 모델을 이용한 순차 마이닝 기반 제조공정을 제안한다. 제안하는 모델은 소규모의 제조공정에서 순차 마이닝 의사결정 모델을 적용하여 제조 효율을 높이는 방법이다. 제조 단계 중 제품 제조 과정에서 나타나는 데이터를 입력 변수들로 구성하고, 시간당 제조량과 불량률을 출력 변수로 구성한다. t-검정을 통해 유의수준이 높은 변수만을 사용하여 GSP 알고리즘과 REPTree 알고리즘을 이용한 규칙과 모델을 생성한다. 의미있는 순차 규칙과 의사결정 모델은 정확도, 민감도, 특이성, 예측도를 통해 유의미함을 확인한다. 결과적으로, 실제 제조에 적용한 결과 불량률은 0.38%가 개선되었고, 시간당 제조량은 평균 1.89/h 증가되었다. 이는 소규모 제조 공정에서 데이터 마이닝 분석을 통한 제조 효율을 높이기 위한 의미있는 결과를 나타낸다.

경보데이터 패턴분석을 위한 순차패턴 알고리즘의 구현 (Implementation of Sequential Pattern Mining algorithm For Analysis of Alert data.)

  • 김헌웅;신문선;류근호;장종수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1555-1558
    • /
    • 2003
  • 침입탐지란 컴퓨터와 네트워크 자원에 대한 유해한 침입 행동을 식별하고 대응하는 과정이다. 점차적으로 시스템에 대한 침입의 유형들이 복잡해지고 전문적으로 이루어지면서 빠르고 정확한 대응을 필요로 하는 시스템이 요구되고 있다. 이에 대용량의 데이터를 분석하여 의미 있는 정보를 추출하는 데이터 마이닝 기법을 적용하여 지능적이고 자동화된 탐지 및 경보데이터 분석에 이용할 수 있다. 마이닝 기법중의 하나인 순차 패턴 탐사 방법은 일정한 시퀸스 내의 빈발한 항목을 추출하여 순차적으로 패턴을 탐사하는 방법이며 이를 이용하여 시퀸스의 행동을 예측하거나 기술할 수 있는 규칙들을 생성할 수 있다. 이 논문에서는 대량의 경보 데이터를 효율적으로 분석하고 반복적인 공격 패턴에 능동적인 대응을 위한 방법으로 확장된 순차패턴 알고리즘인 PrefixSpan 알고리즘에 대해 제안하였고 이를 적용하므로써 침입탐지 시스템의 자동화 및 성능의 향상을 얻을 수 있다.

  • PDF

트랜잭션이 없는 시계열 데이터로 부터 가상 트랜잭션을 이용한 데이터 마이닝 (Mining Time Series Data With Virtual Transaction)

  • 김민수;이준섭;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.31-34
    • /
    • 2001
  • 대용량의 데이터들로부터 사용자가 원하는 데이터를 찾기 위하여 많은 데이터 마이닝 기술들이 연구되어 실제 응용프로그램에서 많이 적용되고 있다. 이러한 데이터 마이닝의 기술 중 연관규칙은 항목들의 집합으로 표현되는 트랜잭션에서 각 항목간의 연관성을 찾는데 사용된다. 그러나 실세계에는 트랜잭션이 없이 일련의 이벤트만 시간에 따라서 발생하는 데이터들이 많이 존재한다. 이러한 시계열 이벤트 데이터들로부터 다양한 가상 트랜잭션을 생성하는 기법들을 제시한다. 이러한 가상 트랜잭션 데이터로 변환된 시계열 데이터에 연관규칙, 순차패턴, 주기패턴과 관련된 여러 가지 알고리즘을 바로 적용 함으로서 유용한 규칙들을 발견해 낼 수 있다.

  • PDF

시계열 데이터베이스와 강결합된 규칙발견 알고리즘 설계와 구현 (Design and Implementation of Rule Discovery Algorithm strongly coupled with Time-series databases)

  • 박인창;김성규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.43-45
    • /
    • 2001
  • 마이닝 시스템은 그 특성에 따라 매우 다른 형태의 구현 방법이 존재한다. 그러므로 마이닝 시스템간 호환성이나 재사용성은 매우 낮다. 본 노문에서는 이 문제를 시계열 데이터베이스를 통한 RDB와 강 결합함으로써 표준화에 대한 문제를 해겨라고자 시도하였다. RDB와의 강 결합은 표준화 문제를 해결함과 더불어 마이닝 시스템에 DBMS의 관련 기술을 이용함으로써 성능을 극대화시킨다. 특히 DBMS의 인텍스 기능을 이용함으로써 마이닝 시스템의 성능 향상을 시도하였다. 본 논문에서는 기존의 순차패턴 탐사의 시간개념 부재, 트랜잭션 데이터베이스 기반구조, 그리고 알고리즘 수행에 있어서 메모리 한계에 따른 문제등의 단점을 지적하고, 이를 수정하고 보완하기 위해서 시간 거리와 패턴 길이의 개념을 확장하였으며 그에 따른 연관규칙의 관련 공식을 수정 보완하여 제안한다. 또한 RDB와의 강 결합되어 기존의 트랜잭션 데이터베이스 구조를 벗어나 시계열 데이터에 보다 쉽게 적용할 수 있는 절차와 알고리즘을 제안한다.

  • PDF

변형된 FP-Tree를 기반한 상품 추천 시스템 (The Goods Recommendation System based on modified FP-Tree Algorithm)

  • 김종희;정순기
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.205-213
    • /
    • 2010
  • 연관규칙 마이닝 기법 중에 하나인 FP-트리 알고리즘을 이용하는 추천시스템이 시도되고 있다. 본 논문에서는 트랜�Ъ� 데이터베이스로부터 빈발 2-항목집합만을 추출하여 연관규칙을 생성하는 변형된 FP-알고리즘을 사용하는 추천시스템을 제안하였다. 제안된 추천시스템은 전처리 모듈, 학습 모듈, 추천 모듈 및 평가 모듈로 구성되었다. 제안된 추천시스템의 실험을 통하여 상품 추천의정확률과 재현율과 F-Measure와 성공률과 추천실행시간을 수행하였으며, 순차패턴 마이닝 기법을 사용하는 추천시스템과의 성능을 비교분석 하였다. 순차패턴 마이닝기법을 사용하는 추천시스템과 학습 성능, 추천 성능을 비교한 결과 학습 성능은 5배 이상 향상되었으며, 추천 성능은 20%이상 향상 되었다. 결론적으로, 순차패턴 추천시스템과 같은 데이터를 가지고 실험하여 추천시스템 성능의 타당성에는 보다 나은 시스템임을 입증 하였다.

스마트 홈에서 마이닝을 이용한 행동 순차 패턴 발견 (Discovery of Behavior Sequence Pattern using Mining in Smart Home)

  • 정경용;김종훈;강운구;임기욱;이정현
    • 한국콘텐츠학회논문지
    • /
    • 제8권9호
    • /
    • pp.19-26
    • /
    • 2008
  • 유비쿼터스 컴퓨팅의 발전에 따라 일대일 개인화 서비스를 위한 인프라스트럭처가 구축되면서, 사용자의 상황과 환경, 즉 상황인식 기반 서비스의 중요성이 부각되고 있다. 스마트 홈은 현실공간과 가상공간을 연결하여 가상공간에서 현실의 상황을 정보화하고 이를 활용하여 사용자 중심의 지능화된 서비스를 제공하는 기술이다. 본 논문에서는 스마트 홈에서 마이닝을 이용한 행동 순차 패턴 발견을 제안하였다. 마이닝을 이용하여 위치 트랜잭션에서 발생하는 위치간의 연관 규칙에 시간의 변이를 추가하여 행동 순차 패턴을 발견하였다. 인식된 시간 순서에 따라 사용자가 이동한 경로의 파악 및 행동 방향을 예측하고 그에 따른 서비스가 가능하다. 마이닝을 이용한 행동 순차 패턴의 성능 평가를 하기 위해 대응표본 t검정을 실시하여 유용성을 검증하였다. 평가 결과, 서비스에 대한 만족도의 차이가 통계적으로 의미가 있음을 증명하였고 높은 만족도를 보임을 확인하였다. 따라서 본 연구 결과를 활용하면 시장성 증대와 고부가 가치를 창출할 수 있을 것으로 기대하며 다양한 응용 분야에 활용이 가능하다.