• 제목/요약/키워드: 순차 패턴

검색결과 309건 처리시간 0.029초

시계열 데이터로부터의 경향성 기반 순차패턴 탐색 (Trend-based Sequential Pattern Discovery from Time-Series Data)

  • 오용생;이동하;남도원;이전영
    • 지능정보연구
    • /
    • 제7권1호
    • /
    • pp.27-45
    • /
    • 2001
  • 데이터마이닝에서 시계열 데이터로부터 순차패턴을 발견하는 연구는 사건이나 아이템이 주로 연구되어왔지만, 최근에는 설비의 상태를 알 수 있는 센서와 같은 수치 값의 형태를 가지는 분야에 관심을 가지게 되었다. 그러나 수치 형태의 데이터는 패턴을 만드는 동안 동일한 값을 가지는 경우가 거의 없기 때문에 기존의 사건이나 아이템 등으로 변환될 수 있는 패턴요소의 특징을 만드는 것이 가장 중요하다. 이러한 패턴요소를 발견하는 지금가지 방법은 이동 윈도우와 클러스터링을 사용하는 방법을 적용하였는데, 이러한 방법은 다양한 윈도우의 크기와 클러스터 값을 적용하여 반복적으로 작업을 하며, 찾아진 결과를 해석하는데도 많은 문제가 있다. 본 연구는 수치 값을 가진 데이터를 벡터의 형태로 만들어 패턴요소를 만드는 방법을 제시한다. 이렇게 만들어진 패턴요소는 전체 데이터를 사용하는 것 보다 이해되기 쉽고 보다 빠르게 순차패턴을 찾을 수 있다. 벡터로 변환된 패턴요소는 각도와 크기를 가지는데 우리는 이들 벡터들의 상호 연관성을 정의하고, 이들 연관성을 이용하여 순차패턴을 찾는 방법을 제시한다.

  • PDF

서픽스 검사를 이용한 단계적 순차패턴 분할 탐사 방법 (A Partition Mining Method of Sequential Patterns using Suffix Checking)

  • 허용도;조동영;박두순
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.590-598
    • /
    • 2002
  • 효율적인 순차패턴 마이닝을 위해서는 후보패턴의 생성 비용을 줄이고 동시에 생성된 후보패턴에 대한 탐색공간을 줄여야 한다. 그러나 이전에 개발된 알고리즘들은 이러한 문제들을 효율적으로 해결하지 못하고 있다. 특히 Apriori-like 방법들은 알고리즘은 단순하지만 많은 크기의 후보패턴 집합생성, 대용량 데이터 베이스의 반복적인 탐사 등의 문제점이 있고, PrefixSpan[2]은 단계별로 분할된 프레픽스 프로젝티드(prefix projected) 데이터 베이스들을 구성 하여 후보패턴의 지지도 계산을 위한 탐색 공간을 줄이지만 프로젝티드 데이타베이스들의 구성비용이 크다는 문제점이 있다. 이러한 문제점들의 개선을 위해 본 논문에서는 새로운 순차패턴 마이닝 방법인 Suffixspan(Suffix Checked Sequential Pattern mining)을 제 안한다. Suffixspan은 순차패턴 집합의 단계별 분할특성과 서픽스(suffix) 특성을 이용하여 적은 비용으로 작은 크기의 후보패턴 집합을 생성하고, 1-프레픽스 프로젝티드 데이타베이스를 구성하여 후보패턴 검사를 위한 탐색공간을 줄인다.

  • PDF

탐지성능을 향상 위한 해시기반 패턴 매칭 시스템 (Hash-based pattern matching system for detection performance)

  • 김병훈;이동휘;김귀남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.671-672
    • /
    • 2009
  • 네트워크 대역폭과 침입 기술의 발달하는 상황에서 침입탐지 시스템의 패턴 매칭 방식으로는 대용량화된 패킷을 스니핑되는 환경에서 기존의 패턴 매치 방식은 서비스에 따른 순차적인 패턴 매칭 방법으로는 모든 패킷들의 패턴을 분석하는 것에는 한계가 발생하며, 중요한 패킷을 패턴 매칭을 통하여 분석하지 못하여 여러 취약점에 대한 공격이 발생할 수 있는 악성 봇, 정보의 유출이 발생할 수 있다. 본 연구에서는 패턴 매칭 기법을 이용하는 침입탐지 시스템의 패턴 매칭 성능 향상을 위하여 서비스별로의 순차적인 패턴 매칭 방법에서 해시 기반의 패턴 매칭을 이용하여 패턴 매칭의 시간을 단축 시켜 빠른 속도로 탐지 할 수 있는 시스템을 제시하고 검증하고자 한다.

웹 문서 형식과 클러스터 내의 문서 유사도를 이용한 동적 추천 시스템 (Dynamic Recommendation System Using Web Document Type and Document Similarity in Cluster)

  • 김진수;김태용;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.274-276
    • /
    • 2001
  • 기존의 여러 동적 추천 시스템에서 사용자들의 브라우징 패턴을 반영하려고 노력하였다 .그러나 대부분의 동적 추천 시스템들은 웹 문서들의 형식이나 웹 문서들 간의 연관성을 고려하지 않고, 사용자들의 브라우징 패턴에만 근거하기 때문에 연관성이 없거나 의미 없는 웹 문서들에 대한 추천까지 제공하는 문제점을 지니고 있다. 본 논문에서는 웹 문서들 사이의 유사도와 로그 파일 안에 들어있는 사용자들이 패턴을 이용하여 웹 문서 자체의 형식에 따라 연관된 웹 문서뿐만 아니라 순차적인 특성을 가진 웹 문서를 추천 문서로 제공한다. 이때 추천 웹 문서의 형식이 탐색 페이지이면 사용자 브라우징 순차 패턴 DB 중에서 사용자들이 자주 항해하는 순차적인 특성을 갖는 웹 문서까지 제공하는 동적 추천 시스템을 제안한다.

  • PDF

수평 분산 데이터베이스 상의 세부 데이터 유출이 없는 순차 패턴 마이닝 기법 (Privacy Preserving Distributed Data Mining of Sequential Patterns on Horizontally Partitioned Databases)

  • 김승우;원정임;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.61-63
    • /
    • 2005
  • 본 논문에서는 수평 분산 데이터베이스에서 각 로컬 데이터베이스의 세부 데이터를 유출하지 않는 순차패턴 마이닝 기법을 제안한다. 데이터 마이닝은 대용량 데이터베이스에서 유용한 지식을 추출하는 기법으로서 각광을 받고 있다. 그러나 분산 데이터베이스를 대상으로 마이닝을 수행하는 경우, 데이터 공유에 따른 개인 혹인 집단의 프라이버시가 유출될 수 있다는 문제점이 존재한다. 따라서 본 논문에서는 프라이버시 보호를 위하여 각 로컬 데이터베이스의 세부 데이터를 보호하면서도, 마이닝 결과의 정확성을 보장할 수 있는 새로운 순차 패턴 마이닝 기법을 제안한다. 제안된 기법에서는 우선, 세부 데이터의 유출을 방지하기 위하여 마이닝의 대상이 되는 항목과 항목간의 시간 선후 관계의 성립 여부를 벡터로 표현한 후, 이들 벡터간의 스칼라 프로덕트 연산을 수행하여 얻어진 결과를 패턴의 지지도로 활용하는 방안을 제안하였다. 또한, 연산 결과에 영향을 미치지 않는 벡터를 미리 제거하여 스칼라 프로덕트 연산에 따른 비용을 감소시키는 방안을 제안하였다.

  • PDF

분할 순차 패턴과 SVM을 이용한 HPV 타입 예측 시스템 (HPV-type Prediction System using SVM and Partial Sequential Pattern)

  • 김진수
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.365-370
    • /
    • 2014
  • 기존의 시스템에서는 서열 전체 혹은 정렬되지 않은 서열로부터 패턴들을 생성하기 때문에 패턴의 수가 기하급수적으로 증가하여 많은 시간과 비용이 소모된다. 본 논문에서는 단백질의 전체 서열로부터 패턴을 찾아내는 것이 아니라, 다중 서열 정렬 기법을 이용하여 단백질의 분할 서열 구간을 생성하고 분할 서열 구간의 순차 패턴을 생성하며 생성된 패턴들을 통합하여 전체 모티프 후보 집합을 만들어 SVM의 훈련 집합으로 선택 및 학습하며, 최종적으로 미지의 혹은 알려진 단백질 서열의 HPV 타입을 SVM을 통해 학습된 정보를 적용하여 예측하는 시스템을 제안한다. 제안된 시스템은 기존의 시스템에 비해 최소 지지도 30%에서 정확도와 재현율 측면에서 보다 향상된 성능을 보였다.

비트맵을 사용한 닫힌 빈발 시퀀스 마이닝 (Mining Frequent Closed Sequences using a Bitmap Representation)

  • 김형근;황환규
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.807-816
    • /
    • 2005
  • 순차 패턴 탐사에 대한 연구는 대용량의 데이터베이스에서 사용자에 의해 주어지는 최소 지지도를 만족하는 빈발 시퀀스를 찾는 문제를 다룬다. 하지만 현재까지 이루어진 순차 패턴 탐사 방법은 빈발 시퀀스들의 길이가 길어지거나 최소 지지도가 상대적으로 낮게 주어진 상황에서는 생성되는 시퀀스가 기하급수적으로 많아져서 성능이 급격히 저하되는 문제점을 가지고 있다. 본 논문에서는 이 문제를 해결하기 위해서 모든 빈발 시퀀스의 정보를 포함하며 그 수가 현저히 적은 닫힌 빈발 시퀀스를 찾는 방법을 제안한다. 제안하는 알고리즘은 효율적으로 가지치기를 수행하기 위해서 깊이우선 탐색 방법으로 후보 시퀀스를 생성하고 데이터베이스를 비트맵으로 표현하여 비트 연산으로 지지도를 효율적으로 계산한다. 또한, 비트맵으로 표현된 시퀀스 특성을 이용하여 가지치기할 시퀀스를 적은 연산 비용으로 찾을 수 있다. 이런 장점을 통하여 제안한 방법이 지금까지 제안된 알고리즘보다 훨씬 빨리 닫힌 빈발 시퀀스를 찾는 것을 성능 실험을 통하여 확인하였다.

수평 방향 에지의 패턴을 고려한 순차주사화 알고리즘 (New Edge Dependent Deinterlacing Algorithm Based on Horizontal Edge Pattern)

  • 박민규;이태윤;강문기;오상근
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.492-500
    • /
    • 2003
  • 본 논문에서는 수평 방향의 에지 패턴을 고려한 새로운 순차주사화(de-interlacing) 알고리즘을 제안한다. 일반적으로 기존의 에지를 고려한 순차주사화 알고리즘은 한 장의 필드만을 사용한 다른 순차주사화 알고리즘들에 비해 시각적으로 우수한 결과를 나타낸다. 그러나 에지의 방향을 잘못 추정할 경우, 결과 영상에서 심각한 에러가 발생하므로, 이를 보완하고 정확한 에지의 방향을 찾아내기 위해, 기존의 크기의 차 성분만을 이용한 방법들과는 달리 에지의 패턴까지 고려하여 에지를 고려한 순차주사화(EDI: edge dependent interpolation)가 제안된다. 제안된 새로운 알고리즘은 기존의 방법에 비해 수치상으로도 시각적으로도 뛰어난 결과를 산출한다.

스마트 홈에서 마이닝을 이용한 행동 순차 패턴 발견 (Discovery of Behavior Sequence Pattern using Mining in Smart Home)

  • 정경용;김종훈;강운구;임기욱;이정현
    • 한국콘텐츠학회논문지
    • /
    • 제8권9호
    • /
    • pp.19-26
    • /
    • 2008
  • 유비쿼터스 컴퓨팅의 발전에 따라 일대일 개인화 서비스를 위한 인프라스트럭처가 구축되면서, 사용자의 상황과 환경, 즉 상황인식 기반 서비스의 중요성이 부각되고 있다. 스마트 홈은 현실공간과 가상공간을 연결하여 가상공간에서 현실의 상황을 정보화하고 이를 활용하여 사용자 중심의 지능화된 서비스를 제공하는 기술이다. 본 논문에서는 스마트 홈에서 마이닝을 이용한 행동 순차 패턴 발견을 제안하였다. 마이닝을 이용하여 위치 트랜잭션에서 발생하는 위치간의 연관 규칙에 시간의 변이를 추가하여 행동 순차 패턴을 발견하였다. 인식된 시간 순서에 따라 사용자가 이동한 경로의 파악 및 행동 방향을 예측하고 그에 따른 서비스가 가능하다. 마이닝을 이용한 행동 순차 패턴의 성능 평가를 하기 위해 대응표본 t검정을 실시하여 유용성을 검증하였다. 평가 결과, 서비스에 대한 만족도의 차이가 통계적으로 의미가 있음을 증명하였고 높은 만족도를 보임을 확인하였다. 따라서 본 연구 결과를 활용하면 시장성 증대와 고부가 가치를 창출할 수 있을 것으로 기대하며 다양한 응용 분야에 활용이 가능하다.

사이트의 접속 정보 유출이 없는 네트워크 트래픽 데이터에 대한 순차 패턴 마이닝 (Privacy Preserving Data Mining of Sequential Patterns for Network Traffic Data)

  • 김승우;박상현;원정임
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.19-22
    • /
    • 2005
  • 본 논문에서는 대용량 네트워크 트래픽 데이터를 대상으로 사이트의 프라이버시를 보호하면서 마이닝 결과의 정확성, 실용성 등을 보장할 수 있는 효율적인 순차 패턴 마이닝 기법을 제안한다. 네트워크가 발달함에 따라 네트워크 트래픽 데이터에 대한 마이닝은 네트워크를 통한 통신의 패턴을 찾아내고, 이를 사용하여 침입 탐지, 인터넷 웜의 탐지 등으로 유용하게 쓰이게 되었다. 그러나 네트워크 트래픽 데이터는 네트워크 사용자 개개인의 인터넷 접속 형태, IP 주소 등의 정보를 포함하는 데이터로 네트워크 사용자의 프라이버시를 해칠 수 있다는 문제점이 존재한다. 따라서 이들 네트워크 트래픽 데이터를 대상으로 하는 마이닝 기법에서는 프라이버시 보호를 위하여 각 사이트에 저장되어 있는 네트워크 트래픽 데이터를 공개하지 않으면서도, 의미있는 패턴을 찾을 수 있어야 한다. 본 논문에서는 프라이버시 보호를 위하여 N-저장소 서버 모델을 제안한다. 제안된 모델에서는 데이터를 분할하여 암호화한 후, 이를 복호화할 수 없는 서버에서 집계하는 방식을 사용하여 실제 데이터가 저장되어 있는 각 사이트의 출처 정보를 감추는 방식을 사용한다. 또한, 효율적인 빈번 패턴 생성을 위하여 빈번 항목에 대한 인덱스 구조를 제안하고, 이를 기반으로 한 순차 패턴 마이닝 기법을 보인다.

  • PDF