• 제목/요약/키워드: 유사패턴

검색결과 1,592건 처리시간 0.031초

빈발 패턴 네트워크에서 아이템 클러스터링을 통한 연관규칙 발견 (Discovering Association Rules using Item Clustering on Frequent Pattern Network)

  • 오경진;정진국;하인애;조근식
    • 지능정보연구
    • /
    • 제14권1호
    • /
    • pp.1-17
    • /
    • 2008
  • 데이터 마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템(item) 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량의 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 많이 제안되어 왔다. 연관규칙을 발견하기 위한 기존의 연구들은 모든 규칙을 찾아내지만, 사람이 분석하기에 너무 많은 규칙이 생성되기 때문에 규칙을 분석하기 위한 일 또한 많은 과정을 거쳐야 한다. 본 논문에서는 빈발 패턴 네트워크(Frequent Pattern Network)라 부르는 자료 구조를 제안하고 이를 활용하였다. 네트워크는 정점과 간선으로 구성되며 정점은 아이템을 표현하고, 간선은 두 아이템 집합을 표현한다. 아이템의 빈도수를 이용하여 빈발 패턴 네트워크를 구성하고, 아이템 사이의 유사도를 측정한다. 그리고 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 클러스터를 생성한다. 클러스터를 이용해 연관규칙을 생성하고 실험을 통해 Apriori와 FP Growth 알고리즘과의 성능을 비교를 하였다. 그 결과 빈발 패턴 네트워크에서 신뢰도 유사도를 이용하는 것이 클러스터의 정확성을 높여줌을 볼 수 있었다. 그리고 전통적인 방법과 비교를 통해 빈발 패턴 네트워크를 이용하는 것이 최소지지도에 유연성을 가짐을 알 수 있었다.

  • PDF

집단화를 이용한 음성의 표준 패턴설정에 관한 연구 (A study on creating Reference Pattern of speech by using the cluster)

  • 김계국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1985년도 학술발표회 논문집
    • /
    • pp.59-63
    • /
    • 1985
  • 불특정 화자의 음성인식을 위해 150 숫자음에 대하여 10개의 표준패턴을 설정하는데 목적을 두고 기술했다. 남성화자 3인이 각숫자음(0-9)를 5번씩 반복 발음한 150음을 지단화하여 숫자음의 표준패턴을 설정하였다. 특징 파라미터는 포르만트 주파수를 이용하였고 유크리드 거리 측정법을 유사도 비교에 사용하였다. 실험결과 85.3%의 인식률을 얻었다.

  • PDF

집단화를 이용한 한국어 숫자음성의 표준 패턴 설정에 관한 연구 (A Study on Creating Refrence Pattern of Korean Digits by using the Clustering)

  • 김계국
    • 한국음향학회지
    • /
    • 제5권2호
    • /
    • pp.3-12
    • /
    • 1986
  • 본 논문은 불특정 화자의 음성을 인식시키기 위하여 한국어 150 숫자음에 대하여 10개의 표준 패턴을 설정하는데 목적을 두고 연구하였다. 남성 화자 3인이 각 숫자음을 5번씩 반복 발음한 150숫자 음을 집단화 하여 표준 패턴을 설정하였다. 특징 피라미터는 포르만트 주파수를 이용하였고 유크리드 거리 측정법을 유사도 비교에 사용하였다. 실험 결과는 85.3%의 인식율을 얻었다.

  • PDF

나노임프린트 리소그래피를 이용한 나노 패턴 사파이어 기판 제작과 이를 이용한 청색 LED의 효율 향상 연구 (Enhancement of Blue LED's efficiency with nano-patterned sapphire substrate fabricated by using nano-imprint lithography)

  • 김진승;조중연;이헌
    • 한국표면공학회:학술대회논문집
    • /
    • 한국표면공학회 2012년도 춘계학술발표회 논문집
    • /
    • pp.164-164
    • /
    • 2012
  • 청색 발광 다이오드의 광추출 효율 향상 및 전기적 특성 향상을 위하여 기판이 되는 사파이어에 마이크로급 패턴을 형성하는 공정이 일반적으로 사용되고 있다. 기존의 공정과는 달리, 저가의 간단한 공정을 통해 쉽게 유사한 성능 향상을 얻기 위하여, 나노임프린트 리소그래피 공정을 도입하여 사파이어 기판 상에 일정한 주기와 형태를 갖는 나노 패턴을 형성하였으며, 이를 이용하여 제작한 발광 다이오드의 성능이 전기적, 광학적 측면에서 크게 향상되었음을 확인할 수 있었다.

  • PDF

순위다중패턴매칭을 위한 해싱기반 알고리즘 (A Hashing-Based Algorithm for Order-Preserving Multiple Pattern Matching)

  • 강문성;조석현;심정섭
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.509-515
    • /
    • 2016
  • 순위패턴매칭문제는 텍스트 T와 패턴 P가 주어질 때, P와 각 문자들의 순위가 동일한 순서로 나타나는 T의 모든 부분문자열을 찾는 문제이다. 순위패턴매칭문제는 주가지수분석과 음악의 유사성분석과 같이 문자 자체를 비교하는 것보다 값의 변화순서가 중요한 분야에서 연구가 진행되었다. 순위다중패턴매칭문제는 텍스트 T와 여러 개의 패턴들로 이루어진 패턴집합 $\mathbb{P}$가 주어질 때, $\mathbb{P}$에 속한 패턴과 각 문자들의 순위가 동일한 순서로 나타나는 T의 모든 부분문자열을 찾는 문제이다. 본 논문에서는 순위다중패턴매칭문제를 해결하는 해싱기반 알고리즘을 제시한다.

시퀀스 데이터웨어하우스에서 이산푸리에변환과 비트맵을 이용한 시퀀스 스트림 색인 기법 (Sequence Stream Indexing Method using DFT and Bitmap in Sequence Data Warehouse)

  • 손동원;홍동권
    • 한국지능시스템학회논문지
    • /
    • 제22권2호
    • /
    • pp.181-186
    • /
    • 2012
  • 최근 시간적으로 변화된 데이터에서 유사한 값의 움직임 즉 유사 패턴을 검색하는 연구가 활발히 진행되고 있다. 시간적으로 변화된 데이터는 시계열 데이터 (time series data) 또는 시퀀스 데이터(sequence data)로 분류되며 기존의 스칼라 값을 가지는 데이터와는 매우 다른 의미를 가진다. 본 논문에서 유사 시퀀스 검색은 시퀀스 데이터웨어하우스에서 값의 변화가 유사한 형태를 가지는 시퀀스들을 검색한다. 유사 시퀀스를 검색하기 위하여 본 논문에서는 먼저 시퀀스 원시 데이터에 이 산 푸리에 변환(DFT, Discrete Fourier Transform)을 적용하여 데이터를 변환한다. 변환된 데이터는 그 특성으로 인하여 유사 패턴의 검색에 적합하며 또 유사도를 비교할 때 일부분만 사용되므로 색인에 사용되는 속성의 개수를 줄이는 장점이 있다. 또 데이터웨어하우스 환경이므로 더 좋은 성능을 보일 수 있는 비트맵 색인 기법을 적용하였다. 시퀀스 데이터의 효율적인 검색을 위하여 영역 지정 검색 방법을 제안하고 효율적인 실행을 위한 비트맵을 활용한 다양한 조합의 색인을 생성하고, 질의 최적화기의 연산 비용을 비교하면서 효율적인 검색 연산을 위한 최저 비용의 색인을 선택하는 기법을 연구하였다.

설계 패턴 재사용 라이브러리 구현 (Implementation of Library for Design Pattern Reuse)

  • 김행곤;김지영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권1호
    • /
    • pp.48-62
    • /
    • 2001
  • 다양한 플랫폼 상에서 응용 시스템에 대한 개발, 배포, 운영의 고생산성과 고품질을 얻기 위해서는 소프트웨어 구성 요소들의 체계적인 재사용 접근과 자동화된 도구의 지원이 요구된다. 함수나 클래스 라이브러리에서 설계 패턴과 프레임워크, 그리고 최근의 상업적인 비즈니스 컴포넌트에 이르기까지 여러 재사용 방법이 제시되었으나 기대만큼의 확실한 효과를 얻을 수 없었다. 설계 패턴은 설계 경험에 대한 캡슐화된 빌딩 블록으로 개발 응용의 표준화된 아키텍쳐 제공을 통해 응용 도메인의 한정성과 클래스 수준의 재상용의 복잡성을 극복할 수 있다. 응용 개발의 표준 아키텍쳐로서의 웹을 통한 재사용 요소들의 공유는 여러 개발자들에 의한 다양한 도메인 요소로서의 전개와 동적이며 실시간적인 라이브러리 관리가 가능하다. 본 논문에서는 웹 환경 하에서 자동화된 설계 패턴 재사용 환경 구축을 목적으로 한다. 그러므로 For Reuse 관점에서 서버 상에 각 도메인별 패턴 라이브러리를 구축하며 With Reuse 관점에서 패턴 검색, 이해, 획들 그리고 재구조화를 통한 응용으로의 재사용 지원기를 구축한다. 본 시스템은 패턴의 공유에 의한 유사 도메인 응용의 표준화를 유도하고 사용자의 패턴 재정의에 의한 자생적을 확장 가능한 패턴 라이브러리 제공이 가능하다. 또한 이를 위해 도메인 분석을 통한 패턴의 행위와 의도를 기준으로 설계 패턴들을 분류, 카탈로깅하여 재사용 라이브러리를 제시한다.

  • PDF

정규 표현식을 이용한 패턴 매칭 엔진 개발 (Development of the Pattern Matching Engine using Regular Expression)

  • 고광만;박홍진
    • 한국콘텐츠학회논문지
    • /
    • 제8권2호
    • /
    • pp.33-40
    • /
    • 2008
  • 스트링 패턴 매칭 알고리즘은 특정 검색어, 키워드를 검색하는 속도에서는 우수성이 다양한 방법으로 입증되었지만 다양한 패턴에 대해서는 기존의 알고리즘으로는 한계를 가지고 있다. 본 논문에서는 정규 표현식을 이용하여 특정 키워드를 포함하여 다양한 패턴의 검색어에 대해서도 효율적인 패턴 매칭을 수행하여 패턴 검색의 효율을 높이고자 한다. 이러한 연구는 기존의 단순한 키워드 매칭에 비해 각종 유해한 스트링 패턴을 효과적으로 검색할 수 있으며 스트링 패턴 매칭 속도에서도 기존의 알고리즘에 비해 우수성을 갖는다. 본 연구에서 제안한 LEX로부터 생성된 스트링 검색 엔진은 패턴 검색 속도에 대한 실험에서 패턴의 수가 1000개 이상인 경우에서는 BM&AC 알고리즘보다 효율적이지만 키워드 검색에서는 유사한 결과를 얻었다.

유비쿼터스 환경에서 Context 처리를 위한 패턴 수집 모델의 설계와 구현 (Design and Implementation of Pattern Collection Model for Handling the Context on a Ubiquitous Environment)

  • 이대준;김성조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.344-349
    • /
    • 2007
  • 유비쿼터스 환경에서 사용자의 편의성을 증대하기 위해 상황인지 기술이 필요하며 댁내의 다양한 기기의 정보를 수집하여 현재 상태를 파악하고 그에 맞는 서비스를 제공해야 한다. 하지만 다양한 종류의 디바이스, 센서, 서비스에 따라 생성하는 데이터의 형태와 의미가 다르기 때문에 이를 활용하는데 어려움이 있다. 본 논문은 다양한 기기와 환경에서 발생하는 데이터를 처리하여 사용자의 패턴을 수집하고 활용할 수 있는 연구 모델을 제안하고 구현한다. 구성요소는 실제 환경과 유사하게 Context를 생성할 수 있는 Emulator와 수집된 Context를 활용하여 패턴을 찾는 패턴 수집 서버와 수집된 데이터를 표현하는 시각화 도구로 구성된다. Emulator는 댁내에 존재할 수 있는 다양한 종류의 Context를 정의하고 서로간의 관계에 따라 Context를 생성하고 패턴 수집 서버는 Emulator에서 생성한 불완전한 Context를 통합하여 완전한 Context를 생성한다. 그리고 생성된 Context를 통해서 사용자의 서비스 이용패턴, Fault, Conflict를 발견했다.

  • PDF

에너지 기반 모델을 이용한 순차 패턴 부호화 방법 (An Encoding Method of Sequential Patterns using Energy-based models)

  • 허민오;김권일;이상우;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.330-332
    • /
    • 2012
  • 시계열 데이터 모델링은 시간 간격의 길이에 따라 단기적인 패턴이 주로 반영된다. 특히, 모델에 마코프 가정을 적용하였을 경우 이전 시간의 값에 따라 현재값이 결정된다. 시계열 데이터의 장기적인 변화를 다루기 위해, 특정 길이의 순차적 패턴을 부호화 하고, 이를 상위 모델의 입력으로 사용하는 과정을 통해 추상화를 시도하고자 한다. 실제로 사람의 감각기억은 200~500 밀리초 가량의 짧은 기억 유지기간을 갖는데, 이 기간의 정보를 상위 처리기의 입력 단위로 보고자 하는 것이다. 이에 본 고에서는 에너지기반 모델링 기법을 이용하여 반복적으로 나타나는 순차적 패턴을 부호화 하는 방법을 제안한다. 이 부호화 방법은 시간 순서에 따른 패턴의 유사도를 이용하여 확률적으로 다음 패턴과의 관계를 표현할 수 있으며, 이는 향후 시계열 데이터를 간략하게 표현하여 분석 및 시각화에 도움을 줄 수 있다.