• 제목/요약/키워드: 패턴 유사도

검색결과 1,591건 처리시간 0.025초

시퀀스 데이터베이스를 위한 모양기반의 유사 부분시퀀스 검색 (Efficient Retrieval of Similar Shape-Based Subsequences for Sequence Database)

  • 이정화;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.340-342
    • /
    • 1999
  • 시퀀스 데이터(sequence data)에서는 각 데이터 값보다는 전후 그들 사이의 변화추세 등이 더 큰 정보로 작용하는 것이 일반적이다. 본문에서는 시퀀스 데이터베이스를 대상으로 하여 주어진 시퀀스 패턴과 모양이 유사한 모든 부분시퀀스를 검색해 내는 새로운 방식을 제안한다. 본 방식에서는 시퀀스 데이터의 모양 추출을 위한 데이터 변환, 유사 모양 패턴 클러스터링, 새로운 유사도 계산 방식 등을 도입함으로써, 기존의 방식이 매우 제한적인 패턴만을 유사패턴으로 간주하던 것에 비하여, 패턴이 데이터축 혹은 타임축으로 각각 확대, 축소, 이동된 경우에도 유사패턴으로 검색이 가능하다.

  • PDF

홉필드 신경망을 이용한 부분패턴의 복원에 관한 연구 (A Study on Partial Pattern Restoration using Hopfield Neural Network)

  • 김지훈;이주영;남궁재찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.591-594
    • /
    • 2003
  • 본 논문에서는 hopfield 신경망을 사용한 다양한 부분적인 패턴 복원에 관하여 연구하였다. 여섯 개의 $32{\times}32$ 비트맵 훈련패턴들은 한글자음 ㄱ, ㅁ, ㅂ, ㅇ, ㅊ, ㅍ, 그리고 남자와 여자 이미지로 구성되어 있다. 그리고 부분패턴들의 크기, 범위, 방향의 효과를 알아보기 위해서 훈련패턴에서 여덟 가지 형태의 테스트 패턴을 만든다. 한글 자음의 경우 유사 패턴이 많기 때문에 완전히 복원되지 못하였으나, 400회 정도 수렵된 후에는 테스트패턴들이 견본패턴과 비슷한 모양으로 복원되었다. 이 유사도를 측정하기 위해 해밍거리 (Hamming distance)를 이용하였다. 유사도를 측정하여 해밍거리가 가장 적은 것으로 본래의 이미지들 복원하였다.

  • PDF

패턴매칭을 이용한 유사도 비교 분석 (A Similarity Valuating System using The Pattern Matching)

  • 고방원;김영철
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.185-192
    • /
    • 2010
  • 본 논문에서는 서로 다른 두 개의 문서에 등장하는 패턴 매칭을 이용하여 유사도를 평가하는 시스템을 제안한다. 기존의 문서들의 유사도를 평가하는 방법에는 지문법과 같은 통계적 방법을 주로 이용하였다. 하지만 이 방법은 관련이 없는 두 문서에서 우연히 유사한 단어가 많이 등장 할 때 유사성이 높게 나오는 정확성의 문제점이 있다. 이러한 문제점은 단순히 두 문서의 통계적인 수치를 비교하기 때문에 발생한다. 하지만 본 논문에서 제시하는 패턴을 이용한 방법은 일치하는 패턴을 검색하여 유사성을 판별하기 때문에 이러한 문제를 해결하였다. 하지만 패턴을 검색하는 시간이 오래 걸리는 단점이 있는데 이를 개선하는 알고리즘 또한 본문에서 소개한다.

빈발 패턴 네트워크에서 연관 규칙 발견을 위한 아이템 클러스터링

  • 오경진;정진국;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.321-328
    • /
    • 2007
  • 데이터마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 제안되어 왔다. 본 논문에서는 정점으로 아이템을 표현하고, 간선으로 두 아이템집합을 표현하는 빈발 패턴 네트워크(FPN)이라 불리는 새 자료 구조를 제안한다. 빈발 패턴 네트워크에서 아이템 사이의 연관 관계를 발견하기 위해 이 구조를 어떻게 효율적으로 사용 하느냐에 초점을 두고 있다. 구조의 효율적인 사용을 위하여 한 아이템이 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 네트워크의 정점을 클러스터링하는 방법을 사용한다. 실험은 신뢰도, 상관관계 그리고 간선 가중치 유사도를 이용하여 네트워크에서 아이템 클러스터링의 정확도를 보여준다. 본 논문의 실험 결과를 통해 신뢰도 유사도가 네트워크의 정점을 클러스터링할 때 클러스터의 정확성에 가장 많은 영향을 미친다는 것을 알 수 있었다.

  • PDF

순차 패턴을 이용한 XML문서의 유사성 계산 방법 분석 (Korea Information Science Society)

  • 이원철;이상민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2004
  • XML 문서의 요소는 의미적인 정보와 트리기반의 구조적인 정보를 포함하고 있기 때문에 요소의 구조적인 유사성이 곧 XML 문서의 유사성으로 연구되어 왔다. 그러나 구조적이고 순차적인 유사성만을 고려한 순차패턴 유사성 검색 방법은 의미적인(sementic) 유사성을 제대로 반영을 할 수가 없다. 이것은 정보 검색에 있어 재현율(recall)을 낮을 수밖에 없는 원인을 제공한다. 따라서 본 논문에서는 기존에 사용되었던 순차패턴을 기반으로 한 유사성의 계산 방법과 각각의 연구 방법이 의미적인 유사성에 대하여 한계가 있음을 찾아보았다.

  • PDF

텍스트 마이닝을 이용한 소비자 소비패턴 분석 기법 설계 (An Analysis Scheme Design of Customer Spending Pattern using Text Mining)

  • 정은희;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.181-188
    • /
    • 2018
  • 본 논문에서는 텍스트 마이닝을 이용한 소비자의 소비패턴 분석 기법을 제안하였다. 제안하는 소비패턴 분석기법에서는 첫째, 피어슨의 상관계수를 이용하여 사용자의 평가점수에 대한 유사도를 분석하고, 둘째, 텍스트 마이닝 기법 중의 하나의 TD-IDF의 코사인 유사도를 이용하여 사용자의 리뷰들간의 유사도를 분석하고, 셋째, Sentiwordnet를 이용하여 평가점수와 리뷰의 일치성을 분석하였다. 그리고 제안하는 소비패턴 분석 기법은 평가점수의 유사도와 리뷰의 유사도를 이용하여 근접이웃들을 선정하고, 선정된 이웃에 소비패턴에 적합한 추천리스트를 제공하였다. 추천리스트의 정확도는 피어슨 상관계수가 0.79, TD-IDF가 0.73, 그리고 제안하는 소비패턴분석기법이 0.82로 나타났다. 즉, 제안하는 소비패턴분석기법은 소비자의 정량적인 평가점수와 정성적인 리뷰를 모두 이용하므로 소비 패턴을 좀 더 정확하게 분석할 수 있었다.

의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상 (Improving The Performance of Triple Generation Based on Distant Supervision By Using Semantic Similarity)

  • 윤희근;최수정;박성배
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.653-661
    • /
    • 2016
  • 기존의 패턴기반 트리플 생성 시스템은 distant supervision의 가정으로 인해 오류 패턴을 생성하여 트리플 생성 시스템의 성능을 저하시키는 문제점이 있다. 이 문제점을 해결하기 위해 본 논문에서는 패턴과 프로퍼티 사이의 의미 유사도 기반의 패턴 신뢰도를 측정하여 오류 패턴을 제거하는 방법을 제안한다. 의미 유사도 측정은 비지도 학습 방법인 워드임베딩과 워드넷 기반의 어휘 의미 유사도 측정 방법을 결합하여 사용한다. 또한 한국어 패턴과 영어 프로퍼티 사이의 언어 및 어휘 불일치 문제를 해결하기 위해 정준 상관 분석과 사전 기반의 번역을 사용한다. 실험 결과에 따르면 제안한 의미 유사도 기반의 패턴 신뢰도 측정 방법이 기존의 방법보다 10% 높은 정확률의 트리플 집합을 생성하여, 트리플 생성 성능 향상을 증명하였다.

의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상 (Improving The Performance of Triple Generation Based on Distant Supervision By Using Semantic Similarity)

  • 윤희근;최수정;박성배;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.23-28
    • /
    • 2015
  • 본 논문에서는 한국어 트리플 생성 시스템의 정확도를 향상시키기 위한 distant supervision 기반의 신뢰도 측정 방법을 제안한다. 기존의 많은 패턴 기반의 트리플 생성 시스템에는 distant supervision의 기본 가정으로 인해 다수의 오류 패턴이 발생할 여지가 크다. 기존의 연구에서는 오류 패턴을 제거하기 위하여 발생 빈도, 공기 횟수 등의 통계에 기반하여 간접적으로 신뢰도를 측정하였다. 본 논문에서는 한국어 패턴과 영어 프로퍼티 사이의 의미 유사도를 측정함으로써 통계에 기반한 방법보다 더 정확한 신뢰도 측정 방법을 제안한다. 비지도 학습 방법인 워드임베딩을 활용하여 어휘의 의미를 학습하고, 이들 사이의 유사도를 측정한다. 한국어 패턴과 영어 프로퍼티의 어휘 불일치 문제를 해결하기 위하여 정준상관분석을 활용하였다. 실험 결과에 따르면 본 논문에서 제안한 패턴 신뢰도 측정 방법은 통계 기반의 방법에 비해 정확률이 9%나 더 높은 트리플 집합을 생성함을 보여주어, 의미 유사도를 반영한 신뢰도 측정이 기존의 통계 기반 신뢰도 측정보다 고품질 트리플 생성에 더 적합함을 확인하였다.

  • PDF

탭 패턴 유사도를 이용한 사용자 맞춤형 즐겨찾기 스마트 폰 UX/UI개발 (The Development of the User-Customizable Favorites-based Smart Phone UX/UI Using Tap Pattern Similarity)

  • 김영빈;곽문상;김유희
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권8호
    • /
    • pp.95-106
    • /
    • 2014
  • 본 논문에서는 화면터치에 따른 탭 동작을 패턴 화하여 인식할 수 있는 UX/UI와 탭 패턴인식 알고리즘을 설계하여 사용자 맞춤형 즐겨찾기 애플리케이션 구현을 하였다. 스마트 폰 사용자가 입력패드에 손가락으로 탭 하는 동작들을 패턴으로 생성하고, 이 탭 패턴에 스마트 폰에서 사용자가 즐겨 사용하는 서비스를 설정할 수 있도록 한다. 사용자가 입력패드를 이용하여 탭 패턴을 입력했을 때, 탭 패턴 유사도를 측정하여 등록된 탭 패턴과 유사하면 설정된 스마트 폰의 서비스 기능을 수행한다. 실험을 통해 제안한 방법이 사용자 편의성을 고려한 다양한 형태의 탭 패턴에 대하여 높은 인식률과 입력 종료 후의 지연 시간 단축을 보장함을 보여주었다.

퍼지패턴매칭에 의한 음성인식에 관한 연구 (A Study on Speech Recognition Using Fuzzy Pattern Matching)

  • 이기영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1991년도 학술발표회 논문집
    • /
    • pp.3-6
    • /
    • 1991
  • 본 연구에서는 음성의 패턴작성법을 개선하고 음성인식율을 향상시키기 위하여 퍼지패턴매칭을 개선한 뉴럴퍼지패턴매칭에(a neural-fuzzy pattern matching)의해 특정화자 고립단어인식을 수행하였다. 이 방법에서는 신경회로망의 연상기억에 의한 사상에 의해 패턴을 작성하여 주파수변동을 흡수하고 표준패턴고 선형매칭에 의해 유사도를 측정하여 인식하므로써 시간변동의 문제를 보완하였다. 또한, 이 방법에서 사용하는 특징피라미터는 2진화 스펙트럽이며, 유사도는 논리연산에 의해 측정되기 때문에 종래의 왜곡척도를 이용한 DTW 방법에 비해 기억용량과 계산량이 매우 작다. 이 방법의 인식성능을 평가하기 위하여 남녀가 발성한 28개의 도시명을 대상으로 인식실험을 수행한 결과, 신경회로망을 이용하지 않은 퍼지패턴매칭보다 오인식을 감소시켰으며, 뉴럴-퍼지 패턴매칭에 의한 특정화자 고립단어인식의 우수성을 확인하였다.

  • PDF