• 제목/요약/키워드: 유사거리

검색결과 1,257건 처리시간 0.027초

효율적인 계산을 위한 개선된 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘 (Improved Triangle Keypoints matching system for efficient generation)

  • 이인홍;강전호;남귀중;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.236-238
    • /
    • 2020
  • 기존에 개발한 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘은 근접 거리에 과도하게 많은 특징점이 추출되면 정확도가 낮아지는 점, 계산 과정에서의 Threshold를 주관적으로 설정해 주어야 해 정확한 Threshold를 찾기 위하여 전체 알고리즘을 여러번 반복하여 실행시켜야 하는 점에서 비효율적인 측면이 있다. 이를 해결하기 위하여 본 논문에서는 기존의 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘에 근접 거리 내의 특징점을 제거하는 알고리즘과 서로 다른 Threshold를 가진 유사 공간 계산 알고리즘들을 병렬적으로 계산해 한 번의 알고리즘 실행만으로 자동적으로 적절한 Threshold를 찾을 수 있도록 하는 모듈을 추가하여 기존의 알고리즘과 비교하여 더 효율적으로 영상 간 유사 공간을 계산해낼 수 있도록 개선된 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘을 제안한다.

  • PDF

알파 다이버전스를 이용한 무게중심 모델 기반 음악 유사도 (Centroid-model based music similarity with alpha divergence)

  • 서진수;김정현;박지현
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.83-91
    • /
    • 2016
  • 음악 유사도 계산은 음악 검색 및 분류 등의 정보 처리 시스템 구현에 있어서 가장 중요한 부분이다. 본 논문은 최근 제안된 무게중심 모델을 이용한 음악 검색 방법에 대해서 살펴보고, 무게중심 모델의 확률 분포 유사도를 이용하여 음악 검색을 수행하고 성능을 평가하였다. 확률 분포간의 거리는 주어진 두 개의 확률 분포가 특정 기준에서 얼마나 가까운 지를 계산하는 것으로 다이버전스라고 불리기도 한다. 본 논문에서는 무게중심 모델에서 확률 분포 간의 거리 비교 시에 알파 다이버전스를 활용하였다. 알파 다이버전스는 알파 값에 따라 다양한 형태를 가지며, 널리 사용되고 있는 KLD(Kullback-Leibler)와 BD(Bhattacharyya Distance)를 포함한다. 음악 장르와 가수 데이터셋에서 검색 실험을 수행했고, 확률 분포 거리 기반 유사도와 벡터 거리 기반 유사도의 음악 검색 성능을 비교하였다. 알파 다이버전스를 통해서 무게중심 모델 기반 음악 검색 성능을 개선시킬 수 있음을 보였다.

모바일 라이프로그 데이터 마이닝을 위한 Non-Euclidean 데이터의 유사도 계산 (Similarity Calculation for Mobile Life Log Data Mining)

  • 이영설;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.298-301
    • /
    • 2011
  • 모바일 기기에서 수집된 많은 정보들은 시맨틱한 정보들을 포함하고 있기 때문에 수치 해석에 특화된 클러스터링 등의 데이터마이닝 방법들을 적용하기가 힘들다. 따라서 상대적인 유사도를 계산하는 방법이 많이 이용되지만, 상대적인 유사도 값조차 유클리드 거리로 환산이 불가능한 특징을 가지는 경우가 많다. 본 논문에서는 비유클리드 특징을 가지는 유사도를 TFIDF 와 pseudo-Euclidean embedding을 적용하여 유클리드 공간 상의 거리값으로 변환하는 방법을 제안한다. 제안하는 방법의 가능성을 보이기 위하여 모바일 기기에서 대학생들의 생활 패턴을 반영하는 데이터를 수집하고, 수집된 데이터에 제안하는 방법을 적용한다. 그리고 적용된 결과를 대학생들의 생활 패턴과 비교하여 분석한다. 또한 장소 간의 유사도를 이용하는 애플리케이션의 프로토타입을 개발한다.

윈도우 제약 조건을 가지는 시간 왜곡 변환 기반 유사 시퀸스 검색 (Similar Sequence Searching under Time Warping with Window constraint)

  • 김인태;송병호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.214-216
    • /
    • 2001
  • 유사 시퀸스 검색에서 시간 왜곡 변환을 지원하기 위한 연구가 최근 활발히 이루어지고 있다. 음성 인식과 같은 몇몇 응용에서는 시간 왜곡 변환을 적용할 때 과도한 타이밍의 차이는 허용하지 않을 필요가 있다. 그래서 대부분의 경우 윈도우라는 제약 조건을 추가하게 된다. 이 논문에서는 윈도우 제약 조건이 있을 때 시간 왜곡 변환을 지원하는 유사 검색 방법으로 세그먼트 분할 기법(Segment Partition Approach:SFA)을 제안한다. SFA는 각 시퀸스를 세그먼트로 분할한 뒤 특징을 추출하여 다차원 인덱스를 구성한다. 유사 검색 질의를 수행할 때 이 인덱스를 검색하여 질의 시퀸스와 유사할 가능성이 큰 후보들을 빠르게 찾아낼 수 있고 찾아낸 후보들에 대해서만 정확한 시간 왜곡 변환 거리를 계산하기 때문에 전체 질의 처리 시간을 단축할 수 있다. SPA는 순차 검색에 비하여 좋은 성능을 보이며, 특히 거리 허용치가 작을 때 더욱 우수한 성능을 보인다.

  • PDF

거리 척도에 따른 PCA/LDA기반의 얼굴 인식 성능 분석 (A Performance Analysis of the Face Recognition Based on PCA/LDA on Distance Measures)

  • 송영준;김영길;안재형
    • 한국산학기술학회논문지
    • /
    • 제6권3호
    • /
    • pp.249-254
    • /
    • 2005
  • 본 논문은 얼굴인식에서 사용되고 있는 PCA/LDA 방식의 유사도 측정 방식에 따른 인식 성능을 비교 분석하였다. 총 14가지의 거리 척도를 ORL 얼굴 데이터베이스에 적용하였으며, PCA와 PCA/LDA로 나누어 성능 비교를 하였다. PCA의 경우에는 맨하튼 거리, Weighted SSE 거리의 인식률이 좋지만, PCA/LDA인 경우에는 Angle-based 거리, Modified SSE거리에 대한 인식률이 좋음이 확인되었다. 또한 PCA보다 PCA/LDA의 경우 유사도 비교 차원의 수를 줄이면서 높은 인식률을 유지할 수 있어, PCA/LDA와 Angle-based 거리 척도를 적용하여 얼굴인식을 할 경우 계산의 경제성과 인식률에서 높은 경쟁력을 갖출 수 있다.

  • PDF

시계열 데이터베이스에서 복수의 모델을 지원하는 모양 기반 서브시퀀스 검색 (Shape-Based Subsequence Retrieval Supporting Multiple Models in Time-Series Databases)

  • 원정임;윤지희;김상욱;박상현
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.577-590
    • /
    • 2003
  • 모양 기반 검색이란 실제 요소 값과 관계없이 질의 시퀀스와 유사한 모양을 갖는 시퀀스(서브시퀀스)를 데이터베이스 내에서 검색하여 내는 연산이다. 본 논문에서는 시계열 데이터베이스에서의 모양 기반 검색을 위한 유연성 있는 새로운 유사 모델을 정의하고, 이 유사 모델을 지원하기 위한 인덱싱 및 질의 처리 방안을 제시한다. 제안된 유사 모델에서는 정규화, 이동 평균, 타임 워핑 등 다양한 변환을 지원한다. 특히 최종 유사 정도를 계산하기 위하여 사용되는$L_p$거리 함수론 사용자가 임의로 지정하도록 함으로써 응용에서 선호하는 유사 모델을 반영할 수 있다. 또한 이러한 모양 기반 검색을 효과적으로 지원하기 위한 압축된 서브시퀀스 트리 구조를 제안하고, 이를 기반으로 하는 효율적인 질의 처리 기법을 제시한다. 실험 결과에 의하면 제안된 기법은 진의 시퀀스와 모양이 유사한 서브시퀀스들을 사용자에 의하여 선택된 거리 함수를 사용하여 성공적으로 검색할 뿐 아니라, 순차 검색과 비교하여 거리 함수 선택에 따라 수 십배에서 수 백배까지의 성능 개선 효과를 갖는 것으로 나타났다.

다양한 스마트폰 키패드 환경에서 유사 단어 검색을 위한 수정된 편집 거리 계산 방법 (Modified Edit Distance Method for Finding Similar Words in Various Smartphone Keypad Environment)

  • 송영길;김학수
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.12-18
    • /
    • 2011
  • 대부분의 스마트폰은 터치패드 기반의 가상 키패드를 사용한다. 가상 키패드는 기기의 화면 크기나 입력 방법의 물리적인 한계로 입력 오류가 자주 발생한다. 이 문제를 해결하기 위해 유사 단어를 찾기 위한 많은 연구가 있었다. 본 논문에서는 편집 거리 방법을 다양한 가상 키패드를 고려하여 수정하는 방법을 제안한다. 제안 방법은 다양한 키패드에서 발생하는 입력 오류를 효과적으로 해결하기 위해, 입력 문자열을 사용자가 실제 누르게 되는 입력열로 변환하고, 가상 키패드의 특성에 따라 편집 비용을 수정하였다. 다양한 키패드에서 실험한 결과 제안 방법이 일반적인 편집 거리 방법을 이용한 것 보다 좋은 성능을 보였다.

서열정렬을 이용한 유전체 서열클러스터의 압축 방법 (A Compressing Method for Genome Sequence Cluster Using Sequence Alignment)

  • 유남희;정광수;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.194-197
    • /
    • 2008
  • 생물학자들은 기능이 밝혀진 단백질들로부터 치환된 몇몇의 잔기를 이용해 새로운 유용한 단백질들을 만든다. 만들어진 단백질은 높은 서열 유사성을 가지는데 우리는 이런 유사한 서열들로 구성되어 있는 클러스터를 서열 클러스터라고 정의한다. 이 논문에서는 서열정렬방법을 이용하여 서열들의 클러스터에 새로운 요약적 표현방법을 제안한다. 먼저 클러스터 안의 모든 서열들 각각의 거리에서 최소거리를 갖는 서열을 대표로 선택한다. 이 서열거리는 계산된 정렬스코어에 의해 얻을 수 있고 서열정렬의 결과에서 변환된 서열을 Edit-Script라고 불리는 보존정보에 저장한다. 대표로 선택된 서열과 각 클러스터의 Edit-Script가 데이터베이스에 저장되고 이 정보로 각 클러스터의 서열들이 보다 쉽게 만들어진다. 본 연구의 결과에서 Edit-Script의 정보를 이용하면 클러스터안의 서열들의 유사도이 55% 넘었을 때 사이즈가 감소된 것을 알 수 있다. 또한 데이터베이스에서 검색하려는 서열과 관련된 서열들을 검색할 때 데이터베이스 있는 대표서열들을 먼저 비교해 본 후 가장 거리가 가까운 대표서열을 선택하여 그 안의 클러스터 구성서열들과 검색하기 때문에 검색 시간을 단축시킬 수 있다.

  • PDF

워드넷을 이용한 문서내에서 단어 사이의 의미적 유사도 측정 (Semantic Similarity Measures Between Words within a Document using WordNet)

  • 강석훈;박종민
    • 한국산학기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.7718-7728
    • /
    • 2015
  • 단어 사이의 의미적 유사성은 많은 분야에 적용 될 수 있다. 예를 들면 컴퓨터 언어학, 인공지능, 정보처리 분야이다. 본 논문에서 우리는 단어 사이의 의미적 유사성을 측정하는 문서 내의 단어 가중치 적용 방법을 제시한다. 이 방법은 워드넷의 간선의 거리와 깊이를 고려한다. 그리고 문서 내의 정보를 기반으로 단어 사이의 의미적 유사성을 구한다. 문서 내의 정보는 단어의 빈도수와 단어의 의미 빈도수를 사용한다. 문서 내에서 단어 마다 단어 빈도수와 의미 빈도수를 통해 각 단어의 가중치를 구한다. 본 방법은 단어 사이의 거리, 깊이, 그리고 문서 내의 단어 가중치 3가지를 혼합한 유사도 측정 방법이다. 실험을 통하여 기존의 다른 방법과 성능을 비교하였다. 그 결과 기존 방법에 대비하여 성능의 향상을 가져왔다. 이를 통해 문서 내에서 단어의 가중치를 문서 마다 구할 수 있다. 단순한 최단거리 기반의 방법들과 깊이를 고려한 기존의 방법들은, 정보에 대한 특성을 제대로 표현하지 못했거나 다른 정보를 제대로 융합하지 못했다. 본 논문에서는 최단거리와 깊이 그리고 문서 내에서 단어의 정보량까지 고려하였고, 성능의 개선을 보였다.

유사추론 기반 예측모형

  • 장용식;최윤정
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.581-585
    • /
    • 2007
  • 본 연구는 비선형적인 시계열 자료로부터 최신 데이터와 유사한 사례를 탐색하여 미래를 예측하기 위하여 유사추론 기법을 이용한 예측 알고리즘을 제안한다. 기존의 연구들이 최신 데이터와 과거 사례와의 유사성을 비교하기 위해 유클리디언 거리 또는 평균 제곱에러 등을 이용하나, 추세의 유사성을 고려하지는 않는다. 본 연구는 사례 구간 크기, 예측 오차, 평균차이 검증, 사례간 추세의 유사성 등 다차원적 유사추론 요인을 이용한 예측방법과 그 효과를 제시한다.

  • PDF