• 제목/요약/키워드: 데이터매칭

검색결과 682건 처리시간 0.028초

구조적 차이를 고려한 서브 그래프 매칭을 위한 요약 색인 기법 (Summary Indexing Scheme for Subgraph Matching Considering Structural Differences)

  • 최도진;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.447-448
    • /
    • 2019
  • 생명 공학 분야에서는 노이즈가 많고 불완전한 데이터 집합의 사용이 많이 이루어진다. 불완전한 그래프에서 구조적 차이를 고려한 근사 서브 그래프 매칭에 대한 활용이 이루어지고 있다. 본 논문에서는 기존 기법에서 모든 데이터 및 경우의 수를 색인하는 과도한 색인 문제와 계산 비용 감소를 위한 요약 색인 기법을 제안한다. 구조적 차이 정보를 저장하기 위해서 특정 정점간의 최단 거리 값을 관리하고, 색인 부하 감소 및 일관성을 위해 요약 색인에 대한 간결화 작업을 수행한다.

  • PDF

은닉 마코프 모델을 이용한 시계열 데이터의 의미기반 패턴 매칭 (Conceptual Pattern Matching of Time Series Data using Hidden Markov Model)

  • 조영희;전진호;이계성
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.44-51
    • /
    • 2008
  • 시계열 데이터에서 패턴을 찾고 검색하는 문제는 여러 분야에서 오랫동안 관심을 가지고 연구되어 왔다. 본 논문은 시간의 흐름에 따라 값의 변화를 나타내는 시계열 형태의 주식 데이터에 적용할 수 있는 새로운 패턴 매칭 방법을 제안한다. 우선, 의미를 기반으로 패턴을 정의하고 정의된 패턴에 일치하는 데이터들을 추출하여 학습모델을 작성한다. 그리고 새로운 질의 시퀀스가 어떤 종류의 패턴과 일치하는가는 각 학습 모델과의 유사도를 측정하여 결정하게 된다. 학습 모델은 시계열을 잘 설명하는 것으로 알려진 은닉 마코프 모델을 사용하여 작성하였다. 실험 결과 은닉 마코프 모델의 특성을 사용하여 생성된 각 학습 모델은 주어진 의미를 잘 나타내는 패턴을 생성하였으며, 새로운 시퀀스가 주어졌을 때 일치하는 패턴에 따라서 시퀀스가 가진 의미를 파악할 수 있었다.

시계열 데이터 기반의 부분 노이즈 제거 윤곽선 이미지 매칭 (Partial Denoising Boundary Image Matching Based on Time-Series Data)

  • 김범수;이상훈;문양세
    • 정보과학회 논문지
    • /
    • 제41권11호
    • /
    • pp.943-957
    • /
    • 2014
  • 윤곽선 이미지 매칭에서 이미지의 노이즈를 제거하는 것은 직관적이고 정확한 매칭을 위해 매우 중요한 요소이다. 본 논문에서는 윤곽선 이미지 매칭에서 부분 노이즈를 허용하는 문제를 시계열 도메인에서 다룬다. 이를 위해, 먼저 부분 노이즈 제거 시계열(partial denoising time-series)을 정의하여 이미지 도메인이 아닌 시계열 도메인에서 매칭 문제를 신속하게 해결하는 방법을 제안한다. 다음으로, 두 윤곽선 이미지, 즉 질의 시계열과 데이터 시계열에서 구성된 부분 노이즈 제거 시계열들 간에 가질 수 있는 최소거리인 부분 노이즈 제거 거리(partial denoising distance)를 제시한다. 본 논문에서는 이를 두 윤곽선 이미지 간의 유사성 척도로 사용하여 윤곽선 이미지 매칭을 수행한다. 그러나, 부분 노이즈 제거 거리를 측정하기 위해서는 매우 많은 계산이 빈번하게 발생하므로, 본 논문에서는 부분 노이즈 제거 거리의 하한을 구하는 방법을 제안한다. 마지막으로, 부분 노이즈 제거 윤곽선 이미지 매칭의 질의 방식에 따라 범위 질의 매칭과 k-NN 질의 매칭을 각각 제안한다. 실험 결과, 제안한 부분 노이즈 제거 윤곽선 이미지 매칭은 성능을 수 배에서 수십 배까지 향상시킨 것으로 나타났다.

주성분 분석을 통한 포인트 클라우드 굽은 실린더 형태 매칭 (Matching for the Elbow Cylinder Shape in the Point Cloud Using the PCA)

  • 진영훈
    • 정보과학회 논문지
    • /
    • 제44권4호
    • /
    • pp.392-398
    • /
    • 2017
  • 포인트 클라우드를 이용한 물체의 표현은 레이저 스캐너를 통해 공간을 스캔하여 점의 집합을 추출하고, 정합(Registration)을 통해 하나의 좌표계로 통합하는 과정을 거쳐 이루어진다. 정합이 완료된 포인트 클라우드 집합은 수학적 해석을 통해 의미 있는 영역, 형태, 잡음 등으로 분류되어 쓰이게 된다. 본 논문은 3차원 포인트 클라우드 데이터에서 실린더 형태의 굽은 영역 매칭을 목표로 한다. 매칭 절차는 포인트 클라우드에서 RANdom SAmple Consensus(RANSAC)을 통한 구(sphere) 적합(fitting)으로 실린더 형태의 점 후보군을 추출하여 중심과 반지름 데이터를 얻고, 추출된 중심점 데이터에서 주성분 분석(Principal Component Analysis)을 통해 굽은 영역인지 판별한 후 캣멀롬 스플라인(Catmull-Rom spline)으로 굽은 영역 매칭을 완료한다. 제안된 방법은 제약조건 및 분할 없이 중심축 추정에 이은 직선 및 굽은 형태의 실린더 추정으로 비교적 빠른 추정결과를 도출하고, 역설계의 작업효율을 높일 수 있을 것으로 기대된다.

시계열 데이터베이스에서 인덱스 보간법을 기반으로 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘 (An Index Interpolation-based Subsequence Matching Algorithm supporting Normalization Transform in Time-Series Databases)

  • 노웅기;김상욱;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.217-232
    • /
    • 2001
  • 본 논문에서는 시계열 데이터베이스에서 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 정규화 변환을 시계열 데이터 간의 절대적인 유클리드 거리에 관계 없이, 구성하는 값들의 상대적인 변화 추이가 유사한 패턴을 갖는 시계열 데이터를 검색하는 데에 유용하다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 정규화 변환 서브시퀀스 매칭에 단순히 응용할 경우, 질의 결과로 반환되어야 할 서부시퀀스를 모두 찾아내지 못하는 착오 기각이 발생한다. 또한, 정규화 변환을 지원하는 기존의 전체 매칭 알고리즘의 경우, 모든 가능한 질의 시퀀스 길이 각각에 대하여 하나씩의 인덱스를 생성하여야 하므로, 저장 공간 및 데이터 시퀀스 삽입/삭제의 부담이 매우 심각하다. 본 논문에서는 인덱스 보간법을 이용하여 문제를 해결한다. 인덱스 보간법은 인덱스가 요구되는 모든 경우 중에서 적당한 간격의 일부에 대해서만 생성된 인덱스를 이용하며, 인덱스가 필요한 모든 경우에 대한 탐색을 수행하는 기법이다. 제안된 알고리즘은 몇 개의 질의 시퀀스 길이에 대해서만 각각 인덱스를 생성한 후, 이를 이용하여 모든 가능한 길이의 질의 시퀀스에 대해서 탐색을 수행한다. 이때, 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 질의 시에 주어진 질의 시퀀스의 길이에 따라 생성되어 있는 인덱스 중에서 가장 적절한 것을 선택하여 탐색을 수행한다. 이때, 생성되어 있는 인덱스의 개수가 많을수록 탐색 성능이 향상된다. 필요에 따라 인덱스의 개수를 변화함으로써 탐색 성능과 저장 공간 간의 비율을 유연하게 조정할 수 있다. 질의 시퀀스의 길이 256 ~ 512중 다섯 개의 길이에 대해 인덱스를 생성하여 실험한 결과, 탐색 결과 선택률이 $10^{-2}$일 때 제안된 알고리즘의 탐색 성능이 순차 검색에 비하여 평균 2.40배, 선택률이 $10^{-5}$일 때 평균 14.6배 개선되었다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 더욱 향상되므로, 실제 데이터베이스 응용에서의 효용성이 높다고 판단된다.

  • PDF

집합 유사 시퀀스 매칭의 성능 향상을 위한 인덱스 기반 검색 방법 (An Index-Based Search Method for Performance Improvement of Set-Based Similar Sequence Matching)

  • 이주원;임효상
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.507-520
    • /
    • 2017
  • 집합 유사 시퀀스 매칭 방법은 유사한 정도를 나타내는 척도로 교집합을 기반으로 한 유사도를 사용한다. 그러나 교집합 크기를 계산하는 과정에 시간이 오래 걸릴 뿐만 아니라, 유사한 시퀀스를 찾기 위해서 수많은 집합 간 교집합 크기를 구해야 하므로 수행 시간이 오래 걸리는 성능상의 문제가 있다. 본 논문에서는 이러한 성능상의 문제를 해결하기 위해 인덱스 기반의 검색 방법을 사용하여 집합 기반 유사 시퀀스 매칭을 빠르게 수행하는 방법을 제안한다. 제안하는 방법은 크게 두가지로 구분된다. 첫 번째로 집합 시퀀스 유사도 문제를 교집합의 크기 비교 문제로 정형적으로 변환하고, 교집합의 크기를 빠르게 찾을 수 있는 인덱스 구조를 제안한다. 두 번째로 제안한 인덱스 구조를 사용하여 집합 기반 유사 시퀀스 매칭을 효율적으로 수행할 수 있는 방법을 제안한다. 성능 평가 결과, 제안하는 방법이 기존 방법에 비해 최대 30배에서 50배의 수행 시간 단축이 있음을 보인다. 또한 데이터 시퀀스의 개수가 증가할수록 수행시간의 차이가 점점 커지므로, 대용량 데이터 처리에 적절함을 보인다.

방송용 스포츠 경기 비디오에서 제스처의 자동 추출 (Automatic Spotting of Gestures in Broadcast Sports Videos)

  • 노명철;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.841-843
    • /
    • 2005
  • 비디오 데이터 분석은 감시, 검색, 스포츠 경기 자동 요약 등 많은 분야에서 사용되는 기술이다. 그러나 감시 카메라나 스포츠 경기 비디오와 같이 사람의 영역이 저해상도인 환경에서는 포즈 추정, 모델과의 매칭이 어렵기 때문에 제스처 인식 연구는 많이 이루어지고 있지 못하다. 본 논문에서는 카메라가 Pan/Tilt/Zoom 동작을 하고 사람이 빠르게 움직이는 방송용 테니스 비디오에서, 사람을 추출하고, Curvature Scale Space를 기반으로 한 특징을 추출하여 학습된 포즈 모델과 매칭하는 방법과, 차원의 축소를 통해 일련의 포즈들을 학습된 제스처와 매칭하는 방법을 제안한다. 50개의 방송용 테니스 경기 비디오 장면에 대하여 서브 제스처 추출을 수행한 결과, 서브 포즈에 대하여 모델과 매칭이 잘 되고, 매칭이 되지 않는 포즈를 포함하는 시퀀스에 대해서도 강인한

  • PDF

부분 매칭 방법을 이용한 효율적인 서식 문서 분류 (Efficient From Document Classification Large using Partial Matching Method)

  • 변영철;최영우;김경환;이일병
    • 정보처리학회논문지B
    • /
    • 제8B권1호
    • /
    • pp.1-9
    • /
    • 2001
  • 본 논문에서는 서식 문서를 짧은 처리 시간에 정확히 분류함으로써 실제 환경에서 응용할 수 있는 서식 분류 방법을 제안한다. 제안하는 방법은 서식 문서 이미지 전체를 다루기보다는 처리하고자 하는 서식 문서에서 서식 구조가 많이 다른 곳을 찾아서 매칭 영역으로 결정하고, 그 영역들에 대해서만 비교를 수행함으로써 계산 시간을 줄이고 인식률을 높인다. 선분 추출 시 오류를 고려하기 위하여 기존 인쇄 문자와 채워진 데이터, 그리고 매칭 영역의 크기 정보를 페널티 함수로 반영하여 매칭 영역 선택 시 고려한다. 본 방법은 구조적으로 많이 다르고, 양질의 특징을 포함하는 적은 수의 매칭 영역을 선택함으로써 처리 시간을 줄일 수 있음은 물론 높은 서식 분류율을 얻을 수 있다.

  • PDF

윈도우-초인: 이원성 기반 서브시퀸스 매칭을 위한 최적의 방법 (Window-Join: An Optimal Way to Process Duality-Based Subsequence Matchi)

  • 김상욱;박대현;이헌길;김만순;박정일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.184-186
    • /
    • 2001
  • 본 논문에서는 시계열 데이터베이스에서 서브시퀸스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 본 논문에서는 먼저, 기존의 이원성 기반 서브시퀸스 매칭 기법에서 발생하는 성능상의 문제점들을 지적하고, 이들을 해결할 수 있는 방법을 제시한다. 제안된 기법은 서브시퀸스 매칭 시 요구되는 인덱스 검색을 윈도우-조인이라는 일종의 공간 조인 문제로 새롭게 해석하는 것에서 출발한다. 제안된 기법에서는 효과적인 윈도우-조인의 처리를 위하여 질의 윈도우 점들을 위한 R*-트리를 주기억장치 내에 on-the-fly로 구성하는 방법을 사용한다. 또한, 데이터 윈도우 점들을 위한 디스크 상의 R*-트리와 질 윈도우 점들을 위한 주기억장치 상의 R*-트리를 효과적으로 조인할 수 있는 새로운 알고리즘을 제안한다. 제안된 기법은 R*-트리 페이지들을 착오 채택 없이 단 한번만 디스크로부터 액세스 측면에서 이원성 기반 서브시퀸스 매칭을 위한 최적의 기법이다.

  • PDF

택시 텔레매틱스 상에서 쉐이프 파일에 기반한 맵 매칭 모듈의 구현 (Implementation of a map matching module based on the shape file for the Taxi telematics system)

  • 이정훈;홍영신;박경린;신인혜;강지애
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1222-1223
    • /
    • 2008
  • 본 논문에서는 1분에 최대 200 개의 위치보고를 처리하여야 하는 제주 택시 텔레매틱스 시스템에서 보다 효율적인 트래킹과 택시 배차를 위해 맵 매칭에 의해 차량이 위치한 도로를 검색하는 모듈을 설계하고 구현한다. 구현된 모듈은 위치기반 서비스에 있어서 저비용 효율적으로 맵 매칭을 구현하기 위해 쉐이프 파일을 직접 순차적으로 처리하고 보고지점과 세그먼트들로 이루어진 삼각형의 면적을 기반으로 매칭 링크를 검색한다. 이 기능은 차량의 진행방향을 판단하거나 도로 내에서의 위치 비율을 계산하는데 용이하며 다양한 부가 정보를 생성할 수 있다. 구현된 시스템에서 실제 히스토리 데이터에 대해 맵 매칭을 수행한 결과 95% 이상 해당 링크를 검색하였다.