• 제목/요약/키워드: 데이터매칭

검색결과 683건 처리시간 0.035초

시계열 거리 계산에서 미리 버림 효과의 최대화 (Maximizing the Early Abandon Effect in Time-Series Distance Computation)

  • 이정곤;김상필;문양세
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1226-1228
    • /
    • 2011
  • 본 논문에서는 유사 시퀀스 매칭에서 미리 버림 계산의 효율적인 방법을 제안한다. 미리 버림은 유사 시퀀스 매칭에서 유클리디안 거리 계산 도중 거리 계산 값이 허용치보다 큰 경우 나머지 거리 계산을 하지 않는 방법이다. 기존의 방법은 시퀀스 첫 엔트리를 시작으로 하여 유클리디안 거리 계산을 진행한다. 이 방법은 데이터 고려 없이 계산이 진행되기 때문에 데이터의 특성에 따라 효과가 크게 다른 점을 보인다. 본 논문에서는 미리 버림의 효과를 최대화 시키기 위해 유클리디안 거리 계산 시작점을 오프셋이라 정의하고, 이를 데이터 특성에 맞게 조절하는 방법을 제안한다. 실험 결과, 제안한 오프셋 조절 미리 버림 방법이 대용량의 데이터 베이스 기반 시스템에서 기존 기법에 비해 좋은 성능 향상시킨 것으로 나타났다.

인덱스 보간법에 기반한 효율적인 서브시퀀스 매칭 기법 (An Efficient Subsequence Matching Method Based on Index Interpolation)

  • 노웅기;김상욱
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.345-354
    • /
    • 2005
  • 서브시퀀스 매칭은 데이터 마이닝 분야에서 중요한 연산 중의 하나이다. 기존의 서브시퀀스 매칭 알고리즘들은 하나의 인덱스만을 사용하여 검색을 수행하며, 인덱스를 생성하기 위하여 데이터 시퀀스로부터 추출한 윈도우의 크기와 질의 시퀀스의 길이 간의 차이가 커질수록 검색 성능이 급격히 저하된다. 본 논문에서는 이러한 문제점을 해결하기 위하여 인덱스 보간법에 기반한 새로운 서브시퀀스 매칭 기법을 제안한다. 인덱스 보간법이란 하나 이상의 인덱스를 구축하고 주어진 질의 시퀀스의 길이에 따라 적절한 인덱스를 선택하여 검색을 수행하는 기법이다. 본 논문에서는 먼저 사전 실험을 통하여 서브시퀀스 매칭을 수행하는 데에 있어 질의 시퀀스 길이와 윈도우 크기 간의 차이로 인한 성능의 변화를 관찰하고, 이 관찰을 통하여 물리적 데이터베이스 설계 관점에서 질의 시퀀스의 길이 분포에 따른 검색 비용 공식을 산출한다. 다음에, 윈도우 크기 효과에 의한 성능 저하를 개선하기 위해 인덱스 보간법에 기반한 새로운 검색 기법을 제안한다. 또한, 검색 비용 공식에 기반하여 제안된 검색 기법의 성능을 최적화할 수 있도록 다수의 인덱스를 구성하는 알고리즘을 제시한다. 마지막으로, 실제 데이터와 합성 데이터를 이용한 여러 가지 실험을 통하여 제안된 기법의 우수성을 검증한다.

위치기반서비스 고도화를 위한 요소 기술 개발

  • 유기윤
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 춘계학술대회
    • /
    • pp.183-183
    • /
    • 2010
  • 위치기반서비스(Location Based Service)는 갈수록 고도화 되어 가고 있다. 특히 최근의 대형 포털을 중심으로 지오웹 서비스가 활성화 되어 있고 이를 스마트폰과 같은 개인용 이용기기를 통해 연속적으로 제공하려는 경향이 뚜렷하다. 이와 같은 시점에서 정부와 민간에서 구축 중이거나 보유 중인 전국적 규모의 데이터 간 상호 연동과 융합을 도모하려는 시도 또한 불가결하다. 이는 고도화된 LBS를 위하여 반드시 필요한 과정이기 때문이다. 이에 따라 몇 가지 주요한 전국 데이터를 대상으로 상호 연동과 융합을 위한 기술개발을 시도하였다. 우선 도로명주소기본도와 수치지형도 간 POI의 연계를 위한 연구를 수행하고 있다. 이 연구에서는 두도면 내의 POI를 대상으로 다양한 매칭과 이에 기반 한 의사결정 방법론을 이용하여 자동으로 상호 인식 및 연계가 될 수 있도록 하고 있다. 다음으로 지적도와 수치지형도 간의 객체 매칭에 관한 연구이다. 수치지형도와 지적도의 불부합으로 인하여 그 동안 지적도를 수치지형도에 맞춘 형태의 편집지적도를 지속적으로 생산하여 왔고 앞으로도 그럴 것이다. 문제는 여기에 필요한 많은 예산이다. 만일 수치지형도와 지적도를 자동으로 매칭하여 편집지적도를 자동으로 생산할 수 있게 된다면 많은 예산 절감과 함께 편집지적도의 현시성을 확보할 수 있게 될 것이다. 다음으로 항공사진과 도로망도의 매칭이다. 현재 주요 포털에서 제공하고 있는 항공사진 기반의 도로망도는 기복변위와 같은 문제로 인하여 시각적으로 많은 위치오차를 보이고 있다. 만일 항공사진의 도로영역을 자동으로 추출하여 벡터 도로망도와 매칭을 할 수 있다면 보다 시각적으로 안정된 항공사진 상의 도로망도를 제공할 수 있게 되고 나아가 이는 차량이나 보행자 네비게이션에 매우 요긴하게 이용될 수 있을 것이다. 다음으로 서로 LOD가 다른 도로망도의 매칭 문제이다. 많은 기관에서 독자적으로 생산한 도로망도는 LOD의 상이에 기인한 문제가 많아 서로 연계 활용되지 않는다. 이를 자동으로 매칭하여 서로 연계할 수 있다면 두 도로망도가 보유하고 있는 속성정보를 공동으로 이용할 수 있는 이익을 얻게 된다. 다음으로 지도 일반화 기술이다. 지도일반화는 지적도내 수치지형도와 같은 대규모 데이터를 스마트폰과 같은 저용량 사양의 기기에 서비스 할 때 불가결한 기술이다. 지도상 객체들의 기하학적 정보 손실을 최소화하면서 메모리 측면에서 경량의 지도를 자동으로 만들어 낸다면 이는 매우 요긴하게 이용될 것이다. 마지막으로 보행자 네트워크의 생성기술이다. 보행자 네트워크는 그 상세함과 정보용량에 있어서 차량용 네트워크에 견줄 수 없다. 이를 현행의 차량용 네트워크와 같이 수동으로 생성하는 데에는 경제적으로나 시간적으로 막대한 투자가 필요하다. 따라서 이를 기존의 공간정보들을 활용하여 자동으로 생성해 낼 수 있다면 그 파급효과는 매우 크리라 판단된다. 본 발표에서는 위와 같은 주제에 관하여 그간의 연구 성과를 개략적으로 소개해본다.

  • PDF

산업용 CT 볼륨데이터에서 템플릿 매칭을 통한 이물질 자동 검출 (Automatic Detection of Foreign Body through Template Matching in Industrial CT Volume Data)

  • 지혜림;홍헬렌
    • 한국멀티미디어학회논문지
    • /
    • 제16권12호
    • /
    • pp.1376-1384
    • /
    • 2013
  • 본 논문에서는 산업용 CT 볼륨데이터에서 템플릿 매칭을 통하여 제품의 이물질을 자동 검출하는 기법을 제안한다. 제안방법은 다음과 같은 세 단계로 이루어진다. 첫째, 다운 샘플링 데이터에서 잡음제거 후 제품을 배경과 분리하고, 영상의 평균값 및 표준편차를 이용하여 초기 이물질 후보를 추출한 후, K-평균 클러스터링을 이용하여 이물질 후보를 추출한다. 둘째, 템플릿 매칭을 이용하여 제품과 유사도가 다른 이물질을 검출한다. 이 때, 검출하고자 하는 이물질의 크기에 따라 밝기값평균차이(SSD)와 조인트 엔트로피를 이용한 유사도 평가를 통하여 이물질을 검출한다. 셋째, 원 볼륨데이터에서 이물질 검출률을 개선하기 위하여 여과기법으로 제품의 이물질을 최종 검출한다. 본 제안 방법의 결과를 평가하기 위해 산업용 CT 볼륨데이터와 시뮬레이션 데이터를 사용하여 육안평가, 정확성 평가와 수행시간 측정을 수행하였다. 정확성 평가를 위하여 기존 밝기값 기반 검출 기법을 비교방법으로 사용하고, 다이스 계수 유사도를 측정하였다.

Index-based Boundary Matching Supporting Partial Denoising for Large Image Databases

  • Kim, Bum-Soo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.91-99
    • /
    • 2019
  • 본 논문에서는 대용량 이미지 데이터베이스에서 보다 빠른 매칭을 위한 색인 기반의 부분 노이즈 제거 윤곽선 매칭을 제안한다. 최근에는 윤곽선 매칭에서 부분 노이즈제거 문제를 해결하기 위해 윤곽선 이미지를 시계열로 변환하는 시도가 있어 왔다. 본 논문에서는 대용량 이미지 데이터베이스에서 부분 노이즈제거를 지원하기 위해 윤곽선 매칭의 디스크 I/O 오버헤드 문제를 다룬다. 이는 색인 기술을 윤곽선 매칭에 단순히 적용하면 되기 때문에 단순해 보이지만 가능한 모든 노이즈제거 매개변수에 대해 여러 개의 색인이 필요하기 때문에 어려운 문제이다. 이 문제를 해결하기 위해 본 논문에서는 윤곽선 매칭에서 $R^*-tree$를 사용하여 부분 노이즈제거에 대한 효율적인 색인 기반 접근 방식을 제안한다. 수행 된 실험 결과, 제안한 색인 기반 매칭 방법은 검색 성능을 수백 배 향상시킨다.

KT 변환과 템플릿매칭을 이용한 얼굴 인식 방법 (Comparative Study on the Recognition of Face Image Using the KL transform and the Template Matching)

  • 강환일;송영기;이세영;정요원
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.301-305
    • /
    • 1999
  • 얼굴인식의 방법 중 하나인 전체얼굴에 대한 인식 방법으로, 고유벡터를 이용한 인식 방법과 템플릿 매칭을 이용한 방법의 차이점을 비교 연구한다. 고유벡터를 이용한 방법은 얼굴 영상에 대한 벡터공간을 얻은 후 각 얼굴 영상을 구별할 수 있는 공간에 대한 투영을 통하여 인식에 이용한다. 템플릿 매칭에 기반한 방법은 몇가지 유사도 정의를 이용한 것이다. 또한 얼굴 영상에 대한 전처리 과정이 인식에 끼치는 영향도 분석한다. 본 논문은 두가지의 얼굴 영상 인식기술의 비교를 통하여 얼굴 영상의 인식에 대한 유용한 도구로서 에지영상을 이용한 KL변환 방법이 더 우수함을 보인다.

  • PDF

심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 (Question Retrieval using Deep Semantic Matching for Community Question Answering)

  • 김선훈;장헌석;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

칼라 매칭을 위한 지능형 전문 시스템의 구현 (Implementation of Intelligent Expert System for Color Matching)

  • 장경원;이종석;안태천;윤양웅
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 D
    • /
    • pp.2768-2770
    • /
    • 2001
  • 본 논문은 지능형 알고리즘과 이미지 프로세싱 방법을 결합한 새로운 방법으로 칼라 매칭 시스템에 구현한다. 칼라 매칭 시스템은 이미지 프로세싱을 이용하여 칼라의 RGB 데이터를 분석한 후 얻어진 색상정보를 가지고 사용자가 원하는 칼라는 구현하는 시스템이다. 칼라 매칭 시스템의 모델링에 이용되는 지능형 모델은 퍼지 추론과 적응 퍼지 추론 시스템(Adaptive Neuro-Fuzzy Inference System: ANFIS)이며, 최소 자승법을 기반으로 한 회귀 다항식과 비교하여 제안된 지능형 모델에 대한 성능과 실용성을 검증한 후 델파이를 이용하여 구현하였다.

  • PDF

딥러닝 감정 인식 기반 배경음악 매칭 설계 (Design for Mood-Matched Music Based on Deep Learning Emotion Recognition)

  • 정문식;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.834-836
    • /
    • 2021
  • 멀티모달 감정인식을 통해 사람의 감정을 정확하게 분류하고, 사람의 감정에 어울리는 음악을 매칭하는 시스템을 설계한다. 멀티모달 감정 인식 방법으로는 IEMOCAP(Interactive Emotional Dyadic Motion Capture) 데이터셋을 활용해 감정을 분류하고, 분류된 감정의 분위기에 맞는 음악을 매칭시키는 시스템을 구축하고자 한다. 유니모달 대비 멀티모달 감정인식의 정확도를 개선한 시스템을 통해 텍스트, 음성, 표정을 포함하고 있는 동영상의 감성 분위기에 적합한 음악 매칭 시스템을 연구한다.

이종의 도로망 데이터 셋에서 면 객체 매칭 기반 변화탐지 (Automatic Change Detection Based on Areal Feature Matching in Different Network Data-sets)

  • 김지영;허용;유기윤;김정옥
    • 한국측량학회지
    • /
    • 제31권6_1호
    • /
    • pp.483-491
    • /
    • 2013
  • 차량용 내비게이션의 빠른 확산과 스마트폰 등 개인 단말기의 측위 기술 발달로 사용자 중심위치기반서비스, 특히 보행자 내비게이션 서비스에 대한 관심이 증대되고 있다. 보행자 내비게이션 서비스를 위한 핵심정보인 수치지도는 대용량이고 짧은 갱신주기를 요구하는 경우가 많아 수치지도의 효율적인 갱신이 중요한 이슈가 된다. 본 연구에서는 구축시기가 상이한 이종의 도로망 데이터 셋에 형상유사도 기반 면 객체 매칭을 적용하여 변화 탐지하는 기법을 제안하였다. 변화탐지에 앞서 이종의 도로망 데이터 셋의 면 객체 매칭에서 탐지될 수 있는 갱신 유형을 정의하였다. 면 객체 매칭 기반 변화 탐지를 위하여 이종의 두 도로망 데이터 셋의 선형인 도로객체를 이들로 둘러싸인 면인 블록으로 변환하였다. 변환된 블록을 중첩하여 중첩된 블록 간의 형상유사도를 계산하고, 이 값이 0.6 이상인 것을 후보 블록 쌍으로 추출하였다. 객체 유형별로 이분 그래프 군집화와 오목다각형 특성을 적용하여 정의된 갱신유형별 블록 쌍을 탐지하고, 해당 블록 쌍을 구성하거나 내부에 있는 도로 세그먼트 간의 프레셰 거리를 계산하였다. 이때, 프레셰 거리가 50 이상인 도로명주소기본도 도로구간의 도로객체가 갱신 도로객체로 추출된다. 그 결과 0.965의 높은 탐색율을 보여 제안된 기법이 이종의 도로망 데이터 셋의 선형 객체의 변화탐지에 적용될 수 있음을 확인할 수 있었다.