• Title/Summary/Keyword: 데이터 매칭

Search Result 682, Processing Time 0.027 seconds

Maximizing the Early Abandon Effect in Time-Series Distance Computation (시계열 거리 계산에서 미리 버림 효과의 최대화)

  • Lee, Jeong-Gon;Kim, Sang-Pil;Moon, Yang-Sae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1226-1228
    • /
    • 2011
  • 본 논문에서는 유사 시퀀스 매칭에서 미리 버림 계산의 효율적인 방법을 제안한다. 미리 버림은 유사 시퀀스 매칭에서 유클리디안 거리 계산 도중 거리 계산 값이 허용치보다 큰 경우 나머지 거리 계산을 하지 않는 방법이다. 기존의 방법은 시퀀스 첫 엔트리를 시작으로 하여 유클리디안 거리 계산을 진행한다. 이 방법은 데이터 고려 없이 계산이 진행되기 때문에 데이터의 특성에 따라 효과가 크게 다른 점을 보인다. 본 논문에서는 미리 버림의 효과를 최대화 시키기 위해 유클리디안 거리 계산 시작점을 오프셋이라 정의하고, 이를 데이터 특성에 맞게 조절하는 방법을 제안한다. 실험 결과, 제안한 오프셋 조절 미리 버림 방법이 대용량의 데이터 베이스 기반 시스템에서 기존 기법에 비해 좋은 성능 향상시킨 것으로 나타났다.

An Efficient Subsequence Matching Method Based on Index Interpolation (인덱스 보간법에 기반한 효율적인 서브시퀀스 매칭 기법)

  • Loh Woong-Kee;Kim Sang-Wook
    • The KIPS Transactions:PartD
    • /
    • v.12D no.3 s.99
    • /
    • pp.345-354
    • /
    • 2005
  • Subsequence matching is one of the most important operations in the field of data mining. The existing subsequence matching algorithms use only one index, and their performance gets worse as the difference between the length of a query sequence and the site of windows, which are subsequences of a same length extracted from data sequences to construct the index, increases. In this paper, we propose a new subsequence matching method based on index interpolation to overcome such a problem. An index interpolation method constructs two or more indexes, and performs search ing by selecting the most appropriate index among them according to the given query sequence length. In this paper, we first examine the performance trend with the difference between the query sequence length and the window size through preliminary experiments, and formulate a search cost model that reflects the distribution of query sequence lengths in the view point of the physical database design. Next, we propose a new subsequence matching method based on the index interpolation to improve search performance. We also present an algorithm based on the search cost formula mentioned above to construct optimal indexes to get better search performance. Finally, we verify the superiority of the proposed method through a series of experiments using real and synthesized data sets.

위치기반서비스 고도화를 위한 요소 기술 개발

  • Yu, Gi-Yun
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.06a
    • /
    • pp.183-183
    • /
    • 2010
  • 위치기반서비스(Location Based Service)는 갈수록 고도화 되어 가고 있다. 특히 최근의 대형 포털을 중심으로 지오웹 서비스가 활성화 되어 있고 이를 스마트폰과 같은 개인용 이용기기를 통해 연속적으로 제공하려는 경향이 뚜렷하다. 이와 같은 시점에서 정부와 민간에서 구축 중이거나 보유 중인 전국적 규모의 데이터 간 상호 연동과 융합을 도모하려는 시도 또한 불가결하다. 이는 고도화된 LBS를 위하여 반드시 필요한 과정이기 때문이다. 이에 따라 몇 가지 주요한 전국 데이터를 대상으로 상호 연동과 융합을 위한 기술개발을 시도하였다. 우선 도로명주소기본도와 수치지형도 간 POI의 연계를 위한 연구를 수행하고 있다. 이 연구에서는 두도면 내의 POI를 대상으로 다양한 매칭과 이에 기반 한 의사결정 방법론을 이용하여 자동으로 상호 인식 및 연계가 될 수 있도록 하고 있다. 다음으로 지적도와 수치지형도 간의 객체 매칭에 관한 연구이다. 수치지형도와 지적도의 불부합으로 인하여 그 동안 지적도를 수치지형도에 맞춘 형태의 편집지적도를 지속적으로 생산하여 왔고 앞으로도 그럴 것이다. 문제는 여기에 필요한 많은 예산이다. 만일 수치지형도와 지적도를 자동으로 매칭하여 편집지적도를 자동으로 생산할 수 있게 된다면 많은 예산 절감과 함께 편집지적도의 현시성을 확보할 수 있게 될 것이다. 다음으로 항공사진과 도로망도의 매칭이다. 현재 주요 포털에서 제공하고 있는 항공사진 기반의 도로망도는 기복변위와 같은 문제로 인하여 시각적으로 많은 위치오차를 보이고 있다. 만일 항공사진의 도로영역을 자동으로 추출하여 벡터 도로망도와 매칭을 할 수 있다면 보다 시각적으로 안정된 항공사진 상의 도로망도를 제공할 수 있게 되고 나아가 이는 차량이나 보행자 네비게이션에 매우 요긴하게 이용될 수 있을 것이다. 다음으로 서로 LOD가 다른 도로망도의 매칭 문제이다. 많은 기관에서 독자적으로 생산한 도로망도는 LOD의 상이에 기인한 문제가 많아 서로 연계 활용되지 않는다. 이를 자동으로 매칭하여 서로 연계할 수 있다면 두 도로망도가 보유하고 있는 속성정보를 공동으로 이용할 수 있는 이익을 얻게 된다. 다음으로 지도 일반화 기술이다. 지도일반화는 지적도내 수치지형도와 같은 대규모 데이터를 스마트폰과 같은 저용량 사양의 기기에 서비스 할 때 불가결한 기술이다. 지도상 객체들의 기하학적 정보 손실을 최소화하면서 메모리 측면에서 경량의 지도를 자동으로 만들어 낸다면 이는 매우 요긴하게 이용될 것이다. 마지막으로 보행자 네트워크의 생성기술이다. 보행자 네트워크는 그 상세함과 정보용량에 있어서 차량용 네트워크에 견줄 수 없다. 이를 현행의 차량용 네트워크와 같이 수동으로 생성하는 데에는 경제적으로나 시간적으로 막대한 투자가 필요하다. 따라서 이를 기존의 공간정보들을 활용하여 자동으로 생성해 낼 수 있다면 그 파급효과는 매우 크리라 판단된다. 본 발표에서는 위와 같은 주제에 관하여 그간의 연구 성과를 개략적으로 소개해본다.

  • PDF

Automatic Detection of Foreign Body through Template Matching in Industrial CT Volume Data (산업용 CT 볼륨데이터에서 템플릿 매칭을 통한 이물질 자동 검출)

  • Ji, Hye-Rim;Hong, Helen
    • Journal of Korea Multimedia Society
    • /
    • v.16 no.12
    • /
    • pp.1376-1384
    • /
    • 2013
  • In this paper, we propose an automaticdetection method of foreign bodies through template matching in industrial CT volume data. Our method is composed of three main steps. First,Indown-sampling data, the product region is separated from background after noise reduction and initial foreign-body candidates are extracted using mean and standard deviation of the product region. Then foreign-body candidates are extracted using K-means clustering. Second, the foreign body with different intensity of product region is detected using template matching. At this time, the template matching is performed by evaluating SSD orjoint entropy according to the size of detected foreign-body candidates. Third, to improve thedetection rate of foreign body in original volume data, final foreign bodiesare detected using percolation method. For the performance evaluation of our method, industrial CT volume data and simulation data are used. Then visual inspection and accuracy assessment are performed and processing time is measured. For accuracy assessment, density-based detection method is used as comparative method and Dice's coefficient is measured.

Index-based Boundary Matching Supporting Partial Denoising for Large Image Databases

  • Kim, Bum-Soo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.24 no.10
    • /
    • pp.91-99
    • /
    • 2019
  • In this paper, we propose partial denoising boundary matching based on an index for faster matching in very large image databases. Attempts have recently been made to convert boundary images to time-series with the objective of solving the partial denoising problem in boundary matching. In this paper, we deal with the disk I/O overhead problem of boundary matching to support partial denoising in a large image database. Although the solution to the problem superficially appears trivial as it only applies indexing techniques to boundary matching, it is not trivial since multiple indexes are required for every possible denoising parameters. Our solution is an efficient index-based approach to partial denoising using $R^*-tree$ in boundary matching. The results of experiments conducted show that our index-based matching methods improve search performance by orders of magnitude.

Comparative Study on the Recognition of Face Image Using the KL transform and the Template Matching (KT 변환과 템플릿매칭을 이용한 얼굴 인식 방법)

  • 강환일;송영기;이세영;정요원
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.301-305
    • /
    • 1999
  • 얼굴인식의 방법 중 하나인 전체얼굴에 대한 인식 방법으로, 고유벡터를 이용한 인식 방법과 템플릿 매칭을 이용한 방법의 차이점을 비교 연구한다. 고유벡터를 이용한 방법은 얼굴 영상에 대한 벡터공간을 얻은 후 각 얼굴 영상을 구별할 수 있는 공간에 대한 투영을 통하여 인식에 이용한다. 템플릿 매칭에 기반한 방법은 몇가지 유사도 정의를 이용한 것이다. 또한 얼굴 영상에 대한 전처리 과정이 인식에 끼치는 영향도 분석한다. 본 논문은 두가지의 얼굴 영상 인식기술의 비교를 통하여 얼굴 영상의 인식에 대한 유용한 도구로서 에지영상을 이용한 KL변환 방법이 더 우수함을 보인다.

  • PDF

Question Retrieval using Deep Semantic Matching for Community Question Answering (심층적 의미 매칭을 이용한 cQA 시스템 질문 검색)

  • Kim, Seon-Hoon;Jang, Heon-Seok;Kang, In-Ho
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

Implementation of Intelligent Expert System for Color Matching (칼라 매칭을 위한 지능형 전문 시스템의 구현)

  • Jang, Kyung-Won;Lee, Jong-Seok;Ahn, Tae-Chon;Yoon, Yang-Woong
    • Proceedings of the KIEE Conference
    • /
    • 2001.07d
    • /
    • pp.2768-2770
    • /
    • 2001
  • 본 논문은 지능형 알고리즘과 이미지 프로세싱 방법을 결합한 새로운 방법으로 칼라 매칭 시스템에 구현한다. 칼라 매칭 시스템은 이미지 프로세싱을 이용하여 칼라의 RGB 데이터를 분석한 후 얻어진 색상정보를 가지고 사용자가 원하는 칼라는 구현하는 시스템이다. 칼라 매칭 시스템의 모델링에 이용되는 지능형 모델은 퍼지 추론과 적응 퍼지 추론 시스템(Adaptive Neuro-Fuzzy Inference System: ANFIS)이며, 최소 자승법을 기반으로 한 회귀 다항식과 비교하여 제안된 지능형 모델에 대한 성능과 실용성을 검증한 후 델파이를 이용하여 구현하였다.

  • PDF

Design for Mood-Matched Music Based on Deep Learning Emotion Recognition (딥러닝 감정 인식 기반 배경음악 매칭 설계)

  • Chung, Moonsik;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.834-836
    • /
    • 2021
  • 멀티모달 감정인식을 통해 사람의 감정을 정확하게 분류하고, 사람의 감정에 어울리는 음악을 매칭하는 시스템을 설계한다. 멀티모달 감정 인식 방법으로는 IEMOCAP(Interactive Emotional Dyadic Motion Capture) 데이터셋을 활용해 감정을 분류하고, 분류된 감정의 분위기에 맞는 음악을 매칭시키는 시스템을 구축하고자 한다. 유니모달 대비 멀티모달 감정인식의 정확도를 개선한 시스템을 통해 텍스트, 음성, 표정을 포함하고 있는 동영상의 감성 분위기에 적합한 음악 매칭 시스템을 연구한다.

Automatic Change Detection Based on Areal Feature Matching in Different Network Data-sets (이종의 도로망 데이터 셋에서 면 객체 매칭 기반 변화탐지)

  • Kim, Jiyoung;Huh, Yong;Yu, Kiyun;Kim, Jung Ok
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.31 no.6_1
    • /
    • pp.483-491
    • /
    • 2013
  • By a development of car navigation systems and mobile or positioning technology, it increases interest in location based services, especially pedestrian navigation systems. Updating of digital maps is important because digital maps are mass data and required to short updating cycle. In this paper, we proposed change detection for different network data-sets based on areal feature matching. Prior to change detection, we defined type of updating between different network data-sets. Next, we transformed road lines into areal features(block) that are surrounded by them and calculated a shape similarity between blocks in different data-sets. Blocks that a shape similarity is more than 0.6 are selected candidate block pairs. Secondly, we detected changed-block pairs by bipartite graph clustering or properties of a concave polygon according to types of updating, and calculated Fr$\acute{e}$chet distance between segments within the block or forming it. At this time, road segments of KAIS map that Fr$\acute{e}$chet distance is more than 50 are extracted as updating road features. As a result of accuracy evaluation, a value of detection rate appears high at 0.965. We could thus identify that a proposed method is able to apply to change detection between different network data-sets.