• 제목/요약/키워드: 데이터매칭

검색결과 683건 처리시간 0.032초

시퀀스 데이터베이스를 위한 유연 규칙 매칭 (Matching of Elastic Rules in Sequence Databases)

  • 박상현;;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.57-60
    • /
    • 2001
  • 본 논문에서는 유연 패턴(elastic pattern)을 갖는 규칙(rule)을 탐사하고 매칭하는 기법에 대해 논의한다. 유연 패턴은 시간 축으로 확장 및 수축할 수 있는 요소들의 순서화된 리스트이다. 유연 패턴은 서로 다른 샘플링 비율을 갖는 데이터 시퀀스들로부터 규칙들을 찾아내는데 유용하게 사용된다. 본 연구에서는 헤드(head: 규칙의 왼쪽 부분)와 바디(body: 규칙의 오른쪽 부분)가 모두 유연 패턴으로 구성된 규칙들을 신속하게 찾도록 하기 위하여 데이터 시퀀스로부터 서픽스 트리(suffix tree)를 구성한다. 이 서픽스 트리는 유연 규칙들의 압축된 표현이며, 타깃 헤드 시퀀스와 매치되는 규칙을 찾기 위한 인덱스 구조로서 사용된다. 만일, 매치되는 규칙을 찾을 수 없는 경우에는 규칙 완화(rule relaxation)의 개념을 이용한다. 클러스터 계층(cluster hierarchy)과 완화 오차(relaxation error)를 사용하여 타깃 헤드 시퀀스의 고유한 정보를 대부분 포함하고 있는 최소한으로 완화된 규칙을 찾는다. 다양한 실험을 통한 성능 평가를 통하여 제안한 기법의 우수성을 검증한다.

  • PDF

Random Sample Consensus를 이용한 포인트 클라우드 실린더 형태 매칭 (Matching for Cylinder Shape in Point Cloud Using Random Sample Consensus)

  • 진영훈
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.562-568
    • /
    • 2016
  • 포인트 클라우드 데이터는 어떠한 형태를 표현하기 위해 무수히 많은 점들을 갖는 데이터 집합으로 특정 벡터 시스템에서 표현될 수 있으며, 일반적으로 3차원 좌표 공간에서 다양한 특성을 갖게 된다. 본 논문은 3차원 좌표 시스템의 포인트 클라우드에서 기존 방법(Hough Transform)보다 빠른 실린더 형태의 파이프 추정을 목표로 한다. 이를 위해 비교적 빠른 RANdom SAmple Consensus(RANSAC)를 사용한다. 본 논문에서 제안하는 실린더 형태의 파이프 추정은 두 가지 형태의 수학적 모델을 근거로 파라미터를 계산하고, 결과를 조합하여 예측한다. 두 가지 수학적 모델은 구(Sphere)와 직선(Line)이며, RANSAC 적합을 통해 실린더의 축과 반지름이 될 수 있는 구의 파라미터(중심과 반지름)를 계산하고, 이를 직선화하여 실린더를 추정한다. 이는 법선 추정(Normal Estimation) 및 분할(Segmentation) 없이 비교적 정확도를 유지하며, 빠르게 실린더 매칭을 할 수 있게 한다. 빠른 실린더 매칭은 실시간 파이프 추정이 필요한 레이저 스캐닝 및 건설 역설계 분야에서 활용할 수 있을 것이다.

실내 공간에서의 문자매칭 기반 지오코딩 기법 (A Geocoding Method on Character Matching in Indoor Spaces)

  • 이강재;이지영
    • Spatial Information Research
    • /
    • 제21권1호
    • /
    • pp.87-100
    • /
    • 2013
  • 최근 위치 정보의 이용이 여러 분야에 걸쳐 급격하게 증가하고 있다. 실외에서는 위치 정보의 획득을 위해 일반적으로 GPS 기술을 사용하였으나, 복잡한 실내 공간에서는 벽, 기둥과 같은 물리적인 장애물들로 인해 발생한 다중경로 간섭으로 무선 근거리통신망, RFID, 블루투스 등의 무선 네트워크 기술을 적용한 연구가 진행되었다. 그러나 이러한 위치 측정 기술들은 센싱 인프라스트럭쳐 구축비용이 많이 들며, 측위에 있어 계산 집약적이고, 실내 구조에 따른 정확도의 변화가 발생하는 한계가 존재한다. 본 연구에서는 이러한 한계점을 보완하고자 복합용도건물 내에서 쉽게 획득 및 식별이 가능한 상가, 컨벤션 센터 및 오피스의 전화번호, 방 번호, 상호명과 같은 서술 데이터를 이용하여 위치를 추출한다. 이 과정에서 문자 매칭을 활용하며, 위치 추정에 있어 신속한 계산과 실내 환경에 따른 정확도 변화를 배제하기 위해 지오코딩 방법을 적용한다. 본 연구에서 제안된 방법을 아키텍쳐로 설계하며, 구현을 위해 3차원 가시화 프로그램을 개발한다. 또한 제한된 기법에서의 매칭률, 프로세싱 시간을 통하여 정략적으로 평가한다.

시계열 데이터베이스에서 DFT-기반 다차원 인덱스를 위한 물리적 데이터베이스 설계 (Physical Database Design for DFT-Based Multidimensional Indexes in Time-Series Databases)

  • 김상욱;김진호;한병일
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1505-1514
    • /
    • 2004
  • 시퀀스 매칭은 시계열 데이터베이스로부터 질의 시퀀스와 변화의 추세가 유사한 데이터 시퀀스들을 검색하는 연산이다. 기존의 대부분의 연구에서는 효과적인 시퀀스 매칭을 위하여 다차원 인덱스를 사용하며, 데이터 시퀀스를 이산 푸리에 변환(Discrete Fourier Transform: DFT)한 후, 단순히 앞의 두 개 내지 세 개의 DFT 계수만을 구성 속성 (organizing attributes)으로 사용함으로써 고차원의 경우 발생하는 차원 저주(dimensionality curse) 문제를 해결한다. 본 논문에서는 기존의 단순한 기법이 가지는 성능 상의 문제점들을 지적하고, 이러한 문제점들을 해결하는 최적의 다차원 인덱스 구성 기법을 제안한다. 제안된 기법은 대상이 되는 시계열 데이터베이스의 특성을 사전에 분석함으로써 변별력이 뛰어난 요소들을 다차원 인덱스의 구성 속성으로 선정하며, 비용 모델(cost model)을 기반으로 한 시퀀스 매칭 비용의 추정을 통하여 다차원 인덱스에 참여하는 최적의 구성 속성의 수를 결정한다. 제안된 기법의 우수성을 규명하기 위하여 실험을 통한기존 기법과의 성능 비교를 수행하였다 실험 결과에 의하면, 제안된 기법은 기존의 기법에 비교하여 매우 큰 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF

위치 오차를 고려한 건물 데이터 셋의 매칭에 관한 연구 (Study on Building Data Set Matching Considering Position Error)

  • 김기락;허용;유기윤
    • Spatial Information Research
    • /
    • 제19권2호
    • /
    • pp.37-46
    • /
    • 2011
  • 최근 GIS 분야에서 공간 정보를 효과적으로 사용하기 위하여 다양한 원천 자료를 통합하는 것이 중요한 화두로 대두되고 있다. 일반적으로 공간 정보의 통합은 대응 공간 객체를 탐색하고 각 객체와 연동되어 있는 정보를 결합함으로써 수행된다. 하지만 어떤 공간 객체에 대응되는 다른 공간 객체를 탐색하는 것은 매우 어려운 문제로, 서로 다른 공간 객체를 탐색하기 위한 매칭 방법이 많이 연구되고 있다. 따라서 본 연구는 서로 다른 건물 데이터 셋의 통합 과정에서 좌표 변환 이후에도 잔존하는 국지적 위치 오차를 고려하여 대응 공간 객체를 탐색할 수 있는 방법을 개발하는 것을 목적으로 한다. 이러한 목적을 위해 두 지도를 좌표 변환하고 중첩 및 위치 오차가 유사한 단위 구역을 생성한 후, 위치 오차가 유사한 단위 구역 내의 건물들을 매칭하기 위하여 유사도와 ICP(iterative closest point) 알고리즘을 이용하였다. 그리고 이러한 제안된 방법의 활용 가능성을 실험을 통하여 알아보았다.

MMS로부터 취득된 LiDAR 점군데이터의 반사강도 영상과 UAV 영상의 정합을 위한 특징점 기반 매칭 기법 연구 (Feature-based Matching Algorithms for Registration between LiDAR Point Cloud Intensity Data Acquired from MMS and Image Data from UAV)

  • 최윤조;;홍승환;손홍규
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.453-464
    • /
    • 2019
  • 최근 3차원 공간정보에 대한 수요가 증가함에 따라 신속하고 정확한 데이터 구축의 중요성이 증대되어 왔다. 정밀한 3차원 데이터 구축이 가능한 LiDAR (Light Detection and Ranging) 데이터를 기준으로 UAV (Unmanned Aerial Vehicle) 영상을 정합하기 위한 연구가 다수 수행되어 왔으나, MMS (Mobile Mapping System)로부터 취득된 LiDAR 점군데이터의 반사강도 영상을 활용한 연구는 미흡한 실정이다. 따라서 본 연구에서는 MMS로부터 취득된 LiDAR 점군데이터를 반사영상으로 변환한 데이터와 UAV 영상 데이터의 정합을 위해 9가지의 특징점 기반매칭 기법을 비교·분석하였다. 분석 결과 SIFT (Scale Invariant Feature Transform) 기법을 적용하였을 때 안정적으로 높은 매칭 정확도를 확보할 수 있었으며, 다양한 도로 환경에서도 충분한 정합점을 추출할 수 있었다. 정합 정확도 분석 결과 SIFT 알고리즘을 적용한 경우 중복도가 낮으며 동일한 패턴이 반복되는 경우를 제외하고는 약 10픽셀 수준으로 정확도를 확보할 수 있었으며, UAV 영상 촬영 당시 UAV 자세에 따른 왜곡이 포함되어 있음을 감안할 때 합리적인 결과라고 할 수 있다. 따라서 본 연구의 분석 결과는 향후 LiDAR 점군데이터와 UAV 영상의 3차원 정합을 위한 기초연구로 활용될 수 있을 것으로 기대된다.

DP매칭에 의한 On-Line 악보인식 (On-Line music score recognition by DPmatching)

  • 구상훈;이병선;김수경;이은주
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.502-511
    • /
    • 2002
  • 컴퓨터의 기술적 발전은 사회 여러 분야에 막대한 영향을 끼쳤다. 그중 악보인식분야에도 커다란 영향을 주었다. 그러나, On-line 상에서 그린 악보를 실시간으로 정형화된 악보형태로 변환하는 처리에 대한 연구가 미흡하여 이에 대한 연구가 필요하다. 본 논문에서는 실시간으로 악보를 인식하고, 사용자의 편의를 도모하기 위해 DP(Dynamic Programming) 매칭 법을 이용한 On-Line 악보인식에 관한 방법을 제안하였다. 본 연구에서는 실시간으로 입력되는 악상기호를 인식하기 위해, 가장 유효한 정보인 악상 기호내의 방향, x, y 좌표를 이용하여 벡터형태로 추출한 후 음표와 비음 표(쉼표, 기타기호)의 두개의 그룹으로 나누어진 표준패턴과의 DP매칭을 통해 인식한다. 먼저 tablet을 통해 실시간으로 악상 기호를 입력할 때 생기는 x, y좌표를 이용하여, 펜의 움직임에 대한 16방향 부호화를 수행한다. 음표와 비 음표를 구분하기 위한 시간을 줄이고자 16방향 부호화를 적용하지 않고 사사분면부호화를 적용한다. 음표를 약식으로 그릴 경우 음표 머리에 해당하는 부분의 좌표는 삼사분면에 분포하고, 폐곡선의 음표일 경우에는 좌표가 사사분면에 고르게 나타난다. 폐곡선을 제외한 음표의 머리는 폐곡선과 같은 조건이면서 입력받은 y좌표 값들 중에서 최소 값과 최대 값을 구한 다음 2로 나눈 값을 지나는 y좌표의 개수가 임의의 임계값 이상이면 음표로 판단한다. 위 조건을 만족하지 않을 경우 비 음표로 취급한다. 음표와 비 음표를 결정한 다음, 입력패턴과 표준패턴과의 DP매칭을 통하여 벌점을 구한다. 그리고 경로탐색을 통해 벌점에 대한 각각의 합계를 구해 최소 값을 악상기호로 인식하였다. 실험결과, 표준패턴을 음표와 비음표의 두개의 그룹으로 나누어 인식함으로써 DP 매칭의 처리 속도를 개선시켰고, 국소적인 변형이 있는 패턴과 특징의 수가 다른 패턴의 경우에도 좋은 인식률을 얻었다.리되고 이원화된 코드체계와 데이터 형태의 이질화를 통일하는 방법으로 데이터웨어하우스 시스템을 제시하였다. 결국 병원에서 데이터웨어하우스 시스템의 구축은 임상, 연구, 교육의 유기적 순환관계를 정립하여 지식의 순환적 고리인 수집, 공유, 확산, 재창출을 지속적 유지할 수 있는 인프라를 구축해 준다. 반면 상이한 정보들간의 충돌과 이에 따른 해석의 오류로 잘못된 의사결정을 위한 정보를 제공할 수 있고 기초정보의 접근 및 추출의 유용성에 의해서 정보유출에 대한 문제가 한계점으로 나타났다.로세스 개선을 위해서 무엇을 정말로 필요로 하는지를 밝힘으로써, 한국 소프트웨어 산업의 현실적인 특수성을 고려한 소프트웨어 프로세스 평가와 개선 모델의 개발을 위한 기초적인 자료를 제공할 것으로 예상된다. 또한, 본 연구 결과는, 우리나라 소프트웨어 조직들이 실제로 무엇을 필요로 하는지를 밝힘으로써, 우리나라의 소프트웨어 산업을 육성하기 위한 실효성 있는 정책 입안을 위한 기초 자료를 제공할 것으로 예상된다.를 검증하려고 한다. 협력체계 확립, ${\circled}3$ 전문인력 확보 및 인력구성 조정, 그리고 ${\circled}4$ 방문보건사업의 강화 등이다., 대사(代謝)와 관계(關係)있음을 시사(示唆)해 주고 있다.ble nutrient (TDN) was highest in booting stage (59.7%); however no significant difference was found among other stages. The concentrations of Ca and P were not different among mature stages. According to these results, the yellow ripe period is appropriate to harvest the whole crop rice for forage considering

  • PDF

심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 (Question Retrieval using Deep Semantic Matching for Community Question Answering)

  • 김선훈;장헌석;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

왜곡 제거 시계열 서브시퀀스 매칭에서 빠른 인덱스 구성법 (Fast Index Construction in Distortion-Free Time-Series Subsequence Matching)

  • 길명선;김범수;문양세;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.73-76
    • /
    • 2011
  • 본 논문에서는 기존 단일 인덱스 기반의 왜곡 제거 시계열 서브시퀀스 매칭의 인덱스 구성 알고리즘을 분석하여 보다 효율적인 인덱스 구성 알고리즘을 제안하였다. 기존 왜곡 제거 시계열 서브시퀀스 매칭의 단일 인덱스 구성 알고리즘은 대용량 시계열 데이터인 경우 왜곡 제거를 고려해야 되는 많은 윈도우로 인해 실제 인덱스 생성에 매우 많은 시간이 걸린다. 본 논문에서는 기존 선형 제거 서브시퀀스 매칭의 인덱스 구성 알고리즘을 예로서 인덱스를 구성하는 각 과정을 체계적으로 분석하여, 각 과정에서 필요한 연산 횟수를 줄이는 방법을 제안한다. 이를 위해, 저차원 변환하는 과정에서 발생하는 중복되는 연산들을 한 번씩 미리 수행하여 배열에 저장한 후 재사용하는 DF-버컷(DF-bucket)씨의 개념을 제시한다. 실험 결과, 저장 후 재사용 원칙에 따라 인덱스 구성의 효율성을 증대시킨 접근법이 그렇지 않은 접근법에 비해서 인덱스 구성 시간을 평균 32% 에서 55% 까지 줄인 것으로 나타났다.

영상 대 영상 매칭을 이용한 한글 문서 영상에서의 단어 검색 (Keyword Spotting on Hangul Document Images Using Image-to-Image Matching)

  • 박상철;손화정;김수형
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.357-364
    • /
    • 2005
  • 본 논문에서는 두 단계 이미지 매칭을 이용하여 한글 문서영상에서 사용자 검색어를 빠르고 정확하게 검색할 수 있는 시스템을 제안한다. 본 시스템은 문자 분리, 검색어 영상 생성, 특징 추출 그리고 이미지 매칭 과정으로 구성된다. 매칭 과정에서 차원이 다른 두 가지 특징 벡터를 이용한다. 8쪽 분량의 문서 영상을 한국정보과학회 웹사이트에서 다운로드하였고, 그 문서로부터 1600개의 한글단어 영상을 획득하여 실험데이터로 사용하였다 그 결과 제안한 시스템은 기존에 제안된 영상-기반 한글 단어 검색 시스템보다 성능이 크게 향상되었음을 알 수 있었다.