• 제목/요약/키워드: 데이터매칭

검색결과 682건 처리시간 0.029초

XML문서의 자동변환을 위한 스키마 매칭 알고리즘 (A Schema Matching Algorithm for an Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1195-1207
    • /
    • 2004
  • 스키마 매칭은 XML문서의 자동 변환을 위한 전처리 과정으로서 필수적이다. 스키마 매칭에 관한 기존 연구는 의미적으로 대응 가능한 모든 매칭관계를 고려하기 때문에 다대다의 대응관계를 추출한다. 이에 명확한 매칭관계를 필요로하는 XML문서의 자동변환에는 적합하지 않다. 본 논문에서는 스키마 사이의 일대일 대응관계를 추출할 수 있는 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 단발노드 사이의 언어적 유사도와 데이터타입 유사도를 이용하여 후보매칭을 계산한다. 계산된 후보매칭의 경로유사도 비교를 통해 일대일 매칭을 추출하게 된다. 특히 제안된 방법은 보다 정교한 수준의 스키마 매칭을 위하여 축약어 사전, 동의어 사전, 그리고 도메인 온탈로지에 기반한다. 제안된 알고리즘의 성능을 평가하기 위해서 전자상거래 분야에서 사용 중인 스키마를 대상으로 실험한 결과, 평균적으로 97%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

마커 없는 매칭을 활용한 3 차원 인체 스캔 데이터의 기준점 추출 (Landmark Extraction for 3D Human Body Scan Data Using Markerless Matching)

  • 윤동욱;허남빈;고형석
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.163-167
    • /
    • 2009
  • 3 차원 인체 스캔 차원 기술의 활용도는 정확도의 개선과 가격의 저렴화로 인해 산업계에서 점점 부각되고 있다. 이런 인체 스캔 데이터의 활용도를 높이기 위해서는 인체 스캔 데이터의 기준점 추출이 필수적이다. 본 논문에서는 자동으로 인체 스캔 데이터의 기준점을 추출하는 알고리즘을 제안한다. 이를 위해 여러 인체 스캔 데이터들을 활용하여 주성분 분석을 하고 최적화를 거쳐 마커 없는 매칭을 수행한다. 최종적으로는 생성된 인체 모델의 위상 구조에서 기준점을 추출한다.

  • PDF

계층적 블록매칭 알고리즘을 위한 파이프라인식 VLSI 아키텍쳐 (Pipelined VLSI Architectures for the Hierarchical Block-Matching Algorithm)

  • 김형철;맹승렬
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1691-1716
    • /
    • 1998
  • 본 논문에서는 계층적 블록매칭 알고리즘(HBMA)을 위한 두 가지 병렬 VLSI 아키텍쳐를 제안한다. HBMA는 계층에 따른 반복수행과 공간 인터폴레이션을 기반으로 수행되며, 이러한 수행 특성은 병렬처리의 장애요소인 데이터 종속성을 내재하고 있다. 제안된 아키텍쳐는 HBMA의 계층간 데이터 종속성을 해결하기 위하여 기본적으로 파이프라인 구조를 채택하고 있으며, HBMA에서 주어진 매개변수에 따라 세 단계의 스테이지로 구성된다. 제안된 아키텍쳐는 입력 프레임 데이터의 흐름을 제어하는 방식에 따라 두 가지 종류로 구분된다. U-Architecture는 단방향 스캔 순서를 따르도록 설계되었으며, B-Architecture는 양방향 스캔 수서를 따르도록 설계되었다. 각 아키텍쳐의 내부 메모리와 인터폴레이션 모듈은 해당 스캔 순서에 따라 동기적으로 동작할 수 있는 구조를 가진다. 성능분석의 결과로서 본 논문에서 제안한 두 가지 아키텍쳐가 모두 방송용 비디오 포맷을 실시간으로 처리할 수 있음을 보이고, HDTV 포맷은 가까운 장래의 VLSI 기술로 실시간 성능을 얻을 수 있음을 보였다. 또한, B-Architecture는 공간 연결성 내부 메모리 구조를 채택함으로써 입력 데이터의 재활용도를 높이고, 이에 따라 Q-Architecture에 비해서 데이터 입출력 핀의 개수를 약 반정도 줄일 수 있는 특성을 보이고 있다.

  • PDF

질의 추론을 통한 온톨로지기반 시맨틱 검색 시스템의 성능 향상 (Performance Enhancement of A Ontology-based Semantic Search System with Query Inference)

  • 하상범;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.157-159
    • /
    • 2004
  • 시맨틱 웹 기술을 활용한 시맨틱 검색은 문서의 의미를 온톨로지의 메타데이터로 생성하여 이를 바탕으로 검색을 수행하게 된다. 이와같은 온톨로지 기반의 시맨틱 검색은 논리를 바탕으로 추론을 적용할 수 있다. 본 논문에서는 온톨로지 기반의 추론을 적용한 시맨틱 검색 시스템을 언급하고 시맨틱 검색 시스템에서의 성능향상을 위해 추론엔진의 작업메모리 영역의 부하를 줄여 기존의 시스템보다 빠른 성능의 시맨틱 검색 시스템을 제안한다. 본 논문에서 시맨틱 검색 시스템의 성능향상을 위한 방법론으로는 다음과 같다 첫째, 추론엔진이 검색 도메인내의 전체 메타데이터를 가지고 추론을 수행하지 않고 메타데이터의 온톨로지부분 만을 사용하여 사용자가 원하는 질의문을 추론하여 검색에 사용하게 한다. 둘째, 시맨틱 검색 방법에서 Dirtectly 매칭 검색과 시맨틱 추론검색을 병행하여 수행하게 한다. 이를 위해 본 논문에서는 메타데이터의 온톨로지부분과 인스턴스부분을 분리하는 단계와 분리된 온톨로지부분에서 사용자가 원하는 질의를 추론하는 단계, 추론된 질의문을 검색시스템에서 매칭하는 단계를 수행하게 된다. 이러한 방법은 메타데이터의 양이 증가하여도 온톨로지부분은 증가하지 않으므로 추론엔진에서 전 방향 추론단계의 수행시간을 단축과 추론엔진의 호출 횟수를 단축시키는 결과를 가져온다.

  • PDF

스타일 분석을 통한 커플 매칭 플랫폼 (Couple Matching Platform through Style Analysis)

  • 최형락;조성언;김동하;문재현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2019
  • 본연구는 커플들의 이미지 빅 데이터를 분석하여 각각 얼굴과 패션에 따라 유사한 유형 끼리 클러스터링 하여 새로운 사람 이미지가 주어졌을 때 해당 사람이 어느 유형에 속하는지 찾아내고 해당 유형의 사람들은 어떤 유형의 이성과 잘 맞는지 찾아 추천해주는 플랫폼이다. 빅 데이터를 수집하기 위하여 SNS상에서 커플들의 이미지를 크롤링하여 저장한다. 수집된 커플들의 이미지를 AI 머신 러닝으로 나이, 성별을 분석하여 미리 설정한 나이대의 이성 커플들의 이미지 만을 추려내서 각각 남, 여의 이미지를 분리하여 저장한다. 해당 이미지들로 비슷한 얼굴, 패션 유형의 사람들을 같은 클러스터로 모으고 CNN 으로 학습 시켜서 새로운 이미지가 들어올 경우 효율적으로 해당 이미지가 어느 클러스터에 속하는지 찾아낼 수 있도록 한다. 특정 이미지가 속하는 클러스터를 찾아내면 해당 클러스터에 속하는 사람들의 연인들이 어느 클러스터에 가장 많이 포함되어 있는지 찾아서 해당 클러스터 유형의 이성을 추천해준다. 웹과 어플리케이션으로 이루어진 플랫폼 서비스이며, 커플 매칭 기능 뿐만 아니라 매칭된 회원 간 연락 기능, 실제 커플의 이미지로 두 사람의 매칭도 확인 등의 부가적 기능 또한 인공 지능 서비스로 제공된다.

이원성 기반 시계열 서브시퀀스 매칭의 인덱스 검색을 위한 최적의 기법 (An Optimal Way to Index Searching of Duality-Based Time-Series Subsequence Matching)

  • 김상욱;박대현;이헌길
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1003-1010
    • /
    • 2004
  • 본 논문에서는 시계열 데이터베이스에서 서브시퀀스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 본 논문에서는 서브시퀀스 매칭을 위한 기존 기법의 인덱스 검색에서 발생하는 성능상의 문제점들을 지적하고, 이들을 해결할 수 있는 새로운 방법을 제시한다. 제안된 기법은 서브시퀀스 매칭의 인덱스 검색 문제를 윈도우-조인이라는 일종의 공간 조인 문제로 새롭게 해석하는 것에서 출발한다. 윈도우-조인의 빠른 처리를 위하여 제안된 기법에서는 서브시퀀스 매칭을 시작할 때 질의 시퀀스를 위한 R*-트리를 주기억장치 내에 구성한다. 또한, 제안된 기법은 데이터 시퀀스들을 위한 디스크 상의 R*-트리와 질의 시퀀스를 위한 주기억장치 상의 R*-트리를 효과적으로 조인할 수 있는 새로운 알고리즘을 포함한다. 이 알고리즘은 데이터 시퀀스들을 위한 R*-트리 페이지들을 인덱스 단계의 착오 채택 없이 단 한번만 디스크로부터 액세스하므로 디스크 액세스 측면에서 최적의 기법임이 증명된다. 또한, 다양한 실험을 통한 성능 평가를 통하여 제안된 기법의 우수성을 정량적으로 규명한다.

단백질 2-DE 이미지 분석에서 정확한 스팟 매칭 패턴 검색을 위한 효과적인 방법 (An Efficient Method to Find Accurate Spot-matching Patterns in Protein 2-DE Image Analysis)

  • 김연화;이원석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.551-555
    • /
    • 2010
  • 단백질 2-DE 이미지 분석에서 단백질 자체가 가지고 있는 불안정성과 2-DE 실험이 가지고 있는 근본적인 문제점으로 인하여 이미지 스팟 매칭 분석의 정확도가 낮아지게 된다. 이 논문에서는 다중 참조이미지를 사용하여, 스팟 매칭 패턴의 정확도에 큰 영향을 주는 이미지 찌그러짐을 보완하고, 그에 따른 노이즈 스팟 제거와 참조 이미지 품질에 의한 정확도 저하를 최소화하는 방법을 제안하였다. 또한 2-DE 이미지의 데이터 특성에 의하여 이미지 수가 증가할 때 성능이 급격히 떨어지는 문제를 해결하기 위하여, 다중 참조이미지를 사용하여 구축한 스팟 매칭 데이터베이스를 이미지의 생물학적 특성에 의하여 "분할 및 확장" 방법을 사용하여, 정확도를 향상시키는 동시에 패턴 길이를 보장하는 스팟 매칭 패턴을 효과적으로 생성하였다. 실험에서는 실제 인간 2-DE 이미지 데이터를 사용하여 제안한 방법의 타당성을 보여준다.

임의의 부분 노이즈제거를 지원하는 윤곽선 매칭의 색인 구축 방법 (An Index-Building Method for Boundary Matching that Supports Arbitrary Partial Denoising)

  • 김범수
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1343-1350
    • /
    • 2019
  • 윤곽선 이미지를 시계열로 변환하는 작업은 빠르고 상호작용 방식이 매우 중요한 대용량 이미지 데이터베이스에서도 윤곽선 매칭 수행을 가능 할 수 있게 만든다. 최근 연구에서는 윤곽선 이미지를 시계열 데이터로 변환하여 부분 노이즈제거를 고려하면서 빠르게 매칭을 수행하려는 시도가 있었다. 본 논문에서는 성능 향상을 위해 임의의 노이즈제거를 위해 임의의 모든 노이즈제거 매개 변수를 고려한 색인 구축 방법을 제안한다. 이는 가능한 모든 노이즈제거 매개 변수에 따른 부분 노이즈제거를 고려해야하기 때문에 어려운 문제이다. 본 논문에서는 다차원 색인인 R*-tree를 사용하여 모든 가능한 노이즈제거 매개 변수에 의한 최소 경계 영역(MBR)을 구성하여 효율적인 단일 생성 알고리즘을 제안한다. 다양한 실험 결과, 제안한 색인 기반 매칭 방법은 검색 성능을 최대 46.6 ~ 4023.6 배나 향상시킨다.

시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 (A Single Index Approach for Subsequence Matching that Supports Normalization Transform in Time-Series Databases)

  • 문양세;김진호;노웅기
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.513-524
    • /
    • 2006
  • 정규화 변환은 시계열 시퀀스를 구성하는 엔트리들의 전체적인 패턴을 분석하는데 매우 유용하다. 본 논문에서는 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 다양한 길이의 질의 시퀀스를 지원하기 위하여 여러 개의 색인을 생성해야 하고, 이에 따라 색인 저장 공간의 오버헤드와 색인 관리의 오버헤드가 발생한다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 질의 시퀀스에 대한 정규화 변환을 지원하는 효율적인 서브시퀀스 매칭 방법을 제안한다. 이를 위하여, 우선 정규화 변환을 일반화한 포함-정규화 변환(inclusion-normalization transform) 개념을 제시한다. 포함 정규화 변환이란 색인에 저장할 윈도우에 대해서 해당 윈도우를 포함하는 서브시퀀스의 평균과 표준편차로 정규화하는 것으로서, 기본적인 정규화 변환을 윈도우 및 서브시퀀스 개념을 사용하여 확장한 것이다. 다음으로, 포함-정규화 변환을 기존 서브시퀀스 매칭 연구에 적용하기 위한 이론적 근거를 정리로서 제시하고 증명한다. 그리고, 이 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시한다. 실제 주식 데이터에 대한 실험 결과, 제안한 방법은 기존 방법에 비해 최대 $2.5{\sim}2.8$배까지 성능을 향상 시킨 것으로 나타났다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 정규화 변환 이외의 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있다. 따라서, 제안한 방법은 정규화 변환을 포함하는 많은 다른 종류의 변환을 지원하는 서브시퀀스 매칭에 폭넓게 적용될 수 있는 좋은 연구결과라 사료된다.

초분광 영상 라이브러리에서 피라미드 색인 기법의 영역 질의를 이용한 스펙트럴 매칭 (Spectral matching using Range Queries based on Pyramid-Technique in Hyperspectral Image Library)

  • 유재환;김덕환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.83-84
    • /
    • 2011
  • 초분광 영상은 기존의 다중분광 영상보다 많은 밴드를 통해 넓은 범위의 파장 영역에 대한 반사율을 담고 있는 고차원 데이터이다. 이와 같은 고차원 데이터를 기존의 R-Tree, X-Tree와 같은 다차원 색인 방법을 사용하게 되면 차원의 저주(Course of Dimensionality)라는 문제가 발생한다. 본 논문에서는 차원의 저주 문제를 해결하기 위해 피라미드 기법을 사용하여 초분광 영상 라이브러리의 색인을 구축하였다. 파라미드 기법은 D차원의 데이터를 2D차원의 피라미드에 사상하고, B+-트리를 이용하여 1차원적으로 색인하는 방법이다. 실험 결과 스펙트럼 매칭을 위한 영역질의 방법이 후보자 추출 시간, 데이터 접근 빈도 측면에서 순차적 접근 방법보다 좋은 성능을 나타냈다.

  • PDF