• Title/Summary/Keyword: 매칭기법

Search Result 761, Processing Time 0.035 seconds

The Design of Document Matching Method using Type Information (타입 정보를 이용한 문서 매칭 기법 설계)

  • 고승규;임순범;최윤철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.535-538
    • /
    • 2002
  • XML 문서가 널리 사용됨에 따라 XML 문서 간의 통합이나 변환의 필요성이 증가하고 있다. 이러한 변환이나 통합을 위해서는 미디에이터나 웨어하우스와 같은 방법이 이용될 수 있다. 그런데 어떤 방법을 이용하더라도 질의어와 지역 DTD 간의 매칭이나 지역 DTD 간의 매칭은 필수적이다. 따라서 매칭은 변환이나 통합을 위한 기본적인 기술이라고 볼 수 있다. 이와 같은 매칭 관련 연구는 관계형 데이터베이스 분야에서 많이 진행되었으며, 근래에 SGML/XML 분야에서도 연구가 진행되고 있다. 이중 SGML/XML 문서와 관련된 매칭은 주로 엘리먼트 이름과 구조 정보만을 이용하고 있으며, 특히 구조 정보를 이용할 경우에 잘못된 매칭을 유발시킬 수 있다. 이는 구조 정보가 의미 정보를 적절히 표현하지 못하고 있기 때문이다. 따라서 본 논문에서는 XML문서에서 추출 가능한 타입패턴을 정의하고, 이를 이용한 매칭 기법을 제안한다. 이 기법은 구조 정보를 이용하는 기존의 매칭 기법보다 좀 더 명확하고, 정확한 매칭이 가능하다. 또한 이는 타입 정보를 사용할 수 없는 DTD 기반의 XML 문서에서의 매칭 정확도를 높여줄 수 있을 뿐만 아니라 타입에 기본적인 의미 정보도 반영되므로 의미 기반 웹에 사용될 수 있다.

  • PDF

The partial matching method for effective recognizing HLA entities (효과적인 HLA개체인식을 위한 부분매칭기법)

  • Chae, Jeong-Min;Jung, Young-Hee;Lee, Tae-Min;Chae, Ji-Eun;Oh, Heung-Bum;Jung, Soon-Young
    • The Journal of Korean Association of Computer Education
    • /
    • v.14 no.2
    • /
    • pp.83-94
    • /
    • 2011
  • In the biomedical domain, the longest matching method is frequently used for recognizing named entity written in the literature. This method uses a dictionary as a resource for named entity recognition. If there exist appropriated dictionary about target domain, the longest matching method has the advantage of being able to recognize the entities of target domain quickly and exactly. However, the longest matching method is difficult to recognize the enumerated named entities, because these entities are frequently expressed as being omitted some words. In order to resolve this problem, we propose the partial matching method using a dictionary. The proposed method makes several candidate entities on the assumption that the ellipses may be included. After that, the method selects the most valid one among candidate entities through the optimization algorithm. We tested the longest and partial matching method about HLA entities: HLA gene, antigen, and allele entities, which are frequently enumerated among biomedical entities. As preparing for named entity recognition, we built two new resource, extended dictionary and tag-based dictionary about HLA entities. And later, we performed the longest and partial matching method using each dictionary. According to our experiment result, the longest matching method was effective in recognizing HLA antigen entities, in which the ellipses are rare, and the partial matching method was effective in recognizing HLA gene and allele entities, in which the ellipses are frequent. Especially, the partial matching method had a high F-score 95.59% about HLA alleles.

  • PDF

Effective Resolving of the Performance Bottleneck in Time-Series Subsequence Matching (시계열 서브시퀀스 매칭에서 발생하는 성능 병목의 효과적인 해결 방안)

  • 김상욱;오세봉
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.530-532
    • /
    • 2003
  • 서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이터베이스로부터 검색하는 연산이다. 본 논문에서는 서브시퀀스 매칭 처리의 성능 병목을 파악하고, 이를 해결함으로써 전체 서브시퀀스 매칭의 성능을 크게 개선하는 방안에 관하여 논의한다. 먼저, 사전 실험을 통하여 후처리 단계가 서브시퀀스 매칭의 성능 병목이며, 후처리 단계의 최적화가 기존의 서브시퀀스 매칭 기법들이 간과한 매우 중요한 이슈임을 지적한다. 이러한 서브시퀀스 매칭의 성능 병목을 해결하기 위하여 후처리 단계를 최적으로 처리할 수 있는 간단하면서도 매우 효과적인 기법을 제안한다. 제안된 기법은 후처리 단계에서 후보 서브시퀀스들이 질의 시퀀스와 실제로 유사한가를 판단하는 순서를 조정함으로써 기존의 후처리 단계의 처리에서 발생하는 많은 디스크 액세스의 중복과 CPU 처리의 중복을 완전히 제거할 수 있다. 실제 데이터와 생성 데이터를 이용한 다양한 실험들을 통하여 제안된 기법의 성능 개선 효과를 정량적으로 검증한다.

  • PDF

A Survey of Mashup Capable Services' Retrieval Methods for OpenAPI using Semantic Technology (시맨틱 기술을 활용한 OpenAPI 조합 가능 서비스 검색에 관한 연구)

  • Choi, Young-Ho;Cha, Seung-Jun;Lee, Kyu-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1234-1237
    • /
    • 2011
  • 본 논문은 시맨틱 기술을 활용한 OpenAPI 조합가능 서비스 검색 기법 개발을 위해 관련 연구들을 분석하여 적용방안을 도출하였다. OpenAPI 조합가능 서비스 검색이란 선택된 서비스의 출력과 매칭이 되는 입력을 가진 서비스나 선택된 서비스의 입력과 매칭되는 출력을 가진 서비스를 찾는 것이다. 본 논문에서는 기존의 키워드 기반의 조합 가능 서비스 검색 기법의 한계를 시맨틱 기술을 활용하여 해결하기 위한 관련연구로 SAWSDL-MX2와 LOG4SWS.KOM에 관한 논문들을 분석했다. SAWSDL-MX2에서는 세가지 매칭 기법과 이에 따른 유사도 분석 기법을 제시하였고, LOG4SWS.KOM에서는 두가지 매칭 기법과 이에 따른 유사도 분석 방법을 제시하였다. 관련 연구들에서 분석된 내용을 바탕으로 OpenAPI 조합 가능 서비스에 대한 매칭 기법의 정의, 유사도 분석 기법의 정의가 추후 진행되어야 한다.

Histogram matching by the classified image according to its depth information for Illumination mismatch compensation in multi-view video (깊이 정보에 따라 여러 객체로 분리한 영상 단위의 히스토그램 매칭에 기반한 다시점 비디오의 조명 불일치 보상 기법)

  • Lee, Dong-Seok;Seo, Young-Ho;Kim, Dong-Wook;Yoo, Ji-Sang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.07a
    • /
    • pp.80-82
    • /
    • 2010
  • 본 논문에서는 깊이 정보를 이용하여 영상을 색상 분포가 각각 다른 객체 영상으로 분리하고 개별적으로 히스토그램 매칭 기법을 적용하는 조명 보상 기법을 제안한다. 서로 위치가 다른 다시점 카메라의 경우, 다시점 비디오 부호화(multi-view video coding)의 성능을 저하시키는 인접 시점 영상 간 조명 불일치 현상이 발생한다. 이러한 조명 불일치를 보상하기 위한 히스토그램 매칭(histogram matching)을 이용한 전처리 기법이 제안되었다. 모든 시점의 다시점 영상 히스토그램은 정해진 참조 시점 영상의 히스토그램으로 매칭되어 조명 불일치와 다시점 비디오 부호화의 성능을 개선할 수 있다. 하지만 일반적인 영상은 색상 분포와 깊이 정보가 상호 독립적인 객체들로 구성되어 있다. 또한 다시점 비디오는 시점에 따라 획득된 영상 간에 동일 객체의 위치와 깊이가 서로 달라 정해진 참조 시점의 히스토그램으로 매칭하는 기존의 방법은 적합하지 않다. 본 논문에서는 주어진 영상 내에서 깊이 정보를 이용하여 객체를 먼저 분리하고, 객체 영상별로 히스토그램 매칭 기법을 적용하여 색상 보상을 수행하는 새로운 기법을 제안한다. 실험을 통해 제안하는 객체 단위의 조명 보상 기법이 향상된 다시점 비디오 부호화 효율을 보이는 것을 확인하였다.

  • PDF

Window-Join: An Optimal Way to Process Duality-Based Subsequence Matchi (윈도우-초인: 이원성 기반 서브시퀸스 매칭을 위한 최적의 방법)

  • 김상욱;박대현;이헌길;김만순;박정일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.184-186
    • /
    • 2001
  • 본 논문에서는 시계열 데이터베이스에서 서브시퀸스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 본 논문에서는 먼저, 기존의 이원성 기반 서브시퀸스 매칭 기법에서 발생하는 성능상의 문제점들을 지적하고, 이들을 해결할 수 있는 방법을 제시한다. 제안된 기법은 서브시퀸스 매칭 시 요구되는 인덱스 검색을 윈도우-조인이라는 일종의 공간 조인 문제로 새롭게 해석하는 것에서 출발한다. 제안된 기법에서는 효과적인 윈도우-조인의 처리를 위하여 질의 윈도우 점들을 위한 R*-트리를 주기억장치 내에 on-the-fly로 구성하는 방법을 사용한다. 또한, 데이터 윈도우 점들을 위한 디스크 상의 R*-트리와 질 윈도우 점들을 위한 주기억장치 상의 R*-트리를 효과적으로 조인할 수 있는 새로운 알고리즘을 제안한다. 제안된 기법은 R*-트리 페이지들을 착오 채택 없이 단 한번만 디스크로부터 액세스 측면에서 이원성 기반 서브시퀸스 매칭을 위한 최적의 기법이다.

  • PDF

Topic maps Matching and Merging Techniques based on Partitioning of Topics (토픽 분할에 의한 토픽맵 매칭 및 통합 기법)

  • Kim, Jung-Min;Chung, Hyun-Sook
    • The KIPS Transactions:PartD
    • /
    • v.14D no.7
    • /
    • pp.819-828
    • /
    • 2007
  • In this paper, we propose a topic maps matching and merging approach based on the syntactic or semantic characteristics and constraints of the topic maps. Previous schema matching approaches have been developed to enhance effectiveness and generality of matching techniques. However they are inefficient because the approaches should transform input ontologies into graphs and take into account all the nodes and edges of the graphs, which ended up requiring a great amount of processing time. Now, standard languages for developing ontologies are RDF/OWL and Topic Maps. In this paper, we propose an enhanced version of matching and merging technique based on topic partitioning, several matching operations and merging conflict detection.

Improving Spot Matching Accuracy Using an Automated Landmark Extraction in Protein 2-DE Gel Images (단백질 2-DE 젤 이미지에서 자동 기준점 추출을 통한 스팟 매칭 정확도 향상 기법)

  • Shim, Jung-Eun;Jin, Yan-Hua;Lee, Won-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.455-458
    • /
    • 2008
  • 단백질체학에서 2-DE는 조직내의 단백질을 규명하는 단백질 분리 기술로서 2-DE에 의하여 생성된 단백질 이미지에서 스팟 매칭을 진행하여 상이한 단백질 젤 내에 존재하는 동일한 단백질 클래스를 찾을 수 있다. 그러나 단백질 2-DE 이미지는 실험 환경의 변화에 민감하여 이미지의 위치적인 변형이나 먼지, 공기방울 등으로 인해 많은 에러 정보를 포함할 수 있다. 이러한 에러는 스팟 매칭에 치명적인 영향을 주어 낮은 정확도를 가지게 된다. 본 논문에서는 단백질 2-DE 이미지 분석을 위한 스팟 매칭에서의 정확도를 향상시키기 위하여 기준점 학습과 기준점 추출의 두 단계로 이루어진 자동화된 기준점 추출 방법을 사용하여 스팟 매칭의 정확도를 향상시킬 수 있는 최적의 기준점을 선정하는 방법을 제안하며 선정된 기준점을 기반으로 다수의 기준 이미지를 선택하여 스팟 매칭을 반복적으로 진행함으로써 확률 기반의 정확한 스팟 매칭 결과를 도출하고자 한다. 특히 데이터 마이닝 기법에서 사용되는 최소지지도 값을 적용함으로써 지지도가 높은 스팟 매칭 결과를 빈발한 스팟 매칭으로 판정한다. 제안한 스팟 매칭 정확도 향상 기법의 정확도를 평가하기 위하여 실제 단백질 2-DE 젤 이미지 데이터를 사용하여 입력 기준점의 개수와 최소 지지도의 증가에 따른 정확도의 변화를 분석하였다.

Continuous Subgraph Matching Scheme Considering Edge Types and Weights (간선 유형 및 가중치를 고려한 연속 서브 그래프 매칭 기법)

  • Choi, do-jin;Bok, kyoung-soo;Lee, byoung-yup;Yoo, jae-soo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.451-452
    • /
    • 2019
  • 논문 검색 서비스 응용에서는 공저자, 출판 정보 등을 표현하기 위해서 다양한 정점 레이블 (논문,저자) 및 간선 정보(주저자, 공저자)를 이용하여 그래프로 표현한다. 이와 함께 다양한 간선 특징 정보를 질의로 입력하는 연속 서브 그래프 매칭에 대한 요구가 존재한다. 본 논문에서는 간선의 다양한 특성을 지원하고 색인의 부하를 감소시킨 연속 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 거리 값과 질의 연관 정보만을 관리하여 간선의 다양한 특성을 지원하는 효율적인 서브 그래프 매칭을 수행한다.

  • PDF

Efficient Approximate Top-k Subgraph Matching Scheme in Graph Stream (그래프 스트림에서 효율적인 근사 Top-k 서브 그래프 매칭 기법)

  • Choi, do-jin;Bok, kyoung-soo;Yoo, jae-soo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.11-12
    • /
    • 2019
  • IoT 및 SNS의 발달로 인해 관계를 표현하는 그래프 모델링 기법이 활용되고 있다. 실시간 스트림 그래프에서 유사한 모형의 그래프를 탐색하기 위한 근사 Top-k 서브 그래프 매칭에 대한 요구가 증가하고 있다. 본 논문에서는 그래프 스트림에서 간선의 유형 및 구조적 차이를 고려한 효율적인 근사 Top-k 서브 그래프 매칭 기법을 제안한다. 임계값 기반의 필터링과 스트림 환경에 맞는 연속 서브 그래프 매칭 구조를 제안함으로써 그래프 스트림에 적합한 질의 처리를 수행한다.

  • PDF