• 제목/요약/키워드: 유사성 질의

검색결과 946건 처리시간 0.028초

도메인 지식을 이용한 의미 기반 검색을 위한 유사성 측정 (Similarity Measure for Semantic-based Retrieval using Domain Knowledge)

  • 조미영;최창;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.347-350
    • /
    • 2007
  • 멀티미디어 데이터 처리 요구가 증가함에 따라 이의 의미적 표현 및 검색에 관한 연구가 활발히 이루어지고 있다. 최근에는 특히 지식 기반의 온톨로지를 이용한 의미적 검색에 초점을 두고 있으며, 구축된 온톨로지를 기반으로 동의어 관계, 반의어 관계 등을 이용하여 질의 확장으로 활용되고 있다. 하지만 이들은 대부분 속성 관계 등을 고려하지 않을 뿐만 아니라 각 관계별 가중치를 고려하지 않고 있다. 이에 본 논문에서는 비디오의 의미적 특징들을 추출하여 온톨로지를 구축한 후 의미 기반 검색을 위하여 관계별 가중치를 고려한 유사성 측정을 제안하고자 한다.

  • PDF

XML 문서의 효율적인 경로 통합 기법 (An Efficient Path Combining Strategy of XML Document)

  • 이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.19-22
    • /
    • 2005
  • XML은 비즈니스 메시징, 웹사이트 정보 통합, 그리고 카탈로그 통합 등의 분야에서 다양한 데이터를 표현하기 위한 포맷으로 급격하게 성장했다. 그러나 XML 데이터의 형태가 고정되어 있지 않기 때문에 전통적인 질의 방법이 항상 정확한 결과를 보여주지는 않는다. 또한 객체 지향 DBMS가 이 영역에 적합한지의 여부는 아직 명확하지 않다. 따라서 XML 데이터를 효율적으로 검색하기 위해 기존의 관계형 DBMS와 연계하여 구조 유사성을 기반으로 하는 검색 기법이 연구되고 있다. 그 중 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스를 이용한 검색 시스템은 다른 XML 문서 검색 시스템보다 훨씬 빠른 수행 속도를 보여주지만, 3차원의 메모리 구조를 사용하여 많은 저장공간을 필요로 하는 단점이 있다. 본 논문에서는 XML 문서를 저장할 때 경로들 사이의 유사성을 이용하여 XML 데이터의 경로를 통합하는 기법에 대해 소개한다. 이렇게 통합된 경로를 이용하여 생성하는 3차원 비트맵 인덱스는 그 크기가 상당히 줄어들게 되고, 기존의 연구에서 보여주었던 문제점들을 해결하게 되었다.

  • PDF

XML 공유 구조 발견을 위한 변형 순차패턴 마이닝 알고리즘 (Adapted Sequential Pattern Mining Algorithms for Finding XML Common Structure)

  • 이정원;이기호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.1-3
    • /
    • 2002
  • 최근 XML관련 연구가 급증하면서 저장 기법, 질의 최적화, 인덱싱 등의 기법이 활발히 개발되고 있다. 그러나 하나의 DTD나 XML Schema를 공유하는 문서집합이 아닌 다양한 구조를 가진 문서들을 대상으로 하는 경우, 다중 문서간의 구조적 유사성이나 차이 등을 파악할 필요가 있다. 특히 서로 다른 사이트나 문서관리 시스템에서 도출된 문서들을 병합하거나 분류할 필요가 있을 때, 두 문서의 병합 가능성 및 분류 기준을 파악하는 것은 매우 중요하다. 따라서 본 연구에서는 여러 문서들의 구조를 구성하는 경로들간의 유사성을 파악하기 위해 기존의 순차패턴 마이닝 알고리즘을 변형하였다. 변형된 순차패턴 마이닝 알고리즘[1]을 통해 두 문서간의 정확한 공유 경로를 찾을 수 있었다.

  • PDF

용어 분포 유사도를 이용한 질의 용어 확장 및 가중치 재산정 (Query Term Expansion and Reweighting using Term-Distribution Similarity)

  • 김주연;김병만;박혁로
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권1호
    • /
    • pp.90-100
    • /
    • 2000
  • 본 논문에서는 사용자의 적합 피드백을 기반으로 피드백 문서들에서 발생하는 용어들과 초기 질의와의 관련 정도를 이용하여 용어의 가중치를 산정하는 방법에 대하여 제안한다. 피드백 문서들에서 발생하는 용어들 중에서 불용어를 제외한 모든 용어들을 질의로 확장될 수 있는 후보 용어들로 선택하고 피드백 문서들에서 발생 빈도 유사성을 이용하여 초기 질의에 대한 후보 용어의 관련 정도를 산정하며, 피드백 문서들에서의 가중치와 관련 정도를 결합하여 후보 용어들의 가중치를 산정 하였다. 본 논문에서는 성능을 평가하기 위하여 KT-set 1.0과 KT-set 2.0을 사용하였으며, 성능의 상대적인 평가를 위하여 질의어를 확장하지 않은 방법, Dec-Hi방법들을 정확률-재현율을 사용하여 평가 하였다.

  • PDF

가중치에 따른 질의확장의 검색효율성 (Retrieval Effectiveness of Query Expansion depending on Term Weights)

  • 최성환
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.259-264
    • /
    • 2002
  • 기존의 질의확장 혹은 적합성 피드백 연구에서 코사인 정규화를 사용하여 검색성능을 향상시킨 연구들이 많다. 본 논문에서 실험한 결과를 근거로 하였을 때 이는 낮은 검색성능을 보였던 것이 검색공간의 확장으로 성능이 크게 향상되었을 가능성이 있다. 실험결과 가중치 유사도 모델간의 커다란 차이는 보이지 않고 코사인정규화 가중치 알고리즘에서 상당한 성능향상이 있었다. 그러나 기존의 코사인정규화 가중치 알고리즘을 이용한 전역적 질의확장의 경우 성능 향상률은 높으나 원질의어를 이용하여 가장 좋은 성능을 보였던 가중치 알고리즘들의 검색성능과 비교하면 오히려 낮은 성능을 보였다.

  • PDF

확률적 부울(Boolean) 모델과 연관성 학습을 통한 내용기반 영상 검색 성능 향상 (Performance Improvement For Content-Based Image Retrieval Using Probabilistic Bollean Model And Relevance Learning)

  • 고병철;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.556-558
    • /
    • 2001
  • 전체 영상을 이용하지 않고 영상 안에 포함된 특정 객체 혹은 영역만을 이용하는 "영역에 의한 질의(query-by-region)" 방법은 내용기반 영상 검색 중 상위개념의 방법 이지만, 영상 분할의 한계, 여러개로 분할된 영역을 모두 검색하기 위한 인덱싱 문제, 유사성 측정 시 선형적으로 분리되지 않는 특징 값들에 대한 무리한 선형 조합으로 인한 검색 오류와 같은 많은 문제점을 안고 있다. 따라서 본 논문에서는 영역 기반 영상 검색 시스템인 FRIP에 대하여 영상 분할의 한계를 극복하고, 사용자의 주관성을 영상 검색에 적용하기 위해 확률적 연관성 학습 모델(MPFRL)을 유사성 측정 단계에서 적용 하였고, 아울러 검색 모델로는 기존에 일반적으로 사용되어 오던, 선형 모델을 사용하지 않고 선형 모델보다 유연한 검색 결과를 보여주는 확률적 이접 부울 모델(PDB)을 사용하였다. 또한, 검색 시간을 단축 시키기 위해, 선형 검색 방법에 부울 AND 연산자를 적용 시킴으로써, 검색 시간을 상당부분 단축 할 수 있었다. 실험 결과, 본 논문에서 제안하는 방법(MPFRL+PDB)을 사용할 경우 검색 결과가 선형 조합 보다 향상되는 것을 알 수 있었다. 아울러 사용자 피드백을 통해 사용자가 특징 가중치를 일일이 조절하지 않더라도 단순한 몇 번의 클릭만으로 사용자의 주관성을 반영하고 보다 정확한 검색 결과를 보여 줄 수 있는 시스템을 설계 할 수 있었다.

  • PDF

SOSiM: 형태 특징 기술자를 사용한 형태 기반 객체 유사성 매칭 (SOSiM: Shape-based Object Similarity Matching using Shape Feature Descriptors)

  • 노충호;이석룡;정진완;김상희;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.73-83
    • /
    • 2009
  • 본 논문에서는 영상 내의 객체의 형태(shape)에 기반한 객체 유사성 매칭(matching) 방법을 제안한다. 제안한 방법에서는 객체의 윤곽선(edge)에서 점들(edge points)을 추출하고, 추출된 점들의 위치 관계를 나타내기 위하여 각 점을 기준으로 로그 원형 히스토그램(log polar histogram)을 생성하였다. 객체의 윤곽을 따라가며 각 점에 대한 원형 히스토그램을 순차적으로 비교함으로써 객체간의 매칭이 이루어지며, 데이타베이스로부터 유사한 객체를 검색하기 위하여 사용한 매칭 방식은 널리 알려진 k-NN(nearest neighbor) 질의 방식을 사용하였다. 제안한 방법을 검증하기 위하여 기존의 형태 문맥 기법(Shape Context method)과 제안한 방법을 비교하였으며, 객체 유사성 매칭 실험에서 k=5일 때 기존 방법의 정확도가 0.37, 제안한 방법이 0.75-0.90이며, k=10일 때 기존 방법이 0.31, 제안한 방법이 0.61-0.80로서 기존의 방법에 비해 정확한 매칭 결과를 보여 주었다. 또한 영상의 회전 변형 실험에서 기존 방법의 정확도가 0.30, 제안한 방법이 0.69로서 기존 방법보다 회전 변형에 강인한(robust) 특성을 가짐을 관찰할 수 있었다.

복합적인 영상 특성을 이용한 영상 검색 시스템 구현 (Implementation of Image Retrieval System using Complex Image Features)

  • 송석진;남기곤
    • 한국정보통신학회논문지
    • /
    • 제6권8호
    • /
    • pp.1358-1364
    • /
    • 2002
  • 현재 방송 및 인터넷분야에서는 멀티미디어 정보가 급격히 증가하고 있다. 본 논문에서는 멀티미디어 정보 중에서 정지영상 검색을 위해 사용자가 질의(query)를 원하는 물체영역을 선택한 후 유사물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상으로부터 우선 컬러특성을 추출하기 위해 제안한 방법으로 색상을 HSV 변환한 후 히스토그램을 구해 데이터베이스영상과 히스토그램 인터섹션을 통해 유사치를 구한다 또한 질의영상을 그레이영상으로도 변환시켜 웨블릿 변환한 후 밴디드 오토코릴로그램과 GLCM을 통해 공간적 그레이분포와 질감특성을 추출하여 유사치를 구한다. 그리고 2개의 유사치를 더하여 최종 유사도를 결정하는데 이때 각 유사치에 가중치를 적용하였다. 질의영상으로부터 컬러영상 특성뿐만 아니라 그레이영상 특성도 파악하여 단점을 보완하였고 실험결과에서도 소환성(recall) 및 정확성(precision)이 향상됨을 볼 수 있었다. 또한 가중치를 적용함으로써 검색효율이 개선되었다.

비디오의 움직임 객체를 위한 새로운 시공간 표현 기법의 설계 (Design of New Spatio-temporal Representation Scheme for Moving Objects in Video)

  • 심춘보;김남기;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.110-112
    • /
    • 2000
  • 이미지와는 달리, 비디오 데이터는 객체에 대한 움직임 정보(motion trajectory)를 가지고 있으며, 이러한 움직임 정보는 비디오 데이터만이 가지는 매우 중요한 특징으로 비디오 데이터에 대한 색인과 내용 기반 검색을 수행하는 데 있어 중요한 역할을 한다. 따라서, 본 논문에서는 비디오 데이터베이스에서 효율적인 내용기반 검색을 위해 하나의 객체에 대한 움직임 정보를 나타내는 single motion trajectory와 두 객체에 대한 움직임 정보를 나타내는 multiple motion trajectory를 위한 새로운 시공간 표현 기법을 제안한다. 아울러, 움직임 정보에 대한 사용자 질의에 대해 유사성을 측정하여 순위부여와 Time Interval을 지원하는 새로운 유사성 측정 알고리즘인 SIST와 SIMT를 제안한다.

  • PDF

하이퍼링크 환경에서 정보검색을 위한 개선 알고리즘 (Improved Algorithms for Information Retrieval in a Hyperlinked Environment)

  • 최익규;김희수;이병희;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.262-264
    • /
    • 2002
  • 하이퍼링크 환경에서의 정보검색은 주로 문서에 존재하는 링크정보를 이용하여 이루어진다. 본 논문은 하나의 문서에 존재하는 여러 개의 하이퍼링크마다 연결되는 문서와의 유사성을 측정하여 차등적으로 링크의 연결정보를 부여하여 기존의 알고리즘을 개선하였고, 관련이 없는 문서로의 하이퍼링크로 인해 발생되는 topic drift현상을 제거하기 위해 문서와 확장된 질의와의 유사성을 측정하여 문서의 가중치를 계산에 적용하도록 알고리즘을 개선하였다. 개선한 알고리즘의 성능을 확인하고자 TREC10의 web tree부분에 적용하여 향상된 검색 결과를 얻었다.

  • PDF