• 제목/요약/키워드: 유사도 질의

검색결과 1,858건 처리시간 0.028초

HummingBird: 향상된 스케일드앤워프트 매칭을 이용한 유사 음악 검색 시스템 (HummingBird: A Similar Music Retrieval System using Improved Scaled and Warped Matching)

  • 이혜환;심규석;박형민
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.409-419
    • /
    • 2007
  • 허밍을 통한 유사 검색 질의가 주어질 때 효과적으로 음악 데이타베이스를 검색하는 시스템에 대한 연구는 다양한 방향으로 진행되어 왔다. 최근에는 음악 데이타베이스와 허밍 질의를 시계열 데이터로 변환하여 시계열 데이타의 유사 검색과 관련하여 제안되어 왔던 여러 가지 거리 척도(distance measure)나 인덱싱 기법등을 적용하여 효과적으로 질의를 처리하려는 시도가 계속 되고 있다. 허밍 질의의 특성을 고려하여 균일 스케일링(Uniform Scaling)과 동적 프로그래밍을 사용한 타임 워핑(Dynamic Time Warping)을 함께 고려한 스케일드 앤 워프트 매칭(Scaled and Warped Matching) 거리를 사용하여 효과적인 유사 검색을 하는 방법은 가장 최근 제시된 방법 중 하나이다. 본 논문에서는 허밍을 통한 유사 검색 시스템인 Humming BIRD(Humming Based sImilaR miDimusic retrieval system)를 제안하고 구현하였다. 슬라이딩 윈도우를 사용하여 음악의 임의의 부분에 대한 허밍 질의를 처리할 수 있도록 하였으며 더 효율적으로 검색하기 위해 이전의 균일 스케일링을 변형하여 중심을 일치시킨(center-aligned) 균일 스케일링을 제안하고 이와 타임 워핑을 결합한 형태의 스케일드 앤워프트 매칭을 제안하였다. 이 거리의 좀 더 타이트한 하한을 계산하는 하계 함수를 사용하여 탐색 공간(search space)을 효과적으로 줄여 더 빠르고 효과적인 유사 검색을 가능하도록 하였다. 마지막으로 실험을 통해 개선된 스케일드 앤 워프트 매칭이 이전에 비해 같은 검객 결과를 얻으면서도 효과적으로 검색함을 탐색 공간을 줄이는 가지치기 성능을 비교함으로써 보였다.

잠재적 의미 색인을 이용한 유사 질의어 확장 (Query expansion by Similar words Using LSI)

  • 임태훈;안동언;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-169
    • /
    • 2009
  • 오늘날 인터넷 검색은 하루가 다르게 발전되고 있다. 주로 키워드 매칭에 의존을 둔 지금의 검색 서비스들은 사용자 중심의 아이템들을 개발해 정보검색의 경과시간 및 결과의 분류면에서 우수함을 보여주고 있다. 질의어의 의미에 유사한 검색은 아직은 발전하는 단계로, 내용에 기반을 둔 검색 환경에 초점이 맞춰지고 있다. 이와 관련하여 행렬의 특이치 분해(SVD)를 이용한 잠재적 의미 색인 기법(LSI)을 본 연구에서 다루고자 한다. 구축한 시스템의 성능 평가는 재현도 계산으로 비교되었는데 작은 크기의 특이값(singular value)들 생략에 의한 SVD의 성능과 그것을 재이용, 질의어에 대한 의미 구조상 근접한 용어들을 찾아 질의어를 확장한 후 적합한 문서들의 검색을 사용한 특이값 개수, 유사단어 확장 개수를 달리하여 실험하였다. 실험 결과, 특이값 2개를 사용한 잠재적 의미 색인이 특이값 3개를 사용한 잠재적 의미 색인보다 보다 나은 성능을 보였다. 그리고 조건을 달리한 모든 잠재적 의미 색인의 경우 단어 매칭에 의한 적합문서 검색보다 별 뚜렷한 나은 결과는 보이지 않았다. 하지만 의미적으로 관계가 깊은 유사어들을 찾아냈고, 의미적으로 가장 관계 깊은 문서를 대부분의 경우에서 순위 1위로 찾아내는 부분적 우수함을 보였다.

  • PDF

주제어구 추출과 질의어 기반 요약을 이용한 문서 요약 (Document Summarization using Topic Phrase Extraction and Query-based Summarization)

  • 한광록;오삼권;임기욱
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.488-497
    • /
    • 2004
  • 본 논문에서는 추출 요약 방식과 질의어 기반의 요약 방식을 혼합한 문서 요약 방법에 관해서 기술한다. 학습문서를 이용해 주제어구 추출을 위한 학습 모델을 만든다. 학습 알고리즘은 Naive Bayesian, 결정트리, Supported Vector Machine을 이용한다. 구축된 모델을 이용하여 입력 문서로부터 주제어구 리스트를 자동으로 추출한다. 추출된 주제어구들을 질의어로 하여 이들의 국부적 유사도에 의한 기여도를 계산함으로써 요약문을 추출한다. 본 논문에서는 주제어구가 원문 요약에 미치는 영향과, 몇 개의 주제어구 추출이 문서 요약에 적당한지를 실험하였다. 추출된 요약문과 수동으로 추출한 요약문을 비교하여 결과를 평가하였으며, 객관적인 성능 평가를 위하여 MS-Word에 포함된 문서 요약 기능과 실험 결과를 비교하였다.

객체지향 시소러스에서의 참조 질의 조건 완화 기법 (Relaxing Reference Queries in the Object-Oriented Thesaurus)

  • 김정애;박종민;김원중;양재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.208-210
    • /
    • 2002
  • 현재의 정보검색 시스템에서 사용자는 관련 분야의 지식을 가지고 정확한 질의를 작성해야만 원하는 결과를 얻을 수 있다. 이 문제를 해결하기 위하여, 본 논문에서는 객체지향 시소러스에서의 참조 질의 조건 완화를 이용한 지능적인 질의 처리 기법을 제안한다. 참조 질의 조건 완화 기법은 객체지향 시소러스의 구조적인 특징을 이용하여 질의 조건을 일반화시킨다. 따라서 사용자는 정확한 질의를 제공하지 않아도 정확한 결과뿐만 아니라 유사하거나 관련 있는 정보를 얻을 수 있다.

  • PDF

중요 문장추출 휴리스틱과 MMR을 이용한 질의기반 문서요약. (Query-Based Document Summarization using Important Sentence Selection Heuristics and MMR.)

  • 김동현;이승우;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-291
    • /
    • 2002
  • 본 논문은 자연어 검색엔진에서의 검색결과에 대한 HIT LIST[6]와 검색 문서의 요약을 위하여 질의 기반의 3단계 문서요약을 제안한다. 첫째단계로 IR에 주어지는 질의를 유의어 DB를 통해 질의확장을 거친다. 둘째로 질의와 검색문서상의 문장의 유사도 계산을 통해 문장의 중요도 점수를 구한다. 좀더 정확한 요약을 위해 4가지 방법론을 적용하여 각 문장의 중요도를 ranking한다. 셋째로 MMR (Maximal Marginal Relevance)방식을 적용하여 요약 시 중복이 되는 부분을 줄인다. 이때 요약 압축률을 임의로 조절할 수 있다. 실험은 KORDIC의 신문기사로 구성된 문서요약 테스트 집합을 사용하여 좋은 요약결과를 얻었다.

  • PDF

가추적 추론에 기반한 가부형(O/X 퀴즈) 질의응답 시스템 (Abductive Reasoning based Question Answering System for Yes/No Quiz)

  • 허정;이형직;배용진;김현기;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.46-49
    • /
    • 2015
  • 본 논문에서는 가추적 추론에 기만한 질의응답 기술을 활용하여 O/X 퀴즈 질문에 대한 질의응답을 수행하는 기술에 대해서 소개한다. O/X 퀴즈를 기존의 질의응답 기술에 적용하기 위해서는 O/X 퀴즈 문장을 단답형 질문으로 재생성해야 한다. 질문재생성에서는 단답형 질문으로 변환하기 위해 특정 어휘(또는 개체나 구)를 <지시대명사>나 <지시관형사+명사>로 대체한다. 이때 대체된 어휘는 정답후보로 인식된다. 단답형질문과 정답후보의 쌍으로 구성된 정답가설은 근거검색과 유사도에 기반한 신뢰도 값 계산을 통해, O/X를 결정하게 된다. 실험을 통해, 신뢰도 임계값이 0.45일 때 정확률이 69.17%를 보였다.

  • PDF

부분 서열 정렬을 이용한 확대축소 부분 영상 검색 기법 (Scaled Sub-image Retrieval Approach using Alignment of Sub-Sequence)

  • 김준호;장원앙;양익석;이도훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.512-515
    • /
    • 2012
  • 부분 영상 검색은 질의 영상을 입력으로 사용해서 질의 영상을 부분 영상으로 포함하는 대상 영상을 찾아낸다. 본 논문에서는 부분 영상 검색에 생물정보학에서 사용하는 정렬(Alignment)을 이용한다. 생물정보학에서는 두 DNA 서열 간에 유사도를 비교하고 시각화하는 방법으로 점 행렬을 널리 사용한다. 두 영상을 정렬하기 위해서 먼저 질의 영상과 대상 영상을 일차원 명암도 영상 서열로 변환하고 정렬하여 부분 영상 후보 영역을 찾는다. 이전 연구[1]에서 정렬하는 방법은 두 서열의 길이의 곱만큼의 메모리 공간이 필요하므로 두 서열의 길이가 길어지면 필요한 메모리 공간이 선형적으로 증가했다. 본 논문에서는 영상 데이터의 특성을 이용해서 부분 서열 정렬로 필요한 메모리 공간을 줄였고 부가적인 효과로 처리시간이 감소하고 정확도가 상향되었다.

운동학적 접근 방법을 사용한 복잡한 인간 동작 질의 시스템 (A Kinematic Approach to Answering Similarity Queries on Complex Human Motion Data)

  • 한혁;김신규;정형수;염헌영
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-11
    • /
    • 2009
  • 대규모 인간 동작 데이터베이스에서 고차원의 데이터를 처리하는 것이 큰 비용을 요구하기에, 최근 데이터베이스 및 그래픽스 학계는 인간 동작 데이터 질의 및 접근에 큰 관심을 가지게 되었다. 특히, 인간 동작 데이터를 위한 효과적인 유사도(거리) 측정 방법이나 질의 처리는 여전히 많은 연구진들이 도전하고 있는 문제이다. 이에, 본 연구진은 SMoFinder 라고 명명한 동작 질의 처리 시스템을 제안한다. SMoFinder는 새롭게 고안된 운동학적 거리 측정 그리고 적응적 프레임 세그멘테이션에 기반하는 효율적인 인덱싱을 사용하여 동작 질의를 처리한다. 이를 위해, SMoFinder에서는 인간 동작을 다연결 물리 운동으로 간주하고 새로운 가중치 Minkowski 함수를 정의했다. 또한, 효율적인 인덱싱을 위해 모든 프레임을 저장하지 않고 유사한 프레임들 중에서 대표 프레임을 뽑아서 저장하는 적응적 세그멘테이션을 고안했다. 그리고, 효율적인 검색을 위해 이들 대표 프레임들만 가지고 k-근접 이웃 질의를 수행하는 새로운 방법을 제안한다. 마지막으로, SMoFinder가 데이터베이스 용량이 크게 줄지만(1/25배), 검색 능력은 다른 시스템과 동일하거나 우월하다는 것을 실험을 통해 보여주고자 한다.

  • PDF

유사 멜로디 검색을 이용한 음악 표절 감지 시스템 (A Music Plagiarism Detection System Using Similar Melody Searching)

  • 박정일;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.97-100
    • /
    • 2004
  • 유사 멜로디 검색은 질의 멜로디와 유사한 멜로디들을 음악 데이터베이스로부터 찾는 연산이다. 본 논문에서는 유사 멜로디 검색을 기반으로 하는 표절 감지 시스템 개발에 관하여 논의한다. 먼저, 정합 및 이동 변환을 지원하는 새로운 유사 모델을 제안한다. 또한, 각 멜로디의 특징들을 인덱싱 하는 방법과 인덱스를 기반으로 표절 감지를 처리하는 방법을 제시한다. 제안된 표절 감지 시스템을 이용하여 작곡가는 자신의 멜로디와 유사한 멜로디를 가지는 곡들을 음악 데이터베이스에서 효과적으로 검색할 수 있다. 실험을 통한 성능 평가를 통하여 제안된 기법의 우수성을 규명한다. 실험 결과에 의하면, 제안된 기법은 순차 검색을 기반으로 하는 방법과 비교하여 약 31배까지의 성능 개선 효과를 보였다.

  • PDF

분산 네트워크 환경에서의 웹뷰 구체화 (A study of WebView materialization on distributed network environment)

  • 서진형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.211-213
    • /
    • 2002
  • 현재의 정보검색 시스템에서 사용자는 관련 분야의 지식을 가지고 정확한 질의를 작성해야만 원하는 결과를 얻을 수 있다. 이 문제를 해결하기 위하여, 본 논문에서는 객체지향 시소러스에서의 참조 질의 조건 완화를 이용한 지능적인 질의 처리 기법을 제안한다. 참조 질의 조건 완화 기법은 객체지향 시소러스의 구조적인 특징을 이용하여 질의 조건을 일반화시킨다. 따라서 사용자는 정확한 질의를 제공하지 않아도 정확한 결과뿐만 아니라 유사하거나 관련 있는 정보를 얻을 수 있다.

  • PDF