• 제목/요약/키워드: Similarity Query

검색결과 246건 처리시간 0.027초

콘텐트 기반의 이미지검색을 위한 분류기 접근방법 (Image Classification Approach for Improving CBIR System Performance)

  • 한우진;손경아
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.816-822
    • /
    • 2016
  • 콘텐트 기반 이미지 검색은 기존의 태그 또는 레이블이 있는 텍스트 기반의 검색이 아닌 이미지의 특징을 이용하여 검색하는 방법이다. 실생활 이미지 데이터는 태그나 레이블이 달려있는 경우가 많지 않기 때문에 텍스트 기반의 검색 방법을 사용하기 힘든 경우가 있다. 또한, 기존에 주로 사용되는 이미지 특징 벡터의 유사도를 사용하여 검색하는 방법은 추출 벡터의 유사도 기준으로 사용자가 의도한 결과가 나올지 확신할 수 없다. 예를 들어 사용자가 입력한 질의 이미지와 검색된 이미지들의 종류가 일치하는지의 문제가 있다. 본 논문에서는 사용자가 질의 이미지의 클래스를 예상하고 결과도 동일한 클래스를 원한다는 가정에 착안하여 이미지 검색 엔진의 성능을 개선하였다. 기존의 유사도 기반의 검색에 머신 러닝 기법을 사용한 이미지 분류기를 적용하여 질의와 동일한 클래스의 결과를 찾는 방법을 제안하였으며, 그 성능을 20개 카테고리에 속하는 11,530개의 이미지로 구성되어 있는 PASCAL VOC 공개 데이터를 이용하여 검증하였다.

용어 자동분류를 사용한 검색어 범주화의 분석적 고찰 (An Analytic Study on the Categorization of Query through Automatic Term Classification)

  • 이태석;정도헌;문영수;박민수;현미환
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.133-138
    • /
    • 2012
  • 검색 창을 통해 입력된 검색어는 정보이용자가 의미 있는 자료를 찾아내는 적극적인 활동의 산물이다. 따라서 검색로그는 정보이용자의 관심사항을 알 수 있는 중요한 분석 데이터이다. 본 연구의 목적은 입력한 검색어의 범주화 결과와 엑세스한 문서의 범주가 어느 정도 유사한 상관관계를 가지는지 분석적으로 고찰해보는 것이다. KISTI(한국과학기술정보연구원)의 NDSL(과학기술정보센터) 사이트의 2009년 검색로그의 검색세션을 식별하고 검색세션단위로 검색어와 이용 자료를 추출한 후, 검색어에 대해 어떤 주제 분류에 속하는 용어인지 자동분류기로 식별한 결과가 실제 이용한 자료의 주제 분야와 잘 맞는지 비교하였다. 그 결과 상위 100개 검색어 분류에 대한 유사도 평균이 58.8%로 파악되었다. 결국 전체적인 유사도는 58.8%이하이며, 관련 연구에서 수행한 자료의 자동분류 검색성능 전문가 평가 결과인 76.8%에 비해 낮다. 이것은 검색어로 쓰인 용어가 다른 연구 분야의 관심 용어로 새롭게 주목 받고 있기 때문이라는 사실을 알 수 있었다.

웨블릿 변환기법을 이용한 내용기반 컬러영상 검색시스템 구현 (Implementation of Content Based Color Image Retrieval System using Wavelet Transformation Method)

  • 송석진;이희봉;김효성;남기곤
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.20-27
    • /
    • 2003
  • 본 논문에서는 사용자가 질의를 원하는 물체 영역을 선택하면 유사 물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상은 색상성분과 그레이성분으로 나누어져 웨블릿 변환되고 색상성분에서는 컬러 오토코릴로그램과 분산으로 색상특성을 추출한다. 그리고 그레이성분에서는 오토코릴로그램과 GLCM을 통해 질감특성을 추출한다. 이렇게 구한 2개 성분에서의 특성들을 이용하여 데이터베이스내의 영상들과 각각 유사도를 비교하여 검색하게 된다. 이때 각 유사도에 가중치를 적용하였다. 한 가지 성분보다 두 가지 성분에서 특성을 구하여 각각의 단점을 보완하였고 실험 결과에서도 소환성(recall) 및 정확성(precision)이 향상됨을 볼 수 있었다 또한 가중치를 적용함으로써 검색 효율이 개선되었다. 그리고 데이터베이스내 영상들의 여러 특성을 특성 라이브러리내에 자동 색인화 시킴으로써 고속의 영상 검색이 가능하였다.

Dominant 컬러쌍 정보와 Color Correlogram을 이용한 객체기반 영상검색 (Object-based Image Retrieval Using Dominant Color Pair and Color Correlogram)

  • 박기태;문영식
    • 전자공학회논문지CI
    • /
    • 제40권2호
    • /
    • pp.1-8
    • /
    • 2003
  • 본 논문에서는 컬러 영상에서 Dominant 컬러쌍 정보를 이용한 객체기반 영상검색 기법을 제안한다. 기존의 대부분 연구에서는 관심있는 객체를 포함한 영상 전체에 대해 특징값을 추출하여 유사 영상을 검색함으로써 배경으로 인해 검색 성능이 나빠지는 단점이 있었다. 본 논문에서는 관심있는 객체 정보만 질의로 사용하고 DB내의 영상들에 대해서도 객체가 존재할 수 있는 후보 영역을 추출한 후 유사도를 측정하는 방법을 제안한다. 제안하는 기법은 평탄 컬러 영역들이 이웃하고 있는 경계부분에서의 Dominant 컬러쌍 정보를 추출하여 특징값으로 사용하였으며, 유사도는 색상을 이용한 Color Correlogram 방법을 사용하였다. 제안하는 Dominant 컬러쌍 특징값은 이동, 회전, 그리고 크기변화에 강건한 특성을 갖는다. 질의 객체 영상에 대해서 DB내에 있는 각각의 영상에 대해 영상 전체를 비교하는 것이 아니라 객체가 존재하는 영역을 추출한 후 유사도를 측정함으로써, 배경 컬러에 의해 영상이 잘못 검출되는 오류가 줄고, 검색 성능이 향상됨을 실험을 통해 확인하였다.

다양한 환경에 강건한 DSTW 기반의 동적 손동작 인식 (A Robust Method for the Recognition of Dynamic Hand Gestures based on DSTW)

  • 지재영;장경현;이정호;문영식
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.92-103
    • /
    • 2010
  • 본 논문에서는 Dynamic Space Time Warping(DSTW) 알고리즘을 이용하여 손동작을 다양한 배경에서도 정확하게 인식할 수 있는 방법을 제안한다. DSTW 알고리즘을 이용한 기존의 손동작 인식 방법은 질의 영상의 매 프레임마다 검출된 다수의 손 후보 영역과 모델 영상을 시간 축 상으로 비교하는 방법이다. 그러나 DSTW 알고리즘을 이용한 기존의 손동작 인식 방법은 손을 포함하지 않은 후보 영역들(배경, 팔꿈치 등)에 의해 오 인식될 수 있는 경로를 생성하며, 그 결과로 사용자가 의도하지 않은 손동작으로 인식된다. 이러한 단점을 해결하기 위해서, 본 논문에서는 손 후보 영역의 불변 모멘트를 이용하여 질감정보를 추출한 후 후보 영역들 사이의 유사도를 비교한다. 제안한 방법을 통해 계산된 유사도는 모델 영상과 질의 영상의 매칭 비용에 가중치로 적용된다. 실험 결과를 통해 제안한 방법은 다양한 배경에서도 사용자의 손동작을 정확하게 인식하였으며 기존의 방법에 비해 약 13%의 인식률이 향상한 것을 확인하였다.

특징벡터의 끌러스터링 기법을 통한 2단계 내용기반 이미지검색 시스템 (Two-phase Content-based Image Retrieval Using the Clustering of Feature Vector)

  • 조정원;최병욱
    • 전자공학회논문지CI
    • /
    • 제40권3호
    • /
    • pp.171-180
    • /
    • 2003
  • 내용기반 이미지검색이란 색상, 형태 및 질감 등의 저-수준 특징정보를 이용하여 이미지 데이터베이스를 구축하고, 이미지에 대한 검색요구가 발생했을 때 사용자가 찾고자 하는 이미지와 유사한 이미지를 제공하는 시스템으로 정의된다. 데이터베이스의 구축시간과 사용자가 질의를 입력한 후 결과를 얻을 때까지의 반응시간을 나누어 고려할 때, 사용자는 반응시간에 보다 관심을 갖는 것이 일반적이다. 내용기반 이미지검색 시스템에서 질의이미지와 데이터베이스 내의 이미지와의 유사도 비교시간이 전체 반응시간 중에서 가장 큰 비중을 차지한다. 본 논문에서는 이러한 유사도 비교시간을 최소화하기 위해 특징벡터의 클러스터링 기법을 적용한 2단계 탐색방법을 제안한다. 실험 결과를 통해 제안하는 2단계 탐색방법으로 대용량의 이미지 데이터베이스 내의 전체 이미지에 대한 원 특징정보와 비교하는 전체검색에 비해, 동일한 적합성을 보장하면서 평균적으로 2배 이상의 검색속도 향상을 확인하였으며, 이미지의 수가 더욱 커질수록 효과적임을 입증하였다.

색상-공간 특징을 사용한 내용기반 칼라 이미지 검색 시스템의 설계 및 구현 (Design and Implementation of a Content-based Color Image Retrieval System based on Color -Spatial Feature)

  • 안철웅;김승호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권5호
    • /
    • pp.628-638
    • /
    • 1999
  • 본 논문에서는 색상-공간 특징을 사용하여 24bpp RGB 칼라 이미지를 검색하는 방법을 제안한다. 각 이미지는 RGB 색상공간에서 인지적 균등 색상공간인 CIE L*u*v* 색상공간으로의 변환을 거친 후 색상 유사도를 사용하여 여러 개의 영역으로 나누어진다. 크기가 작은 영역은 무시할 수 있으며, 큰 영역은 공간 특징을 추출하기 어려우므로, 영역 분할 시 영역의 크기에 제약을 가하였다. 분할 된 각 영역의 평균 색상과 중점을 색상-공간 특징으로 추출하게 된다. 검색 과정에서는 질의의 색상-공간 특징과 데이타베이스 이미지의 색상-공간 유사도를 검사하여 검색하게 된다. 사용자 그래픽 질의와 예제 이미지에 의한 검색이 가능한 내용기반 이미지 검색 시스템을 구현하였다. 실험한 결과 Recall/Precision이 0.80/0.84였다.

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저 (e-Cohesive Keyword based Arc Ranking Measure for Web Navigation)

  • 이우기;이병수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.22-29
    • /
    • 2009
  • 웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

허밍 질의 처리 시스템의 성능 향상을 위한 효율적인 빈번 멜로디 인덱싱 방법 (An Efficient Frequent Melody Indexing Method to Improve Performance of Query-By-Humming System)

  • 유진희;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권4호
    • /
    • pp.283-303
    • /
    • 2007
  • 최근 방대한 양의 음악데이타를 효율적으로 저장하고 검색하기 위한 방법의 필요성이 증대되고 있다. 현재 음악 데이타 검색에서 가장 일반적으로 쓰이는 방법은 텍스트 기반의 검색 방법이다. 그러나 이러한 방법은 사용자가 키워드를 기억하지 못할 경우 검색이 어려울 뿐만 아니라 키워드와 정확하게 일치하는 정보만 검색해 주기 때문에 유사한 내용을 가진 정보를 검색하기에 부적절하다. 이러한 문제점을 해결하기 위해 본 논문에서는 내용 기반 인덱싱 방법(Content-Based Indexing Method)을 사용하여 사용자가 부정확한 멜로디(Humming)로 질의하였을 경우라도 원하는 음악을 효율적으로 찾아주는 허밍 질의처리 시스템(Query-By-Humming System)을 설계한다. 이를 위해 방대한 음악 데이타베이스에서 한 음악을 대표하는 의미 있는 멜로디를 추출하여 인덱싱하는 방법을 제안한다. 본 논문에서는 이러한 의미 있는 멜로디를 사용자가 자주 질의할 가능성이 높은 멜로디로서 하나의 음악에서 여러 번 나타나는 반면 멜로디와 긴 쉼표 후에 시작되는 쉼표 단위 멜로디로 정의한다. 실험을 통해 사용자들이 이들 멜로디를 자주 질의한다는 가정을 증명하였다. 본 논문은 성능 향상을 위한 3가지 방법을 제안한다. 첫 번째는 검색속도를 높이기 위해 인덱스에 저장할 멜로디를 문자열 형태로 변환한다. 이때 사용되는 문자 변환 방법은 허밍에 포함된 에러를 허용한 방법으로써 검색 결과의 정확도를 높일 수 있다. 두 번째는 사용자가 자주 질의할 가능성이 높은 의미 있는 멜로디를 인덱싱 하여 검색 속도를 높이고자 한다. 이를 위해 신뢰도가 높은 의미 있는 멜로디를 생성하는 빈번 멜로디 추출 알고리즘과 쉼표 단위 멜로디 추출 방법을 제안한다. 세 번째로는 정확도를 향상시키기 위한 3단계 검색 방법을 제안한다. 이는 데이타베이스 접근을 최소화하여 정확한 검색 결과를 얻기 위하여 제안되었다. 또한 기존 허밍 질의 처리 시스템의 대표적인 인덱싱 방법으로 제안되었던 N-gram 방법과의 성능 비교를 통해 본 논문이 제안하는 방법의 성능이 보다 더 향상되었음을 검증하였다.

유사도 검색을 위한 데이터 재배열을 이용한 공간 효율적인 역 색인 기법 (A Space-Efficient Inverted Index Technique using Data Rearrangement for String Similarity Searches)

  • 임마누;김종익
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1247-1253
    • /
    • 2015
  • 유사도 검색에서는 효율적으로 유사성을 만족하는 문자열을 찾기 위해서 데이터에 대한 역 색인을 구축하여 이용한다. 일반적으로 기존의 기법들은 빠른 응답속도의 질의처리를 위해서 역 색인을 메모리에 상주시킨다. 하지만 구축된 역 색인은 그 크기가 매우 크다는 문제점을 가지고 있다. 따라서 데이터의 크기가 매우 큰 경우나 자원이 제약적인 환경에서는 역 색인을 이용한 질의처리가 불가능할 수 있다. 본 논문에서는 동일한 q-그램을 포함하는 문자열들이 서로 인접한 위치가 되도록 재배치시킨 후 해당 문자열들을 범위로 표현한다. 실험을 통하여 질의처리의 성능을 희생하지 않으면서도 색인의 크기가 줄어드는 것을 보인다.