• 제목/요약/키워드: region based image retrieval

검색결과 109건 처리시간 0.03초

다중 특징을 이용한 영상 및 비디오 내용 기반 검색 시스템 설계 (Content-Based Retrieval System Design for Image and Video using Multiple Fetures)

  • 고병철;이해성;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권12호
    • /
    • pp.1519-1530
    • /
    • 1999
  • 오늘날 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 멀티미디어 데이타베이스에 대한 효율적인 관리는 더욱 중요한 의미를 가지게 되었다. 게다가 영상과 같은 비 문자형태의 데이타에 대한 사용자들의 내용기반 검색욕구 증가로 인해 비디오 인덱싱에 대한 관심은 더욱 고조되고 있다. 따라서 본 논문에서는 우선적으로 분할된 샷 경계면에서 추출된 대표 프레임과 정지 영상 데이타베이스로부터 유사 영상과 유사 대표 프레임을 검색할 수 있는 환경을 제공한다. 우선적으로 영상에 의한 질의는 기존에 주로 사용되어온 색상 히스토그램방식을 탈피하여 본 논문에서 제안하는 CS와 GS방식을 이용하여 색상 및 방향성 정보도 고려하도록 설계하였다. 또한 얼굴에 의한 질의는 대표 프레임으로부터 얼굴 영역을 추출해 내고 얼굴의 경계선 값 및 쌍 직교 웨이블릿 변환에 의해 얻어진 2개의 특징값을 이용하여 유사 인물이 포함된 대표 프레임을 검색해 내도록 설계하였다. Abstract There is a rapid increase in the use of digital video information in recent years, it becomes more important to manage multimedia databases efficiently. There is a big concern about video indexing because users require content-based image retrieval. In this paper, we first propose query-by-image system environment which allows to retrieve similar images from the chosen representative frames or images from the image databases. This algorithm considers not only the discretized color histogram but also the proposed directional information called CS & GS method. Finally, we designe another query environment using query-by-face. In this system , user selects a people in the representative frame browser and then system extracts a face region from that frame. After that system retrieves similar representative frames using 2 features, edge information and biorthogonal wavelet transform.

GLIBP: Gradual Locality Integration of Binary Patterns for Scene Images Retrieval

  • Bougueroua, Salah;Boucheham, Bachir
    • Journal of Information Processing Systems
    • /
    • 제14권2호
    • /
    • pp.469-486
    • /
    • 2018
  • We propose an enhanced version of the local binary pattern (LBP) operator for texture extraction in images in the context of image retrieval. The novelty of our proposal is based on the observation that the LBP exploits only the lowest kind of local information through the global histogram. However, such global Histograms reflect only the statistical distribution of the various LBP codes in the image. The block based LBP, which uses local histograms of the LBP, was one of few tentative to catch higher level textural information. We believe that important local and useful information in between the two levels is just ignored by the two schemas. The newly developed method: gradual locality integration of binary patterns (GLIBP) is a novel attempt to catch as much local information as possible, in a gradual fashion. Indeed, GLIBP aggregates the texture features present in grayscale images extracted by LBP through a complex structure. The used framework is comprised of a multitude of ellipse-shaped regions that are arranged in circular-concentric forms of increasing size. The framework of ellipses is in fact derived from a simple parameterized generator. In addition, the elliptic forms allow targeting texture directionality, which is a very useful property in texture characterization. In addition, the general framework of ellipses allows for taking into account the spatial information (specifically rotation). The effectiveness of GLIBP was investigated on the Corel-1K (Wang) dataset. It was also compared to published works including the very effective DLEP. Results show significant higher or comparable performance of GLIBP with regard to the other methods, which qualifies it as a good tool for scene images retrieval.

지역 밀집도 및 Hausdorff 거리를 이용한 영상기반 텍스트 매칭 (Image Based Text Matching Using Local Crowdedness and Hausdorff Distance)

  • 손화정;김지수;박미선;유재명;김수형
    • 한국콘텐츠학회논문지
    • /
    • 제6권10호
    • /
    • pp.134-142
    • /
    • 2006
  • 본 논문에서는 영상의 유사성을 측정하는데 많이 이용되는 Hausdorff거리 기법이 텍스트 영상을 검색하는 분야에도 효과적임을 입증하고자 한다. 즉, 시차를 두고 스캔된 임의의 텍스트 영상들의 동일성 여부를 판단할 수 있는 영상기반 텍스트 매칭 기법을 제안하고 이를 위해 지역 밀집도와 Hausdorff 거리를 이용한다. Hausdorff 거리 방법은 처리시간이 오래 걸리는 단점이 존재하는데, 본 논문에서는 지역 밀집도 알고리즘을 이용한 특징점 추출을 수행하여 이를 보완하였다. 우편 봉투에서 얻은 텍스트 영상으로 190개의 동일 영상 190개의 비등일 영상을 만들어 실험을 수행하였다. 기존에 영상 간의 유사도 매칭에 가장 일반적으로 이용되는 이진 상관도 및 Hausdorff 거리 방법과 본 논문에서 제안한 수정된 Hausdorff 방법의 실험 결과를 비교한 결과, 유사한 영역을 찾고 일치하는 정도를 얻는데 있어 다른 방법에 비해 약 2.7%에서 9.0%의 높은 정확률을 얻어 성능의 우수성을 입증하였다.

  • PDF

자동 객체 영역 추출과 GLCM 기반 Texture특징을 이용한 영상 검색 시스템 구현 (Implementation of Image-Retrieval System Using Automatic Object Region Extraction and Property of GLCM-based Texture)

  • 김성빈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 추계학술대회
    • /
    • pp.255-257
    • /
    • 2008
  • 본 논문에서는 최근 IT 기술의 발전에 따라 무수히 양산되고 있는 멀티미디어 데이터를 효율적으로 검색하기 위한 방법을 제안한다. 영상 검색 시스템에 사용되는 데이터베이스(DB) 영상들에 존재하는 각 객체들의 존재 영역을 기반으로 질의 영상 (query image)의 객체 영역을 추정해서 검색에 활용하는 것이다. 이는 질의 영상의 전체 영역으로부터 객체를 추정하는 것보다 데이터베이스 영상들로부터 추출한 통계적 객체 분포 범위를 기반으로 추정하기 때문에 빨리 객체 추출이 가능하도록 한다. 따라서 객체를 추출하기 위한 배경 지식이나, 사용자 입력이 전혀 필요 없다. 이렇게 추출된 객체 영역의 영상들로부터 GLCM 알고리즘을 이용해서 객체 영역의 특성이 잘 반영된 질감 특징 값을 바탕으로 검색에 활용 할 경우 원본 영상의 질감 특징을 활용한 경우보다, 객체의 질감 특징을 더 잘 반영한다는 것을 실험을 통해 확인할 수 있었다.

  • PDF

사용자 선호도와 시각적 기술자를 이용한 사용자 프로파일 기반 이미지 추천 알고리즘 (Image recommendation algorithm based on profile using user preference and visual descriptor)

  • 김덕환;양준식;조원희
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.463-474
    • /
    • 2008
  • 정보 기술과 인터넷의 발전은 멀티미디어 컨텐츠의 양에 있어서 폭발적인 성장을 가져 왔으며 이러한 멀티미디어 컨텐츠 양의 증가는 이용자의 요구에 맞는 멀티미디어 컨텐츠 추천에 대한 필요성을 더 증가 시켰다. 현재까지 일반상품과 멀티미디어 컨텐츠 추천을 위한 기법에는 협업필터링 (CF: Collaborative Filtering)이 있다. 하지만 기존의 CF 기법은 이미지가 갖고 있는 시각적 특징을 제대로 표현하지 못하고 있으며, 입력 데이터의 희박성 (Sparsity) 문제와 신상품 추천 문제 그리고 선호도의 동적인 변화 문제를 포함하고 있기 때문에 이미지 컨텐츠 추천에는 적합하지 않다. 이와 같은 기존의 CF기법의 단점을 해결하기 위해서 본 논문에서는 새로운 이미지 추천 방법으로 FBCF (Feature Based Collaborative Filtering) 기법을 제안한다. FBCF 기법은 시각적 특징을 선호도에 따라 군집화한 새로운 사용자 프로파일 구성방법을 제시하며, 선호도 피드백을 통하여 구매자의 현재 성향을 추천에 반영할 수 있다. 실제 모바일 이미지 데이터를 사용한 실험에서 FBCF 기법이 기존의 CF 기법보다 400% 향상된 성능을 보임을 확인할 수 있다.

IPTV에서 컷 검색을 위한 색 분포정보를 이용한 FE-CBIRS (FE-CBIRS Using Color Distribution for Cut Retrieval in IPTV)

  • 구건서
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.91-97
    • /
    • 2009
  • 본 논문은 IPTV에서 방영되는 디지털 콘텐츠에서 검색하고자 하는 컷의 위치 정보를 검색하는데, 이때 색 분포에 관한 특징 정보를 이용한 FE-CBIRS을 제안한다. 기존 CBIRS에서는 색상과 모양에 대한 정보를 추출하여 이미지를 구분하는 특징정보로써 활용하며, 이미지를 세그멘테이션 처리하여 얻은 부분영역 특징정보를 전체 이미지의 특징정보와 함께 사용하여 검색하는 방법을 제시하였다. 또한 적용되는 색상 특징 정보의 경우 색상, 채도, 명도의 각각에 대한 평균, 표준편차, 왜도를 사용하며 부분영역을 특징정보로 적용하는 경우 대표색상만을 사용한다. 아울러 모양특징정보의 경우 추출된 부분영역들에 대한 불변 모멘트가 주요하게 사용된다. 이로 인한 처리시간의 문제, 정확성의 문제가 제기되어 왔다. 그러나 본 논문에서 제시하는 방법에서는 추출된 색상 특징정보들을 클래스별로 구분하여 인덱싱 하고 검색 시 비교대상 이미지를 해당 컷에 한정하여 적용하므로서 검색속도를 향상시키도록 하였다.

한국과 영국 사이의 국립공원 자연 경관 특색의 판별 분석 - 내용기반 영상검색의 저단계 기능 측면에서 - (Discriminant Analysis of Natural Landscape Features in National Parks between Korea and Scotland - Using Low-Level Functions of Content-Based Image Retrieval -)

  • 이덕재
    • 한국환경생태학회지
    • /
    • 제22권3호
    • /
    • pp.289-300
    • /
    • 2008
  • 질감, 모양, 색채 등 내용기반 영상검색(CBIR)의 기능을 이용하여 한국의 지리산 국립공원과 영국의 케이른고럼스 국립공원의 자연 경관에 있어서의 차이를 판별하는데 본 연구의 목적이 있다. 먼저 각 국립공원의 자연경관을 디지털 사진영상으로 촬영한 후, 전형적인 경관사진을 선별하였다. 사진영상의 저단계 기능(Low-level function)이 계량화되어 수직적으로 회전된 다섯 개의 요인으로 축약되었다. 이 중 유의한 차이를 보이지 않은 물 관련 요인이 제외된 나머지 네 개의 요인에 근거한 판별선이 케이른고럼스 경관과 지리산 경관 사이에서 도출되어, 판별함수가 두 그룹을 유의하게 분할하였다($x^2(4)$=61.433; p<0.001). 고유치 2.417과 월크스 람다 0.293에 의하여 전체 변이가 두 그룹의 판별함수 평균의 차이에서 대부분 산출되었음을 확인하였다. 또한, 네 개의 독립변수가 종속변수 전체 분산의 70.7%를 설명하는 것으로 추정되었다. 경관에 대하여 가장 큰 효과를 나타내는 변수는 원거리관련 변수(r=1.073)이며, 다음으로 근거리관련 변수(r=0.896)였으며, 전체적으로 90.7%가 타당하게 분류되었다. 이는 케이른고럼스 국립공원과 지리산 국립공원 자연경관 사이에서 사진영상의 근거리 요인뿐만 아니라, 원거리 요인이 보다 경관 차이에 유의한 판별력을 보이는 것으로 해석되므로, 국립공원의 경관정체성과 관련한 원거리 스카이라인의 시각적 중요성을 보여주는 것이라 하겠다.

가변 블록 DCT를 이용한 영상 검색 기법 (Image Retrieval using Variable Block Size DCT)

  • 김동우;서은주;윤태승;안재형
    • 한국멀티미디어학회논문지
    • /
    • 제4권5호
    • /
    • pp.423-429
    • /
    • 2001
  • 본 논문은 JPEG/MPEG과 같은 영상 압축에 사용되는 DCT(Discrete cosine transform)의 DC 성분으로 영상을 검색하는 방법을 개선한 기법을 제시한다. 기존의 방법은 DCT의 블록 크기를 고정한 후 DC비교로 검색한다. 이 방법은 블록 크기를 늘리면 검색 속도는 빠르지만 정보의 정확성이 떨어진다. 반대로 블록 크기를 줄이면 정보의 정확성은 높아지나 검색속도가 느려지는 단점이 있다. 이 문제를 해결하기 위해 가변블록 DCT를 제안한다. 이 기법은 우선 각 블록의 객체 영역 존재를 판단하여, 영상영역 패턴 테이블을 작성한다. 그 후 이 테이블을 이용하여 객체가 있는 영역에서 블록 크기를 줄이고, 그 밖의 영역에서는 블록 크기를 늘려 블록 크기를 가변한다. 제안한 가변 블록 DCT 영상 기법을 사용시 정확성이 15% 정도 향상되었다. 한편 동일 패턴의 영상이 거의 없는 경우에는 영상영역 패턴 비교만으로 빠르게 검색할 수 있다.

  • PDF

인간 시각과 MPEG-7 시각 기술자를 이용한 관심영역 기반의 의료 영상 검색 (ROI-based Medical Image Retrieval using Human Perception and MPEG-7 Visual Descriptors)

  • 서미숙;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.127-130
    • /
    • 2006
  • 본 논문에서는 MPEG-7 의 특징 기술자를 이용하고, 초기 중요도 가중치를 고려한 관심영역(ROI: Region-Of-Interest) 기반의 의료 영상 검색 시스템을 제안한다. 의료 영상에서 의미 없는 배경 부분을 제거하고, 영역 추출 처리 시간을 줄이는 관심 윈도우(AW: Attention Window)를 생성하여 관심 영역 세그먼테이션을 수행한다. 또한 인간 시각에 부합하는 검색 성능의 향상을 위해 특징 벡터 거리 계산에서 영역의 초기 가중치를 설정하였다. 실험에서 구현된 시스템은 의료 영상을 효과적으로 찾아내며, 조합된 특징과 가중치를 이용한 유사도 측정으로 검색 성능이 향상됨을 보여준다.

  • PDF

영역 색상과 키워드를 이용한 내용기반 영상검색 (Content-based Image Retrieval Using Region Color and Keyword)

  • 김지영;정성호;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1999년도 춘계학술대회 발표논문집
    • /
    • pp.68-74
    • /
    • 1999
  • 본 논문에서는 영상의 내용을 나타내는 키워드를 이용하는 기존의 텍스트 기반 영상 검색과 영역 색상 정보를 이용한 내용 기반 영상 검색을 결합한 시스템을 구현함으로서, 보다 효과적인 영상 검색을 할 수 있도록 하였다. 영상의 크기는 입력된 원 영상을 사용하였으며, 색상 정보 추출에 있어 HSI 공간으로 변환하여 256개의 칼라로 양자화하였다. 보통의 정지 영상의 경우 대부분의 객체가 중앙에 있을 경우를 고려하여, 영상을 중앙 영역과 배경 영역으로 구분하고, 각각의 영역에서 두 개의 히스토그램을 생성한다. 중앙 영역과 배경영역의 히스토그램 인터섹션을 이용한 검색을 실험하였고, 영역색상과 기존의 키워드를 결합한 검색도 또한 실험하였다. 기존의 히스토그램 인터섹션의 경우 Precision/Recall이 0.34/0.60인데 비해 영역 색상 히스토그램을 인터섹션한 경우의 Precision/Recall은 0.69/0.76이고 키워드를 결합한 경우의 Precision/Recall은 0.92/0.80를 얻음으로써, 제안된 방식의 검색이 비교적 효율적임을 보였다.

  • PDF