• 제목/요약/키워드: Content-based Visual Descriptor

검색결과 22건 처리시간 0.021초

내용기반 비디오 검색을 위한 MPEG-7 비주얼 디스크립터 분석 (The Analysis of Visual Descriptors for Content-based Video Retrieval)

  • 김성희
    • 한국비블리아학회지
    • /
    • 제16권2호
    • /
    • pp.157-175
    • /
    • 2005
  • 본 논문의 목적은 멀티미디어 내용을 표현하기 위해 제정된 MPEG-7의 비주얼 디스크립터를 설명하고 분석하기 위한 것이다. MPEG-7의 비주얼 디스크립터는 컬러, 모양, 질감, 모션으로 구성되어 있으며 이들 각각의 요소들에 대해 예제 및 응용분야와 더불어서 자세히 설명하고 있다. 마지막으로 본 연구에서는 이들 비주얼 디스크립터에 대한 전반적인 응용분야를 기술하고 있다. 이러한 비주얼 디스크립터들은 다양한 모양의 멀티미디어 내용을 인간의 개입 없이 자동으로 풍부하고 상세하게 표현할 수 있으며 내용 표현의 일관성을 유지하게 함으로써 멀티미디어 검색의 성능을 향상시킬 뿐 아니라 시스템간의 상호운영성을 향상 시킬 수 있을 것으로 기대된다.

  • PDF

A new approach for content-based video retrieval

  • Kim, Nac-Woo;Lee, Byung-Tak;Koh, Jai-Sang;Song, Ho-Young
    • International Journal of Contents
    • /
    • 제4권2호
    • /
    • pp.24-28
    • /
    • 2008
  • In this paper, we propose a new approach for content-based video retrieval using non-parametric based motion classification in the shot-based video indexing structure. Our system proposed in this paper has supported the real-time video retrieval using spatio-temporal feature comparison by measuring the similarity between visual features and between motion features, respectively, after extracting representative frame and non-parametric motion information from shot-based video clips segmented by scene change detection method. The extraction of non-parametric based motion features, after the normalized motion vectors are created from an MPEG-compressed stream, is effectively fulfilled by discretizing each normalized motion vector into various angle bins, and by considering the mean, variance, and direction of motion vectors in these bins. To obtain visual feature in representative frame, we use the edge-based spatial descriptor. Experimental results show that our approach is superior to conventional methods with regard to the performance for video indexing and retrieval.

칼라와 에지 정보를 이용한 내용기반 영상 검색 (Contents-based Image Retrieval Using Color & Edge Information)

  • 박동원;안성옥
    • 컴퓨터교육학회논문지
    • /
    • 제8권1호
    • /
    • pp.81-91
    • /
    • 2005
  • 본 논문에서는 칼라와 에지 정보를 이용한 내용기반 영상검색 기법을 제안하였다. 기존의 RGB 공간 정보를 이용하기 보다는, 시각적 인식에 보다 중점을 둔 HSI칼라 공간에서 고찰하였다. 비슷한 류의 색을 대표색으로 통합 표현하여, 개선된 칼라 정보 이용법을 본 연구에서 제안하였다. 또한 칼라 정보만을 이용했을 때의 시스템 성능상의 결점을 보완하기 위하여, 효율적인 에지 디텍션 기법을 함께 사용하였다. 칼라와 에지 기법을 통합함에 있어서, 각각의 기법에 적절한 가중치를 배분함으로써 시스템 성능을 실험적으로 향상시켰다.

  • PDF

MPEG-7 기반 비디오/이미지 검색 시스템(VIRS) (MPEG-7 based Video/Image Retrieval System (VIRS))

  • 이재호;김형준;김회율
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.543-552
    • /
    • 2003
  • 멀티미디어데이터의 급격한 양적 팽창은 원하는 데이터를 빠르고 정확하게 검색해야 한다는 새로운 과제를 안겨주었다. 이러한 효율적 검색을 위해서 가장 중요한 기반이 되는 것이 바로 데이터의 적절한 표현이다. 2001년 국제 표준으로 제정된 MPEG-7은 바로 이러한 이유로 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 그러나 MPEG-7의 내용은 표준의 특성상 포함하는 범위가 방대하고 실제 검색시스템을 구축하려는 이들에게 다루기 힘든 것이 사실이다. 이에 본 논문에서는 MPEG-7에 제시되어 있는 표준 중 비주얼 기술자들만을 이용하여 간단한 검색시스템을 구축하는 방법에 대하여 제시하고 그 검색 결과를 도시하였다. 또한 개발된 시스템인 MPEG-7 VIRS(Video/Image Retrieval System)의 검색 결과를 통하여 각 비주얼 기술자를 이용한 검색과 다중 기술자들의 조합을 이용한 검색간의 결과를 분석하였으며 앞으로 MPEG-7을 이용한 검색 시스템이 나아갈 방향에 대한 간단한 제시를 하고 있다.

객체의 모양과 색상특징을 이용한 내용기반 영상검색 기법 (A Content-Based Image Retrieval Technique Using the Shape and Color Features of Objects)

  • 박종현;박순영;오일환
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1902-1911
    • /
    • 1999
  • 본 논문에서는 객체들의 공간적 특성이 반영된 시각적인 특징벡터를 이용한 내용기반 영상검색 알고리즘을 제안한다. 제안된 검색 기법은 여러 색상으로 이루어진 객체들을 표현하기 위하여 가우시안 혼성 모델을 적용하여 모델의 최대유사 파라미터는 EM 알고리즘을 사용하여 추정한다. GMM을 기반으로 하여 분할된 각 객체들로부터 Fourier descriptor의 색상 히스토그램을 사용하여 모양과 색상 특징을 추출하게 된다. 영상 검색은 두 단계로 구성되는데 첫 단계에서는 공간적인 모양 특성을 추출하여 모양이 유사한 객체들을 후보 영상으로 압축하게 되며 마지막으로 객체의 색상 히스토그램에 의하여 검색이 수행된다. 실험 결과 제안된 알고리즘은 분할된 객체의 공간적, 시각적 특징을 이용하여 효율적으로 검색을 수행할 수 있음을 보여준다.

  • PDF

Improved Feature Selection Techniques for Image Retrieval based on Metaheuristic Optimization

  • Johari, Punit Kumar;Gupta, Rajendra Kumar
    • International Journal of Computer Science & Network Security
    • /
    • 제21권1호
    • /
    • pp.40-48
    • /
    • 2021
  • Content-Based Image Retrieval (CBIR) system plays a vital role to retrieve the relevant images as per the user perception from the huge database is a challenging task. Images are represented is to employ a combination of low-level features as per their visual content to form a feature vector. To reduce the search time of a large database while retrieving images, a novel image retrieval technique based on feature dimensionality reduction is being proposed with the exploit of metaheuristic optimization techniques based on Genetic Algorithm (GA), Extended Binary Cuckoo Search (EBCS) and Whale Optimization Algorithm (WOA). Each image in the database is indexed using a feature vector comprising of fuzzified based color histogram descriptor for color and Median binary pattern were derived in the color space from HSI for texture feature variants respectively. Finally, results are being compared in terms of Precision, Recall, F-measure, Accuracy, and error rate with benchmark classification algorithms (Linear discriminant analysis, CatBoost, Extra Trees, Random Forest, Naive Bayes, light gradient boosting, Extreme gradient boosting, k-NN, and Ridge) to validate the efficiency of the proposed approach. Finally, a ranking of the techniques using TOPSIS has been considered choosing the best feature selection technique based on different model parameters.

Content Based Dynamic Texture Analysis and Synthesis Based on SPIHT with GPU

  • Ghadekar, Premanand P.;Chopade, Nilkanth B.
    • Journal of Information Processing Systems
    • /
    • 제12권1호
    • /
    • pp.46-56
    • /
    • 2016
  • Dynamic textures are videos that exhibit a stationary property with respect to time (i.e., they have patterns that repeat themselves over a large number of frames). These patterns can easily be tracked by a linear dynamic system. In this paper, a model that identifies the underlying linear dynamic system using wavelet coefficients, rather than a raw sequence, is proposed. Content based threshold filtering based on Set Partitioning in a Hierarchical Tree (SPIHT) helps to get another representation of the same frames that only have low frequency components. The main idea of this paper is to apply SPIHT based threshold filtering on different bands of wavelet transform so as to have more significant information in fewer parameters for singular value decomposition (SVD). In this case, more flexibility is given for the component selection, as SVD is independently applied to the different bands of frames of a dynamic texture. To minimize the time complexity, the proposed model is implemented on a graphics processing unit (GPU). Test results show that the proposed dynamic system, along with a discrete wavelet and SPIHT, achieve a highly compact model with better visual quality, than the available LDS, Fourier descriptor model, and higher-order SVD (HOSVD).

다채널 Gabor 필터와 Log-Polar 변환을 사용한 내용기반 영상 검색 (Multichannel Gabor Filler and Log-Polar Transform for Content-Based Image Retrieval)

  • 박현;문영식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.181-184
    • /
    • 2000
  • In this paper, we propose new features for describing texture images by using multi-channel Gabor filter and log-polar transform based on human visual system (HVS). Gabor features are extracted by the mean and standard deviation of energy in Gabor response, followed by Fourier series extension. Log-polar features are extracted by log-polar transform and projection. The proposed texture descriptor performs reasonably well with less number of features than other texture descriptors, which has been verified by experiments using some texture images of MPEG-7 data set.

  • PDF

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

내용 기반 영상 검색을 위한 에지 기반의 공간 기술자 (Edge-based spatial descriptor for content-based Image retrieval)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.1-10
    • /
    • 2005
  • 오늘날 급격한 멀티미디어 정보의 증가에 따라 영상에서의 시각적 특성을 이용하여 멀티미디어 데이터를 검색하는 내용 기반 영상 검색 기법에 대한 관심이 크게 늘어나고 있다. 본 논문에서는 효과적인 영상 검색을 위한 새로운 접근으로서 edge correlogram과 color coherence vector를 이용한 에지 기반의 공간 기술자를 제안한다. 우선 color vector angle기법을 이용하여 주어진 영상을 고주파 성분과 저주파 성분의 영상으로 나눈다. 저주파 성분의 영상에서는 color coherence vector를 이용하여 평탄 화소의 공간적인 색상 분포를 추출함으로써 이를 평탄 영역에서의 특징 정보로서 활용한다. 반면, 고주파 성분의 영상에서는 edge correlogram으로부터 에지 화소들 간의 분포를 추출하여 이를 에지 영역에서의 특징 정보로 이용한다. 제안된 방법은 색상 간의 지엽적인 특성과 전체적인 특성을 모두 가지고 있기 때문에, 영상 간의 비교에 있어서 영상의 모양과 크기의 급격한 변화로 인한 오검출 등에 매우 강건하다. 또한, 영상에서의 구조적인 특징을 이용함으로써 복잡한 영상에 대해서도 간단하고 유연한 특징을 제공한다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 알고리즘이 최근의 여러 히스토그램 정밀화 기법에 비하여 더 효과적임을 보여준다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용하였다.