• 제목/요약/키워드: Descriptor Vectors

검색결과 30건 처리시간 0.021초

다중 곡률-단계 공간 기술자를 이용한 다중형상 검색 (Multi-Shape Retrieval Using Multi Curvature-Scale Space Descriptor)

  • 박상현;이수찬;윤일동
    • 방송공학회논문지
    • /
    • 제13권6호
    • /
    • pp.962-965
    • /
    • 2008
  • 2차원 형상기술자는 형상의 특성을 수치화하여 형상의 분류와 비교를 가능하게 하며, 영상 검색 및 3차원 모델 검색 등에 적용되어왔다. 기존에 개발된 기술자들은 한 형상의 외곽선에 해당하는 폐곡선만을 기술하거나 정밀성이 떨어진다는 한계가 있었다. 이에 따라 본 논문에서는 하나 이상의 폐곡선으로 이루어진 다중형상에 적용하기 위한 다중 곡률-단계 공간 (Multi Curvature-Scale Space) 기술자를 제안한다. 구체적으로, 하나의 폐곡선을 기술하는데 뛰어난 곡률-단계공간 기술자를 각 폐곡선에 적용하고, 이와 함께 전체 형상내의 각 폐곡선들의 배치 형태를 수치화하여 전체 형상을 기술한다. 또한, 기술자를 구성하는 각 값의 가중치를 조절할 수 있게 하여 사용자에 따른 유사도의 모호함을 극복할 수 있게 하였다. 제시하는 다양한 실험 결과는 제안하는 기술자의 유용함을 나타낸다.

A new approach for content-based video retrieval

  • Kim, Nac-Woo;Lee, Byung-Tak;Koh, Jai-Sang;Song, Ho-Young
    • International Journal of Contents
    • /
    • 제4권2호
    • /
    • pp.24-28
    • /
    • 2008
  • In this paper, we propose a new approach for content-based video retrieval using non-parametric based motion classification in the shot-based video indexing structure. Our system proposed in this paper has supported the real-time video retrieval using spatio-temporal feature comparison by measuring the similarity between visual features and between motion features, respectively, after extracting representative frame and non-parametric motion information from shot-based video clips segmented by scene change detection method. The extraction of non-parametric based motion features, after the normalized motion vectors are created from an MPEG-compressed stream, is effectively fulfilled by discretizing each normalized motion vector into various angle bins, and by considering the mean, variance, and direction of motion vectors in these bins. To obtain visual feature in representative frame, we use the edge-based spatial descriptor. Experimental results show that our approach is superior to conventional methods with regard to the performance for video indexing and retrieval.

Video Representation via Fusion of Static and Motion Features Applied to Human Activity Recognition

  • Arif, Sheeraz;Wang, Jing;Fei, Zesong;Hussain, Fida
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권7호
    • /
    • pp.3599-3619
    • /
    • 2019
  • In human activity recognition system both static and motion information play crucial role for efficient and competitive results. Most of the existing methods are insufficient to extract video features and unable to investigate the level of contribution of both (Static and Motion) components. Our work highlights this problem and proposes Static-Motion fused features descriptor (SMFD), which intelligently leverages both static and motion features in the form of descriptor. First, static features are learned by two-stream 3D convolutional neural network. Second, trajectories are extracted by tracking key points and only those trajectories have been selected which are located in central region of the original video frame in order to to reduce irrelevant background trajectories as well computational complexity. Then, shape and motion descriptors are obtained along with key points by using SIFT flow. Next, cholesky transformation is introduced to fuse static and motion feature vectors to guarantee the equal contribution of all descriptors. Finally, Long Short-Term Memory (LSTM) network is utilized to discover long-term temporal dependencies and final prediction. To confirm the effectiveness of the proposed approach, extensive experiments have been conducted on three well-known datasets i.e. UCF101, HMDB51 and YouTube. Findings shows that the resulting recognition system is on par with state-of-the-art methods.

영역 기반의 영상 질의를 이용한 내용 기반 영상 검색 (Content-based image retrieval using region-based image querying)

  • 김낙우;송호영;김봉태
    • 한국통신학회논문지
    • /
    • 제32권10C호
    • /
    • pp.990-999
    • /
    • 2007
  • 본 논문에서는 효과적인 영상 검색을 위한 방법으로서 JSEG 영상 분할 기법을 통한 영역 기반의 영상 인덱싱 및 검색 기법을 제안한다. JSEG은 영상을 색상 분류에 따라 양자화하고 이에 영역 윈도우를 적용시켜 J-image를 만든 다음, 세부 분할된 영역의 성장과 병합을 통하여 영상을 효과적으로 분할하는 방법이다. 제안하는 영상 검색 시스템은 JSEG에 의해 분할된 영상을 사용자에게 질의 영상으로 주고, 사용자로 하여금 분할 영상에서 관심 영역군(群)을 선택하게 한다. 그리고 나서, 사용자 질의에 의해 선택된 영역의 MBR을 구하고 이 영역의 중심을 기준으로 다중 윈도우 마스크를 생성하여 적용시킴으로써 특정 관심 영역을 중심으로 한 영상의 전역적인 특징을 추출한다. 최종적으로 추출된 특징의 성능 비교를 위한 기술자로는 누적 히스토그램을 이용하였다. 제안된 방법은 특정 영역에서의 특징과 전역 특징을 동시에 추출하여 검색에 이용함으로써 보다 빠르고 정확하게 사용자가 원하는 영상을 제공할 수 있다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 방법이 영상 기반의 검색 기법과 비교하여 더 효과적임을 보여준다.

방범용 CCTV를 위한 배회행위 탐지 솔루션 (Loitering Detection Solution for CCTV Security System)

  • 강주형;곽수영
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.15-25
    • /
    • 2014
  • 본 논문에서는 지능형 감시 시스템을 위해 공간적 확률 분포와 방향 서술자를 이용하여 다양한 배회행위를 검출하는 방법을 제안한다. 적응적 배경 모델링 기법을 이용하여 움직이는 객체를 검출하고, 검출된 객체로부터 움직임의 정보를 추출한다. 추출된 객체의 움직임 정보는 이동 궤적과 방향에 대해 특징벡터를 생성한다. 생성된 특징벡터는 k-Nearest Neighbor를 통해 최종적으로 배회행위를 검출하게 된다. 제안한 방법을 실내외 다양한 환경에서 테스트하여 배회 행위를 검출하는 결과를 나타내었으며 이는 실시간으로 검출되는 것을 확인하였다.

딥 러닝을 이용한 화면 전환 검출 (Deep Learning-based Scene Change Detection)

  • 이재은;서영호;김동욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.549-550
    • /
    • 2019
  • 본 논문에서는 딥 러닝을 이용해 화면 전환을 검출하는 방식을 제안한다. 특징점을 추출할 때는 딥 뉴럴 네트워크를 사용하였고 추출한 특징점을 SIFT(Scale Invariant Features Transform) 기술자를 이용해 128차원 벡터를 생성한다. 이를 기반으로 각 픽셀마다 매칭 여부를 판단하여 25% 미만일 경우 화면 전환이라고 판단한다.

  • PDF

다중 클래스 SVM과 주석 코드 배열을 이용한 의료 영상 자동 주석 생성 (Medical Image Automatic Annotation Using Multi-class SVM and Annotation Code Array)

  • 박기희;고병철;남재열
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.281-288
    • /
    • 2009
  • 본 논문은 의료 영상 중 X-ray 영상에 대한 효과적인 분류와 자동 주석 생성을 위한 방법을 제안한다. X-ray 영상은 일반 자연 영상과는 다르게 영상 내에 중요한 의미를 가지고 있는 관심 영역과 어두운 단색의 배경으로 구성된 특징을 가지고 있음으로 본 논문에서는, 영상의 중요영역에서 해리스 코너 검출기를 이용한 색 구조 기술자(H-CSD)로 색 특징을 추출하고, 질감 특징을 위해 경계선 히스토그램 기술자(EHD)를 사용하였다. 추출된 두 개의 특징 벡터들은 각각 다중 클래스 Support Vector Machine에 적용되어 20개의 카테고리 중 하나로 영상을 분류한다. 마지막으로, 영상은 미리 정의된 카테고리들의 계층적인 관계와 우선 순위에 기반하여 주석 코드 배열(Annotation Code Array)을 부여 받고 이를 이용하여 다수의 최적 키워드를 얻으며 갖게 된다. 실험에서는 제안한 주석 생성방법을 관련 연구 방법과 비교하여 성능이 개선 되었음을 보여주고 있다.

내용기반 이미지 검색을 위한 색상, 텍스쳐, 에지 기능의 통합 (Integrating Color, Texture and Edge Features for Content-Based Image Retrieval)

  • 마명;박동원
    • 감성과학
    • /
    • 제7권4호
    • /
    • pp.57-65
    • /
    • 2004
  • 본 논문에서는 color, texture, shape의 정보를 통합 이용하여 내용기반 영상검색 시스템의 성능을 향상시키는 기법을 고찰하였다. 먼저 영상에 내재되어 있는 color를 분석 추출하여 몇 개의 대표색으로 요약 표현한 다음, 이를 활용한 근사치 측정도를 고안하였다. Texture정보 분석에 있어서는 영상의 주축 행렬 데이터를 통계적 접근 방법으로 추출하였다. Edge분석의 방법으로는 Edge 막대그래프에서 색상변환, 양자화, 필터링에 관련된 정보를 선행처리 후 Edge 정보를 추출하였다. 마지막으로, 본 연구의 결과인 내용기반 영상검색 시스템의 효율성을 precision-recall 분석과 실험적 결과를 통하여 입증하였다.

  • PDF

MPEG CDVA 전역 특징 서술자 압축 방법 (Compression Method for MPEG CDVA Global Feature Descriptors)

  • 김준수;조원;임근택;윤정일;곽상운;정순흥;정원식;추현곤;서정일;최유경
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.295-307
    • /
    • 2022
  • 본 논문은 동영상의 시각적 특징을 추출하는 MPEG CDVA 표준 기술에서 개별 프레임의 전역적인 특징을 표현하는 scalable Fisher vector (SCFV)의 새로운 압축 방법을 제안한다. CDVA 표준은 전역 특징 서술자에 대한 시간적 중복성 제거 기법을 도입하였으며, 구체적으로 부호화 단위 세그먼트 내의 SCFV 들이 서로 유사할 가능성이 높다는 점을 활용하여 SCFV에 대한 차분을 부호화하는 방식을 사용하고 있다. 그러나 SCFV의 구조적 특징에 의해 SCFV의 차분을 부호화 한 결과물이 원본 데이터보다도 용량이 큰 경우가 발생하게 된다. 이와 같은 현상을 방지하기 위해 비대칭적 SCFV의 차분 계산 방법과 변경된 SCFV 차분을 활용하여 원본 SCFV를 복원하는 새로운 방법을 제안하였다. FIVR 데이터셋을 활용한 실험결과는 전역 특징 서술자의 압축 효율이 기존 CDVA Experimental Model에 대비하여 유의미하게 증가함을 보여준다.

퍼지 유사관계를 이용한 다차원 특징들의 가중치 결정과 감성기반 음악검색 (The Weight Decision of Multi-dimensional Features using Fuzzy Similarity Relations and Emotion-Based Music Retrieval)

  • 임지혜;이준환
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.637-644
    • /
    • 2011
  • 음원이 디지털화 되면서 쉽게 음악을 구매하고 들을 수 있게 되었다. 하지만 많은 음악 중에서 음악가, 장르, 제목, 앨범 타이틀 등 전통적인 음악 정보를 이용하여 사용자들이 자신의 취향에 맞는 음악을 찾는 데는 여전히 어려움이 있다. 이러한 어려움을 해소하기 위해 내용기반 음악검색과 감성기반 음악검색 방법 등이 제안되고 개발되고 있다. 본 논문에서는 이러한 어려움을 해소하기 위한 감성기반 음악 검색방법에서 다차원 벡터형태의 MPEG-7 저수준 오디오 서술자들의 감성기반 검색에서의 중요도를 결정하기 위한 새로운 방법을 제안하였다. 제안된 방법에서는 상호간에 대립되는 감성을 대표되는 음악들의 유사성을 다차원 서술자 관점에서 측정하고 이 유사관계를 러프 근사화와 군집 내/군집 간의 유사성 비율을 이용하여 서술자의 중요성을 결정한다. 중요성을 바탕으로 결정된 가중치는 여러 개의 오디오 서술자들의 유사성을 총체화하는데 이용되며 이를 활용하여 감성기반 음악검색을 수행한다. 제안된 방법은 내용기반 음악 검색을 기반으로 한 감성기반 음악검색 구조에서 실험한 결과 평균 검색 개수측면에서 기존의 휴리스틱 방법보다 좋은 검색 결과를 나타내었다.