• 제목/요약/키워드: query image

검색결과 300건 처리시간 0.024초

특징점 기반 확률 맵을 이용한 단일 카메라의 위치 추정방법 (Localization of a Monocular Camera using a Feature-based Probabilistic Map)

  • 김형진;이동화;오택준;명현
    • 제어로봇시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.367-371
    • /
    • 2015
  • In this paper, a novel localization method for a monocular camera is proposed by using a feature-based probabilistic map. The localization of a camera is generally estimated from 3D-to-2D correspondences between a 3D map and an image plane through the PnP algorithm. In the computer vision communities, an accurate 3D map is generated by optimization using a large number of image dataset for camera pose estimation. In robotics communities, a camera pose is estimated by probabilistic approaches with lack of feature. Thus, it needs an extra system because the camera system cannot estimate a full state of the robot pose. Therefore, we propose an accurate localization method for a monocular camera using a probabilistic approach in the case of an insufficient image dataset without any extra system. In our system, features from a probabilistic map are projected into an image plane using linear approximation. By minimizing Mahalanobis distance between the projected features from the probabilistic map and extracted features from a query image, the accurate pose of the monocular camera is estimated from an initial pose obtained by the PnP algorithm. The proposed algorithm is demonstrated through simulations in a 3D space.

CBIR 기반 데이터 확장을 이용한 딥 러닝 기술 (CBIR-based Data Augmentation and Its Application to Deep Learning)

  • 김세송;정승원
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.403-408
    • /
    • 2018
  • 딥 러닝의 학습을 위해서 일반적으로 많은 양의 데이터가 필요하다. 그러나 많은 양의 데이터 세트를 만드는 것은 쉽지 않기 때문에, 회전, 반전 (flipping), 필터링 (filtering) 등의 간단한 데이터 확장 (data augmentation) 기법을 통해 작은 데이터 세트를 좀 더 큰 데이터 세트로 만드는 여러 시도들이 있었다. 그러나 이러한 기법들은 이미 보유하고 있는 데이터 세트만을 이용하기 때문에 확장성에 제약을 갖는다. 이런 문제를 해결하기 위해 본고에서는 보유하고 있는 영상 데이터를 이용하여 새로운 영상 데이터를 획득하는 기술을 제안한다. 이는 기존 데이터 세트의 영상 데이터를 CBIR(Contents based image retrieval)의 쿼리로 이용하여 유사 영상들을 검색하여 획득하는 방식으로 이루어진다. 최종적으로 CBIR을 이용해 확장한 데이터를 딥 러닝으로 학습시켜 확장 전후의 성능을 비교하였다.

최적화된 특정 영역을 이용한 스케치 기반 영상 검색 시스템 (Sketch-based Image Retrieval System using Optimized Specific Region)

  • 고광훈;김낙우;김태은;최종수
    • 한국통신학회논문지
    • /
    • 제30권8C호
    • /
    • pp.783-792
    • /
    • 2005
  • 본 논문은 애니메이션 캐릭터를 대상으로 한 스케치 기반 영상 검색의 특징 추출 방법을 제안한다. 우리는 특징 영역의 추출을 위해서 영상에서의 장면 전환 검출 기법, 프레임 사이의 대응점 검출 기법 및 애니메이션 제작과정의 특성을 이용한다. 추출된 특징 영역에서 유사한 색상들이 집중된 영역들을 검출한다. 각 영역들의 색상, 크기 그리고 영역간의 관계로 영상 검색을 위한 특징으로 사용한다. 최종적으로 애니메이션 제작 특성과 사용자의 스케치를 질의 영상으로 사용하여 유사한 캐릭터를 검색한다.

변형된 질의 영상에 강한 내용 기반 영상 검색 기법 (A Robust Content-Based Image Retrieval Technique for Distorted Query Image)

  • 김익재;이제호;권용무;박상희
    • 방송공학회논문지
    • /
    • 제2권1호
    • /
    • pp.74-83
    • /
    • 1997
  • 본 논문에서는 칼라 영상 검색을 위한 특징으로서 칼라 정보와 모양 정보를 고려하는 복합적인 특징벡터를 사용한 영상 검색 기법을 제안하였다. 비균둥 양자화 방법인 Lloyd-Max quantizer를 통한 효율적인 칼라 양자화를 하였고, 양자화를 거친 후 생성된 칼라 그룹간의 공간적 분포상황을 고려하기 위해 히스토그램 행렬을 도입함으로써 칼라 정보를 기반으로한 검색 효율을 증대시켰다. 또한 모양 정보를 획득하기 위해 향상된 불변 모멘트를 사용함으로써 연산량을 줄이면서, 검색 효율을 증대시켰다. 영상으로 200여개의 칼라 트레이드마크를 사용하여 기존의 방법들과의 비교실험을 통해 원영상 뿐만 아니라 변형된 영상에 대해서 보다 향상된 검색 결과를 얻을 수 있었다. 즉, 영상내의 물체의 회전, 이동, 잡음 첨가와 감마 보정값 등에 의해 변형된 영상에 대해서 보다 더 강한 결과를 얻을 수 있었다.

  • PDF

컬러와 블록영역 특징을 이용한 내용기반 화상 검색 (Content-based Image Retrieval using Color and Block Region Features)

  • 최기호
    • 한국통신학회논문지
    • /
    • 제27권6C호
    • /
    • pp.610-618
    • /
    • 2002
  • 본 논문에서는 질러 공간과 블록영역 정보에 기반한 새로운 화상검색 방법을 제시한다. 각 화상에 대한 컬러 공간 정보는 컬러 이진세트에 의해 구해지고 블록영역 정보는 영역 세그멘테이션에 의해서 구해진다. 화상 검색 과정에서, 질의 화상과 데이터베이스 화상들의 컬러 및 화상 이진세트들을 비교하여 검색될 후보 화상의 집합을 결정한다. 특히, 유사도 측정 시 컬러 공간 분포와 객체의 블록영역 특징에 가중치를 고려한 검색이 가능하도록 하였다. 제안된 방법을 구현하고 6,000개의 화상들로 이루어진 화상 데이터베이스에 대해 적용함으로써 컬러 공간 및 블록영역특징을 이용한 화상 검색이 매우 효과적임을 보였다.

지역 감성기반 영상 검색을 위한 감성 스케치 질의 (Query-by-emotion sketch for local emotion-based image retrieval)

  • 이경미
    • 인터넷정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.113-121
    • /
    • 2009
  • 본 논문에서는 지역적으로 서로 다른 감성을 지닌 영상을 검출하기 위해서 감성 스케치를 이용한 영상 검색 시스템을 제안 하였다. 제안하는 검색 시스템은 영상을 $17{\times}17$의 겹치지 않는 부분영역으로 나누고, 각 부분영역에 대한 감성 특징을 추출한다. 본 논문에서는 부분영역 내에서 감성 특징을 추출하기 위해서, H. Nagumo의 배색이미지차트에서 제안하는 160개 감성어에 대한 감성 색상을 이용하였다. 부분영역으로부터 해당 감성어에 대한 감성 색상의 분포정도를 계산하여 각 부분영역의 감성어에 대한 히스토그램 값 중 가장 큰 값을 지닌 감성어를 취하게 된다. 제안하는 감성 스케치를 이용한 영상 검색 시스템은 Corel 영상 데이터베이스에 대해서 유효성을 평가하여, 전역적 방법보다 우수한 검색 정확도와 재현도를 가짐을 보여주었다.

  • PDF

Score Image Retrieval to Inaccurate OMR performance

  • Kim, Haekwang
    • 방송공학회논문지
    • /
    • 제26권7호
    • /
    • pp.838-843
    • /
    • 2021
  • This paper presents an algorithm for effective retrieval of score information to an input score image. The originality of the proposed algorithm is that it is designed to be robust to recognition errors by an OMR (Optical Music Recognition), while existing methods such as pitch histogram requires error induced OMR result be corrected before retrieval process. This approach helps people to retrieve score without training on music score for error correction. OMR takes a score image as input, recognizes musical symbols, and produces structural symbolic notation of the score as output, for example, in MusicXML format. Among the musical symbols on a score, it is observed that filled noteheads are rarely detected with errors with its simple black filled round shape for OMR processing. Barlines that separate measures also strong to OMR errors with its long uniform length vertical line characteristic. The proposed algorithm consists of a descriptor for a score and a similarity measure between a query score and a reference score. The descriptor is based on note-count, the number of filled noteheads in a measure. Each part of a score is represented by a sequence of note-count numbers. The descriptor is an n-gram sequence of the note-count sequence. Simulation results show that the proposed algorithm works successfully to a certain degree in score image-based retrieval for an erroneous OMR output.