• 제목/요약/키워드: Feature-based image matching

검색결과 339건 처리시간 0.027초

Efficient Visual Place Recognition by Adaptive CNN Landmark Matching

  • Chen, Yutian;Gan, Wenyan;Zhu, Yi;Tian, Hui;Wang, Cong;Ma, Wenfeng;Li, Yunbo;Wang, Dong;He, Jixian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.4084-4104
    • /
    • 2021
  • Visual place recognition (VPR) is a fundamental yet challenging task of mobile robot navigation and localization. The existing VPR methods are usually based on some pairwise similarity of image descriptors, so they are sensitive to visual appearance change and also computationally expensive. This paper proposes a simple yet effective four-step method that achieves adaptive convolutional neural network (CNN) landmark matching for VPR. First, based on the features extracted from existing CNN models, the regions with higher significance scores are selected as landmarks. Then, according to the coordinate positions of potential landmarks, landmark matching is improved by removing mismatched landmark pairs. Finally, considering the significance scores obtained in the first step, robust image retrieval is performed based on adaptive landmark matching, and it gives more weight to the landmark matching pairs with higher significance scores. To verify the efficiency and robustness of the proposed method, evaluations are conducted on standard benchmark datasets. The experimental results indicate that the proposed method reduces the feature representation space of place images by more than 75% with negligible loss in recognition precision. Also, it achieves a fast matching speed in similarity calculation, satisfying the real-time requirement.

열화상 이미지 히스토그램의 가우시안 혼합 모델 근사를 통한 열화상-관성 센서 오도메트리 (Infrared Visual Inertial Odometry via Gaussian Mixture Model Approximation of Thermal Image Histogram)

  • 신재호;전명환;김아영
    • 로봇학회논문지
    • /
    • 제18권3호
    • /
    • pp.260-270
    • /
    • 2023
  • We introduce a novel Visual Inertial Odometry (VIO) algorithm designed to improve the performance of thermal-inertial odometry. Thermal infrared image, though advantageous for feature extraction in low-light conditions, typically suffers from a high noise level and significant information loss during the 8-bit conversion. Our algorithm overcomes these limitations by approximating a 14-bit raw pixel histogram into a Gaussian mixture model. The conversion method effectively emphasizes image regions where texture for visual tracking is abundant while reduces unnecessary background information. We incorporate the robust learning-based feature extraction and matching methods, SuperPoint and SuperGlue, and zero velocity detection module to further reduce the uncertainty of visual odometry. Tested across various datasets, the proposed algorithm shows improved performance compared to other state-of-the-art VIO algorithms, paving the way for robust thermal-inertial odometry.

현실 객체 인식 기반 모바일 증강현실 게임 (Real Object Recognition Based Mobile Augmented Reality Game)

  • 이동춘;이헌주
    • 한국게임학회 논문지
    • /
    • 제17권4호
    • /
    • pp.17-24
    • /
    • 2017
  • 본 논문은 마커를 사용하지 않고 현실 객체 대상 모바일 증강현실 게임의 일반적인 제작 과정에 대해서 기술하고 있다. 본 논문에서는 모바일 환경에서의 성능 최적화를 위해서 slam 기술을 사용하여 만들어진 포인트 클라우드 데이터를 별도의 편집툴을 사용하여 편집하였다. 또한 게임 실행단계에서 특징점 추출 및 디스크립터 매칭으로 인해 많은 부하가 발생하는데, 이를 줄이기 위해서 이전 입력 영상에서 매칭된 특징점에 대한 위치 추적을 위해 Opticalflow 추적을 사용하였다.

야외 RGB+D 데이터베이스 구축을 위한 깊이 영상 신뢰도 측정 기법 (Confidence Measure of Depth Map for Outdoor RGB+D Database)

  • 박재광;김선옥;손광훈;민동보
    • 한국멀티미디어학회논문지
    • /
    • 제19권9호
    • /
    • pp.1647-1658
    • /
    • 2016
  • RGB+D database has been widely used in object recognition, object tracking, robot control, to name a few. While rapid advance of active depth sensing technologies allows for the widespread of indoor RGB+D databases, there are only few outdoor RGB+D databases largely due to an inherent limitation of active depth cameras. In this paper, we propose a novel method used to build outdoor RGB+D databases. Instead of using active depth cameras such as Kinect or LIDAR, we acquire a pair of stereo image using high-resolution stereo camera and then obtain a depth map by applying stereo matching algorithm. To deal with estimation errors that inevitably exist in the depth map obtained from stereo matching methods, we develop an approach that estimates confidence of depth maps based on unsupervised learning. Unlike existing confidence estimation approaches, we explicitly consider a spatial correlation that may exist in the confidence map. Specifically, we focus on refining confidence feature with the assumption that the confidence feature and resultant confidence map are smoothly-varying in spatial domain and are highly correlated to each other. Experimental result shows that the proposed method outperforms existing confidence measure based approaches in various benchmark dataset.

Robust Features and Accurate Inliers Detection Framework: Application to Stereo Ego-motion Estimation

  • MIN, Haigen;ZHAO, Xiangmo;XU, Zhigang;ZHANG, Licheng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권1호
    • /
    • pp.302-320
    • /
    • 2017
  • In this paper, an innovative robust feature detection and matching strategy for visual odometry based on stereo image sequence is proposed. First, a sparse multiscale 2D local invariant feature detection and description algorithm AKAZE is adopted to extract the interest points. A robust feature matching strategy is introduced to match AKAZE descriptors. In order to remove the outliers which are mismatched features or on dynamic objects, an improved random sample consensus outlier rejection scheme is presented. Thus the proposed method can be applied to dynamic environment. Then, geometric constraints are incorporated into the motion estimation without time-consuming 3-dimensional scene reconstruction. Last, an iterated sigma point Kalman Filter is adopted to refine the motion results. The presented ego-motion scheme is applied to benchmark datasets and compared with state-of-the-art approaches with data captured on campus in a considerably cluttered environment, where the superiorities are proved.

의미론적 분할된 항공 사진을 활용한 영상 기반 항법 (Vision-based Navigation using Semantically Segmented Aerial Images)

  • 홍경우;김성중;박준우;방효충;허준회;김진원;박장호;서송원
    • 한국항공우주학회지
    • /
    • 제48권10호
    • /
    • pp.783-789
    • /
    • 2020
  • 영상 기반 항법은 GPS/INS 통합 항법 시스템의 취약점을 보강할 수 있는 보조 항법 기술로 비행체에서 촬영한 항공 영상과 기존의 데이터베이스를 비교하여 비행체의 위치를 구한다. 하지만 데이터베이스가 생성된 시점은 항공 영상 촬영 시점과 다를 수밖에 없으며, 이러한 시점 차이로 인해 두 영상 간의 다른 특징점들이 생성된다. 즉, 유사하지만 다른 두 영상이므로 일반적인 영상 대조 알고리즘을 항법 문제에 적용하기 힘들다. 따라서 본 논문에서는 인공지능 기법인 의미론적 분할을 활용하여 항공 영상에서 항법에 필요한 정보를 분류한 후 영상 대조를 수행하는 방법을 제안한다. 의미론적 분할로 시점 변화, 촬영 조건 변화가 있더라도 강건하게 두 영상이 정합 되도록 한다. 제안한 방법은 시뮬레이션과 비행 실험을 통해 성능을 확인하며, 일반적인 영상 대조 알고리즘을 이용하여 항법을 수행한 결과와 비교한다.

문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 (Keyword Spotting on Hangul Document Images Using Character Feature Models)

  • 박상철;김수형;최덕재
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.521-526
    • /
    • 2005
  • 본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

필터뱅크 기반 지문정합에서 빠른 지문 정렬 방법 및 가중치를 부여한 특징 벡터 추출 방법 (Fast Fingerprint Alignment Method and Weighted Feature Vector Extraction Method in Filterbank-Based Fingerprint Matching)

  • 정석재;김동윤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.71-81
    • /
    • 2004
  • 특징점 기반(Minutiae-based) 지문 인식 시스템은 지문에 포함된 융선들의 구조 정보를 완벽하게 표현할 수 없는 특징점 정보를 활용한다. 더욱이, 동일한 지문이라 하더라도 일정하지 않게 추출되는 특징점은 정합과정에서 여러 가지 기법들을 요구하게 된다. 이와 같이 정량적으로 표현되지 않는 특징점 기반 방법의 대안으로 여러 방향을 갖는 가보 필터(Gabor filter)를 이용해 영역별 특징 값들을 추출하는 필터뱅크 기반(Filterbank-based) 지문 인식방법이 제안되었다(1). 그러나 필터뱅크 기반 방법은 다른 손가락에서 얻은 지문이지만 같은 종류일 경우 유사한 특징 벡터를 추출한다는 점과 지문 입력시의 회전오차를 고려하기 위한 오버헤드를 갖는다는 문제점을 가진다. 본 논문에서는 이러한 문제점을 해결하기 위해 특징 벡터를 추출할 때, 특징점이 존재하는 영역에 대해 가중치를 부여하여 특징벡터를 구성하는 방법을 제안하였다. 또한 코어 주변의 지역적인 방향들의 평균치를 이용해 지문 정렬을 수행하는 새로운 지문정렬 방법을 제한하였다. 두 가지 방법은 각각 시스템의 성능향상과 속도를 증가시키는 결과를 얻을 수 있다. 제안한 방법에 따라 NIST Special Database 14 지문 데이타로 실험한 결과 0.967%의 FAR(False Acceptance Rate)에서 0.524%의 FRR(False Reject Rate)을 보여, 기존 방법에 비해 1.28배 이상의 속도 향상과 ERR(Equal error Rate)에서 약 5%의 성능 향상을 보였다.

스테레오 영상 인식에 기반한 3D 물체의 부피계측방법 (A Stereo Image Recognition-Based Method for measuring the volume of 3D Object)

  • 정윤수;이해원;김진석;원종운
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.237-244
    • /
    • 2002
  • 본 논문에서는 스테레오 영상 인식에 기반한 직육면체형 물체의 부피를 계측하는 한 방법이 제안된다. 제안된 방범은 두 대의 CCD(charge coupled device)카메라로부터 획득된 영상에 대하여 관심영역추출, 특징 추출, 그리고 스테레오 정합에 기반한 꼭지점 인식의 과정을 통하여 3D 물체의 부피를 계측한다. 제안된 방법은 3D 물체의 특징을 나타내는 꼭지점 후보들을 영상처리과정을 통해 추출한 후, 이들 꼭지점들에 대해서만 스테레오 정합을 수행함으로써 고속의 부피 계측이 가능한 이점이 있다. 실험을 통하여, 본 논문에서 제안한 방법이 직육면체형 물체의 고속 부피계측에 효과적으로 사용될 수 있음이 보여진다.

A New Rectification Scheme for Uncalibrated Stereo Image Pairs and Its Application to Intermediate View Reconstruction

  • Ko, Jung-Hwan;Jung, Yong-Woo;Kim, Eun-Soo
    • Journal of Information Display
    • /
    • 제6권4호
    • /
    • pp.26-34
    • /
    • 2005
  • In this paper, a new rectification scheme to transform the uncalibrated stereo image pair into the calibrated one is suggested and its performance is analyzed by applying this scheme to the reconstruction of the intermediate views for multi-view stereoscopic display. In the proposed method, feature points are extracted from the stereo image pair by detecting the comers and similarities between each pixel of the stereo image pair. These detected feature points, are then used to extract moving vectors between the stereo image pair and the epipolar line. Finally, the input stereo image pair is rectified by matching the extracted epipolar line between the stereo image pair in the horizontal direction. Based on some experiments done on the synthesis of the intermediate views by using the calibrated stereo image pairs through the proposed rectification algorithm and the uncalibrated ones for three kinds of stereo image pairs; 'Man', 'Face' and 'Car', it is found that PSNRs of the intermediate views reconstructed from the calibrated images improved by about 2.5${\sim}$3.26 dB than those of the uncalibrated ones.