• 제목/요약/키워드: Normalized Cross Correlation

검색결과 100건 처리시간 0.023초

3D-CNN에서 동적 손 제스처의 시공간적 특징이 학습 정확성에 미치는 영향 (Effects of Spatio-temporal Features of Dynamic Hand Gestures on Learning Accuracy in 3D-CNN)

  • 정영지
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.145-151
    • /
    • 2023
  • 3D-CNN은 시계열 데이터 학습을 위한 딥 러닝 기법 중 하나이다. 이러한 3차원 학습은 많은 매개변수를 생성할 수 있으므로 고성능 기계학습이 필요하거나 학습 속도에 커다란 영향을 미칠 수 있다. 본 연구에서는 손의 동적인 제스처 동작을 시공간적으로 학습할 때, 3D-CNN 모델의 구조적 변화 없이 입력 영상 데이터의 시공간적 변화에 따른 학습 정확성을 분석함으로써, 3D-CNN을 이용한 동적 제스처 학습의 효율성을 높이기 위한 입력 영상 데이터의 최적 조건을 찾고자 한다. 첫 번째로 동적 손 제스처 영상 데이터에서 동적 이미지 프레임의 학습구간을 설정함으로써 제스처 동작간 시간 비율을 조정한다. 둘째로는 클래스간 2차원 교차 상관 분석을 통해 영상 데이터의 이미지 프레임간 유사도를 측정하여 정규화 함으로써 프레임간 평균값을 얻고 학습 정확성을 분석한다. 이러한 분석을 통하여, 동적 손 제스처의 3D-CNN 딥 러닝을 위한 입력 영상 데이터를 효과적으로 선택하는 두 가지 방법을 제안한다. 실험 결과는 영상 데이터 프레임의 학습구간과 클래스간 이미지 프레임간 유사도가 학습 모델의 정확성에 영향을 미칠 수 있음을 보여준다.

빠른 피쳐변위수렴을 위한 BMA을 이용한 STK 피쳐 추적 (STK Feature Tracking Using BMA for Fast Feature Displacement Convergence)

  • 진경찬;조진호
    • 전자공학회논문지S
    • /
    • 제36S권8호
    • /
    • pp.81-87
    • /
    • 1999
  • 일반거인 피쳐검출 및 추적 알고리즘에는 Garbor-jet를 이용한 elastic bunch graph matching (EBGM), rotation normalized cross-correlation (NCC-R) 및 화소의 고유치를 이용한 Shi-Tomasi-Kanade(STK) 알고리즘 등이 있다. 이들 중에서 EBGM, NCC-R은 피쳐모델에 의해 피쳐를 검출하지만 STK 알고리즘은 피쳐를 자동적으로 검출하는 특징을 가진다. 본 논문에서는 STK알고리즘인 Newton-Raphson (NR) 추적의 초기화 문제를 해결하기 위해서 모델링된 피쳐영역에서 STK 알고리즘으로 피쳐를 검출한 후, NR 방법으로 피쳐를 추적할 때, NR 방법에 의한 피쳐추적의 정확성을 개선시키기 위해 block matching agorithm (BMA)-NR 방법을 제안하였다. NR 방법에 의한 피쳐변위수렴시 BMA-NR 방법이 NBMA-NR (no BMA-NR)방법보다 피쳐추적의 정확성이 향상되었는데, 이는 NR의 서치영역크기로 인한 국소 최소치(local minimum) 문제를 해결하였기 때문이다.

  • PDF

고밀도 3D 형상 계측 시스템에서의 고속 시차 추정을 위한 NCC 알고리즘 기반 하드웨어 구조 (A hardware architecture based on the NCC algorithm for fast disparity estimation in 3D shape measurement systems)

  • 배경렬;권순;이용환;이종훈;문병인
    • 센서학회지
    • /
    • 제19권2호
    • /
    • pp.99-111
    • /
    • 2010
  • This paper proposes an efficient hardware architecture to estimate disparities between 2D images for generating 3D depth images in a stereo vision system. Stereo matching methods are classified into global and local methods. The local matching method uses the cost functions based on pixel windows such as SAD(sum of absolute difference), SSD(sum of squared difference) and NCC(normalized cross correlation). The NCC-based cost function is less susceptible to differences in noise and lighting condition between left and right images than the subtraction-based functions such as SAD and SSD, and for this reason, the NCC is preferred to the other functions. However, software-based implementations are not adequate for the NCC-based real-time stereo matching, due to its numerous complex operations. Therefore, we propose a fast pipelined hardware architecture suitable for real-time operations of the NCC function. By adopting a block-based box-filtering scheme to perform NCC operations in parallel, the proposed architecture improves processing speed compared with the previous researches. In this architecture, it takes almost the same number of cycles to process all the pixels, irrespective of the window size. Also, the simulation results show that its disparity estimation has low error rate.

SPOT 위성데이타를 이용한 수치표고모델 생성에 관한 연구 (A Study on the Generation of Digital Elevation Model from SPOT Satellite Data)

  • 안철호;안기원;박병욱
    • 한국측량학회지
    • /
    • 제9권2호
    • /
    • pp.93-102
    • /
    • 1991
  • 본 연구에서는 STOP 위성의 CCT(Computer Compatible Tape) 데이타를 이용하여 수치표고모델을 생성하는 기술을 개발하므로써, 광역에 대한 수치표고모델을 경제적이고 효율적으로 작성하는 방안을 제시하였다. 경사관측된 한 쌍의 SPOT 수치데이타를 이용하여 표고를 추출하기 위해서는 먼저 관측당시의 위성의 외부표정요소(위성의 위치 및 자세)를 결정하여야 하며, 이것을 위하여 번들조정법을 적용하였다. SPOT 데이타는 항공사진과는 달리 다중 중심투영이므로 외부표정요소에 대하여 라인의 함수형태로 모델링을 하였다. 입체 수치데이타에서 동일점을 찾기 위하여 표준상관계수매칭 기법을 적용하였으며, SPOT 위성데이타에 적합한 기준영역의 크기(매칭사이즈)를 결정하기 위한 실험 결과 13$\times$13의 크기가 적절하였다. 동일점을 자동매칭 기법으로 찾은 후, 외부표정요소를 이용한 공간교차(space intersection) 이론으로 각 점마다의 지상좌표를 결정하였다. 이와 함께 이상표고들을 소거하는 알고리즘을 개발 적용한 결과 상당히 효과적이었으며 수치표고모델의 정확도를 향상시킬 수 있었다.

  • PDF

AUTOMATIC PRECISION CORRECTION OF SATELLITE IMAGES

  • Im, Yong-Jo;Kim, Tae-Jung
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.40-44
    • /
    • 2002
  • Precision correction is the process of geometrically aligning images to a reference coordinate system using GCPs(Ground Control Points). Many applications of remote sensing data, such as change detection, mapping and environmental monitoring, rely on the accuracy of precision correction. However it is a very time consuming and laborious process. It requires GCP collection, the identification of image points and their corresponding reference coordinates. At typical satellite ground stations, GCP collection requires most of man-powers in processing satellite images. A method of automatic registration of satellite images is demanding. In this paper, we propose a new algorithm for automatic precision correction by GCP chips and RANSAC(Random Sample Consensus). The algorithm is divided into two major steps. The first one is the automated generation of ground control points. An automated stereo matching based on normalized cross correlation will be used. We have improved the accuracy of stereo matching by determining the size and shape of match windows according to incidence angle and scene orientation from ancillary data. The second one is the robust estimation of mapping function from control points. We used the RANSAC algorithm for this step and effectively removed the outliers of matching results. We carried out experiments with SPOT images over three test sites which were taken at different time and look-angle with each other. Left image was used to select UP chipsets and right image to match against GCP chipsets and perform automatic registration. In result, we could show that our approach of automated matching and robust estimation worked well for automated registration.

  • PDF

A novel computer vision-based vibration measurement and coarse-to-fine damage assessment method for truss bridges

  • Wen-Qiang Liu;En-Ze Rui;Lei Yuan;Si-Yi Chen;You-Liang Zheng;Yi-Qing Ni
    • Smart Structures and Systems
    • /
    • 제31권4호
    • /
    • pp.393-407
    • /
    • 2023
  • To assess structural condition in a non-destructive manner, computer vision-based structural health monitoring (SHM) has become a focus. Compared to traditional contact-type sensors, the advantages of computer vision-based measurement systems include lower installation costs and broader measurement areas. In this study, we propose a novel computer vision-based vibration measurement and coarse-to-fine damage assessment method for truss bridges. First, a deep learning model FairMOT is introduced to track the regions of interest (ROIs) that include joints to enhance the automation performance compared with traditional target tracking algorithms. To calculate the displacement of the tracked ROIs accurately, a normalized cross-correlation method is adopted to fine-tune the offset, while the Harris corner matching is utilized to correct the vibration displacement errors caused by the non-parallel between the truss plane and the image plane. Then, based on the advantages of the stochastic damage locating vector (SDLV) and Bayesian inference-based stochastic model updating (BI-SMU), they are combined to achieve the coarse-to-fine localization of the truss bridge's damaged elements. Finally, the severity quantification of the damaged components is performed by the BI-SMU. The experiment results show that the proposed method can accurately recognize the vibration displacement and evaluate the structural damage.

HRNet 모델을 이용한 항공정사영상간 영상 매칭 (Image Matching for Orthophotos by Using HRNet Model)

  • 성선경;최재완
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.597-608
    • /
    • 2022
  • 원격탐사 자료는 재난, 농업, 도시계획 및 군사 등 다양한 분야에서 활용되며, 최근 다양한 고해상도 센서에서 취득된 시계열 자료의 활용에 대한 요구가 증대되고 있다. 본 연구에서는 시계열 원격탐사 자료의 활용을 위해 딥러닝 기법을 이용한 영상 매칭 방법을 제안하였다. 본 연구에서 적용한 딥러닝 모델은 영상분할 영역에서 많이 사용되고 있는 HRNet을 기반으로 하였다. 특히, 기본영상과 목표영상 간 상관도 맵을 효과적으로 계산하고, 학습의 효율을 높이기 위하여 denseblock을 추가하였다. 국토지리정보원의 다시기 항공정사영상을 이용하여 제안된 모델의 학습을 수행하였으며, 학습에 사용하지 않은 자료를 이용하여 평가를 하고자 하였다. 딥러닝 모델을 이용한 영상매칭 성능을 평가하기 위해 영상 매칭결과와의 비교평가를 수행하였다. 실험 결과, 제안기법을 통한 영상 매칭률이 80%일 때의 평균 오차는 3화소로 ZNCC에 의한 결과인 25화소에 비해 더 높은 정확도를 보였다. 제안된 기법은 식생의 생장에 따라 영상의 변화가 심한 산지 및 농지 지역에 대해서도 효과적임을 확인하였다. 이를 통해 딥러닝을 이용한 기준영상과 목표영상의 매칭을 수행할 수 있을 것으로 판단되며, 위성영상의 상호좌표등록 및 다시기 영상의 정합 등에 활용할 수 있을 것으로 예상된다.

다차원 인접화소 간 명암차의 극좌표 기반 비선형 양자화 히스토그램에 의한 서명인식 (Signatures Verification by Using Nonlinear Quantization Histogram Based on Polar Coordinate of Multidimensional Adjacent Pixel Intensity Difference)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.375-382
    • /
    • 2016
  • 본 논문에서는 다차원 인접화소 간 명암차 기반 극좌표의 비선형 양자화 히스토그램을 이용한 서명인식을 제안한다. 다차원 인접화소 간 명암차는 기준화소를 중심으로 횡방향, 종방향, 대각 방향, 역대각 방향 각각의 이웃화소 간 명암차이고, 극좌표는 횡과 종 방향 및 대각과 비대각 방향 각각의 직교좌표로부터 변환된 좌표이며, 비선형 양자화 히스토그램은 반복계산 기법인 Lloyd 알고리즘에 의해 극좌표 값을 비균일 양자화한 히스토그램이다. 여기서 4방향 명암차의 극좌표 히스토그램은 대응하는 화소간의 상관성을 좀 더 많이 고려할 뿐만 아니라 히스토그램의 수를 감소시켜 계산부하를 줄이기 위함이다. 또한 비선형 양자화는 화소간의 명암변화의 속성을 더욱 더 잘 반영할 뿐만 아니라 저차원의 히스토그램 레벨을 얻기 위함이다. 제안된 기법을 256*256 픽셀의 90개(3인*30개) 서명들을 대상으로 city-block거리, Euclidean 거리, 순서값, 그리고 정규상호상관계수 각각의 정합척도에 기반 한 실험결과, 선형 양자화 기반 히스토그램에 비해 우수한 인식성능을 가지며, Euclidean 거리가 가장 우수한 정합척도임을 확인하였다.

다중영상 영역기반 영상정합을 위한 유사성 측정방법 분석 (An Analysis of Similarity Measures for Area-based Multi-Image Matching)

  • 노명종;김정섭;조우석
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.143-152
    • /
    • 2012
  • 항공영상을 이용하여 수치표면자료와 같은 3차원 자료를 자동으로 제작하기 위해서는 영상정합이 반드시 필요하다. 최근 사용되고 있는 항공 디지털 프레임 영상은 과거의 아날로그 영상에 비해 폐색지역이 적은 고중복도 다중 스트립 영상으로 촬영되기에 용이하다. 최근 다중 스트립 영상을 이용한 다중영상정합 기법에 대한 연구가 많이 이루어지고 있으며, 특히 각 영상에서 추출된 점(point feature)이나 형상(linear feature)의 유사성 측정 방법에 대한 연구가 진행되고 있다. 본 연구에서는 수직궤적 기반 다중영상정합을 대상으로 영역기반 유사성 측정 방법으로 SNCC(Sum of Normalized Cross-Correlation)와 SSD(Sum of Squared-Difference) 방법을 비교 분석하였다. 또한 영역기반 유사성 측정에 필요한 요소로 영상의 화소값, 화소값 기울기 강도, 화소값과 화소값 기울기 강도 평균을 각각 사용하여 결과를 비교하였다. 이 외에도 영역기반 유사성 측정에서 중요한 요소인 기준 윈도우의 크기를 비정규 적응형 기준 윈도우 방법과 정규 적응형 윈도우 방법을 적용하여 결과를 비교 분석하였다. 실험을 위하여 사용된 항공영상은 ZI Imaging 사의 DMC (Digital Modular Camera)에 의해 종중복도는 80%, 횡중복도는 60%로 촬영되었으며, 3개의 스트립으로 구성되었다. 다양한 방법으로 실험을 수행한 결과에 따르면 유사성 측정 방법으로는 SNCC, 유사성 측정 요소로는 화소값과 화소값 기울기 강도 평균, 그리고 비정규 적응형 기준 윈도우가 수직궤적 기반 다중영상정합의 영역기반 유사성 측정에 가장 적합하다는 것을 확인하였다.

영상 프레임 분석을 통한 대용량 캡슐내시경 영상의 지능형 판독보조 시스템 (Intelligent Diagnosis Assistant System of Capsule Endoscopy Video Through Analysis of Video Frames)

  • 이현규;최민국;이돈행;이상철
    • 지능정보연구
    • /
    • 제15권2호
    • /
    • pp.33-48
    • /
    • 2009
  • 캡슐내시경검사는 일반 내시경 검사에 비해 고통이 없고 합병증이 적다고 보고되어 있어 향후 지속적인 발전 가능성이 매우 큰 분야로 잘 알려져 있다. 그러나, 캡슐내시경을 이용한 진단은 캡슐이 동일한 위치에 상주할 경우 반복적으로 촬영된 유사한 영상을 오래도록 관찰 하여야 하므로, 진단자로 하여금 막대한 시간적 비용을 발생하게 한다. 따라서 보다 현실적이고 실용적인 캡슐내시경 검사를 위한 효율적인 탐색 및 진단 방법으로써 캡슐내시경영상에 대한 지능형 탐색방법이 요구된다. 본 논문에서 제안하는 지능형 판독보조 시스템은 영상차감을 통해 중복영상을 최소화한 후 프레임단위로 영상이 내포한 정보를 일차원도표(map)의 형태로 제공하고, 이러한 결과도표의 분석도구 및 방법을 제안함으로써 진단시간을 큰 폭으로 단축할 수 있는 방법을 제안하였다. 즉, 비교연산 한 정규화된 교차상관(Normalized Cross-Correlation) 방법을 통해 전처리 된 인접영상에 대한 유사도를 추출하고, 설정된 임계값이상의 영상들만을 탐색 범위로 지정하여 중복 촬영된 영상의 탐색을 최소화 한다. 이외에도 영상간 유사도, 엔트로피와 명암도를 통해 얻어진 이동도표, 특성도표와 명암도표를 분석하여 효율적으로 사용자가 탐색을 원하는 부위에 대한 탐색밀도를 높이는 등의 다양한 진단 매뉴얼을 제시한다.

  • PDF