• 제목/요약/키워드: 고정 특징점 추출기

검색결과 5건 처리시간 0.01초

카메라 흔들림을 고려한 배경 모델 생성 방법 (The Background Modeling Method under Camera Shaking)

  • 이재훈;김형민;박종일;김유경;김광용
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.72-75
    • /
    • 2016
  • 본 논문에서는 고정된 카메라 환경에서 카메라의 흔들림에 강인한 배경 영상을 생성할 수 있는 배경 모델링 방법을 제안한다. 흔들리지 않은 영상을 기준 영상으로 설정하고 기준 영상에서 해리스 코너 검출기를 이용하여 특징점들을 검출한다. 이후 입력 영상에 대해 동일한 방식으로 특징점을 추출한 뒤 탬플릿 매칭과 거리 비교를 이용하여 공통적으로 나타나는 배경 영역들에 대한 특징점만을 선별한다. 기준 영상에서의 특징점과 목표 영상에서의 대응되는 특징점 쌍을 이용하여 보정을 위한 호모그래피 행렬을 계산한다. 이렇게 계산된 보정 행렬을 이용하여 흔들린 목표 영상을 보정하게 된다. 흔들린 영상들을 보정한 후 보정된 영상들로 배경 모델을 생성하게 되면 정확한 배경 모델을 생성할 수 있다.

  • PDF

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

초음파 영상을 위한 계층적 특징점 기반 블록 움직임 추출 (Hierarchical Feature Based Block Motion Estimation for Ultrasound Image Sequences)

  • 김백섭;신성철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권4호
    • /
    • pp.402-410
    • /
    • 2006
  • 연속된 초음파 영상 시퀀스로부터 파노라마 영상을 만들기 위해서는 인접된 프레임 사이의 움직임을 추정해야 한다. 기존에는 고정 블록 움직임 추정 방법이 주로 사용되고 있는데 본 논문은 정확성을 높이고 계산시간을 단축하기 위해 다해상도 영상을 이용한 특징점 기반 블록 움직임 추정 방법을 제안한다. 기존의 블록 움직임 추정 방법은 규칙적으로 블록을 배치하기 때문에 추정된 움직임의 정확도를 높이기 위해서는 블록의 크기가 커지기 때문에 처리 시간이 오래 걸린다. 본 논문에서는 특징점을 중심으로 블록을 배치하여 움직임 추정의 정확도는 유지하면서 블록의 크기를 줄일 수 있었다. 어파츄어문제(aperture problem)을 줄이기 위해 코너점을 특징점으로 하였다. 움직임 추정 영역은 일정한 크기의 부영역으로 나누고, 각 부영역에서 가장 코너 강도가 큰 점을 선택하였다. 특징점을 선택하는 데는 해리스 스테판 코너검출기를 사용하였다. 코너점들이 한 곳으로 편중될 경우 블록들이 움직임 추정 영역에서 골고루 분산되지 않아 이렇게 구한 블록 움직임을 이용하여 전역 움직임을 구하면 오차가 커진다. 본 논문에서는 이러한 문제를 해결하기 위해 특징점을 선택하는 영역에 제한을 두도록 하였다. 초음파 영상에는 스펙클과 잡음이 많아 코너점을 구하기 전에 영상 평활화를 해야 한다. 계산시간을 줄이고 잡음이 감소된 영상에서 코너점을 구하기 위해 저해상도 영상에서 블록 움직임을 구한 후 점점 고해상도로 확산하는 형태로 다해상도 영상을 사용한다. 실제 세가지 종류의 초음파 영상 시퀀스에 대해 실험결과 제안된 방법은 기존의 방법에 비해 움직임 추정 오차(Displaced Frame Difference)를 평균 66.02에서 58.98로 줄이면서 계산시간은 평균 71ms에서 44ms 으로 빠르게 됨을 알 수 있었다.

실시간 영상처리를 위한 SVM 분류기의 FPGA 구현 (FPGA Design of SVM Classifier for Real Time Image Processing)

  • 나원섭;한성우;정용진
    • 전기전자학회논문지
    • /
    • 제20권3호
    • /
    • pp.209-219
    • /
    • 2016
  • 영상처리에 쓰이는 기계학습 방법 중 하나인 SVM은 일반화 능력이 뛰어나 객체를 분류하는 성능이 뛰어나다. SVM을 이용하여 객체를 분류하기 위해서는 여러 번의 MAC 연산을 반복해서 수행해야 한다. 하지만 영상의 해상도가 늘어남에 따라 분류를 해야 하는 개체가 늘어나게 되면 연산 시간이 증가하게 되어 실시간 처리를 요하는 고속 시스템에 사용하기 어렵다. 본 논문에서는 실시간 처리를 요하는 고속 시스템에서도 사용이 가능한 SVM 분류기 하드웨어 구조를 제안한다. 실시간 처리를 하는데 제한 요소가 되는 반복 연산은 병렬처리를 통하여 동시에 계산할 수 있게 하였고 다양한 종류의 특징점 추출기와도 호환이 가능하도록 설계하였다. 하드웨어 구현에 사용한 커널은 RBF 커널이며 커널 사용으로 생기는 지수 연산은 식을 변형하여 고정소수점 연산이 가능하도록 하였다. 제안한 하드웨어의 성능을 확인하기 위해 Xilinx ZC706 보드에 구현하였고 $1360{\times}800$ 해상도 이미지에 대한 수행 시간은 동작 주파수 100 MHz에서 약 60.46 fps로 실시간 처리가 가능함을 확인했다.

도로비탈면 상시계측 실측치와 드론 사진측량에 의한 3D 모델값의 정확도 비교분석 (Accuracy Analysis for Slope Movement Characterization by comparing the Data from Real-time Measurement Device and 3D Model Value with Drone based Photogrammetry)

  • 조한광;장기태;홍성진;홍구표;김상환;권세호
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.234-252
    • /
    • 2020
  • 계측기기만을 이용한 현장 상황대응의 재래적 방식에서 벗어나 온라인 '첨단기술(Hi-Technology)'과 오프라인의 '직관적 경험(Hi-Experience)'을 융합한 하이브리드(Hybrid) 재해관리 기법의 유효성을 검증하였다. 이를 위해 대상 현장에 매설된 상시 계측기 GNSS(RTK) 5대를 지상기준점(Ground Control Point, GCP)으로 사용하였다. 또한, 인근 지점에 크기 불변 특징점(Scale Invariant Feature Transform, SIFT) 4곳을 추출하여 검사점(Control Point, CP)으로 활용하였다. 이를 통해 현장 실측치와 드론기반 3차원 측정 결과치와의 정확도를 각 좌표값의 차이의 평균제곱근오차(Root Mean Square Error)를 이용하여 분석하였다. 결과적으로 드론에 의해 획득된 3차원 수치 모델을 정밀하게 후처리 분석함으로써 피사체의 모든 지형지물이 변위추적의 객체로 활용할 수 있음을 확인할 수 있었다. 포인트 클라우드(Point cloud) 기반의 3-D 수치 영상은 현장 그대로의 모습을 초실감, 고정도 가시화 함으로서 직관적인 경험에 공감할 수 있는 친화적인 솔루션을 제공하며, 단순 신호처리 기반의 계측기기 하드웨어 중심의 재해관리를 탈피해 인명피해/예산 절감 등 비탈면 유지관리에 최적의 플랫폼을 제공할 수 있을 것으로 판단된다. 특히, 특정 위치에 설치된 특정지점(Pin-point) 센서에 의존한 국지적인 정보의 한계를 뛰어넘어 기술생산 중심에서 재난관리의 중심으로 신속하게 전환될 수 있는 매개체가 될 것으로 기대한다.