• 제목/요약/키워드: Affine transformation

검색결과 128건 처리시간 0.021초

적외선 조명 카메라를 이용한 시선 위치 추적 시스템 (Gaze Detection System by IR-LED based Camera)

  • 박강령
    • 한국통신학회논문지
    • /
    • 제29권4C호
    • /
    • pp.494-504
    • /
    • 2004
  • 사용자의 시선 위치를 파악하는 연구는 많은 응용분야를 가지고 지난 몇년간 눈부시게 발전되어 왔다. 기존의 대부분 연구에서는 영상 처리 방법만에 의존하여 시선 위치 추적 연구를 수행하였기 때문에 처리 속도도 늦고 많은 사용 제약을 가지는 문제점이 있었다. 이 논문에서는 적외선 조명이 부착된 단일 카메라를 이용한 컴퓨터 비전 시스템으로 시선 위치 추적 연구를 수행하였다. 사용자의 시선 위치를 파악하기 위해서는 얼굴 특징점의 위치를 추적해야하는데, 이를 위하여 이 논문에서는 적의선 기반 카메라와 SVM(Support Vector Machine) 알고리즘을 사용하였다. 사용자가 모니터상의 임의의 지점을 쳐다볼 때 얼굴 특징점의 3차원 위치는 3차원 움직임량 추정(3D motion estimation) 및 아핀 변환(affine transformation)에 의해 계산되어 질 수 있다. 얼굴 특징점의 변화된 3차원 위치가 계산되면. 이로부터 3개 이상의 얼굴 특징점으로부터 생성되는 얼굴 평면 및 얼굴 평면의 법선 벡터가 구해지게 되며, 이러한 법선 백터가 모니터 스크린과 만나는 위치가 사용자의 시선위치가 된다. 또한. 이 논문에서는 보다 정확한 시선 위치를 파악하기 위하여 사용자의 눈동자 움직임을 추적하였으며 이를 위하여 신경망(다층 퍼셉트론)을 사용하였다. 실험 결과, 얼굴 및 눈동자 움직임에 의한 모니터상의 시선 위치 정확도는 약 4.2cm의 최소 자승 에러성능을 나타냈다.

예측 비디오 코딩을 위한 통합 움직임 보상 알고리즘 (Integration of Motion Compensation Algorithm for Predictive Video Coding)

  • 음호민;박근수;송문호
    • 전자공학회논문지S
    • /
    • 제36S권12호
    • /
    • pp.85-96
    • /
    • 1999
  • 많은 경우의 예측 비디오 압축 표준에서는, BMA에 의해 매크로 블록당 하나의 움직임 벡터가 계산되는 방식인 BMC방식이 널리 사용되고 있다. 그러나 BMC에 의해 예측된 움직임 벡터 필드는 블록당 하나의 움직임 벡터를 사용하기 때문에 불연속적이며, 불연속적인 움직임 벡터 필드로 인해 블록화 현상을 나타낸다. 따라서 이를 제거하는 효과적인 방법은 움직임 벡터 필드를 평활화(smoothing)하는 방법일 것이다. 최적 평활화 과정은 비디오 시퀀스의 움직임 종류에 따라 다를 것이다. 본 논문에서는 움직임 벡터를 평활화하는 몇 개의 방법들을 고려할 것이다. 어떠한 방법이든 BMA로 구한 움직임 벡터는 더 이상 최적화된 움직임 벡터가 아닐 것이므로, BFD(displaced frame difference)의 놈(norm)을 최소화하는 최적 움직임 벡터를 찾아야 한다. 본 논문에서는 conjugate gradient 알고리즘을 사용하여 DFD의 놈을 최소화하는 최적움직임 벡터를 찾는 통합 알고리즘을 제안한다. 이 통합 알고리즘은 ATMC(affine transform based motion compensation), BTMC(bilinear transform based motion compensation), 그리고 본 논문에서 제안하는 FMC(filtered motion compensation)의 세가지 방식에 대하여 적용되고 BMC에 대비해서 평가되어 졌다.

  • PDF

고해상도 위성영상의 센서모형과 방법 비교 (Comparison Among Sensor Modeling Methods in High-Resolution Satellite Imagery)

  • 김의명;이석군
    • 대한토목학회논문집
    • /
    • 제26권6D호
    • /
    • pp.1025-1032
    • /
    • 2006
  • 고해상도 위성의 센서모형화는 도면화와 지형공간정보(Geo-spatial Information System)의 응용을 위해서는 필수적인 단계이다. 영상과 대상물과의 기하학적인 관계를 규정하는 센서모형은 크게 엄밀(rigorous)센서모형화와 간략(approximate)센서모형화의 두 가지로 나눌 수 있다. 엄밀센서모형화는 위성의 실제적인 촬영기하를 고려한 것으로 센서의 내외부적인 특성을 알고 있어야 하는 반면에 간략센서모형화 방법은 영상취득기하의 종합적인 이해나 센서의 내외부적인 특성정보를 필요로 하지 않기 때문에 사진측량 커뮤니티에서 많은 관심이 증대되고 있다. 본 연구에서는 고해상도 위성영상의 3차원 위치결정에 이용되고 있는 엄밀센서모형과 다양한 간략센서모형에 대해 비교연구를 수행하였으며 위성영상의 이용목적에 따른 적합한 모형화 방법을 제안하였다. IKONOS 위성영상을 이용한 사례연구를 통하여 엄밀센서모형과 간략센서모형에 대한 비교연구를 수행하였으며, 수집 가능한 지상기준점에 따른 위치정확도를 평가하였다. 간략센서모형화 방법 중에서 편의보정된 다항식비례모형(bias compensated RFM)이 가장 우수하였으며 개량평행투영모형(modified parallel projection)과 평행-중심투영모형(parallel-perspective model)은 적은 수의 기준점을 이용하여 센서모형화가 가능하였다. 또한 간략센서모형화 방법 중 부등각사상변환(affine transformation)은 고해상도 위성의 수평위치결정과 영상간의 등록에 활용가능하다.

입술정보를 이용한 입술모양의 기하학적 보정 (Geometric Correction of Lips Using Lip Information)

  • 황동국;박희정;전병민
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.834-841
    • /
    • 2004
  • 화자의 입술영상에는 카메라와 화자의 위치나 자세로 인하여 정상적인 입술이 기하학적으로 변환될 수 있다. 이러한 변환은 본래 입술위상의 기하학적 정보를 변경시킨다. 따라서 기하학적으로 변환된 입술모양을 보정하는데 부분적인 입술위상정보를 사용함으로써 전체 입술정보를 개선하고자, 본 논문에서는 입술모양의 기하학적 보정 기법을 제안한다. 제안한 기법은 특징결정 단계와 보정 단계로 구성된다. 특징결정 단계에서는 원영상과 목표영상의 입술모델에 따라 원영상의 특징점과 특징을 추출하고 목표영상의 특징점과 특징을 결정한다. 보정단계에서는 이전 단계에서 추출한 정보를 기반으로 영상을 부분영상으로 분할하고 사상 후 보정된 영상을 통합한다. 실험영상은 6개의 한국어 단모음 발음에 대한 동영상 프레임이고 알고리즘 평가를 위하여 입술의 좌우 대칭성을 활용한다. 실험 결과, 윗입술보다는 아랫입술의 보정률, 입술의 움직임이 작은 발음보다는 움직임이 큰 발음의 보정률이 높게 개선되었다.

GEOMETRY OF SATELLITE IMAGES - CALIBRATION AND MATHEMATICAL MODELS

  • JACOBSEN KARSTEN
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.182-185
    • /
    • 2005
  • Satellite cameras are calibrated before launch in detail and in general, but it cannot be guaranteed that the geometry is not changing during launch and caused by thermal influence of the sun in the orbit. Modem satellite imaging systems are based on CCD-line sensors. Because of the required high sampling rate the length of used CCD-lines is limited. For reaching a sufficient swath width, some CCD-lines are combined to a longer virtual CCD-line. The images generated by the individual CCD-lines do overlap slightly and so they can be shifted in x- and y-direction in relation to a chosen reference image just based on tie points. For the alignment and difference in scale, control points are required. The resulting virtual image has only negligible errors in areas with very large difference in height caused by the difference in the location of the projection centers. Color images can be related to the joint panchromatic scenes just based on tie points. Pan-sharpened images may show only small color shifts in very mountainous areas and for moving objects. The direct sensor orientation has to be calibrated based on control points. Discrepancies in horizontal shift can only be separated from attitude discrepancies with a good three-dimensional control point distribution. For such a calibration a program based on geometric reconstruction of the sensor orientation is required. The approximations by 3D-affine transformation or direct linear transformation (DL n cannot be used. These methods do have also disadvantages for standard sensor orientation. The image orientation by geometric reconstruction can be improved by self calibration with additional parameters for the analysis and compensation of remaining systematic effects for example caused by a not linear CCD-line. The determined sensor geometry can be used for the generation? of rational polynomial coefficients, describing the sensor geometry by relations of polynomials of the ground coordinates X, Y and Z.

  • PDF

딥러닝 기반의 의미론적 영상 분할을 이용한 주행 보조 시스템 (Driving Assist System using Semantic Segmentation based on Deep Learning)

  • 김정환;이태민;임준홍
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.147-153
    • /
    • 2020
  • 기존의 차선 검출 방법들은 곡률과 날씨 변화가 큰 도로 환경에서 검출률이 낮다. 확률적 허프 변환을 이용한 방법은 에지와 직선의 각도를 이용해서 차선을 검출함으로 곡선과 악천후일 때 검출률이 낮다. 슬라이딩 윈도우 방법은 윈도우로 이미지를 분할해서 검출하기 때문에 곡선 형태의 차선도 검출하지만 어파인 변환을 사용하기 때문에 도로의 경사율에 영향을 받는다. 본 논문에서는 다양한 외부 환경에서도 차선을 강인하게 검출하고 장애물을 회피하기 위한 딥러닝 기반의 주행 보조 시스템을 제안한다. VGG-16기반의 SegNet으로 입력 영상을 의미론적으로 분할해서 차선을 검출한다. 검출한 차선과의 이격거리를 계산하고 안전범위를 산출해서 차량이 차선의 중앙을 주행하도록 제어한다. 또한, 전방의 미확인 물체와 충돌이 예상되면 운전자에게 경보를 주고 Adaptive-MPC로 차량을 제어해서 충돌을 회피하는 알고리즘도 제안한다. CARLA로 시뮬레이션한 결과 제안한 알고리즘은 곡률이 큰 차선과 다양한 환경에서도 강인하게 차선을 검출하고 전방의 안전범위를 계산하여 충돌을 회피하는 것을 볼 수 있다.

다해상도 3D 얼굴 모델의 압축 (Multiresolution 3D Facial Model Compression)

  • 박동희;이종석;이영식;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.602-607
    • /
    • 2002
  • 본 논문에서는 효율적인 압축 기법과 멀티미디어를 위한 다 해상도 3D 얼굴 모델 전송, 그리고 저비트율 응용에 대해 제안하고자 한다. 일반적으로 얼굴 모델은 3D 레이저 디지타이저에 의해서 얻어지게 되고 애니메이션, 비디오게임, 비디오 회의와 같은 응용 범위에 따라 여러 해상도로 재양자화 되어진다. 3D 디지털화된 얼굴 모델을 정합하고 재양자화 하기 위해서 2D 템플릿을 변형함으로써 압축 모델을 얻을 수 있다. 현재까지의 연구에서 다섯 가지 해상도로 계층적 2D 얼굴 와이어프레임 템플릿을 만들었다. 변형 과정에서 2D 템플릿은 얼굴 특징점과 제안된 PCAT(piecewise chainlet affine transformation)에 의해 바뀌게 된다. 재양자화된 후 3D 디지털화된 모델은 인지하지 못할 정도로 손실이 줄어들게 된다. 더욱이, 본 논문에서 제안한 계층적 데이터 구조를 갖는 다 해상도 얼굴모델은 통신망에서 점진적으로 알려지고 사용되어질 것이다.

  • PDF

Effective Reduction of Horizontal Error in Laser Scanning Information by Strip-Wise Least Squares Adjustments

  • Lee, Byoung-Kil;Yu, Ki-Yun;Pyeon, Moo-Wook
    • ETRI Journal
    • /
    • 제25권2호
    • /
    • pp.109-120
    • /
    • 2003
  • Though the airborne laser scanning (ALS) technique is becoming more popular in many applications, horizontal accuracy of points scanned by the ALS is not yet satisfactory when compared with the accuracy achieved for vertical positions. One of the major reasons is the drift that occurs in the inertial measurement unit (IMU) during the scanning. This paper presents an algorithm that adjusts for the error that is introduced mainly by the drift of the IMU that renders systematic differences between strips on the same area. For this, we set up an observation equation for strip-wise adjustments and completed it with tie point and control point coordinates derived from the scanned strips and information from aerial photos. To effectively capture the tie points, we developed a set of procedures that constructs a digital surface model (DSM) with breaklines and then performed feature-based matching on strips resulting in a set of reliable tie points. Solving the observation equations by the least squares method produced a set of affine transformation equations with 6 parameters that we used to transform the strips for adjusting the horizontal error. Experimental results after evaluation of the accuracy showed a root mean squared error (RMSE) of the adjusted strip points of 0.27 m, which is significant considering the RMSE before adjustment was 0.77 m.

  • PDF

다중선형회귀모델을 이용한 움직임 추정방법 (Motion estimation method using multiple linear regression model)

  • 김학수;임원택;이재철;이규원;박규택
    • 전자공학회논문지S
    • /
    • 제34S권10호
    • /
    • pp.98-103
    • /
    • 1997
  • Given the small bit allocation for motion information in very low bit-rate coding, motion estimation using the block matching algorithm(BMA) fails to maintain an acceptable level of prediction errors. The reson is that the motion model, or spatial transformation, assumed in block matching cannot approximate the motion in the real world precisely with a small number of parameters. In order to overcome the drawback of the conventional block matching algorithm, several triangle-based methods which utilize triangular patches insead of blocks have been proposed. To estimate the motions of image sequences, these methods usually have been based on the combination of optical flow equation, affine transform, and iteration. But the compuataional cost of these methods is expensive. This paper presents a fast motion estimation algorithm using a multiple linear regression model to solve the defects of the BMA and the triange-based methods. After describing the basic 2-D triangle-based method, the details of the proposed multiple linear regression model are presented along with the motion estimation results from one standard video sequence, representative of MPEG-4 class A data. The simulationresuls show that in the proposed method, the average PSNR is improved about 1.24 dB in comparison with the BMA method, and the computational cost is reduced about 25% in comparison with the 2-D triangle-based method.

  • PDF

다중 기술자를 이용한 잘못된 특징점 정합 제거 (Filtering Feature Mismatches using Multiple Descriptors)

  • 김재영;전희성
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.23-30
    • /
    • 2014
  • 이미지 기술자(descriptor)를 이용한 정합은 최근까지 컴퓨터 비전과 패턴인식 분야에서 사용되고 있는 강력한 정합 방법이다. 그러나 3차원 시점이 변화되거나 밝기가 변화된 이미지, 반복된 패턴이 포함된 이미지 등에서 잘못된 정합들이 발생한다. 본 논문에서는 반복된 패턴이 포함되어 있는 이미지에서 잘못된 정합들이 많이 발생하는 문제점에 대해 기술하고 이를 분석하여 잘못된 정합들을 제거할 수 있는 방법을 제안한다. MDMF(Multiple Descriptors-based Mismatch Filtering) 방법은 각 특징점에 대해 인접한 여러 개의 특징점들의 기술자들을 사용하여 다중 기술자를 생성한 후 이를 활용하여 잘못된 정합들을 제거한다. 실험에서는 크기 변환, 회전 변환, 어파인 변환에 대해 기존 SIFT와 ASIFT의 정합율을 MDMF를 이용해 제거한 정합율과 비교하여 MDMF가 잘못된 정합을 성공적으로 제거할 수 있음을 보였다.