• 제목/요약/키워드: 광류 추정 방법

검색결과 14건 처리시간 0.018초

음성인식기 성능 향상을 위한 영상기반 음성구간 검출 및 적응적 문턱값 추정 (Visual Voice Activity Detection and Adaptive Threshold Estimation for Speech Recognition)

  • 송태엽;이경선;김성수;이재원;고한석
    • 한국음향학회지
    • /
    • 제34권4호
    • /
    • pp.321-327
    • /
    • 2015
  • 본 연구에서는 음성인식기 성능향상을 위한 영상기반 음성구간 검출방법을 제안한다. 기존의 광류기반 방법은 조도변화에 대응하지 못하고 연산량이 많아서 이동형 플렛홈에 적용되는 스마트 기기에 적용하는데 어려움이 있고, 카오스 이론 기반 방법은 조도변화에 강인하지만 차량 움직임 및 입술 검출의 부정확성으로 인해 발생하는 오검출이 발생하는 문제점이 있다. 본 연구에서는 기존 영상기반 음성구간 검출 알고리즘의 문제점을 해결하기 위해 지역 분산 히스토그램(Local Variance Histogram, LVH)과 적응적 문턱값 추정 방법을 이용한 음성구간 검출 알고리즘을 제안한다. 제안된 방법은 조도 변화에 따른 픽셀 변화에 강인하고 연산속도가 빠르며 적응적 문턱값을 사용하여 조도변화 및 움직임이 큰 차량 운전자의 발화를 강인하게 검출할 수 있다. 이동중인 차량에서 촬영한 운전자의 동영상을 이용하여 성능을 측정한 결과 제안한 방법이 기존의 방법에 비하여 성능이 우수함을 확인하였다.

얼굴 모션 추정과 표정 복제에 의한 3차원 얼굴 애니메이션 (3D Facial Animation with Head Motion Estimation and Facial Expression Cloning)

  • 권오륜;전준철
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.311-320
    • /
    • 2007
  • 본 논문에서는 강건한 얼굴 포즈 추정과 실시간 표정제어가 가능한 비전 기반 3차원 얼굴 모델의 자동 표정 생성 방법 및 시스템을 제안한다. 기존의 비전 기반 3차원 얼굴 애니메이션에 관한 연구는 얼굴의 움직임을 나타내는 모션 추정을 반영하지 못하고 얼굴 표정 생성에 초점을 맞추고 있다. 그러나, 얼굴 포즈를 정확히 추정하여 반영하는 작업은 현실감 있는 얼굴 애니메이션을 위해서 중요한 이슈로 인식되고 있다. 본 연구 에서는 얼굴 포즈추정과 얼굴 표정제어가 동시에 가능한 통합 애니메이션 시스템을 제안 하였다. 제안된 얼굴 모델의 표정 생성 시스템은 크게 얼굴 검출, 얼굴 모션 추정, 표정 제어로 구성되어 있다. 얼굴 검출은 비모수적 HT 컬러 모델과 템플릿 매칭을 통해 수행된다. 검출된 얼굴 영역으로부터 얼굴 모션 추정과 얼굴 표정 제어를 수행한다. 얼굴 모션 추정을 위하여 3차원 실린더 모델을 검출된 얼굴 영역에 투영하고 광류(optical flow) 알고리즘을 이용하여 얼굴의 모션을 추정하며 추정된 결과를 3차원 얼굴 모델에 적용한다. 얼굴 모델의 표정을 생성하기 위해 특징점 기반의 얼굴 모델 표정 생성 방법을 적용한다. 얼굴의 구조적 정보와 템플릿 매칭을 이용하여 주요 얼굴 특징점을 검출하며 광류 알고리즘에 의하여 특징점을 추적한다. 추적된 특징점의 위치는 얼굴의 모션 정보와 표정 정보의 조합으로 이루어져있기 때문에 기하학적 변환을 이용하여 얼굴의 방향이 정면이었을 경우의 특징점의 변위인 애니메이션 매개변수(parameters)를 계산한다. 결국 얼굴 표정 복제는 두 개의 정합과정을 통해 수행된다. 애니메이션 매개변수 3차원 얼굴 모델의 주요 특징점(제어점)의 이동은 획득된 애니메이션 매개변수를 적용하여 수행하며, 정점 주위의 부가적 정점의 위치는 RBF(Radial Basis Function) 보간법을 통해 변형한다. 실험결과 본 논문에서 제안된 비전기반 애니메이션 시스템은 비디오 영상으로부터 강건한 얼굴 포즈 추정과 얼굴의 표정변화를 잘 반영하여 현실감 있는 애니메이션을 생성함을 입증할 수 있었다.

Optical Flow 기반 CCTV 영상에서의 차량 통행량 및 통행 속도 추정에 관한 연구 (Optical Flow Based Vehicle Counting and Speed Estimation in CCTV Videos)

  • 김지혜;신도경;김재경;권철희;변혜란
    • 방송공학회논문지
    • /
    • 제22권4호
    • /
    • pp.448-461
    • /
    • 2017
  • 본 논문에서는 교통관제용 CCTV로부터 촬영된 영상에서 교통 상황 분석을 위해 차량의 통행량 및 통행 속도를 획득하는 방법을 제안한다. 제안하는 방법은 촬영된 영상에 역 투영 사상(IPM, Inverse Perspective Mapping) 방법을 이용하여 카메라 각도에 따른 시각적 관점에서 기인한 왜곡을 제거하고, 차선 검출 알고리즘을 통해 1) 차량 통행량, 2) 차량 통행 속도를 측정할 소정 영역을 획득한다. 소정 영역에 대하여 광류(Optical flow) 기반 모션 추정을 이용하여 차량 통행량 및 통행 속도를 획득한다. 본 논문에서 제안한 방법을 지역별 다양한 CCTV 영상인 총 106,993 프레임, 약 세 시간 길이의 영상에 적용하여 88.94%의 검출 성능을 얻을 수 있었다.

회화적 애니메이션에서 브러시 스트로크의 시간적 일관성을 유지하기 위한 모션 맵 생성 (Motion Map Generation for Maintaining the Temporal Coherence of Brush Strokes in the Painterly Animation)

  • 박영섭;윤경현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권8호
    • /
    • pp.536-546
    • /
    • 2006
  • 회화적 애니메이션은 비디오 동영상을 이용하여 손으로 그린 듯 한 회화적 느낌을 표현하는 방법이며 프레임 간 브러시 스트로크의 시간적 일관성을 유지하는 것이 가장 중요한 요소이다. 본 논문에서는 프레임 간 브러시 스트로크의 일관성을 유지하기 위한 모션 맵 생성을 제안한다. 모션 맵이란 모션이 발생한 에지 위치를 기준으로 해서 모션 정보를 더함으로써 프레임 간 에지가 움직이는 영역을 말한다. 본 논문에서 사용한 모션 추정 방법은 광류 (optical flow) 방법과 블록 기반 방법을 이용하였으며 여러 가지 모션 추정 방법을 통해서 얻은 모션 정보 ( 방향과 크기 ) 중 신호 대 잡음비 (PSNR)가 가장 큰 방법을 최종 모션 정보로 선택하여 모션 맵을 생성하였다. 생성된 모션 맵은 다음 프레임의 덧칠 부분을 결정해 준다. 손으로 그린 듯 한 회화적 느낌을 표현하면서도 프레임 간 브러시 스트로크의 시간적 일관성을 유지하기 위해서 브러시 스트로크의 방향을 결정해주는 강한 에지에 대해서만 모션 정보를 적용하였다. 또한 다중노출기법과 소스 영상과 캔버스간의 차이 맵을 이용하여 프레임 간 플릭커링 현상을 줄이고자 하였다. 구조적 일관성을 유지하기 위해 국부 기울기 보간법 (local gradient interpolation)을 이용하여 브러시 스트로크 간 방향의 일관성을 유지하였다.