• 제목/요약/키워드: motion vector estimation

검색결과 365건 처리시간 0.021초

스케일러블 비디오 부호화에서 공간 계층간 움직임 벡터 예측를 이용한 고속 모드 결정 (Fast Block Mode Decision of Spatial Enhancement Layer using Interlayer Motion Vector Estimation in Scalable Video Coding)

  • 이범식;김문철;함상진;이근식;박창섭
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2007년도 동계학술대회
    • /
    • pp.13-17
    • /
    • 2007
  • 스케일러블 비디오 코딩(SVC, Scalable Video Coding)은 MPEG(Moving Picture Expert Group)과 VCEG (Video Coding Expert Group)의 JVT(Joint VIdeo Team)에 의해 현재 표준화 되고 있는 새로운 압축 표준 기술이며 시간, 공간 및 화질의 스케일러빌리티를 지원하기 위해 계층 구조를 가지고 있다. 공간적 스케일러빌리티를 위해 기본 계층으로부터 텍스처, 움직임 그리고 잔차신호 정보를 예측하여 사용한다. 그러나 고효율의 압축효과를 얻기 위해 기존의 방식에서는 기본계층에서 얻은 세가지 정보이외에 현재 향상 계층에서 자체적으로 얻은 부호화 정보를 비교하여 최소의 RD(Rate Distortion) 비용을 가지는 정보를 이용하여 부호화 하도록 되어 있다. 하지만 이러한 방식은 향상 계층에서 인터 모드 결정 시 $16\times16,\;16\times8,\;8\times16,\;8\times8,\;4\times4,\;4\times8,\;4\times4$ 블록 모드에 대한 움직임 벡터 예측 및 보상 과정을 거쳐야 하기 때문에 향상 계층에서의 부호화 복잡도는 기본 계층에 비해 상당히 증가하게 된다. 본 논문에서는 기본계층에서 예측한 움직임 벡터 정보를 이용하여 항상 계층에서 모드 결정을 고속화하는 방법에 대해 소개한다. 제안된 방법은 기본 계층에서 예측한 블록모드 중에서 큰 블록인 $16\times16$ 블록에서 움직임 벡터가 (0, 0) 일 경우에 대하여 향상 계층에서는 $16\times16$매크로 블록에 대해서만 움직임 예측 및 보상을 수행함으로써 향상 계층에서 움직임 모드 결정을 조기에 완료하게 된다. 이것은 하위 공간 계층에서 예측한 움직임 벡터 정보가 아주 작을 때는 큰 블록 크기로 모드로 결정되는 일반적인 원리를 이용한 것이고 이 제안 방법을 이용하였을 경우 향상계층에의 모드 결정과정을 고속화함으로써 전체 스케일러빌 비디오 부호하기의 연산량 및 복잡도를 최대 70%까지 감소 시켰다. 그러나 연산량 감소에 따른 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.

  • PDF

보행 방향 및 상태 분석을 위한 병렬 가우스 과정 (Parallel Gaussian Processes for Gait and Phase Analysis)

  • 신봉기
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.748-754
    • /
    • 2015
  • 본 연구에서는 다중 상태 변수의 인수 HMM을 일반화하여 연속 은닉 변수와 이산 은닉 변수가 결합된 순차 상태 추정 모형을 제안하고 이에 기반한 보행 동작 모형을 설계한다. 유한 상태의 이산변수는 마르코프 연쇄 구조로 보행의 동역학적 특성을 표현하고 각 이산 상태에 대해 연속 변수를 독립변수로 한 가우스 과정을 정의한다. 마르코프 상태 천이는 여러 가우스 과정 사이의 스위칭을 제어하며 각 가우스 과정은 동일한 자세의 회전 또는 다양한 시각을 표현한다. 온라인 필터링 추론을 위해 입자 필터 방식의 추론 알고리듬도 제시한다. 이 알고리듬은 입력 벡터 열이 주어졌을 때 이들 병렬적 가우스 과정을 동적으로 갈아타는 스위칭 궤적을 디코딩 해준다. 실험 결과 비선형적 보행자 비디오 영상을 보행방향과 보행 상태의 열로 분리하며 매우 직관적인 해석을 할 수 있음을 보였다.

ASM-LK Optical Flow 기반 최적 얼굴정서 특징분석 기법 (Optimal Facial Emotion Feature Analysis Method based on ASM-LK Optical Flow)

  • 고광은;박승민;박준형;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.512-517
    • /
    • 2011
  • 얼굴영상에서 나타나는 정서특징을 분석하기 위하여 본 논문에서는 Active Shape Model (ASM)과 Lucas-Kanade (LK) optical flow 기법을 기반으로 하는 특징검출 및 분석방법을 제안한다. Facial Action Coding System에 근거하여 묘사된 정서적 특징을 고려하여, 특징이 분포하는 영역에 위치한 다수의 landmark로 shape 모델을 구성하고 모델에서 각 Landmark를 중심으로 하는 움직임 벡터 윈도우 내부의 픽셀에 대한 LK 기법을 통해 optical flow 벡터를 추출한다. 추출된 움직임 벡터의 방향성 조합에 근거하여 얼굴정서특징을 shape 모델로 표현할 수 있으며, 베이지안 분류기라는 확률 기반 추론기법을 기반으로 정서적 상태에 대한 추정할 수 있다. 또한, 정서특징분석과정의 연산 효율성과 정확성 향상을 도모하기 위하여 common spatial pattern (CSP) 분석기법을 적용하여 정서상태 별로 상관성이 높은 특징만으로 구성된 최적정서특징을 추출한다.

KOSPI200 옵션의 내재변동성 추정 (An estimation of implied volatility for KOSPI200 option)

  • 최지은;이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.513-522
    • /
    • 2014
  • 옵션가격의 결정에 있어서 실제 변동성은 사후에 알 수 있는 정보이므로 대용값으로 내재변동성을 가장 많이 사용하는데 본 연구에서는 동일한 기초자산을 가진 옵션의 잔존만기와 행사가격을 이용하여 내재변동성을 추정하고자 한다. KOSPI200 옵션 데이터와 서포트벡터회귀, 나무모형 및 회귀모형을 통해 모형의 설명력을 평균제곱근오차 (RMSE)와 평균절대오차 (MAE)를 사용하여 살펴보았다. 그 결과 서포트벡터회귀와 MART의 성능이 최소제곱회귀보다 우수한 것으로 나타났으며, 서포트벡터회귀와 MART의 성능은 거의 비슷하였다.

입술 영역의 움직임과 밝기 변화를 이용한 음성구간 검출 알고리즘 개발 (Voice Activity Detection using Motion and Variation of Intensity in The Mouth Region)

  • 김기백;유제웅;조남익
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.519-528
    • /
    • 2012
  • 음성구간을 검출하는 일반적인 방법은 음향신호로부터 특징값을 추출하여 판별식을 거치는 것이다. 그러나 잡음이 많은 환경에서 그 성능은 당연히 저하되며, 이 경우 영상신호를 이용하거나 영상과 음성을 동시에 사용함으로써 성능향상을 도모할 수 있다. 영상신호를 이용하여 음성구간을 검출하는 기존 방법들에서는 액티브 어피어런스 모델, 옵티컬 플로우, 밝기 변화 등 주로 하나의 특징값을 이용하고 있다. 그러나 음성구간의 참값은 음향신호에 의해 결정되므로 한 가지의 영상정보만으로는 음성구간을 검출하는데 한계를 보이고 있다. 본 논문에서는 입술 영역의 옵티컬 플로우와 밝기 변화 두 가지 영상정보로부터 특징값을 추출하고, 추출된 특징값들을 결합하여 음성구간을 검출하는 알고리즘을 제안하고자 한다. 또한, 음성구간 검출 알고리즘이 다른 시스템의 전처리로 활용되는 경우에 적은 계산량만으로 수행되는 것이 바람직하므로, 통계적 모델링에 의한 방법보다는 추출된 특징값으로부터 간단한 대수적 연산만으로 스코어를 산정하여 문턱값과 비교하는 방법을 제안하고자 한다. 입술 영역 검출을 위해서는 얼굴에서 가장 두드러진 특징점을 갖는 눈을 먼저 검출한 후, 얼굴의 구조와 밝기값을 이용하는 알고리즘을 제안하였다. 실험 결과 본 논문에서 제안하는 두 가지 특징값을 결합한 음성구간 검출 알고리즘이 하나의 특징값만을 이용했을 때보다 우수한 성능을 보임을 확인할 수 있다.