• 제목/요약/키워드: 움직임분석

검색결과 768건 처리시간 0.029초

HEVC의 분할 영역에서 효율적인 움직임 정보 표현 (Efficient Motion Information Representation in Splitting Region of HEVC)

  • 이동식;김영모
    • 한국멀티미디어학회논문지
    • /
    • 제15권4호
    • /
    • pp.485-491
    • /
    • 2012
  • 본 논문은 움직임 벡터와 함께 Coding Unit (CU)의 분할 정보를 표현하기 위해 쿼드트리 기반의 Coding Unit Tree (CUT)를 제안한다. 새로운 동영상 국제 표준안인 High Efficiency Video Coding (HEVC)는 높은 압축 효율을 위해 다양한 새로운 기술들을 채택하였다. 그리고 CU, prediction Unit (PU), 와 Transform Unit (TU)라는 분할 개념을 도입하였다. 그중 기본 부호화 단위인 CU는 H.264/AVC의 매크로 블록보다 다양한 크기를 제공하며 계층적인 구조를 가지고 있으며 쿼드트리 기반의 영상을 분할하고 처리한다. 이러한 구조는 유연성과 최적화를 이룰 수 있는 기반을 제공하고 있으나, 분할 정보에 대한 오버헤더가 발생한다. 복잡한 움직임 정보가 발생하면, 해당하는 정보를 전송하기 위해 다양한 신호가 발생한다. 본 논문에서는 이러한 다양한 신호들을 분석하고, 중복되는 정보를 제거하기 위한 알고리즘을 제안한다. 제안하는 알고리즘 은 기본 블록인 $2{\times}2$ 블록을 기준으로 계층적인 구조를 제안한다. 제안하는 알고리즘은 쿼드트리 기반의 타입 코드로 영상을 구조를 나타내고, 대표 값과 잔여 값으로 각 노드의 값을 표현한다. 결과에서 제안하는 알고리즘이 HM1.0보다 13.6% 압축 향상을 보여준다.

GRNN 알고리즘을 이용한 비선형적 움직임 벡터 추정 및 프레임 보간연구 (A Study on Frame Interpolation and Nonlinear Moving Vector Estimation Using GRNN)

  • 이승주;방민석;윤기방;김기두
    • 전기전자학회논문지
    • /
    • 제17권4호
    • /
    • pp.459-468
    • /
    • 2013
  • 본 논문에서는 비선형적 움직임에 대하여 시각적 화질 향상에 목적을 둔 프레임 보간 기법을 제안한다. 그러므로 블록 현상과 영상의 중첩을 감소시키고자 블록 크기를 128x128부터 1x1까지 순차적으로 전역탐색을 실시하여 최소 오차값이 가장 작은 블록이 포함된 프레임을 선택하고, 비선형적인 움직임 벡터를 GRNN(General Regression Neural Network) 알고리즘을 이용하여 재 추정함으로써 프레임을 보간하는 알고리즘을 제안한다. 이러한 알고리즘의 성능 분석을 위해 프레임 반복, 단방향 움직임 보상, 양방향 움직임 보상의 기법들과 비교한다. 객체의 움직임이 크거나 카메라 초점의 이동과 줌인(zoom-in), 줌아웃(zoom-out) 효과가 들어간 대상 영상에 대하여 주관적 화질면에서 성능이 향상됨을 보인다.

다수 사람 추적상태에 따른 감시영상 요약 시스템 (Surveillance Video Summarization System based on Multi-person Tracking Status)

  • 유주희;이경미
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.61-68
    • /
    • 2016
  • 현대사회는 보안과 안전이 중요해지면서 감시카메라들이 여러 곳에 설치되어 있다. 하지만 감시영상을 보고 상황을 파악하는 것은 여전히 사람의 몫으로 인력과 시간이 소모된다. 그래서 자동으로 감시영상을 분석하여 주요 사건 중심으로 요약해 주는 연구의 필요성이 커지고 있다. 본 논문에서는 감시영상에서 존재하는 다수의 사람을 추적하고, 추적을 통해 얻은 정보를 이용하여 감시영상을 요약하는 방법을 제안한다. 제안하는 감시영상 요약 시스템은 조명보정을 적용하여 배경제거한 후 다수의 사람을 추출하고, 추출된 사람의 추적 정보를 상태 데이터베이스에 저장한다. 추적을 통해 얻은 정보로 추적 대상들의 추적 경로, 움직임 상태, 지체시간, 카메라 안으로의 출입시간 등을 사용한다. 또 사람의 움직임에 따라 6 가지(Enter, Stay, Slow, Normal, Fast and Exit)로 움직임 상태를 분류하였고, 움직임 상태를 시간별, 공간별로 요약 그래프로 나타내 추적대상의 움직임 상태를 빠르게 파악할 수 있다.

스테레오 영상과 준원근 카메라 모델을 이용한 객체의 3차원 형태 및 움직임 복원 (3D Object's shape and motion recovery using stereo image and Paraperspective Camera Model)

  • 김상훈
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.135-142
    • /
    • 2003
  • 본 논문은 영상내 객체정보의 정확한 복원을 위하여, 연속된 2차원 영상으로부터 특정 객체의 특징점을 추출하고, 특징점의 위치 데이터들로부터 원형의 3차원 모양 및 모션 정보를 복원하는 알고리즘과 결과를 제시하였다. 2차원 영상의 특징점 검출을 위해서는 물체와 배경이 명확히 구별되는 실험영상 환경에서 색상변환을 통한 자동 추출 방법을 사용하였다. 추출된 2차원 객체의 특징점들로부터 3차원 모앙, 움직임 정보를 복원하기 위하여 스테레오 카메라와 준원근 카메라 모델을 적용하고 SVD(SinEuiar Value Decomposition)에 의한 인수분해연산을 수행하였다. 준원근 카메라 모델의 근본적인 문제인 깊이정보의 복원 에러가, 스테리오 영상 분석에 의해 최소화 되었다. 본 논문에서 제시된 방법들의 성능을 객관적으로 평가하기 위하여 크기와 위치가 알려진 3차원 물체에 대해 실험을 행하였으며, 영상의 21개 특징점 위치와 공간상에서의 3개 방향으로의 움직임 각도를 연산에 의해 복원한 후 원형의 데이터와 비교하여 본 알고리즘의 정확성을 증명하였다.

H.264/AVC 디코더의 움직임 보상을 위한 메모리 접근 감소 기법 (Memory Access Reduction Scheme for H.264/AVC Decoder Motion Compensation)

  • 박경오;홍유표
    • 한국통신학회논문지
    • /
    • 제34권4C호
    • /
    • pp.349-354
    • /
    • 2009
  • H.264/AVC 디코더의 하드웨어 구현 시 실시간 동작을 위한 가장 큰 장애 요소 중 하나인 외부 메모리 엑세스량을 크게 줄인 움직임 보상 기법을 제안한다. H.264/AVC 디코더의 움직임 보상용 참조 영상은 큰 용량 때문에 대게 외부 메모리에 보관되며, 참조 영역은 수시로 디코더 코어 내부로 읽혀지게 되는데, 단순히 참조 영역 단위별 순차적 메모리 접근을 할 경우 그 데이터 엑세스 량은 디코더의 실시간 동작이 불가능할 정도로 막대할 수가 있다. 본 논문에서는 참조 영역을 매크로블럭 단위로 분석하여 가급적 적은 메모리 엑세스로 필요한 참조 영역을 읽어 들이는 방식을 제안하고 있으며, 실험 결과 제안된 움직임 보상 기법은 단순한 순차적 참조 블록별 데이터 접근 방식 대비 외부 메모리 사용 대역폭을 약 30% 감소시킴을 확인할 수 있었다.

실시간 비디오 압축의 움직임 추정을 위한 새로운 이진 블록 정합 알고리즘에 관한 연구 (A Study on the New Binary Block Matching Algorithm for Motion Estimation of Real time Video Coding)

  • 이완범;김환용
    • 융합신호처리학회논문지
    • /
    • 제5권2호
    • /
    • pp.126-131
    • /
    • 2004
  • 전역 탐색 알고리즘은 탐색영역이 증가하는 경우 연산량이 급증하게 되어 처리 시간이 길어지고 하드웨어 복잡도가 증가한다. 고속 탐색 알고리즘 및 기존의 이진 연산 알고리즘은 연산량 및 처리시간을 대폭 줄일 수 있지만 전역 탐색 알고리즘에 비하여 성능이 떨어지는 단점이 있다. 따라서 본 논문에서는 하드웨어 구현이 용이하고 움직임 추정을 고속으로 수행 할 수 있는 새로운 BCBM(Bit Converted Boolean Matching)알고리즘을 제안한다. BCBM 알고리즘은 움직임 추정 시 필요한 연산을 이진 연산으로만 수행하면서 전역 탐색에 근접한 성능을 나타낸다. 움직임 추정 성능은 CIF 포맷의 영상 100프레임을 이용하여 분석하였다. BCBM 알고리즘의 PSNR 성능은 전역 탐색 알고리즘보다 약 0.08㏈ 떨어지지만, 고속 탐색 알고리즘 및 기존의 이진 연산 알고리즘 보다 0.96∼2.02㏈ 정도 우수함을 실험을 통해 확인하였다.

  • PDF

숙련도 차이에 따른 문자 입력 작업 행태 분석 (Analysis of text entry task pattern according to the degree of skillfulness)

  • 김정환;이석재;명노해
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.1-6
    • /
    • 2007
  • 최근 다양한 기기와 환경에서 문자 입력에 대한 요구가 높아지고 있다. 이에 따라 효율적인 문자 입력 인터페이스 설계를 위해 문자 입력 인터페이스의 평가가 필요한 실정이다. 기존 연구를 살펴보면 문자 입력 시간을 시각 탐색 시간과 손가락 이동 시간으로 나누고 정보처리 이론인 Hick-Hyman Law와 Fitts’ Law를 통해 예측, 평가 하였다. 하지만 위 두 과정은 연속적(serial)인 과정으로 눈과 손의 coordination(협응)에 대해 관과 하는 한계가 있다. 또한, 기존 문자 입력 시간 예측 모델은 전문가라는 특정 숙련도를 가정하고 만들어졌기 때문에 실제 문자 입력 시간에 비해 과대 측정되어 왔다. 이에 본 연구는 문자 입력 시간 예측 모델에 눈-손 coordination 매개변수를 삽입하고자 눈-손 coordination의 시간을 측정하고 행태를 분석하였다. 또한, 비숙련자와 숙련자의 구분을 통해 시각 탐색 시간과 손 움직임 시간 그리고 눈-손 coordination의 시간 과 행태가 어떻게 변화하는 지 분석하였다. 그 결과 눈-손 coordination 시간은 문자 입력 시간과 밀접한 관계가 있었다, 그리고, 눈-손 coordination 시간은 숙련도에 상관없이 문자 입력 시간의 22%를 차지하였다. 또한, 숙련자와 비숙련자의 문자 입력 시간과 비교해 손과 coordination 시간 비율은 차이가 없었다. 하지만, 눈의 움직임 시간 비율은 큰 차이를 나타내었다. 이 결과는 눈-손 coordination과 숙련도 차이를 기존 문자 입력 예측 모델에 매개변수로써 적용하기 위한 기초 자료가 될 것이다.

  • PDF

영상 구성 파라미터 추출을 위한 융합 분석 알고리듬 연구 (Convergence Analysis Algorithm Study for Extracting Image Configuration Parameters)

  • 맹채정;하동환
    • 한국과학예술포럼
    • /
    • 제37권3호
    • /
    • pp.125-134
    • /
    • 2019
  • 본 연구는 영상콘텐츠 제작과정에서 배경음악 선정의 자동화를 위하여 영상의 특성을 분류, 분석할 수 있는 프로그램을 구성하였다. 연구 결과 및 내용은 다음과 같다. 영상의 특성은 '주제 범주', '감정', '픽셀 움직임 속도', '색상', '등장인물' 로 선정하며, '주제 범주'와 '감정'은 Microsoft사의 Azure Video Indexer를, '픽셀 움직임 속도'는 Optical flow, '색상'은 Image Histogram, '등장인물'은 CNN (Convolutional Neural Network)을 활용하여 데이터를 추출하였다. 이러한 본 연구의 결과는 최근 주목을 받고있는 '인터넷 1인 방송 크리에이터'들의 콘텐츠 제작과정에서 배경음악 매칭을 위한 영상 특성 분석이 이루어졌다는 점에서 의의가 있다.

HoG 특징 기반 사람 탐지와 멀티레벨 매칭 추적을 이용한 보행자 통행량 측정 알고리즘 (Pedestrian Traffic Counting Using HoG Feature-Based Person Detection and Multi-Level Match Tracking)

  • 강성욱;정진동;서홍일;이해연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권8호
    • /
    • pp.385-392
    • /
    • 2016
  • 현대 사회에서 상업적 성공을 위해서는 상권 분석이 필요하며, 상권 분석의 요소 중에서 핵심적인 부분은 통행량이다. 통행량을 측정하기 위해서 사람이 직접 측정하는 방법이 많이 사용되고 있으나 높은 인건비와 측정 실수를 유발할 가능성이 높다. 본 논문에서는 웹캠을 통해 촬영한 이미지를 이용하여 보행자의 통행량을 측정할 수 있는 알고리즘을 제안한다. 제안하는 알고리즘은 사람 영역 탐지와 움직임 추적으로 구성되어 있다. 사람 영역 탐지에서는 움직임 영역을 추출하고 HoG 특징과 Adaboost 분류기를 이용하여 사람 영역을 탐지한다. 움직임 추적에는 멀티 레벨 매칭과 거짓 양성 제거를 이용하여 추적 및 통행량을 측정한다. 멀티 레벨 매칭은 HoG 영역에 대해 유사도 계수를 구하여 판별하는 과정, 칼만 필터를 이용하여 추정한 위치의 이미지 유사도를 계산 과정, 사람 영역 탐지에서 추출한 움직임 영역을 이용해 유사도를 계산하는 3단계 과정으로 구성되어 있다. 거짓 양성 제거는 사람 영역 탐지에서 잘못된 탐지 영역을 제거한다. 제안한 알고리즘의 성능을 분석하기 위하여 기존의 사람 영역 탐지 및 추적하는 방법과 비교 실험을 수행하였다. 그 결과 제안하는 방법은 사람 통행량 측정에서 83.6% 정확도를 보였으며, 기존 알고리즘에 비하여 11% 높은 성능을 달성하였다.

프로젝션 매핑 콘텐츠의 카메라 움직임 유형에 관한 연구 (A Study on the Types of Camera Working of Projection Mapping Contents)

  • 송민지;박진완
    • 한국콘텐츠학회논문지
    • /
    • 제14권8호
    • /
    • pp.1-12
    • /
    • 2014
  • 프로젝션 매핑 기법은 현재 거의 모든 장르의 공연예술에서 다각적으로 활용되고 있으며, 이에 따라 다양한 분야의 예술가들이 이를 활용한 콘텐츠 제작에 참여하고 있는 상황이다. 프로젝션 매핑 콘텐츠의 다양화는 제작자들로 하여금 더욱 참신한 시각 효과에 대한 시도를 하는 계기가 되었고, 이는 곧 기존에는 프로젝션 매핑 콘텐츠 제작에서 사용되지 않았던 카메라 움직임을 활용한 시점의 변화로 이어졌다. 프로젝션 매핑 영상에 있어서 카메라 움직임의 활용은 시각적 촉각성을 극대화시켜 관객이 콘텐츠에 더욱 몰입할 수 있도록 도와주는 것으로 분석된다. 본 논문에서는 이러한 프로젝션 매핑의 새로운 시각적 표현법인 '카메라 움직임'에 대한 이론적 고찰과 이를 적용한 프로젝션 매핑 작품 사례 분석을 진행하였다. 이를 통해 영화적 영상 문법으로만 적용되었던 카메라 움직임을 프로젝션 매핑 환경에 적합하게 재구성하고 최적의 시각 효과를 창출하기 위한 가이드라인을 제시하고자 한다.