• 제목/요약/키워드: 움직임 표현 코드

검색결과 7건 처리시간 0.025초

신경 회로망 벡터 양자화를 이용한 움직임 탐색 영역의 예측 (Motion Search Region Prediction using Neural Network Vector Quantization)

  • 유대현;김재창
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.161-169
    • /
    • 1996
  • 본 논문에서는 동영상 압축의 핵심 기술인 움직임 벡터 추정에 있어서 신경 회로망을 이용한 벡터 양자화에 의해 탐색 영역을 예측하는 방법을 제안한다. 훈련영상을 입력으로 하여 전역 탐색법 등에 의하여 구해진 움직임 벡터를 이용하여 움직임 벡터 코드 북을 생성하고 이를 예측 탐색 점으로 이용한다. 움직임 벡터 코드 북을 생성하기 위해서 병렬 처리 특성과 다양한 학습 알고리즘을 갖는 신경 회로망을 이용하였다. 제안된 방법은 움직임 벡터들의 높은 공간적 상관성을 이용하게 되고 결과적으로 적은 탐색 점으로 움직임 벡터를 추정할 수 있으므로 계산량을 줄일 수 있을 뿐 아니라 움직임 벡터를 표현하기 위해 소요되는 비트 수도 크게 줄일 수 있다. 모의 실험을 통하여 제안된 방식이 기존의 고속 블록 매칭 알고리즘보다 우수함을 보였다.

  • PDF

애니메이션 창세기 첫 페이지의 오류, 그 기원과 수정 (Desperately Seeking an Icon (with 8 Legs):)

  • 나호원
    • 만화애니메이션 연구
    • /
    • 통권45호
    • /
    • pp.417-434
    • /
    • 2016
  • 알타미라 동굴의 다리 여덟 달린 멧돼지 벽화는 움직임을 표현하고자 하는 인류의 오랜 욕망을 보여주는 예로 제시되곤 한다. 그러나 여덟 개의 다리는 서로 다른 시기에 그려진, 이른바 더블 레이어의 결과물이다. 그럼에도 불구하고 알타미라 동굴벽화를 애니메이션의 시원과 결부시키는 설명은 별다른 의문이나 검증, 출처의 인용 등이 없이 꾸준히 재생산되고 있다. 여러 개의 다리를 움직임과 연결시키는 것은 시대를 초월한 시지각과는 무관하다. 그것은 특정한 시기에 발명된 움직임 표현 코드로 보아야 한다. 여기에는 19세기 후반에 시도된 연속촬영술, 그 중에서도 에티엔 쥘 마레의 시간사진술이 결정적인 역할을 한다. 일련의 연속적인 움직임들을 하나의 프레임 속에 겹쳐서 인화한 마레의 사진술은 20세기 초에 뒤샹과 발라를 비롯한 아티스트들의 회화 작업에 반영되면서 움직임 표현 코드로 형성되었다. 그 무렵부터 등장하기 시작한 애니메이션 매뉴얼들도 움직임을 분석하고 구현하기 위한 방법으로 마레의 시간사진술 이미지를 도입하였다. 결국 다리 여덟 개의 알타미라 동굴벽화를 움직임의 표현이라고 이해하는 것은 오늘날의 시각 코드를 통해 과거를 바라보고자 하는 오류이다.

HEVC의 분할 영역에서 효율적인 움직임 정보 표현 (Efficient Motion Information Representation in Splitting Region of HEVC)

  • 이동식;김영모
    • 한국멀티미디어학회논문지
    • /
    • 제15권4호
    • /
    • pp.485-491
    • /
    • 2012
  • 본 논문은 움직임 벡터와 함께 Coding Unit (CU)의 분할 정보를 표현하기 위해 쿼드트리 기반의 Coding Unit Tree (CUT)를 제안한다. 새로운 동영상 국제 표준안인 High Efficiency Video Coding (HEVC)는 높은 압축 효율을 위해 다양한 새로운 기술들을 채택하였다. 그리고 CU, prediction Unit (PU), 와 Transform Unit (TU)라는 분할 개념을 도입하였다. 그중 기본 부호화 단위인 CU는 H.264/AVC의 매크로 블록보다 다양한 크기를 제공하며 계층적인 구조를 가지고 있으며 쿼드트리 기반의 영상을 분할하고 처리한다. 이러한 구조는 유연성과 최적화를 이룰 수 있는 기반을 제공하고 있으나, 분할 정보에 대한 오버헤더가 발생한다. 복잡한 움직임 정보가 발생하면, 해당하는 정보를 전송하기 위해 다양한 신호가 발생한다. 본 논문에서는 이러한 다양한 신호들을 분석하고, 중복되는 정보를 제거하기 위한 알고리즘을 제안한다. 제안하는 알고리즘 은 기본 블록인 $2{\times}2$ 블록을 기준으로 계층적인 구조를 제안한다. 제안하는 알고리즘은 쿼드트리 기반의 타입 코드로 영상을 구조를 나타내고, 대표 값과 잔여 값으로 각 노드의 값을 표현한다. 결과에서 제안하는 알고리즘이 HM1.0보다 13.6% 압축 향상을 보여준다.

H.264/AVC에서 효율적인 움직임 벡터와 모드 정보의 압축 (Efficient Coding of Motion Vector and Mode Information for H.264/AVC)

  • 이동식;김영모
    • 한국멀티미디어학회논문지
    • /
    • 제11권10호
    • /
    • pp.1359-1365
    • /
    • 2008
  • H.264에서 채택하고 있는 기술들로 인해 H.264의 헤더는 이전 표준안들에 비해 전체 비트 열에서 더 많은 비율을 차지하기 때문에, H.264의 헤더를 압축하기 위한 새로운 기술이 필요하다. H.264에서는 구문요소를 일원화하여 부호화하는데, 부호화할 요소들의 발생 분포를 고려하지 않고 기존의 Exp-Golomb방식을 이용하기 때문에 가변 길이 부호화 관점에서 매우 비효율적이다. 헤더의 대부분을 매크로 블록 타입과 움직임 벡터 차이간이 차지하고 있으며, 본 논문에서 분석한 H.264의 헤더에서의 중복은 다음과 같은 세 가지이다. 매크로 블록 타입에서 자주 발생하는 부호와 그렇지 않는 부호가 있으며, 매크로 블록 모드가 8일 때, 네 개의 서브 매크로 블록 타입들이 모두 전송된다. 그리고 마지막으로 움직임 벡터 차이 값에서 같은 값(특히 '0')들이 발생한다. 본 논문에서는 타입 코드와 쿼드트리를 사용하는 알고리즘을 제안하고 있으며 헤더에서의 반복되는 정보를 이 두 가지 구조들을 가지고 표현한다. 타입 코드는 발생하는 매크로 블록의 모양을 나타내며, 쿼드트리는 움직임 추정 나무 구조를 나타낸다. 실험의 결과에서 제안하는 알고리즘이 JM12.4에 비해 최대 32.51% 비트율 감소를 보여준다.

  • PDF

컴패니언 로봇의 멀티 모달 대화 인터랙션에서의 감정 표현 디자인 연구 (Design of the emotion expression in multimodal conversation interaction of companion robot)

  • 이슬비;유승헌
    • 디자인융복합연구
    • /
    • 제16권6호
    • /
    • pp.137-152
    • /
    • 2017
  • 본 연구는 실버세대를 위한 컴패니언 로봇의 인터랙션 경험 디자인을 위해 사용자 태스크- 로봇 기능 적합도 매핑에 기반한 로봇 유형 분석과 멀티모달 대화 인터랙션에서의 로봇 감정표현 연구를 수행하였다. 노인의 니즈 분석을 위해 노인과 자원 봉사자를 대상으로 FGI, 에스노그래피를 진행하였으며 로봇 지원 기능과 엑추에이터 매칭을 통해 로봇 기능 조합 유형에 대한 분석을 하였다. 도출된 4가지 유형의 로봇 중 표정 기반 대화형 로봇 유형으로 프로토타이핑을 하였으며 에크만의 얼굴 움직임 부호화 시스템(Facial Action Coding System: FACS)을 기반으로 6가지 기본 감정에 대한 표정을 시각화하였다. 사용자 실험에서는 로봇이 전달하는 정보의 정서코드에 맞게 로봇의 표정이 변화할 때와 로봇이 인터랙션 사이클을 자발적으로 시작할 때 사용자의 인지와 정서에 미치는 영향을 이야기 회상 검사(Story Recall Test: STR)와 표정 감정 분석 소프트웨어 Emotion API로 검증하였다. 실험 결과, 정보의 정서코드에 맞는 로봇의 표정 변화 그룹이 회상 검사에서 상대적으로 높은 기억 회상률을 보였다. 한편 피험자의 표정 분석에서는 로봇의 감정 표현과 자발적인 인터랙션 시작이 피험자들에게 정서적으로 긍정적 영향을 주고 선호되는 것을 확인하였다.

하드웨어 구현에 적합한 HEVC 의 CU 단위 율 및 왜곡 예측 방법 (A Rate and Distortion Estimation Scheme for HEVC Hardware Implementation)

  • 이범식;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.15-17
    • /
    • 2014
  • 본 논문에서는 하드웨어의 제한된 자원을 이용하여 HEVC 코덱을 구현할 때 DCT 와 엔트로피 부호화를 사용하지 않고 율 및 왜곡값을 예측하여 고효율의 부호화를 수행하는 방법에 대하여 제안한다. HEVC 는 기존의 부호화기에 비하여 계층적 부호화 구조와 함께 큰 블록 크기를 갖는 DCT 와 엔트로피 부호화를 반복적으로 수행하기 때문에 하드웨어 구현 시 그 복잡도가 매우 크게 증가한다. 먼저 DCT 는 하다마드변환 행렬과 또 다른 정규 직교 변환 행렬의 곱으로 표현될 수 있는 성질을 이용하여 부호화 변환 시 생성된 하드마드변환 행렬에 저복잡도의 정규 직교 변환 행렬을 곱하여 DCT 변환 계수를 생성한 후 변환 및 양자화를 수행한다. 왜곡값의 경우, 이 때 생성된 양자화 계수와 변환 계수 간의 차이를 변환도메인에서 제곱합을 이용하여 계산하여 역변환을 생략함으로써 복잡도를 감소시킬 수 있다. 또한 텍스처에 대한 비트율 예측은 각 CU 블록내의 양자화 계수의 수를 더하여 계산하여 엔트로피를 수행하지 않고 예측할 수 있다. 그리고 비 텍스처에 대한 비트율 예측의 경우 움직임벡터의 비트에 대한 Pseudo CABAC 코드를 수행하여 예측할 수 있다. 이러한 저 복잡도의 텍스처 및 비텍스처 비트와 왜곡을 예측함으로써 하다마드변환만을 이용하여 부호화하였을 때에 비해 최대 33%의 비트율 감소를 얻을 수 있었다.

  • PDF

일월오봉도를 활용한 미디어아트 연구 (A Study on Media Art using Ilwolobongdo)

  • 박기덕;정진헌
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.103-108
    • /
    • 2023
  • 아날로그 자연사 표본정보 전달의 한계점을 디지털 형태의 정보로 전달하여 관람자에게 흥미와 재미를 부여하고 표본전시활용의 디지털 디오라마 활용방안에 대한 방향성을 제시한다. 이번전시는 일만원권 지폐 드라마, 신문기사등 각종 매체를 통해 대중에게 친숙한 그림인 일월오봉도를 직접 현실에서 실감할수 있도록 미디어아트로 재현하였다. 해, 달 다섯 개의 산봉우리, 한쌍의 폭포, 그리고 네그루의 소나무등이 좌우대칭으로 그려져 있는 조선시대 작품이다. 자연의 생동감으로 표현하기 위해 해와 달의 상징을 빛의효과등으로 연출하여 몰입도를 극대화하고 산봉우리 아래에는 파도의 출렁임, 두루미 움직임, 사슴, 모시나비, 잉어등 동물을 새로 삽입하고 행동을 부여하여 자연과 그 속에 뛰어노는 생물의 생동감을 연출하고 미디어아트 병풍을 스크린으로 제작하여 연출하였다. 또한 작품소개 및 작품속 생물 관련 정보는 QR 코드를 통해 제공하였다. 결론으로 관람자에게 기존 아날로그 표본 전시의 정보전달 단점을 2D, 3D디지털 형태의 표본 전시효과 및 관람자에게 일월오봉도의 왕권의 상징성을 미디어아트로 표현하고 자연사 콘텐츠와 결합하여 예술과 자연사의 만남을 연출하였다.