• 제목/요약/키워드: 비디오 화면

검색결과 307건 처리시간 0.029초

Phased-in 코드를 이용한 움직임 벡터 예측기의 효율적인 부호화 방법 (Efficient Coding of Motion Vector Predictor using Phased-in Code)

  • 문지희;최정아;호요성
    • 방송공학회논문지
    • /
    • 제15권3호
    • /
    • pp.426-433
    • /
    • 2010
  • H.264/AVC 비디오 압축 표준은 압축 효율을 높이기 위해 다양한 크기의 블록을 사용하여 화면 사이의 움직임 예측을 수행한다. H.264/AVC는 가변적인 블록 크기의 움직임 보상을 통해 세밀한 영역의 움직임까지 예측할 수 있어 잔여 영상을 나타내는 정보량을 효과적으로 줄일 수 있다. 복호를 위해서는 각 블록의 움직임 벡터를 전송해야 하는데, 저비트율 환경에서는 움직임 벡터 정보가 전체 비트스트림의 약 40%를 차지한다. 움직임 벡터 정보량을 줄이기 위해 비디오 부호화 전문가 그룹(VCEG)에서는 다양한 움직임 벡터 예측(Motion Vector Competition) 방법을 제안하였다. 다양한 예측 움직임 벡터를 사용하여 실제 전송해야 할 움직임 벡터 차분값(Motion Vector Difference, MVD)의 크기를 줄이기 때문에 압축 효율을 높일 수 있다. 그러나 다양한 예측 움직임 벡터를 사용하기 때문에 선택된 예측 움직임 벡터의 인덱스 정보를 복호기로 전송해야 한다. 이 논문에서는 인덱스 정보를 효율적으로 전송하기 위해 Phased-in 코드를 기반으로 한 새로운 코드워드 표를 제안했다. 실험을 통해 제안한 방법을 이용하여 동일한 화질에서 평균 약 7.24%의 비트율을 절감할 수 있었고, 동일한 비트율에서는 평균 약 0.36dB의 화질을 향상시킬 수 있었다.

HEVC 고속 부호화를 위한 효율적인 CU 분할 조기 결정 알고리즘 (An Early Termination Algorithm for Efficient CU Splitting in HEVC)

  • 칼리얀 고스와미;김병규;전동산;정순흥;석진욱;김연희;최진수
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.271-282
    • /
    • 2013
  • 최근 ITU-T/VCEG과 ISO/IEC MPEG은 공동으로 차세대 비디오 압축 표준 기술인 High efficient video coding (HEVC)를 제정하고 있다. HEVC는 H.264/AVC 표준 기술과 비교해 보면 매우 향상된 압축 효율을 보여 주고 있으며, 특히 Full HD 이상의 매우 큰 사이즈의 동영상 및 그에 따른 고화질 비디오 서비스를 주요 목표로 하고 있다. 그러나 품질과 압축 효율 향상을 위해 새로운 구조와 압축 도구들이 추가됨으로써 인코더의 연산 복잡도가 매우 증가되어 있으며, 이에 화질의 열화를 최소한으로 유지하면서 계산량을 감소시키는 연구가 필요해 지고 있는 상황이다. 본 연구에서는 화면 간 예측 시에 부호화 단위의 분할을 효율적으로 조기 종료하는 방법을 제안한다. 제안된 방법은 현재 코딩 단위 (Coding unit)의 움직임 벡터 정보, 율-왜곡 비용, 그리고 상위 코딩 단위에서의 개별 사이즈에 대한 평균 율-왜곡 비용값을 활용하여 분할을 조기에 중단한다. 실험 결과를 통하여 제안된 방법이 기존의 ECU 방법보다 약 10% 정도로 속도 향상이 있으며, HM 참조 소프트웨어와 비교 시 BD-rate 증가는 1.975% 정도로 매우 적게 나타남을 보인다.

질 들뢰즈의 감각론을 기반으로 한 뮤직비디오의 영상디자인 연구 - 크리스 커닝햄 작품을 중심으로 - (A Study on Music Video based on Logic of Sensation of Gilles Deleuze - Analysis of the work of Chris Cunningham -)

  • 고은영
    • 디자인학연구
    • /
    • 제19권4호
    • /
    • pp.121-132
    • /
    • 2006
  • 이성중심의 서향철학사 속에서 '감각'은 '이성'의 하위개념으로 폄하되어왔다. 그러나 21세기 현대의 시각 환경은 '이성' 중심의 인식론을 밀어내고, 그 자리에 '감성' '감각'으로 재구성되고 있다. 특히 대중영상물들은 이러한 변화를 가장 빠르게 반영하고 또 선도하는 분야라 할 수 있다. 그러나 불행하게도 대중영상물들에서 '감각'에 대한 예술적, 미학적 의미를 고민한 흔적을 찾아내기는 쉽지 않다. 이는 오랜 역사를 거쳐 '감각'을 '이성'의 하위개념으로 인식하여 '감각'은 표피적인 것, 진짜가 아닌 것으로만 치부되어 온 탓 때문일 것이다. 때문에 '감각'의 새로운 가치를 부여한 현대 철학가 질 들뢰즈의 감각론을 검토해 보고, 그 개념을 영상화하고 있는 크리스 커닝햄(Chris Cunningham)의 작품세계를 분석하는 것은 유의미한 일이다. 그가 제작한 에이펙스 트윈(Aphex Twin)의 뮤직비디오 3편을 분석한 결과 질 들뢰즈가 <감각의 논리>에서 제시하는 '기관 없는 신체' '히스테리' '디아그람'을 기반하고 있음을 확인할 수 있었다. 크리스 커닝햄을 포함해 최근에 발표된 '감각'을 주제로 한 영상작품들을 제작방법이나, 화면구성 등 표피적인 방법으로 분석하는 것은 작가의 예술 철학을 간과하는 오류를 범하게 된다. 새롭게 전개되고 있는 현대 감각론을 이해하고 그 실체에 대한 탐구와 영상작품들의 분석은 새로운 대안을 제시하는 밑거름이 될 것이다.

  • PDF

폭발장면 자동 검출을 위한 저급 수준 비디오 특징의 추상화 (Abstraction Mechanism of Low-Level Video Features for Automatic Retrieval of Explosion Scenes)

  • 이상혁;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.389-401
    • /
    • 2001
  • 본 논문에서는 MPEG형식의 영화 데이터를 대상으로 폭발 장면 자동 추출을 위한 저급 수준 비디오 내용정보의 추상화 방법을 제안하고, 실제 구현을 통하여 그 유용성을 보인다. 제안한 추상화 방법은 폭발시 발생하는 불꽃의 색이 노란색 톤을 가진다는 사실과, 불꽃이 나타나는 프레임은 같은 tit에 속하는 이웃한 프레임과는 화면 구성이 달라지게 되므로 움직임 에너지 값이 커지게 된다는 사실을 바탕으로 한다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프래임을 키 프레임으로 하다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프레임을 키 프레임으로 선택한 후 영역별 주 색깔(Dominant Color)를 추출한다. 이때 색 공간은 양자화를 통한 512색 중 노란색 톤을 가지는 48 색 범위로 정의한다. 이후 매 샷마다 첫 번째 프레임과 이웃한 프레임의 에지 이미지(Edge Image)를 추출하여 이들의 차이로써 움직임 에너지(Motion Energy)를 얻는다. 이 두 가지 정보, 즉 노란색 톤을 가지는 색 정보와, 같은 장면 내의 다른 샷의 움직임 에너지에 비해 큰 값의 움직임 에너지를 갖는 샷을 폭발장면이 포함된 장면으로 검출한다. 실험 결과에 의하면 검색 결과는 주어진 임계값에 의존적이나, Recall과 Precision에서 80% 이상의 검출률을 보이고 있다. 그러나 일반적인 폭발 장면은 찾기에는 노란색 불꽃을 보이지 않는 예외적인 경우가 발생하여 이를 추출하는데 어려움이 있었다. 앞으로 이러한 문제점등은 기존의 오디오 정보를 이용한 폭발 장면 검출 방법과 함께 이용함으로써 해결되어질 수 있을 것이다.

  • PDF

증강현실을 이용한 선택적 가이드 시스템 -관람자의 관심에 따라 박물관 관람을 안내 하는 가이드 시스템 (Augmented Reality based Museum Guidance System Selective Viewing)

  • 박준석;이동현;박준
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.45-48
    • /
    • 2008
  • 박물관이나 전시관에서 많은 관람객들은 전시물에 대한 멀티미디어 정보를 얻기를 원할 뿐만 아니라 특정한 스타일, 작가, 주제별로 관람하고 싶어 한다. 박물관이나 전시관에는 증강 현실을 이용한 선택적 가이드 시스템을 이용하여 글이나 그림, 다국어 음성, 비디오와 같은 전시물에 대한 정보를 관람객에게 제공하며 관람자들의 흥미에 따른 관람 경로를 관람자에게 제공 해준다. 다음 전시물까지 가는 경로의 정보는 증강현실을 이용하거나, 멀티미디어 정보를 이용해서 관람자들에게 제공한다. 이 시스템은 외관적으로는, UMPC(Ultra Mobile PC)와 카메라, 그리고 관성 센서로 구성되어 있다. 처음 이 시스템을 시작하면, 관람자는 자신의 흥미에 맞는 전시물을 메뉴를 선택한다. 그 후, 시스템은 선택된 전시물과 연관된 관람 경로를 설정하고 다음 전시물에 대한 방향과 거리 그리고 어디로 가는지, 어느 방향에 있는지, 얼마나 멀리 있는지 그리고 전시물에 대한 시각적 실마리의 정보가 주어진다. 해당 정보를 이용하여 다음 전시물을 찾고 화면에 표시된 시각적 실마리와 카메라에서 얻어지는 전시물의 영상을 일치시키면 전시물에 대한 정보를 멀티미디어 형태로 보여준다. 사용자들의 간단한 실험을 통해서 이 시스템은 큰 전시실에도 관람자로 하여금 유익하게 관람할 수 있다.

  • PDF

지능형 비디오 감시를 위한 능동적 객체 추적 시스템 (Active Object Tracking System for Intelligent Video Surveillance)

  • 박호식
    • 한국정보전자통신기술학회논문지
    • /
    • 제7권2호
    • /
    • pp.82-85
    • /
    • 2014
  • 지능형 영상 감시 시스템은 감시카메라의 영상정보를 디지털화 하여 시스템이 스스로 사물의 위치 및 패턴을 분석하고 위험 상황이 발생할 경우 경보 및 출입 차단 시스템을 작동하여 보안담당자에게 즉각 현황을 알려 사람의 관리로 인해 발생하는 취약점을 대체, 보완 할 수 있게 해준다. 그러나 원거리 화면에서에서 작은 객체를 확대하기 위해서는 객체 위치에 따른 정확한 확대 배율과 중심좌표 이동이 이루어져야 한다. 그래서 본 논문에서는 유동적 배경에서 객체 이동에 따른 Pan, Tilt 좌표와 확대 배율을 연산하여 객체가 근거리 혹은 원거리 어디에 있듯 일정한 크기의 객체를 추적할 수 있도록 하고자 하였다. 실험결과 카메라의 정확한 PTZ 제어를 위하여 무게 중심을 검출하여 제어한 결과, 거리에 따라 최소 94%~100%의 정확한 제어가 가능하여 객체의 주요 영역을 인식 및 추적할 수 있었다.

DOM update를 이용한 효율적인 멀티미디어 장면 구성 정보 변경 방안 (Effective Method to Change Multimedia Scene Configuration Information Using DOM Update)

  • 김규헌;박정욱;김병철
    • 방송공학회논문지
    • /
    • 제18권1호
    • /
    • pp.43-58
    • /
    • 2013
  • 리치미디어 서비스는 비디오, 오디오, 텍스트와 같은 다수의 멀티미디어 요소들을 동시에 소비할 수 있으며 시청자의 요구사항을 수용하여 개인화된 데이터에 대한 이용이 가능한 대화형 미디어 서비스를 뜻한다. MPEG(Moving Picture Expert Group)에서는 BIFS(Binary Format for Scenes)와 LASeR(Light Application Scene Representation)를 제정함으로써 리치미디어 서비스를 위한 방안을 제시하였다. 상기 두 표준은 다수의 미디어 콘텐츠간의 시간적, 공간적 배치에 대한 정보와 콘텐츠 간 상호작용을 기술한 장면 구성 정보를 이용함으로써 리치미디어 서비스를 가능하게 하였다. 그러나 기존의 리치미디어 서비스에서는 사용자 및 서비스에 의해서 장면 구성 정보가 변경될 때마다 매번 단말이 가진 기존의 장면 구성 정보를 삭제하고 새로운 장면 구성 정보를 생성 및 분석해야하는 비효율적인 방법으로 장면 전환이 이루어진다. 따라서 본 논문에서는 DOM(Document Object Model) update라는 웹문서 데이터 인터페이스 규격을 사용하여 보다 효율적이고 동적인 장면 구성 변경 방안을 제시하여 장면 전환의 시간적 단축 효과와 장면전환에 따른 화면의 정지 등의 불연속성을 제거하는 효과를 검증하였다.

다중의 특징 분석을 통한 비 유사 영역의 자동적인 검출 (Automatic Detection of Dissimilar Regions through Multiple Feature Analysis)

  • 장석우;정명희
    • 한국산학기술학회논문지
    • /
    • 제21권2호
    • /
    • pp.160-166
    • /
    • 2020
  • 모바일 기반의 하드웨어 기술이 발전함에 따라 많은 종류의 응용 프로그램들이 개발되고 있다. 그리고 이런 응용프로그램들의 인터페이스가 올바르게 동작하는지를 자동으로 검사하려는 수요가 증가하고 있다. 본 논문에서는 입력되는 여러 가지 유형의 영상으로부터 주요한 특징의 비교 분석을 통해서 응용 프로그램의 실행 오류 화면을 강인하게 검출하는 접근 방법을 제시한다. 본 논문에서 제시된 방법에서는 먼저 입력되는 영상으로부터 영상을 대표하는 주요한 다중의 특징을 추출한다. 그런 다음, 추출된 다중의 특징의 차이를 비교함으로써 입력된 영상이 목표 영상과 동일한 정상적인 영상인지, 아니면 목표 영상과 유사하지만 서로 다른 오류 영상인지를 효과적으로 판단한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 종류의 영상으로부터 주요한 다중의 특징 비교를 통해서 정상적인 영상과 오류가 발생한 영상을 정확하게 검출한다는 것을 보여준다. 본 논문에서 제안된 접근 방법은 비디오 색인, 객체 검출 및 추적, 영상 감시 등과 같은 컴퓨터 비전과 관련된 많은 실제 응용 분야에서 유용하게 사용될 것으로 기대된다.

움직임 벡터의 정보 숨김을 이용한 H.264/AVC의 향상된 오류 검출 방법 (Improved Error Detection Scheme Using Data Hiding in Motion Vector for H.264/AVC)

  • 고만근;서재원
    • 한국콘텐츠학회논문지
    • /
    • 제13권6호
    • /
    • pp.20-29
    • /
    • 2013
  • 제한된 통신 채널을 통한 실시간 전송을 위해 비디오 데이터의 압축이 필요하다. 압축된 영상 비트열은 전송 중에 발생되는 오류에 아주 민감하다. 전송 과정에서 오류가 발생된 패킷을 받게 되면, 복호기에서는 현재 입력되는 프레임을 잘못 재구성하게 되고 영상의 시공간적 특성에 의해 연속되는 프레임으로 전파된다. 이런 복호 영상의 화질 저하를 줄일 수 있는 방법으로 오류 검출과 오류 은닉이 있다. 이 논문에서는 오류 검출률을 높이기 위해 정보 숨김을 이용한 새로운 오류 검출 방법을 제안한다. H.264/AVC의 화면간 예측에서 발생하는 각 매크로블록의 움직임 벡터의 차분값에 특정한 정보를 숨겨 부호화하였다. 복호기에서는 전송받은 특정 정보의 체크를 통해 오류의 위치를 쉽게 찾아낼 수 있도록 하였다. H.324M 모바일 실험 도구를 이용한 실험 환경을 통해 제안한 알고리즘이 PSNR과 주관적 화질 측면에서 좋은 성능을 보임을 확인하였다.

이기종망 환경에서의 지상파 UHD 방송을 위한 MMT 기반 서비스 시그널링 구조 설계 (Design of Service Signaling Structure based on MMT for Terrestrial UHD Broadcasting Systems in Heterogeneous Network)

  • 서민재;백종호
    • 한국위성정보통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.54-59
    • /
    • 2015
  • UHD(Ultra High Definition) 방송은 초고선명 비디오와 다채널 오디오 재현으로 최근 관심이 높아지고 있다. 그런데 UHD 방송 서비스를 제공하기 위해서는 지상파 현재 방송 시스템으로는 대역폭, 인코딩 등 해결해야할 기술적인 어려움이 있다. 이러한 문제를 해결하기 위한 방안 중 하나로 MMT(MPEG Media Transport)가 제안되었다. MMT는 UHD와 같은 초고화질의 대용량 멀티미디어를 방송할 수 있는 표준으로, IP를 기반으로 구성되어 있기 때문에 다른 종류의 여러 망을 동시에 사용하여 전달할 수 있다는 특징이 있다. MMT를 기반으로 미디어 데이터를 계층적으로 분리하여 이기종망을 통해 전송하면 현재 방송 시스템으로도 UHD 미디어 서비스가 가능하다. 그러나 MMT를 이용하여 계층화된 UHD 미디어 데이터가 서비스되기 위해서는 이기종망을 통해 들어오는 데이터들이 시그널링을 통해 관리되어야 하고, 수신기가 계층구조에 대한 정보를 빨리 전달받을 수 있어야 빠른 화면 구성 및 제공이 가능하기 때문에 이를 위한 정보가 시그널링 내에 존재해야 한다. 따라서 본 논문에서는 현재 MMT 내에 정의되지 않은 이기종망에 대한 정보를 적절하게 제공하는 시그널링 테이블 구조 설계를 제안한다.