• 제목/요약/키워드: 비디오 인코딩

검색결과 122건 처리시간 0.026초

무선 네트워크 환경에서의 MPEG-4 비디오 전송을 위한 에러 은닉 기법 (An Error Concealment Technique for MPEG-4 Video Transmission over Wireless Networks)

  • 박정범;어진우
    • 전기전자학회논문지
    • /
    • 제9권2호
    • /
    • pp.170-178
    • /
    • 2005
  • 비디오 통신에서의 에러 제어와 은닉 문제는 무선 네트워크들과 인터넷 같은 불안정한 채널 상에서의 비디오 전달에 관심이 증가되면서 관심이 증대되고 있다. 훼손된 데이터들을 복구하기 위하여 공간적 또는 시간적, 두 가지의 에러 은닉 방법이 개발되고 있다. 또한 모바일 비디오 데이터 전송 환경에서 공간적 에러 은닉 알고리즘의 사용으로 인한 계산상의 오버헤드는 심각한 오버헤드로 나타난다. 본 논문에서는 에러 증식이 빈번한 무선 네트워크상의 비디오 스트리밍 시스템에서 모바일 단말 수신단의 저하된 MPEG-4 비디오의 퀄리티를 복구하는 하이브리드 에러 은닉 기법을 제안하였다. 제안된 방법은 MPEG-4 디코더 단에 위치한다. 또한 제안된 방법은 임베디드 멀티미디어 모바일 단말의 높은 성능을 제공하기 위해서 인텔의 무선 MMX 기술을 이용하였고, IP 채널 상에서의 PDA와 같은 모바일 스트리밍 시스템에, 제안한 알고리즘을 채용하여 그 성능을 확인하였다. 제안된 방법은 기존의 전통적인 에러 은닉 알고리즘과의 성능 비교를 통해 낮은 복잡성의 요구와 작은 범위의 검색을 이용하여 인코딩단의 어떠한 변형 없이 비디오 플레이어에 대해 보다 빠른 처리능력과 뛰어난 비디오 품질을 제공하였다.

  • PDF

인터넷상의 비디오 데이타 전송에 효과적인 오류 은닉 기법 (An Effective Error-Concealment Approach for Video Data Transmission over Internet)

  • 김진옥
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권6호
    • /
    • pp.736-745
    • /
    • 2002
  • 압축한 비디오 데이타를 전송할 때 인터넷과 같이 네트워크 채널이 불안정한 경우 패킷이 분실될 가능성이 높다. 패킷 분실은 연속적 비트 열에 오류가 발생하는 버스트 오류 형태로 일어난다. 본 논문에서는 버스트 오류를 은닉 처리하는데 효과적인 오류 내성 기법을 적용하는 동시에 데이타 숨김을 이용하여 디코더의 계산 복잡도를 줄인 빠른 오류 은닉 방법을 제안한다. 오류 은닉 효과를 높이기 위해, 인코더에서는 네트워크 채널의 버스트 오류에 강건하도록 비디오 데이타에 공간적, 시간적 영역에 대한 오류 내성 기법을 적용한다. 공간적 오류 내성 기법으로는 패킷 분실이 발생한 오류 블록을 분리하는데 효과적인 블록 셔플링을 적용하고 시간적 오류 내성 기법으로는 움직임 벡터의 프레임간 패리티 비트를 데이터 숨김 방법으로 내용 데이타에 삽입, 전송하여 디코더에서 분실된 패킷을 처리한다. 비디오 데이타는 전송 후 디코더에서 오류 은닉 처리하는데 디코더에서 주변 정보를 이용하여 오류 비디오 블록을 보간하는 것은 계산이 복잡하여 비용이 많이 든다. 따라서 본 연구에서는 비디오 인코딩 단계에서 비디오 블록의 에지 특징을 추출 후 이 특징 데이타를 원 데이타에 숨겨 전송하고 전송 시 비디오 데이타가 손상되면 디코더에서 숨겨 온 비디오 블록의 특징을 추출하여 쌍선형 보간법을 통해 전송 시 발생한 오류를 은닉 처리한다. 데이타 숨김을 이용하면 디코더의 계산 복잡도는 낮아진다. 본 논문의 실험 결과는 제안 방법이 비디오의 패킷 분실이 30%에 달하는 경우에도 이를 은닉 처리하여 인지 가능한 품질의 비디오 데이타를 보장한다.

대화형 T-DMB 컨텐츠의 효율적인 전송을 위한 장면기술정보 최적화 기법 (An Optimization Technique of Scene Description for Effective Transmission of Interactive T-DMB Contents)

  • 이송록;정원식;유영재;차경애
    • 방송공학회논문지
    • /
    • 제11권3호
    • /
    • pp.363-378
    • /
    • 2006
  • 디지털멀티미디어방송(Digital Multimedia Broadcasting, DMB)은 고품질의 방송 영상 및 부가 데이터를 이동 중인 차량 내에서나 모바일폰, PDA 등과 같은 휴대형 단말에서 수신할 수 있는 이동 멀티미디어 방송 서비스이다. 미디어 및 상호작용 정보의 인코딩 규격으로는 MPEG-4 표준을 사용하며, 대화형 컨텐츠의 사용자 상호작용 등의 정보는 장면기술정보인 MPEG-4 BIFS(Binary Format for Scene)에 의해서 이루어진다. 사용자와의 상호작용이 풍부하고 장면 구성이 복잡한 컨텐츠일수록 BIFS 데이터가 전송되기 위해서 요구되는 비트율도 증가한다. 그러나 이동 단말에 고품질의 비디오 및 오디오 데이터를 전송하는 DMB 환경에서는 BIFS 스트림의 전송율은 매우 제한적이다. 한편 사용자 단말기에서 DMB 컨텐츠를 재생하려면 비디오, 오디오 등 미디어 객체들을 디코딩하기 전에 장면 구성 정보인 BIFS 스트림을 디코딩 및 파싱하여야 한다. 그러므로 MPEG-4의 높은 미디어 압축율에도 불구하고 제한된 대역폭과 장면 구성 정보 등 부가 데이터 전송 및 디코딩으로 인한 지연이 발생될 수 있다. 따라서 방송 컨텐츠의 특성 상 사용자의 임의 접근 시에도 재생될 컨텐츠의 BIFS 데이터를 파싱하여 대기 시간을 최소화하도록 초기 장면 구성 정보를 효율적으로 전송해야 한다. 본 연구에서는 지상파 DMB 대화형 컨텐츠의 장면기술정보인 BIFS 스트림을 저전송율 환경에 적응된 형태로 전달하기 위해서, 장면기술정보를 최적화하는 기법을 제안한다.

전염병 확산 방지를 위한 딥러닝 기반 얼굴 만지기 행동 인식 연구 (Implementation of Face-Touching Action Recognition System based on Deep Learning for Preventing Contagious Diseases)

  • 조성만;김민지;최준명;김태형;박주영;김남국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.630-633
    • /
    • 2020
  • 무의식적인 손-얼굴의 접촉으로 인한 감염의 문제점을 해결하기 위해, 얼굴 만지기 행동을 인식할 필요가 있다. 본 연구는 최근 각광을 받는 딥러닝 기술을 이용하여 비디오 영상에서 얼굴 만지기 행동 인식에 대한 연구이다. 우선, 비디오 영상에서 얼굴 만지기와 관련된 11 가지 행동에 대한 시, 공간적 특징을 컨볼루션 신경망을 통해 추출한다. 추출된 정보는 각 행동 레이블로 인코딩되어 비디오 영상에서 얼굴 만지기 행동을 분류한다. 또한, 3D, 2D 컨볼루션 신경망의 대표 네트워크인 I3D, MobileNet v3에 대해 비교 실험을 진행한다. 제안하는 시스템을 적용하여 인간의 행동을 분류하는 실험을 진행했을 때, 얼굴을 만지는 행동을 99%의 확률로 구분했다. 이 시스템을 이용하여 일반인이 무의식적인 얼굴 만지기 행동에 대해서 정량적으로 또는 적시적으로 인식을 하여, 안전한 위생 습관을 확립하여 감염의 확산방지에 도움을 줄수 있기를 바란다.

  • PDF

고속 움직임 탐색을 위한 효율적인 탐색영역 선택 알고리듬 (The effective search range selection algorithm for fast motion estimation)

  • 이원진;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.229-232
    • /
    • 2010
  • 비디오 압축 기법에서 움직임 추정(Motion Estimation)은 매우 중요한 부분을 차지하는데, 그것은 움직임 추정이 화질과 인코딩 시간에 직접적으로 영향을 미치기 때문이다. 가장 기본적인 움직임 추정 기법은 전역 탐색 기법(Full Search)인데, 이는 가장 좋은 화질을 보여주긴 하지만 매우 많은 계산량이 필요하다는 단점이 있다. 따라서 좋은 화질을 유지하면서도 계산량을 낮추기 위한 많은 고속 탐색 알고리즘들이 제안되었다. 이 논문에서는 현재 프레임의 매크로블록과 이전프레임의 매크로블록간의 Sum of Absolute Difference를 이용하여 탐색영역을 변경하는 새로운 예측 방법을 제시한다. 실험결과에 따르면 우리가 제안한 알고리듬은 FS와 비슷한 PSNR을 유지하면서 속도가 크게 향상된 것을 볼 수 있었다.

  • PDF

HEVC 인트라 인코더를 위한 RDO 알고리듬의 개선 (An improved RDO algorithm for the HEVC intra encoder)

  • 원의연;채수익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.123-126
    • /
    • 2013
  • High Efficiency Video Coding 비디오 표준은 다양한 분할방식 및 35가지 예측모드를 허용하기 때문에 최적의 분할 및 예측모드를 결정하기 위한 연산량이 많다. 이를 줄이기 위하여 본 논문에서는 CU분할의 결정에 있어 가설검정을 이용하여 early splitting 및 early pruning을 위한 임계값을 설정하고, early splitting의 경우 연산의 결과값이 임계값보다 클 경우, early pruning의 경우 연산의 결과값보다 임계값보다 작을 경우 CU의 분할을 조기에 결정하는 논문[1]의 방법을 차용하여 CU의 분할을 조기에 결정하며, 추가로 비트율 및 왜곡을 연산하는 예측모드의 개수를 줄임으로써 인코더의 성능을 향상시켰다. 또한 예측모드를 결정할 때 RDOQ를 수행하지 않음으로써 예측모드를 빠르게 결정하며, TU의 분할에 있어서도 CBF의 값 및 임계값을 이용한 early pruning 방법을 수행하여 인코더의 성능을 향상시켰다. 실험결과 5.9%의 luma BDRate의 증가가 있었으나, 63.7%의 인코딩 시간이 절감되었다.

  • PDF

WAN 환경에서 멀티미디어 서비스를 위한 효율적인 자원 배치

  • 조성봉
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1999년도 춘계학술대회 논문집
    • /
    • pp.80-87
    • /
    • 1999
  • 초고속 정보통신망의 구축과 개인용 컴퓨터의 보급이 늘어나면서 인터넷을 비롯한 다양한 형태의 정보 서비스들이 크게 증가하고 있다. 그러한 서비스를 위한 정보들은 대부분 대규모 데이터 전송을 요구하는 음성이나 동영상과 같은 멀티미디어 정보들로 이루어지며, 그들은 전자도서관이나 거대한 정보 저장소에 디지털로 인코딩 되어진 형태로 저장된다. 그런데 사용자들이 원하는 정보가 하나의 서버에만 저자오디는 중앙집중적인 환경에서는 그 서버가 모든 서비스 요구들을 처리해야 하기 때문에 병목 현상이 발생할 수 있고, 네트워크의 과부하로 인하여 양질의 서비스를 제공하기 어려워진다. 본 연구는 멀티미디어 정보중에서도 가장 많은 전송량이 요구되는 VOD 서비스를 효율적으로 지원할 수 있는 환경 구축방안을 찾는 것을 목표로 한다. 이를 위하여 비디오 정보들을 다수의 서버들에 분산 저장하고, 서버의 위치와 정보의 배치 방법에 따른 서비스 시간과 throughput을 시뮬레이션으로 분석하고, 각각의 경우에 대한 비용을 추정하여 가격대성능비 측면에서 가장 효율적인 방법을 제안하였다.

  • PDF

GOP구조를 이용한 MPEG2 비디오 비트율 제어에 관한 연구 (The Study on the MPEG-2 Video Bitrate Control using GOP Structure)

  • 김상동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.889-891
    • /
    • 2005
  • 디지털 기술과 통신 기술의 발전으로 멀티미디어 컨텐츠가 급격히 증가하고 있다. 이러한 멀티미디어 컨텐츠는 다양한 유무선 서비스 환경에서 실시간 서비스가 가능해야 한다. 그러기 위해서는 멀티미디어 컨텐츠 중 가장 큰 비중을 차지하는 영상 및 오디오 컨텐츠에 대한 압축 및 전송 기술이 요구된다. 현재 여러 분야에서 영상 및 오디오에 대한 압축 표준으로는 MPEG 이 자리잡았다. 그리고 MPEG에 대한 많은 개선 노력이 있었으며 특히 테스트 모델인 TM5를 비롯한 많은 연구에서 벡터 추출이나 양자화를 이용한 방법을 중심으로 비트율을 제어하기 위한 부호화기 모델이 제시되었다. 본 논문에서는 기존의 연구 접근 방식과는 다르게 프레임 유형간의 거리를 이용하여 영상의 특성에 따라 보다 적합한 프레임 구조를 찾아 제안하였다. 즉 영상의 복잡도와 변화도에 따라 영상의 종류를 구분하고 각 종류별 영상에 대한 표준 MPEG 인코딩 화질을 기준으로 삼은 후, GOP구조 내에서 프레임 유형간의 거리를 조정하여 화질을 손상하지 않고 가장 적은 비트율을 보상하는 프레임구조를 실험 및 분석을 통해 찾아 제안하였다.

  • PDF

비디오 품질 향상을 위한 네트워크 적응적인 SVC 스트리밍 프로토콜 (A Network Adaptive SVC Streaming Protocol for Improving Video Quality)

  • 김종현;구자헌;정광수
    • 한국정보과학회논문지:정보통신
    • /
    • 제37권5호
    • /
    • pp.363-373
    • /
    • 2010
  • 비디오 스트리밍을 위한 QoS 메커니즘은 다양한 사용자 환경과 스트리밍 응용 프로그램의 특성에 대한 고려가 부족하다. 이러한 문제점을 극복하기 위해 비디오 부호화의 공간적, 시간적, 품질적 확장성을 제공하는 SVC(Scalable Video Coding)를 이용한 비디오 스트리밍 프로토콜에 관한 연구가 활발히 진행되고 있다. 하지만 이러한 프로토콜들은 혼잡 제어 메커니즘을 가지고 있지 않아 네트워크 혼잡 상황을 심화 시키며, 다른 트래픽과의 공정성(Fairness)을 저하시키는 문제점을 가지고 있다. 또한 SVC 기반의 스트리밍 프로토콜은 단순히 네트워크의 가용대역폭 내에서 최대의 비트율을 가지는 비트스트림을 선택하여 전송함으로써 SVC로 인코딩된 영상의 특성을 간과하는 문제점을 갖는다. 본 논문에서는 이러한 문제점을 해결하기 위해 네트워크 상태와 SVC 비트스트림의 특성을 모두 고려한 T-NASS(TCP-Friendly Network Adaptive SVC Streaming) 프로토콜을 제안하였다. T-NASS 프로토콜은 TCP 친화적인 전송률을 계산하고, 패킷 손실률과 ECN(Explicit Congestion Notification) 패킷의 수신율을 근거로 네트워크 상태를 인지하여 최적의 SVC 비트스트림을 선택한다. T-NASS 프로토콜의 성능 평가를 위해 ns-2(Network Simulator) 시뮬레이터를 이용하여 TCP 친화적인 전송 특성과 네트워크 상태를 인지하여 최적의 비트스트립을 선택하는 것을 확인하였고 이를 통해 전송된 비디오 영상의 품질이 향상되었음을 확인하였다.

비디오 스트리밍 데이타 전송시 RTCP를 이용한 효율적인 네트워크 트래픽 제어 (An Effective Control of Network Traffic using RTCP for Transmitting Video Streaming Data)

  • 박대훈;허혜선;홍윤식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권3호
    • /
    • pp.328-335
    • /
    • 2002
  • 네트워크 상에서 비디오 스트리밍 데이타를 전송할 때에는 다른 어플리케이션에 비해 훨씬 큰 대역폭을 차지하게 되며, 이에 따라 같은 네트워크를 사용하는 다른 어플리케이션과의 충돌로 과부하가 발생하게 된다. 본 논문에서는 이러한 문제점을 해결하기 위해 RTP와 RTCP를 이용한 스트리밍 데이타 전송 방식을 채택하였다. 즉, RTCP의 RR(Receiver Report) 패킷을 수신하여 네트워크 트래픽 발생 여부를 실시간으로 조사한다. 트래픽 발생 여부에 따라 JMF에서 사용하는 RTP 인코딩 방식 중 하나인 Motion JPEG의 양자화 계수를 동적으로 조절함으로써 전체 네트워크 트래픽을 줄이고자 시도하였다. 전체 전송량 평균과 세션별 전송량 평균 비율이 5% 범위를 넘어설 때, 각 세션별 전송량을 세션 평균값에 가깝게 동적으로 조절한 결과 과부하가 줄어들 뿐만 아니라 전체적인 전송 효율도 개선됨을 확인할 수 있었다.