• 제목/요약/키워드: end-to-end codec

검색결과 19건 처리시간 0.034초

얼굴 인식과 추적을 이용한 ROI 기반 영상 통화 코덱 설계 및 구현 (ROI-based Encoding using Face Detection and Tracking for mobile video telephony)

  • 이유선;김창희;나태영;임정연;주영호;김기문;변재완;김문철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.77-78
    • /
    • 2008
  • With advent of 3G mobile communication services, video telephony becomes one of the major services. However, due to a narrow channel bandwidth, the current video telephony services have not yet reached a satisfied level. In this paper, we propose an ROI (Region-Of-Interest) based improvement of visual quality for video telephony services with the H.264|MPEG-4 Part 10 (AVC: Advanced Video Coding) codec. To this end, we propose a face detection and tracking method to define ROI for the AVC codec based video telephony. Experiment results show that our proposed ROI based method allowed for improved visual quality in both objective and subjective perspectives.

  • PDF

통신환경이 WiFi를 이용한 VoIP 서비스 용량에 미치는 영향 (Effects of communication environment on VoIP capacity using WiFi)

  • 최대우
    • 한국정보통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.1327-1332
    • /
    • 2015
  • 본 연구에서는 WiFi 무선망을 통한 VoIP 서비스의 품질에 영향을 주는 요소들을 분석하였다. VoIP 품질에 영향을 주는 요소로는 VoIP 통화의 수, WiFi 구간의 비음성 트래픽, 백본망내의 패킷 손실율과 단대단 지연등이 있다. WiFi 구간내 비음성 트래픽이 없으며 백본망의 패킷 손실율이 4%이고 단대단 지연이 90msec인 경우 G.729a 코덱으로는 12통화가 가능하며 G.729a VAD 코덱으로는 27통화까지 서비스 가능하였다. 분석결과 WiFi 구간의 데이터 트래픽과 TCP/IP망내 지연 및 패킷 손실율이 통화품질에 많은 영향을 주고 있는 것으로 확인되었으며 양질의 통화를 제공하기 위해서는 단대단 지연과 패킷 손실율을 최소한으로 유지하는 것 외에도 AP내에서 일종의 VoIP 호 접속 제어를 할 필요가 있는 것으로 판단된다.

디지털 오디오 방송을 위한 AAC 오디오 코덱 구현 (Implementation of the AAC Audio CODEC for Digital Audio Broadcasting)

  • 장대영;홍진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.43-48
    • /
    • 2000
  • 본 논문에서는 디지털 오디오 방송 시스템으로서 사용하기 위한 AAC (MPEG-2 Advanced Audio Coding) 코덱 시스템의 개발에 관하여 기술한다. 인코더 및 디코더는 ETRI가 제안한 디지털 오디오 방송 시스템에 접속하기 위해 MPEG-2 (Moving Picture Experts Group phase 2) 시스템의 TS(Transport Stream) 형식으로 입/출력한다. 내부 오디오 신호처리를 위한 DSP(Digital Signal Processor)로서는 Tl(Texas Instruments) 사의 TMS320C6701 (Floating point, 166 MHz)을 사용하였다. 인코더에서는 DSP 를 4 개까지, 디코더에서는 3 개까지 사용하여 구성할 수 있도록 설계하였다. DSP 에서는 시스템 제어, 오디오 신호 입력, 오디오 신호 처리, TS 신호 발생, 비트스트림 출력 등의 처리를 수행하며, 각 DSP 는 직렬 및 병렬 접속에 의해 서로 데이터를 전달한다. 본 시스템은 이후 다양한 디지털 방송 분야에 활용될 것이다.

  • PDF

VoIP 환경에서의 잡음제거를 위한 최적화된 위너 필터 (Optimized Wiener Filter for Noise Reduction in VoIP Environments)

  • 정상배;이성독;한민수
    • 대한음성학회지:말소리
    • /
    • 제64호
    • /
    • pp.105-119
    • /
    • 2007
  • Noise reduction technologies are indispensable to achieve acceptable speech quality in VoIP systems. This paper proposes a Wiener filter optimized to the estimated SNR of noisy speech for the noise reduction in VoIP environments. The proposed noise canceller is applied as a pre-processor before speech encoding. The performance of the proposed method is evaluated by the PESQ in various noisy conditions. In this paper, the proposed algorithm is applied to G.711, G.723.1, and G.729A which are all VoIP speech codecs. The PESQ results show that the performance of our proposed noise reduction scheme outperforms those of the noise suppression in the IS-127 EVRC and the ETSI standard for the advanced distributed speech recognition front-end.

  • PDF

저잡음 델타변조방식에 관한 연구 (A Study on the Low Noise Delta Codec System)

  • 심수보
    • 한국통신학회논문지
    • /
    • 제9권3호
    • /
    • pp.120-126
    • /
    • 1984
  • 본 논문에서는 음성신호의 부호화 방식 중에서 지수적 입신 델타 변조이론을 실현한다는 부호기의 새로운 설계법을 제안하였다. 즉 부호기에 포함되어 잇는 국부 부호기의 부분회로는 2중 적분기를 사용함으로써 스텝폭의 입신논리회로를 구성하는 부분회로소자의 지속 스위칭 특성으로 인한 문제점을 보완하고 광범위한 여러 가지 크기의 입력신호 성분에 대해서 일정한 신호대 잡음비(SQNR)를 얻음으로써 넓은 dynanmic range를 커버하였다.

  • PDF

분리형 구조의 고화질 멀티 포맷 비디오 복호기: MPEG-2/MPEG-4/H.264와 VC-1 (A Detachable Full-HD Multi-Format Video Decoder: MPEG-2/MPEG-4/H.264, and VC-1)

  • 배종우;조진수
    • 정보처리학회논문지A
    • /
    • 제15A권1호
    • /
    • pp.61-68
    • /
    • 2008
  • 본 논문에서는 MPEG-2, MPEG-4, H.264/AVC 및 VC-1 코덱 표준을 동시에 지원하는 멀티 포맷 비디오 복호기 (MFD)의 설계 방법을 제안한다. 제안하는 MFD는 디지털-TV SoC 에 필요한 고사양의 고화질급 비디오 처리를 목표로 하였다. 리스크 프로세서, 온칩 메모리 및 주변 회로 등의 크기가 큰 공용 자원들을 공유하여 크기를 최소화 하였다. 또한, 코덱 별로 추가 및 제거가 용이한 분리 가능한 구조를 사용하였다. 이러한 구조는 이미 설계되고 검증된 코덱의 안정성의 유지를 용이하게 해준다. 설계된 MFD는 65nm 공정에서 크기가 약 2.4M 게이트 이며, 동작속도는 225MHz이다. 본 논문에서 제안한 MFD는 현재까지 알려진 MFD 중 최고 성능인 고화질급(1080p@30fps) 이상의 비디오 디코딩을 지원하며, 가장 많은 종류의 비디오 코덱 표준을 지원한다.

Model for Mobile Online Video viewed on Samsung Galaxy Note 5

  • Pal, Debajyoti;Vanijja, Vajirasak
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권11호
    • /
    • pp.5392-5418
    • /
    • 2017
  • The primary aim of this paper is to propose a non-linear regression based technique for mapping different network Quality of Service (QoS) factors to an integrated end-user Quality of Experience (QoE) or Mean Opinion Score (MOS) value for an online video streaming service on a mobile phone. We use six network QoS factors for finding out the user QoE. The contribution of this paper is threefold. First, we investigate the impact of the network QoS factors on the perceived video quality. Next, we perform an individual mapping of the significant network QoS parameters obtained in stage 1 to the user QoE based upon a non-linear regression method. The optimal QoS to QoE mapping function is chosen based upon a decision variable. In the final stage, we evaluate the integrated QoE of the system by taking the combined effect of all the QoS factors considered. Extensive subjective tests comprising of over 50 people across a wide variety of video contents encoded with H.265/HEVC and VP9 codec have been conducted in order to gather the actual MOS data for the purpose of QoS to QoE mapping. Our proposed hybrid model has been validated against unseen data and reveals good prediction accuracy.

SVC에서 스케일러블 암호화를 이용한 스크램블링 기술 (Scrambling Technology using Scalable Encryption in SVC)

  • 권구락
    • 한국멀티미디어학회논문지
    • /
    • 제13권4호
    • /
    • pp.575-581
    • /
    • 2010
  • 트리밍 미디어와 압축 기술의 발전과 인터넷 사용의 확대로 디지털 음악, 비디오, 영상은 인터넷을 이용하여 사용자에게 순간적으로 배포되어질 수 있다. 하지만, 대부분 기존의 디지털 저작권의 관리는 안전하지 못하고 실시간적인 멀티미디어 응용에 의해 야기되는 데이터의 방대한 양의 처리를 빠르게 수행하지 못한다. Scalable video codec (SVC) 은 변화하는 네트워크 대역과 다양한 어플리케이션 목적에 적응 가능한 Spatial, Temporal, SNR 스케일러빌러티를 제공한다. 한편, 많은 멀티미디어 서비스에서 보안성은 인증받지 않은 사용자의 컨텐츠 접근과 분배를 제한하는 중요한 요소이다. 따라서 MPEG4-SVC에 적합한 새로운 암호화 시스템의 구현은 반드시 필요하다. 본 논문에서는 MPEG4-SVC의 스케일러빌러티 특성을 그대로 유지시켜주는 스케일러블 암호화 기술을 제안한다. 기본 레이어에는 선택적 암호화 기법을 적용하여 암호화하고 확장 레이어에는 다양한 Motion Vector Scrambling(MVS)과 인트라 모드 암호화 방법을 적용하였다. 복호화 단계에서는 각 암호화된 레이어마다 다른 암호화 키로 접근이 가능하다. 실험 결과에서 제안된 기술은 암호화 속도가 빠르고 에러에 강한 특성과 추가되는 비트스트림의 크기가 아주 적은 장점이 있다.

딥러닝 기반 컨텐츠 적응적 영상 압축 기술 동향 (Survey on Deep learning-based Content-adaptive Video Compression Techniques)

  • 한창우;김홍일;강현구;권형진;임성창;정승원
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.527-537
    • /
    • 2022
  • 멀티미디어 컨텐츠의 수요와 공급이 증가함에 따라 전 세계의 인터넷 트래픽이 증가하는 가운데 이를 완화하기 위해 여러 표준화 그룹에서는 더 효율적인 압축 표준을 제정하는데 노력을 기울이고 있다. 이러한 노력 중 압축 표준에 딥러닝 기술을 도입하고자 하는 연구들이 활발히 진행되고 있다. 그러나 딥러닝 기반 압축 기술은 학습 데이터와 특성이 다른 영상을 압축할 때 압축 효율이 저하되는 문제를 갖는다. 이를 해결하기 위해 컨텐츠에 적응적으로 딥러닝 기술을 도입하는 시도들이 있었다. 본 논문에서는 이들을 크게 코덱 정보 사용, 모델 선택, 추가 정보 전송의 세 가지로 나누어 살펴보고자 한다.