• 제목/요약/키워드: CODEC

검색결과 694건 처리시간 0.069초

하이브리드 IPTV를 위한 리치 미디어 프레임워크 개발 (Development of a Rich Media Framework for Hybrid IPTV)

  • 성민영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.631-636
    • /
    • 2010
  • 최근 방송통신 융합의 경향에 따라 IP 네트워크 통신 기반의 주문형 미디어와 지상파, 케이블등에 기반한 방송형 미디어를 모두 수용하는 하이브리드 IPTV가 주목을 받고 있다. 본 논문에서는 최신 H.264 코덱을 지원하는 하이브리드 IPTV를 위한 리치 미디어 프레임워크를 제안한다. 이를 위해 하이브리드 미디어를 다루는 TV에 최적화된 미디어 콤포넌트와 RIA 런타임 엔진을 개발한다. 미디어 콤포넌트는 RF 방송, IP 기반 저장된 미디어 및 라이브 미디어의 다양한 재생 방식에 대해 일관되면서도 효율적인 응용 인터페이스를 제공하도록 설계되었다. 특히, 성능과 이식성을 위해 미디어 콤포넌트는 미디어 스트림 추상화, 적응식 주문형 I-프레임 탐색, 재생시간 자동 계산 등을 채택하였다. 제안된 미디어 인터페이스를 기반으로 RIA 런타임 프로토타입을 개발하였다. RIA 런타임은 한정된 자원을 갖는 IPTV 환경에서의 최적화된 렌더링을 위해 프로세서의 내장 그래픽 가속기를 최대한 활용하도록 설계되었다. 개발된 프레임워크의 성능과 유용성을 검증하기 위해 시연 및 실험을 실시하고 그 결과를 제시한다. 제안된 프레임워크는 IPTV 기반 VOD, 광고, 교육 등의 응용에서 벡터 그래픽 및 하이브리드 미디어를 지원하는데 효과적으로 사용될 것으로 기대된다.

A Study on Design and Implementation of Speech Recognition System Using ART2 Algorithm

  • Kim, Joeng Hoon;Kim, Dong Han;Jang, Won Il;Lee, Sang Bae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권2호
    • /
    • pp.149-154
    • /
    • 2004
  • In this research, we selected the speech recognition to implement the electric wheelchair system as a method to control it by only using the speech and used DTW (Dynamic Time Warping), which is speaker-dependent and has a relatively high recognition rate among the speech recognitions. However, it has to have small memory and fast process speed performance under consideration of real-time. Thus, we introduced VQ (Vector Quantization) which is widely used as a compression algorithm of speaker-independent recognition, to secure fast recognition and small memory. However, we found that the recognition rate decreased after using VQ. To improve the recognition rate, we applied ART2 (Adaptive Reason Theory 2) algorithm as a post-process algorithm to obtain about 5% recognition rate improvement. To utilize ART2, we have to apply an error range. In case that the subtraction of the first distance from the second distance for each distance obtained to apply DTW is 20 or more, the error range is applied. Likewise, ART2 was applied and we could obtain fast process and high recognition rate. Moreover, since this system is a moving object, the system should be implemented as an embedded one. Thus, we selected TMS320C32 chip, which can process significantly many calculations relatively fast, to implement the embedded system. Considering that the memory is speech, we used 128kbyte-RAM and 64kbyte ROM to save large amount of data. In case of speech input, we used 16-bit stereo audio codec, securing relatively accurate data through high resolution capacity.

H.264/AVC을 위한 움직임 벡터 복원 방법 (Motion Vector Recovery Scheme for H.264/AVC)

  • 손남례
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.29-37
    • /
    • 2008
  • 무선채널과 같은 저 대역폭에 비디오 스트림을 전송하기 위해서 H.264와 같은 고압축 코덱이 등장하였다. 저 대역폭으로 고압축 비디오 스트림을 전송할 경우, 패킷 손실로 인하여 화질 열화를 초래한다. 본 논문에서는 H.264 부호화 영상이 전송될 때 손실된 움직임 벡터는 주변에 인접한 움직임 벡터와 높은 상관성을 갖는다는 사실에 착안하여 시-공간적 에러 은닉(temporal-spatial error concealment) 방법을 제안한다. 이때 손실된 블록의 후보 움직임 벡터들은 손실된 블록에 인접한 움직임 벡터들을 평균 연결 알고리즘의 단점을 보완하여 후보 벡터 군을 결정한다. 패킷이 손실되는 환경에서 실험한 결과, 제안한 에러 은닉 방법은 H.264 복호기에서 사용하는 기존 에러 은닉 방법에 비하여 후보 벡터 개수가 평균적으로 1/3정도 감소로 인하여 후보벡터에 대한 왜곡 측정 계산량이 크게 감소하였다. 또한 화질에 대한 객관적 평가 기준인 PSNR은 평균적으로 기존 방법들과 거의 비슷하였다.

초고화질 영상처리를 위한 HEVC 표준에 적합한 고속 및 저복잡도 움직임 예측기에 대한 연구 (A Fast and Low-complexity Motion Estimation for UHD HEVC)

  • 김성오;박찬식;전형주;김재문
    • 방송공학회논문지
    • /
    • 제18권6호
    • /
    • pp.808-815
    • /
    • 2013
  • 본 논문은 초고화질 영상처리를 위한 HEVC 표준에 적합한 고속 및 저복잡도 움직임 예측기 알고리즘을 제안하였다. 움직임 예측기는 HEVC 내의 연산양의 77~81%를 차지하고 있다. 결국 비디오 코덱 구현의 핵심은 이러한 움직임 예측기의 고속 및 저복잡도 알고리즘을 찾는 것이다. 본 논문에서는 기존의 움직임 예측기 알고리즘을 분석하였고 일반적인 움직임 탐색 점을 줄이는 방식이 아닌 움직임 벡터 예측과 선택적으로 움직임 탐색 점 개수를 조정하는 등의 HEVC 표준에 적합한 3가지 방식을 제안하였다. 이 제안된 알고리즘은 full search 알고리즘에 비교하여 0.36%의 연산양만을 사용하면서도 그 성능 열화는 1.1%에 불과하였다.

4-way 수퍼 스칼라 디지털 시그널 프로세서 코어 설계 (On Designing 4-way Superscalar Digital Signal Processor Core)

  • 김준석;유선국;박성욱;정남훈;고우석;이근섭;윤대희
    • 한국통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.1409-1418
    • /
    • 1998
  • 최근의 오디오 압축 알고리듬은 다양한 코딩 기법을 조합하여 사용하고 있다. 이들은 DSP 작업(DSP task), 제어 작업(controller task), 그리고 혼합 작업(mixed task)으로 나눌 수 있다. 기존의 DSP 프로세서들은 이들 중 DSP 작업만을 효율적으로 설계되어 있어 제어작업이나 혼합작업에 대해서는 자원을 효율적으로 활용하지 못하는 단점이 있다. 본 논문에서는 기존의 DSP 프로세서가 가지는 DSP 작업에 대하여 고성능을 그대로 유지하면서 제어작업과 혼합작업에서도 좋은 성능을 가지는 새로운 구조를 제안하고 구현하였다. 제안된 프로세서 YSP-3는 4개의 실행 유닛 (곱셈기, 2개의 ALU, 메모리 접근 유닛)을 병렬로 배치한 후 4-way 수퍼스칼라명령어 구조를 사용하여 각 우ㅠ닛을 독립적으로 사용할 수 있도록 하였다. 제안된 구조는 일반적인 DSP 알고리듬과 AC-3 디코딩 알고리듬을 실행하여 성능을 평가하였다. 마지막으로 VHDL을 통해 $0.6\$\mu$textrm{m}$-3ML 표준셀 기술로 합성한 후 Compass상에서 모의실험으로 통해 33MHz의 시스템 클럭에 대해 최대 지연시간 상황에서 실시간 동작을 확인하였다.

  • PDF

HEVC를 이용한 양안식 영상의 효율적인 부호화 방법 (An Efficient Coding Method for Stereoscopic Videos using HEVC)

  • 황수진;호요성
    • 한국통신학회논문지
    • /
    • 제36권12C호
    • /
    • pp.721-726
    • /
    • 2011
  • 차세대 비디오 압축 표준으로 현재 개발 중인 HEVC(high efficiency video coding)는 기존 비디오 압축 표준인 H.264/AVC에 비해 40% 정도의 성능 향상을 보인다. 기존의 양안식 영상을 부호화하기 위한 코텍은 H.264/AVC 기반으로 제작되었기 때문에, HEVC를 이용하여 양안식 영상을 부호화 하면 성능 향상을 기대할 수 있다. 또한 양안식 영상은 기존의 각 화면의 시간 상관도{temporal correlation)에 더해서 화면간의 상관도(interview correlation)가 존재하기 때문에, 좌우 영상을 함께 부호화하는 것이 성능 개선에 유리하다. 본 논문에서는 HEVC의 참조 소프트웨어인 HM 3.4를 이용하여 화면간의 상관도를 고려한 양안식 영상 부호화 방법을 제안한다. 화면간의 예측을 이용한 제안한 코텍을 이용해 부호화한 오른쪽 영상과 기존 HEVC로의 오른쪽 화면을 부호화했을 때의 성능을 비교한 결과 BDBR이 약 36.24% 감소했으며 BDPSNR은 1.19 dB가 증가했다.

비트평면 혼합 코딩을 이용한 무손실 이미지 압축방법 (Method of Lossless Image Compression Using Hybrid Bitplane Coding)

  • 문영호;최종범;심우성
    • 한국통신학회논문지
    • /
    • 제34권10C호
    • /
    • pp.961-967
    • /
    • 2009
  • 본 논문은 8 비트 화소값을 갖는 입력 이미지에 대한 무손실 압축방법을 제안한다. 비트평면 압축에 있어, 하위비트평면은 픽셀의 불규칙성 때문에 압축이 잘 되지 않는다. 이런 단점을 극복하기 위해, 본 논문에서는 블록기반 압축 방법인 H. 264 코덱과 비트기반 압축방법인 JBIG코덱을 이용한 혼합코딩 방법을 제안한다. 우선 비트평면의 특징을 이용하기 위해, 8 개의 비트평면에 대하여 상위 4비트와 하위 4비트를 분리 하였다. 다음으로 분리된 상위 4비트평면에 대해서는 비트간의 상관성이 많으므로 각 비트평면에 JBIG과 같은 비트플레인 압축방법을 이용하였다. 그리고 분리된 하위 4비트평면에 대해서는 블록기반 압축방법인 H. 264의 무손실 화면 내 예측기법의 개선된 방법을 적용 하였다. 전처리를 하위 4비트 평면에 적용하여, 불규칙한 화소값의 분포를 규칙적으로 변환한다. 제안된 방법을 이용하여 다양한 실험이미지에 대해 실험을 수행하였다. 실험결과는 프린터에서 사용하는 JBIG방법 대비 8비트 전체 이미지는 평균 19%, 4비트 하위 이미지는 평균 11%의 압축성능 향상을 얻을 수 있었다.

H.264/AVC 기반의 스테레오 영상 디스플레이 시스템 (Stereoscopic Video Display System Based on H.264/AVC)

  • 김태준;김지홍;윤정환;배병규;김동욱;유지상
    • 한국통신학회논문지
    • /
    • 제33권6C호
    • /
    • pp.450-458
    • /
    • 2008
  • 본 논문에서는 양안시차를 이용한 스테레오 영상의 부호화 기법을 H.264/AVC 기반으로 스테레오 영상을 실시간으로 전송하기 위한 효과적인 시스템을 제안한다. OpenCV를 이용하여 스테레오 웹캠으로부터 영상을 획득하고, 전처리 과정으로 입력 시스템을 통해 획득한 스테레오 영상을 YUV 4:2:0 파일 포맷으로 변환한다. 변환된 파일은 스테레오 부호화기로 입력되고 제안된 예측구조에 의해 부호화기의 복잡도를 감소시킴으로써 초당 30프레임 이상의 부호화 속도로 부호화 된다. 부호화된 비트스트림 파일은 복호화기에 입력되어 좌, 우 스테레오 영상으로 재 생성된다. 재 생성된 스테레오 영상은 입체영상으로 합성되어 3D 디스플레이 장치를 통해 사용자에게 보여지게 된다. 제안된 시스템은 기존의 스테레오 코덱을 사용했을 때 보다 최소 1.5dB에서 최대 3dB의 압축효율이 뛰어남을 본 실험을 통하여 검증 및 확인하였다. 본 연구는 저 대역폭, 저 전력의 실시간 전송을 위한 모바일환경에 응용이 가능할 것으로 기대된다.

VoIP 시스템에서의 SIP 기반의 확장된 Caller Preference 구현 (Implementation of SIP-based Extended Caller Preference in VoIP System)

  • 조현규;장춘서
    • 한국콘텐츠학회논문지
    • /
    • 제4권2호
    • /
    • pp.43-49
    • /
    • 2004
  • SIP(Session Initiation Protocol)에서의 Caller Preference는 송신자가 서버 측에서 자신의 요구를 처리하는데 관련된 각종 선호 사항들을 표현할 수 있도록 하고 또 수신자의 수신능력(Callee Capabilities)에 따라 적절한 호 처리를 진행할 수 있도록 하여주는 유용한 기능이다. 그러나 기존의 Preference 기능에서는 수신 대상을 선정함에 있어 미디어종류에 대한 일치 여부만을 고려하므로 호 설정 과정에서 상호간의 미디어 스트림에 대한 코덱과 같은 미디어 정보가 다를 경우 이를 재 협약하기 위한 추가적인 세션 협약 과정이 발생하게 된다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위한 새로운 확장된 Caller Preference 기능을 제안하였다. 여기서는 SIP 기반의 VoIP(Voice over IP)시스템에서 네트워크 서버가 SIP 호를 연결할 수신대상을 결정하는데 있어서 세션에서의 미디어 스트림에 사용되는 세부적인 미디어 정보의 일치 여부를 판단하여 호 연결 후보 대상들 가운데 미디어 재 협약이 필요치 않은 대상에 우선권을 부여하여 효율적인 호 설정이 가능하도록 하였다.

  • PDF

음악 특징점간의 유사도 측정을 이용한 동일음원 인식 방법 (Same music file recognition method by using similarity measurement among music feature data)

  • 성보경;정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.99-106
    • /
    • 2008
  • 최근 다양한 분야에서(웹 포털, 유료 음원서비스 등) 디지털 음악의 검색이 사용되고 있다. 기존의 디지털 음악의 검색은 음악 데이터에 포함된 자체 메타 정보를 이용하여 이루어진다. 하지만 메타 정보가 다르게 작성되었거나 작성되지 않은 경우 정확한 검색은 어렵다. 요즘 이러한 문제의 보완 방안으로 음악자체를 이용하는 내용기반정보 검색 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보간의 유사도 측정을 통하여 동일음원을 인식하는 방법에 대해 논하고자 한다. 디지털 음악의 특징 정보는 단순화시킨 MFCC (Mel Frequency Cepstral Coefficient)를 이용하여 음악의 파형으로부터 추출하였다. 디지털 음악간의 유사도는 Vision 및 Speech Recognition 분야에서 사용되던 DTW (Dynamic Time Warping) 기법을 활용하여 측정하였다. 제안된 동일 음원 인식 방법의 검증을 위한 같은 장르에서 무작위 추출된 1000곡에서 시행한 500번의 검색은 모두 성공했다. 검색에 사용된 500개의 디지털 오디오는 60개의 디지털음원을 압축방식과 비트율을 다르게 조합하여 만들었다. 실험의 결과로 DTW을 이용한 유사도 측정법이 동일음원을 인식할 수 있음을 증명하였다.

  • PDF