• 제목/요약/키워드: 오디오 부호화기

검색결과 59건 처리시간 0.025초

MPEG 오디오 부호화기를 위한 향상된 프리 에코 컨트롤 알고리듬 (Enhanced Pre echo Control Algorithm for MPEG Audio Coders)

  • 이창준;이재성;박영철
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.191-199
    • /
    • 2006
  • 본 논문은 심리음향 모델 II(PAM II)를 기반으로 한 MPEG 오디오 코더에 대해서 효율적으로 프리 에코(pre echo)를 제어하는 알고리듬을 제안한다. 프리 에코 제어는 PAM II에서 마스킹 임계값 계산의 마지막 단계로써, 현재 프레임에 대해서 발생하는 양자화 오차를 최소화시키는 역할을 한다. 기존에 부호화기에서 프리 에코는 추정되는 마스킹 임계치가 이전 프레임에서 얻어진 값을 넘지 않도록 제한함으로써 결정된다. 기존의 방법에서 사용되는 프리 에코 제어는 단구간 블록(short block)은 물론 장구간 블록(long block)에 대해서도 사용되는데, 이는 마스킹 임계값을 불필요하게 떨어뜨려 전체적인 양자화 잡음 레벨을 높이는 문제를 발생시킨다. 본 논문에서는 이러한 문제를 해결할 수 있는 효율적인 프리 에코 제어 과정을 제안하였다. 음질 테스트 결과에서 변화가 심한 오디오 신호에 대해서 ITU R 테스트를 시행한 결과 제안된 방법이 평균적으로 0.4점 이상 개선된 결과를 보였다.

멀티채널 오디오 부호화를 위한 TMS320C6701 DSP 보드 구현 (Implementation of the TMS320C6701 DSP Board for Multichannel Audio Coding)

  • 장대영;홍진우;곽진석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.199-203
    • /
    • 1999
  • 본 논문은 MPEG-2 AAC 멀티채널 오디오 및 MPEG-4 오디오의 다중객체 부호화를 위한 DSP 시스템의 설계 및 구현에 관하여 기술한다. DSP로서는 TI 사의 최근 제품인 고성능의 TMS320C6701 (이하 6701로 함) 2개를 사용하였고, DSP 보드는 PC에 장착하여 프로그램을 다운로드하고 시스템을 제어할 수 있게 하기 위하여 PCI 인터페이스를 함께 구현하였으며, 부호화기 및 복화기로서 함께 사용할 수 있는 구조로서 설계하였다. 또한 멀티채널 오디오를 디지털 신호로 변환하고 다중화하여 직렬신호로서 입력하고, 다시 역으로 출력하기 위한 시스템을 별도로 외부에 구현하였으며, 접속 인터페이스로서 ADI (Alesys Digital audio Interface)론 사용하여, ADI 인터페이스를 지원하는 멀티채널오디오 장비론 입출력 시스템으로 사용할 수 있도록 하였다. 현재의 결과로서는 MPEG-2 AAC 4채널 오디오를 2개의 DSP를 사용하여 실시간으로 안정되게 부호화 할 수 있으며, 1개의 DSP로도 8채널까지의 복호화가 가능함을 확인하였다.

  • PDF

이동방송수신환경에서 MPEG-4 계층적 비디오 전송을 위한 결합 소스/채널 부호화에 관한 연구 (Studies on Joint Source/Channel Coding for MPEG-4 Scalable Video Transmission in Mobile Broadcast Receiving Environments)

  • 이운문;손원
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.31-40
    • /
    • 2005
  • 이 논문은 국내 디지털 오디오 방송(Digital Audio Broadcasting, DAB)의 표준으로 채택된 Eureka 147 DAB 시스템에 결합 소스/채널 부호화 기법(Joint Source/Channel Coding, JSC)을 적용한 데이터 전송시스템의 기본틀을 제안한다. 제안전송시스템의 소스부호화기는 기존의 SNR-계층적 부호화(SNR-Scalability) 기법의 발전된 형태인 MPEG-4 FGS(Fine Granular Scalability) 비디오부호화기, 채널부호화기로는 상이오류보호(Unequal Error Protection, UEP)에 효율적인 RCPC 부호화기 그리고 변조방식은 QPSK를 적용하였다. 채널환경은 랜덤잡음환경과 이동수신환경을 고려하였다. 이 논문에서는 여러 가지 채널 상태(Es/No)에 따른 율-왜곡특성에 대해 분석하여 소스비트율과 채널부호율 간에 최적의 상충점(Trade-off point)을 결정하였고, DAB의 계층적 비디오 전송을 위한 FGS-JSC 기법이 적용되었을 때와 단일계층의 고정부호율 전송의 경우를 비교하여 FGS-JSC 기법의 우수함을 보였다.

HE-AAC 부호화의 저비트율에서 음질향상 기법 (Quality Improvement of Low-Bitrate HE-AAC Encoder)

  • 김정근;이재성;이태진;강경옥;박영철
    • 한국음향학회지
    • /
    • 제27권2호
    • /
    • pp.66-74
    • /
    • 2008
  • 본 논문에서는 HE-AAC (High Efficiency Advanced Audio Coding) 오디오 부호화기의 저주파 대역과 고주파 대역을 담당하고 있는 AAC부호화기와 SBR (Spectral Band Replication) 부호화기에 대해 낮은 비트율에서 효과적인 개선 방법을 제안한다. AAC 부호화기가 담당하는 저주파 대역에서 과도신호가 발생하는 부분의 프리에코를 줄이기 위하여 적용 주파수범위가 저주파 대역 방향으로 선택적으로 확장되는 eTNS (exteded Temporal Noise Shaping) 방법을 고안하였다. 또한 SBR에 의해 부호화되는 고주파 대역에서 톤 성분 복원 시에 잡음층 (Noise floor)이 추가 발생되지 않도록 정현파 모델을 통해 톤을 사전 인지하고 인지된 톤들의 주파수를 QMF 밴드의 중앙으로 재배치하여 성능 향상을 이루었다. 제안한 방법들을 사용하여 복호화한 샘플 음원들에 대해 주/객관적 음질평가를 실시한 결과, 표준 HE-AAC에 비해 향상된 결과를 보여주었다.

오디오 부호화의 성능 향상을 위한 가변 LPC 기술 (Adaptive LPC for Performance Enhancement of Audio Coding)

  • 함우규;구자성;김기준;강경옥;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.6-7
    • /
    • 2013
  • 저전송률 오디오 부호화기의 성능 향상을 위해 가변 LPC 기반으로 스펙트럼을 평탄화 하는 방법을 제안한다. 제안한 방법은 대역별 scale factor를 동일하게 하여 비트 효율을 증가시키고 spectral hole이 발생하는 문제점을 해결할 수 있다. 또한, 가변 LPC 필터를 사용하여 프레임 특성에 따라 스펙트럼 평탄화 강도를 가변적으로 조절하여 성능 향상을 제공한다. 제안한 방법이 일반 LPC 필터 방법보다 저대역의 부호화 성능을 향상시키고 스테레오 왜곡을 감소시키는 것을 확인하였다.

  • PDF

디지털 오디오/비디오, 통신용 전자기기를 위한 Reed Solomon 복부호기 설계에 대해 (Reed Solomon CODEC Design For Digital Audio/Video, Communication Electronic Devices)

  • 안형근
    • 대한전자공학회논문지TC
    • /
    • 제42권11호
    • /
    • pp.13-20
    • /
    • 2005
  • 현대의 디지털통신기기나, 오디오/비디오 전자기기엔 항상 비바이나리 에러정정복부호기가 사용되는데 그중 필수적으로 사용되는 Reed-Solomon 복부호화기기의 설계에 대해 기술했다. 2,3 symbol RS 복호기설계법을 설명 후, 새로운 RS 부호화기의 설계법을 제시한다. 각각의 복부호화기기의 동작여부를 예를들어 test해보고 잘 동작함을 확인했다.

GOP구조를 이용한 MPEG2 비디오 비트율 제어에 관한 연구 (The Study on the MPEG-2 Video Bitrate Control using GOP Structure)

  • 김상동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.889-891
    • /
    • 2005
  • 디지털 기술과 통신 기술의 발전으로 멀티미디어 컨텐츠가 급격히 증가하고 있다. 이러한 멀티미디어 컨텐츠는 다양한 유무선 서비스 환경에서 실시간 서비스가 가능해야 한다. 그러기 위해서는 멀티미디어 컨텐츠 중 가장 큰 비중을 차지하는 영상 및 오디오 컨텐츠에 대한 압축 및 전송 기술이 요구된다. 현재 여러 분야에서 영상 및 오디오에 대한 압축 표준으로는 MPEG 이 자리잡았다. 그리고 MPEG에 대한 많은 개선 노력이 있었으며 특히 테스트 모델인 TM5를 비롯한 많은 연구에서 벡터 추출이나 양자화를 이용한 방법을 중심으로 비트율을 제어하기 위한 부호화기 모델이 제시되었다. 본 논문에서는 기존의 연구 접근 방식과는 다르게 프레임 유형간의 거리를 이용하여 영상의 특성에 따라 보다 적합한 프레임 구조를 찾아 제안하였다. 즉 영상의 복잡도와 변화도에 따라 영상의 종류를 구분하고 각 종류별 영상에 대한 표준 MPEG 인코딩 화질을 기준으로 삼은 후, GOP구조 내에서 프레임 유형간의 거리를 조정하여 화질을 손상하지 않고 가장 적은 비트율을 보상하는 프레임구조를 실험 및 분석을 통해 찾아 제안하였다.

  • PDF

향상된 버퍼 제어 방법을 사용한 3D 오디오 핵심 부호화기 (A 3D Audio Core-Codec Employing an Improved Buffer Control Method)

  • 김인철
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.233-241
    • /
    • 2020
  • 본 논문에서는 3DA 핵심 부호화기의 FD 처리부의 성능 향상을 위해 새로운 버퍼 제어 기법을 제안하였다. 제안한 버퍼 제어 기법은 3GPP의 심리음향 모델과 스펙트럼 공백 회피 기법을 포함한 율-왜곡 제어부를 채택하였다. 그런 다음, 활동성이 높은 프레임에 충실한 비트 할당이 이루어질 수 있도록 3GPP 버퍼 제어 방법을 수정하였다. 본 논문에서 제안한 버퍼 제어 방법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 3DA RM9 및 3GPP AAC의 버퍼 제어 방법보다 우수한 성능을 보임을 입증한다.

이동멀티미디어 방송을 위한 미디어 처리기 설계 및 구현 (Design and implementation of a media processor for mobile multimedia broadcasting)

  • 안상우;이용주;최진수;김진웅
    • 방송공학회논문지
    • /
    • 제8권3호
    • /
    • pp.259-267
    • /
    • 2003
  • 본 논문에서는 이동 멀티미디어 방송 환경에서 대화형 서비스를 제공하기 위한 이동 멀티미디어 방송 미디어 처리기를 제안한다. 제안한 미디어 처리기는 오디오/비디오 부호화기로 MPEG-4 AVC(Advanced Video Coding) 및 MPEG-4 BSAC(Bit Sliced Arithmetic Coding) 부호화기를 사용하여, MPEG-4 IOD(Initial Object Descriptor)/OD(Object Descriptor)/BIFS(Binary Format for Scene) 데이터를 생성하는 기능, MPEG-4 AVC/BSAC 및 생성된 MPEG-4 OD/BIFS 데이터를 SL(Sync Layer) 패킷으로 캡슐화하는 기능, SL 패킷을 MPEG-2 TS(Transport Stream)로 패킷화하는 기능 및 다중화하는 기능을 지원할 수 있도록 설계하였다. 본 논문에서 제안한 이동 멀티미디어 방송 미디어 처리기는 사용자에게 MPEG-4 시스템 규격을 기반으로 대화형 서비스를 지원할 수 있다.

오디오 부호화기를 위한 스펙트럼 변화 및 MFCC 기반 음성/음악 신호 분류 (Speech/Music Signal Classification Based on Spectrum Flux and MFCC For Audio Coder)

  • 이상길;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.239-246
    • /
    • 2023
  • 본 논문에서는 오디오 부호화기를 위한 스펙트럼 변화 파라미터와 Mel Frequency Cepstral Coefficients(MFCC) 파라미터를 이용하여 음성과 음악 신호를 분류하는 개루프 방식의 알고리즘을 제안한다. 반응성을 높이기 위해 단구간 특징 파라미터로 MFCC를 사용하고 정확도를 높이기 위해 장구간 특징 파라미터로 스펙트럼 변화를 사용하였다. 전체적인 음성/음악 신호 분류 결정은 단구간 분류와 장구간 분류를 결합하여 이루어진다. 패턴인식을 위해 Gaussian Mixed Model(GMM)을 사용하였고, Expectation Maximization(EM) 알고리즘을 사용하여 최적의 GMM 파라미터를 추출하였다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 다양한 오디오 음원에서 평균적으로 1.5% 분류 오류율을 보였고 단구간 단독 분류 방법 보다 0.9%, 장구간 단독 분류 방법보다 0.6%의 분류 오류율의 성능 개선을 이룰 수 있었다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 USAC 오디오 분류 방법보다 타악기 음악 신호에서 9.1% 분류 오류율, 음성신호에서 5.8% 분류 오류율의 성능 개선을 이룰 수 있었다.