• 제목/요약/키워드: Harmonic coding

검색결과 33건 처리시간 0.025초

피치 하모닉 움직임 예측과 적응적 신호 크기 예측을 이용한 패킷 손실 은닉 알고리즘 (Packet Loss Concealment Algorithm Using Pitch Harmonic Motion Estimation and Adaptive Signal Scale Estimation)

  • 김태하;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권4호
    • /
    • pp.247-256
    • /
    • 2021
  • 본 논문에서는 피치 하모닉 움직임 예측과 적응적 신호 크기 예측을 이용한 패킷 손실 알고리즘을 제안한다. 스펙트럼 움직임 예측 방법은 사용 가능한 이전 패킷의 스펙트럼 상의 움직임을 일정한 부대역으로 나누어 손실된 신호의 움직임을 예측하여 복원한다. 제안하는 알고리즘에서는 음성신호를 유성음과 무성음으로 구분하여 유성음의 경우 피치 주파수를 활용하여 피치 하모닉으로 나누어 손실된 신호의 피치 하모닉 움직임을 예측하여 복원하고 무성음의 경우 스펙트럼 움직임 예측 방법을 사용하여 신호를 복원한다. 음성 프레임의 연속 손실이 발생한 경우 LMS(Least Mean Square) 예측기를 사용하여 이전 프레임의 이득 정보를 활용하여 신호 크기를 예측하여 출력 신호의 이득을 조절하는 방법을 제안한다. 객관적 평가방법인 PESQ (Perceptual Evaluation of Speech Quality) 시험을 통해 제안된 알고리즘의 성능을 평가하였고 기존의 방법보다 MOS 0.1의 성능 개선을 보였다.

부동 소수점 DSP를 이용한 MPEG-4 HVXC 인코더 및 디코더의 실시간 구현 (Real-time Implementation of MPEG-4 HVXC Encoder and Decoder on Floating Point DSP)

  • 강경옥;나훈;홍진우;정대권
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.37-44
    • /
    • 2000
  • 본 논문에서는 인터넷 폰, 디지털 이동통신 등과 같이 낮은 비트율이 요구되는 분야에 사용될 수 있는 MPEG-4 오디오의 HVXC(Harmonic Vector eXcitation Coding) 알고리즘을 부동 소수점 DSP인 TMS320C6701에 실시간 구현한 내용을 기술한다. 실시간 동작을 위한 하드웨어 구조를 채택하였으며, 소프트웨어 최적화의 경우 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어 및 어셈블리 언어 레벨의 최적화를 수행하였다. 또한, DSP의 내부 프로그램 메모리의 프로그램 캐쉬로의 활용, DSP의 내부 데이터 메모리의 영역의 중첩 활용 및 background DMA 방식을 이용한 최적화를 수행하였다. 최적화 결과 2kbps및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있으며, 인코더의 경우 2kbps의 경우에는 최적화 전에 비해 약 96% 정도로 수행시간을 단축하였다. 또한, 비공식 주관품질 평가에 의하면 2kbps의 비트율에서 약 MOS 2.45를 얻었다.

  • PDF

고해상도 영상에 대한 MPEG-2 / H.264 / HEVC 비디오 코덱의 성능 비교 분석 (A Performance comparison of HEVC with H.264 and MPEG-2 for HD Sequences)

  • 이하현;김종호;김휘용;최진수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.192-195
    • /
    • 2011
  • 본 논문에서는 JCT-VC(Joint Collaboration Team on Video Coding)에서 표준화가 진행 중인 HEVC(High Efficiency Video Coding)의 Test Model 인 HM1.0과 현재 디지털 방송, 통신, 저장 매체 등 다양한 응용 분야에 사용되고 있는 범용 비디오 코덱들 간의 객관적, 주관적 측면에서의 부호화 성능을 비교한다. 이를 통해 HEVC의 현재 성능 수준에 대한 평가 결과를 보이고, 활용 가능성에 대해 결론을 맺는다. 비교 대상 코덱으로는 H.264/AVC 표준의 S/W 기반인 VideoLAN Project의 x264와 MPEG-2 표준으로 Harmonic사의 H/W기반의 최신형 실시간 인코더인 Electra8000을 사용하였다. 총 5개의 HD(1920x1080)영상에 대한 객관적 성능 비교 결과, HM1.0이 x264 대비 평균 44.93%의 BD-rate 감소와 평균 1.65%의 BD-PSNR 증가를 보였고, Electra8000에 대해서도 월등히 높은 성능차를 보였다. 주관적 화질 비교 결과 동일 PSNR 조건하에서 HM1.0이 범용 비디오 코덱들보다 주관적 화질이 유사하거나 좀 더 나음을 보였다.

  • PDF

MDCT 도메인에서 오디오 신호 특징을 고려한 초광대역 코덱 개선 (Enhancement of Super-wideband Coder by Considering Audio Feature in MDCT Domain)

  • 홍기봉;정규혁;이인성
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.129-136
    • /
    • 2011
  • 본 논문에서는 입력신호에 따라 효율적인 부호화를 위해 다중모드를 가지는 초광대역 부호화기를 제안하였다. 최근에 개발된 G.718기반의 초광대역 확장 코덱은 초광대역에 존재하는 오디오 신호를 부호화하기 위하여 Generic모드와 Sinusoidal모드로 신호를 분류하여 부호화 하지만, 현악기, 관현악기와 같은 오디오 신호에 존재하는 멀티플 피치 및 하모닉 성분과 타악기와 같은 오디오 신호에 존재하는 Individual-Line 성분을 효율적으로 부호화하지 못하였다. 제안하는 방법은 오디오 신호에 존재하는 하모닉과 Individual-Line성분의 특징을 고려하여 모드를 세분화하였다. 성능평가를 위하여 객관적인 평가로 MDCT 도메인에서 SNR을 이용하였으며 MUSHRA 테스트를 통해 주관적인 평가를 하였다. 실험 결과 제안한 방법은 기존의 G.718 초광대역 부호화기보다 Individual-Line신호 경우 약 3dB, 하모닉 신호의 경우 약 0.8dB 높은 SNR을 보였으며 MUSHRA 테스트 역시 평균 5점 음질 향상을 확인하였다.

음성 및 음악을 위한 저 전송률 다중모드 하모닉 변환 여기 부호화기 (Low Bit Rate Multi Mode Harmonic Transform Excitation Coding for Speech and Music)

  • 김종학;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.525-528
    • /
    • 2001
  • 본 논문은 음성 및 음악을 위한 새로운 4kbps 다중 모드 하모닉 변환 여기 부호화 방법을 제안한다. 제안된 부호화방법은 음성/음악 분류기에 의해 분류된 신호를 각각 하모닉-잡음 여기모델과 MLT 여기모델로 부호화한다. 하모닉-잡음 여기모델에서는 전이구간과 유/무성음 혼합신호의 모델링오차 개선을 위해 MP(Matching Pursuit)방법과 혼합된 잡음스펙트럴을 표현하기 위한 캡스트럽 LPC 잡음 모델, 빠른 정현파 합성법을 제안한다. 음악에서는 비트할당 효율을 높이기위한 LP 적응 피크 분석을 적용한 MLT(Modulated Lapped Transform) 부호화 방법을 제안한다. 제안된 방법을 적용한 4kbps 음성부호화 방법은 전이구간에서의 향상된 모델링 구조를 보여주었으며, 주관적음질 평가 8kbps QCELP 보다 MOS 0.2 정도 향상된 결과를 얻었다.

  • PDF

VHOL을 이용한 MPEG-4 HVXC 복호화기 구현 (Implementation of MPEG-4 HVXC decoder with VHDL)

  • 김구용;임강희;차형태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.465-468
    • /
    • 2001
  • MPEG-4 Parametric Coding 중 저 비트율로 음성신호를 부호화하는 HVXC(Harmonic Vector excitation Ending)의 복호화 모듈인 LSP 합성필터와 무성음 합성부, 유성음 합성부를 VHDL을 이용하여 구현하였다. MPEG-4 HVXC의 복호화 과정은 코드북을 이용하여 LSP 계수, VXC signal, 그리고 Spectral Envelop이 복호화 되어 각각 LSP 역필터, 무성음과 유성음 합성단을 통과하여 LPC계수와 유,무성음 여기신호로 변환된 후 LPC 합성필터링 과정을 거쳐 최종적으로 음성신호를 출력시킨다. LSP inverse filter에서 사용되는 cosine함수값을 위하여 Table based Approximation을 이용하여 적은 양의 Table 값을 사용하여 정확하고 고속의 cosine 연산을 수행하였다. VXC 복호화 과정에서는 신호의 중복성을 제거하는 Hidden Address in LSH 방법을 사용하여 코드북의 크기를 줄였다. 유성음 합성단에서는 IFFT 모듈을 이용하여 연산속도를 증가 시켰다. 최종적으로 위와 같이 구현된 시스템을 Simulation을 통해 Software 검증을 하였다.

  • PDF

향상된 2.4kbps 하모닉 스토케스틱 여기 음성 부호화 방법 (Enhanced 2.4kbps Harmonic Stochastic Excitation Coding)

  • 김종학;신경진;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.831-834
    • /
    • 2000
  • 본 논문은 주파수 전이신호와 시간 전이 신호에 대해서 고조파 잡음 여기 방법과 시간 분리 여기 방법을 적용한 2.4kbps 음성부호화 방법을 제안한다. 혼합 여기 부호화 방법은 주기 신호와 비 주기 신호를 효과적으로 표현하기 위해 하모닉 잡음 모델을 사용한다. 혼합신호에 대한 잡음 성분은 캡스트럴 분석 방법을 사용함으로써 추출되고, AR(Autoregressive Model) 모델에 의해 표현된다. 시간 전이구간 신호에서의 모호한 음성을 효과적으로 제거하기 위한 또 다른 방법이 제안된다. 제안된 시간 분리 방법은 시간 에너지 변화정도를 관찰함으로써 전이 시점을 감지하고 다른 시간 길이를 가지는 두 블록으로 분리하여 분석한다. 시간 분리 방법은 분석을 위한 비대칭 윈도우와 합성에서의 위상 합성 방법을 포함한다. 제안된 방법을 사용한 2.4kbps 음성부호화 방법은 주관적 음질 평가에서 전이구간에서의 지각적 음질의 향상을 보여주었으며, 원본 음성 스펙트럼과의 고조파 비 매칭에 의한 윙윙거리는 기계적인 잡음을 감소시킨다.

  • PDF

TMS320C6701 DSP용 MPEG-4 오디오 HVXC 부호기의 최적화 라이브러리 개발 (Library Optimization of the MPEG-4 Audio HVXC Coder using TMS320C6701 DSP)

  • 나훈;이지웅;강경옥;임영권;홍진우;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.197-200
    • /
    • 1999
  • MPEG-4 오디오 부호기의 일부인 HVXC(Harmonic and Vector excitation Coding) 부호기는 음성의 무성음 구간에서는 CELP 코덱, 유성음 구간에서는 MBE 코덱을 이용하여 부호화하는 구조로서, 많은 연산량을 필요로 하여 범용DSP를 이용한 실시간 구현의 장애요소로 작용한다. 본 논문에서는 TMS320C6701 DSP를 이용하여 많은 연산 시간을 요하는 함수들에 대한 C언어 및 어셈블리 레벨의 최적화를 수행하여 HVXC 함수들의 실행시간을 단축하고 이를 라이브러리화 하여 실시간 구현에 이용가능 하도록 하였다.

  • PDF

가변 대역폭 필터를 이용한 음성신호의 AM-FM 성분 분리에 관한 연구 (Decomposition of Speech Signal into AM-FM Components Using Varialle Bandwidth Filter)

  • 송민;이희영
    • 음성과학
    • /
    • 제8권4호
    • /
    • pp.45-58
    • /
    • 2001
  • Modulated components of a speech signal are frequently used for speech coding, speech recognition, and speech synthesis. Time-frequency representation (TFR) reveals some information about instantaneous frequency, instantaneous bandwidth and boundary of each component of the considering speech signal. In many cases, the extraction of AM-FM components corresponding to instantaneous frequencies is difficult since the Fourier spectra of the components with time-varying instantaneous frequency are overlapped each other in Fourier frequency domain. In this paper, an efficient method decomposing speech signal into AM-FM components is proposed. A variable bandwidth filter is developed for the decomposition of speech signals with time-varying instantaneous frequencies. The variable bandwidth filter can extract AM-FM components of a speech signal whose TFRs are not overlapped in timefrequency domain. Also, amplitude and instantaneous frequency of the decomposed components are estimated by using Hilbert transform.

  • PDF

계층구조 음성 부호화기를 위한 지연 없는 MDCT 구조 (Delayless MDCT for Scalable Speech Codec)

  • 성호상;박호종
    • 한국음향학회지
    • /
    • 제26권3호
    • /
    • pp.102-108
    • /
    • 2007
  • 고성능 계층구조 음성 부호화기는 매우 낮은 전송율의 1차 계층과 미세 계층구조를 가지는 2차 계층을 요구하고, 이는 각 계층에서 하모닉 부호화기와 MDCT 기반 변환 부호화기를 사용하여 구현할 수 있다. 그러나 이 구조는 하모닉 부호화기와 변환부호화기에서 각각 독립적인 주파수 변환이 필요하고 각 변환에서 발생하는 시간지연이 누적되어 전체 부호화기의 시간지연이 증가하는 문제를 가진다. 본 논문에서는 시간지연이 누적되는 문제를 해결하기 위하여 2차 계층의 MDCT가 1차 계층의 Look-Ahead 영역을 공유하도록 하고 이 때 발생하는 MDCT 동작의 오류를 분석하고 이 성분을 IMDCT출력에서 제거하는 새로운 MDCT동작 구조를 제안한다 제안한 지연 없는 MDCT구조를 위하여 추가로 전송할 정보는 없으며 동등한 부호화 성능을 유지하면서 시간지연을 감소시켜 부호화기 성능을 크게 향상시킨다.