• 제목/요약/키워드: Digital Speech coding

검색결과 35건 처리시간 0.021초

음성 패킷을 이용한 채널의 에러 정보 전달 (Transmission of Channel Error Information over Voice Packet)

  • 박호종;차성호
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.394-400
    • /
    • 2002
  • 디지털 음성 통신에서 송신하는 음성 패킷의 전송 에러율을 알면 송신 채널 상황에 적합한 압축 동작을 통하여 전체 통신의 품질을 향상시킬 수 있다. 그러나 현재의 이동통신과 인터넷 통신에서는 음성 패킷의 전송 에러정보를 알려주는 프로토콜이 지원되지 않는다. 본 논문에서는 이를 해결하기 위하여 채널의 전송 에러 정보를 음성 패킷에 삽입하여 실시간으로 전달하는 방법을 제안한다. 제안하는 채널 에러 정보 삽입 방법은 ACELP (algebraic code-excited linear predictin) 코드벡터의 펄스 위치의 상관 관계를 이용하며, 이를 통하여 추가정보 삽입에 의한 음질 저하를 막고 오인식율을 줄일 수 있다. 다양한 음성 데이터를 이용하여 제안한 방법의 성능을 측정하였으며 음질의 저하가 거의 발생하지 않고 정보의 검출 능력과 오인식율에서 만족할 만한 성능을 가지는 것을 확인하였다.

16Kbps SBC의 Rayleigh 페이딩 채널에러에 대한 강인성 연구 (A Study on the Robustness of a 16Kbps SBC over the Rayleigh fading Channel Error)

  • 오수환;이상욱
    • 한국통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.287-295
    • /
    • 1986
  • 본 논문에서는 디지털 이동 무선통신을 위한 음성신호와 부호화 기법으로 SBC(sub-bnad coding)를 제안하고, SBC의 레일리(Rayleigh) 페이딩 채널에서의 음질의 강인성을 컴퓨터 시뮬레이션을 통해 조사하였다. 먼저 레일리 페이딩 채널, 시뮬레이터 및 16-ary DPSK(differential phase shift key) 수신기 모델을 제시한 후, 모델의 타당성을 이론치와 비교하여 입증하였다. 채널에러에 대한 영향은 SNR, LPC(linear predictive codin) 거리척도 및 주관적인 청각조사를 통해 검토하였다. BER(bit error rate) =$10_{-3}$, $10_{-2}$, 5$ imes$$10_{-2}$에 대한 시뮬레이션결과 BER=$10_{-2}$에서도 음성의 이해도는 확인되었으며, BER=5$ imes$$10_{-2}$에서도 음성통신에 사용하기는 충분하였다. 따라서 SBC는 ECC(error correction code) 사용없이 BER=$10_{-4}$~$10_{-2}$정도의 레일리 페이딩 채널에서 디지탈 이동무선통신에 응용이 가능함을 알 수 있었다.

  • PDF

스팩트럼과 스팩트로그램의 이해 (Introduction to the Spectrum and Spectrogram)

  • 진성민
    • 대한후두음성언어의학회지
    • /
    • 제19권2호
    • /
    • pp.101-106
    • /
    • 2008
  • The speech signal has been put into a form suitable for storage and analysis by computer, several different operation can be performed. Filtering, sampling and quantization are the basic operation in digiting a speech signal. The waveform can be displayed, measured and even edited, and spectra can be computed using methods such as the Fast Fourier Transform (FFT), Linear predictive Coding (LPC), Cepstrum and filtering. The digitized signal also can be used to generate spectrograms. The spectrograph provide major advantages to the study of speech. So, author introduces the basic techniques for the acoustic recording, digital signal processing and the principles of spectrum and spectrogram.

  • PDF

음성통신망에서 디지털 오디오 신호 음질개선을 위한 전처리방법 (Preprocessing method for enhancing digital audio quality in speech communication system)

  • 송근배;안철용;김재범;박호종;김석호
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.200-206
    • /
    • 2006
  • 본 논문은 음성 부호화기에서 입력 오디오 신호가 보다 효과적으로 처리되도록 하기 위해 입력오디오신호를 전 처리하는 방법을 소개한다. 이를 위해 본 논문은 잡음억제 및 적응이득제어 방법을 도입한다. 여기서 입력 오디오 신호는 잡음 부가된 신호로 간주되며 그 오디오 신호의 부호화오차신호는 부가된 잡음신호로 간주된다. 입력 오디오 신호는 기존의 잡음억제방식에 따라 잡음신호 즉, 부호화 오차신호가 억제된 뒤 적응이득제어기를 거쳐 최종적으로 음성 부호화기에 인가된다. 결과적으로 이러한 동작을 통하여 입력 오디오 신호의 주파수 스펙트럼 분포가 음성 부호화기 특성에 맞게 재배치된다 이 방법의 하나의 단점은 부호화 오차를 계산하기 위해 사전에 추가적인 부호화 동작이 필요하다는 것이다. 반면, 이 방법은 일반적인 구조를 가지고 있으며 따라서 기존의 여러 음성부호화기에 쉽게 적용될 수 있다는 장점을 가진다. 주관적인 선호도 조사결과 제안된 방법이 복잡한 음악신호로 기인한 성가신 잡음을 사전에 억제해 주며 결과적으로 음질개선을 가져다준다는 것을 확인할 수 있었다.

디지틀 이동 통신용 RPE-LTP 음성 부호화기의 실시간 H/W 구현 (Real-Time H/W Implementation of RPE-LTP Speech Coder for Digital Mobile Communications)

  • 김선영;김재공
    • 한국통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.85-100
    • /
    • 1991
  • 디지틀 이동 통신 시스템 검토에 있어서 고음질 저전송 속도의 음성 부호화기 연구는 가용 주파수 대역의 제한을 극복하여 통신 서비스를 증대시키기 위한 필수 사항의 하나이다. 본 논문에서는 디지특 이동 통신용 13 kbps RPE LTP 음성 부호화기의 구현에 관하여 다루었다. 하나의 DSP칩을 이용하여 양방향 통신방식으로 실시간 구현(DSP 로딩율 약 75%)이 가능함을 나타냈으며, 또한 H/W 구현을 위한 고정소수점 시뮬레이션 및 채널코딩과의 연계를 고려한 각 전송 파리미티의 비트 중요도 분석 결과를 제시하였다.

  • PDF

NEC 7720 DSP를 이용한 SBC codec의 실시간 구현 (Real-Time Implementation of a SBC Codec Using a NEC 7720 DSP)

  • 오수환;이상욱
    • 대한전자공학회논문지
    • /
    • 제23권4호
    • /
    • pp.429-438
    • /
    • 1986
  • In this paper we have designed and implemented a real-time, full-duplex SBC (sub-band coding) codec at 16kbps using a high speed digital signal processor, NEC 7720. The SBC codec employs a QMF(quadrature mirror filter) filter bank based on the tree structures of two-band analysis-synthesis pairs to partition speech signal into 4 octabe bands. Computer simulation has been done to investigate the effect of fixed-point computation of the NEC 7720. Three different performance measures, the conventional signal-to-noise ratio, the informal listening test, and an LPC(linear predictive coding)distance measure, have been used in this simulation. The necessary parameters have been optimized through the simulation. The developed hardware and software have been tested in real-time operation using a hardware emulator.

  • PDF

LSF에서 LPC 계수를 구하는 개선된 알고리즘 (The Revised Transform Algorithm from LSF to LPC)

  • 김향진;이기태;함영희;김형준;임재윤
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.679-682
    • /
    • 1999
  • This paper proposes the LSF or LSP that is the method of using to transfer the speech parameters after processed the speech to LPC, which is digital coding transferring efficiently, for the best quality and the lowest bit rate of parameters. The new revised transform algorithm between LSF and LPC coefficients is proposed. The proposed algorithm eliminates all multiplications, computes fewer operations, and reduces memory buffer sizes.

  • PDF

이동통신망에서 삼자회의를 위한 음성 부호화기의 성능에 관한 연구 (A Comparative Performance Study of Speech Coders for Three-Way Conferencing in Digital Mobile Communication Networks)

  • 이미숙;이윤근;김기철;이황수;조위덕
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.30-38
    • /
    • 1995
  • 본 논문에서는 이동통신망에서 신호 가산방식을 이용한 삼자회의에서의 음성 부호화기 성능을 평가하였다. 두 사람의 섞인 목소리가 다른 회의 참가자에게 전달되는 신호 가산방식은 가장 자연스러운 삼자회의 방식이지만, 아직까지 두 사람의 섞인 목소리를 부호화할 수 있는 유용한 방법은 없다. 본 논문에서는 삼자회의에 신호 가산방식을 적용하기 위해 QCELP, VSELP, RPE-LTP 보코도를 구현하여 평가를 수행하였다. 또한 두 화자의 목소리가 섞인 음성신호에 대한 부호화기의 성능평가를 위해 기존의 음질 평가법을 그대로 사용할 수 없으므로, 본 논문에서는 두 가지 주관적 평가법을 제안하였다. 제안된 방법은 문장 식별법(SD)과 수정된 DMOS(MDOMS) 방법이다. 실험결과에 의하면 VSELP 보코더의 출력음질이 다른 두 보코더에 비해 좋게 나타났다.

  • PDF

ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기 (A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E)

  • 김경태;이민기;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제45권2호
    • /
    • pp.81-89
    • /
    • 2008
  • 광대역 신호는 16 kHz로 표본화되어 50-7000 Hz로 밴드 제한된 신호를 말하며, 전화대역 음성 신호에 비해서 높은 자연성(naturalness)과 명료성(intelligibility)을 가진다. 이런 특징으로 광대역 부호화기는 화상회의, 디지털 AM 방송 및 고음질 음성통신 등에 사용될 수 있다. 본 논문에서는 가변대역 특징을 갖는 광대역 음성 오디오 부호화기를 제안하였다. 제안된 부호화기는 대역분한 구조를 가진다. 저주파 대역은 전화대역 음성 부호화기로 많이 사용되고 있는 8 kbit/s ITU-T G.729나 보다 높은 전송률로 오디오 신호까지 처리할 수 있는 11.8 kbit/s ITU-T G.729 Annex E로 부호화한다. 고주파 대역은 청각 모델을 기반으로 한 파라미터 부호화 방법으로 부호화한다. 제안된 고주파 대역 부호화는 감마톤 필터뱅크(gammatone filterbank)를 이용하여 입력신호를 임계대역으로 분할한 후, 각각의 임계대역 신호를 양자화한다. 저주파 대역 부호화기와 고주파 대역 부호화기는 서로 독립되어 있으므로, 복호화기에서는 채널 조건에 따라 전화대역 합성신호와 광대역 합성신호를 선택할 수 있는 특징이 있다. 성능 평가 결과, 제안된 부호화기는 낮은 전송률과 짧은 지연 시간으로 음성과 오디오 신호 모두에 대해 ITU-T G.722.1 24 kbit/s와 동등한 음질을 제공한다는 것을 확인하였다.

어댑티브 델타 변조 앨고리즘 연구 (A Study on the Adaptive Delta Modulation Algorithm)

  • 심수보
    • 한국통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.113-119
    • /
    • 1983
  • 본 논문은 음성신호 델타 변조(이하 DM이라고 약칭함)에 관한 step size의 적응(adaption)에 대하여 연구한 것이다. 선형 및 지수적인 적응 중에서 지수적 적응 앨고리즘을 채택하고 또 복호기에서의 오차회복시간을 단축시켰다. 그리고 한 앨고리즘에 대해서 비례 적산기를 이용하여 실제적인 논리회로 구성법을 제안하였으며 500Hz의 정현과 신호를 16kHz의 펄스로 표본화하여 제안회로에 대한 타당성을 실험적으로 확인하였다.

  • PDF