• 제목/요약/키워드: Digital Speech coding

검색결과 35건 처리시간 0.024초

유무선망에서 사용되는 디지털 음성 부호화 기술 동향 (Digital Speech Coding Technologies for Wire and Wireless Communication)

  • 윤병식;최송인;강상원
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.261-269
    • /
    • 2005
  • 디지털 음성 부호화기는 디지털 통신 시스템의 음성 압축 수단으로 이용되어 왔으며 심한 채널에러와 한정된 주파수 자원과 같은 디지털 무선 통신 시스템 환경에 적합하게 더욱 발전해왔다. 또한 디지털 통신 기술의 비약적인 발전에 따라 사용자는 더욱 높은 수준에 해당하는 음성 서비스를 요구하게 되고 그로 인하여 단순히 의사 전달에 해당하는 음성 서비스에서 높은 수준의 멀티미디어 콘텐츠들을 수용할 수 있는 음성 및 오디오 부호화기의 기술개발로 급격히 전환 되고 있다. 본 논문에서는 유선 및 무선 디지털망에서 사용되어지는 음성 / 오디오 부호화기의 기술에 대하여 살펴보고 이와 관련된 표준화 활동 및 기술동향에 대하여 알아본다. 또한 향후 유무선 디지털망의 발전에 따른 디지털 음성 / 오디오 부호화기술의 발전 방향에 대하여 언급한다.

심층 신경망을 이용한 음성 신호의 부호화 이력 검출 (Coding History Detection of Speech Signal using Deep Neural Network)

  • 조효진;장원;신성현;박호종
    • 방송공학회논문지
    • /
    • 제23권1호
    • /
    • pp.86-92
    • /
    • 2018
  • 본 논문에서는 디지털 음성 신호의 부호화 이력을 검출하는 방법을 제안한다. 음성 신호를 디지털 방식으로 전송 또는 저장할 때 데이터양을 줄이기 위해 부호화한다. 따라서 음성 신호 파형이 주어질 때, 해당 신호가 원본인지 부호화된 신호인지 판단하고, 만일 부호화 되었다면 부호화 횟수를 검출하는 부호화 이력 검출 과정이 필요하다. 본 논문에서는 12.2kbps 비트율의 AMR 부호화기에 대하여 원본, 단일 부호화, 이중 부호화 여부를 판단하는 부호화 이력 검출 방법을 제안한다. 제안한 방법은 입력 음성 신호에서 음성 고유의 특성 벡터를 추출하고, 해당 특성 벡터를 심층 신경망으로 모델링 하는 방법을 사용한다. 본 논문에서 제안하는 특성 벡터가 일반적인 스펙트로그램으로부터 추출한 특성 벡터보다 우수한 부호화 이력 검출 성능을 제공하는 것을 확인하였다.

디지털 이동통신 채널상의 14Kbps SBC-APCM(AQB)를 위한 비트선택적 에러정정부호 (Bit-selective Forward Error Correction for 14Kbps SBC-APCM (AQB) over Digital Mobile Communication Channels)

  • 김민구;이재홍
    • 대한전자공학회논문지
    • /
    • 제27권6호
    • /
    • pp.821-828
    • /
    • 1990
  • A forward error correction (FEC) technique is presented for speech data in 16 Kbps digital mobile communications. 14Kbps SBC-APCM(AQB) and QPSK are used as speech coding and modulation techniques, respectively. Because each bit in a speech data block had different importance, applying FEC to speech data bit-selectively in more effective than applying FEC to all speech data equally. To select bits in a speech data block to be protected by FEC the bit error sensitivity of each bit is computed. For a few BCH and Reed-Solomon codes used as bit-selective FEC the performance of the coding technique is computed.

  • PDF

디지털 이동통신을 위한 음성 부호기의 성능 분석 (A Performance Analysis of the Speech Coders for Digital Mobile Radio)

  • 정영모;이상욱
    • 대한전자공학회논문지
    • /
    • 제27권4호
    • /
    • pp.491-501
    • /
    • 1990
  • Recently, four speech coding techniques, namely, SBC-APCM(sub-band coding adaptive PCM), RPE-LPC(regualr pulse excitation linear predictive codec), MPE-LTP(multi-pulse excited long-term prediction) and CELP (code-excited linear prediction) are proposed for digital mobile radio applications. However, a performance comparison of these coders in the Rayleigh fading environment has not been made yet. In this paper, the performances of the four spech coders in the random bit error and burst error environment are investigated. For the channel coding of SBC-APCM, RPE-LPC and MPE-LTP, the sensitivity of output bit stream is measured and a bit selective forward error correction is provided acording to the measured bit sensitivity. And for an attempt to improve the performance of CELP, an optimum quantizer is applied for transmitting scalar quantities in CELP. However, an improvement over the conventional approach is found to be negligible. For the channel coding of CELP, Reed-Solomon code, Golay code, convolutional code of rate 1/2 shows the best performance. Finally, from the simulation results, it is concluded that CELP is the best candidate for digital mobile radio and is followed by MPE-LTP, SBC-APCM and RPE-LPC.

  • PDF

RPE-LTP와 VSELP 음성부호화기의 비교에 관한 연구 (The Study of Comparison between RPE-LTP and VSELP Speech Coder)

  • 박대덕;김화준;심재훈;유재희;정하봉;서정하
    • 한국통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.1838-1847
    • /
    • 1994
  • 현재 북미, 유럽, 일본 등에서는 디지털 이동 통신용 음성부호화 방식의 표준을 확정하여 세부기술을 경쟁적으로 개발하고 있으나, 아직까지 우리나라는 이를 확정하지 못하고 있는 실정이다. 본 논문에서는 유럽 표준인 RPE-LTP와 북미 표준인 VSELP 알고리즘을 소스 코팅에 중점을 두어 연구, 비교 및 검토하였다. 각 음성부호화기에 대해 종합적으로 분석 및 비교한 후, 성능 개선 방안에 대하여 논의하였다. 또한, 실시간 처리에 가장 큰 영향을 미치는 연산 횟수를 계산, 비교하였다. 아울러 각 부호화기의 알고리즘을 구체화하여 한국인 음성데이타에 대하여 모의 실험을 수행하였으며, 모의 실험 평가결과로서 구간 신호대 잡음비와 5-포인트 MOS를 비교하였다. 연산횟수는 VSELP 부호기의 곱센연산횟수가 가장 많은 것으로 나타났다. 26가지 음성 데이타에 대하여 구간 신호대 잡음비는 VSELP가 RPE-LTP에 비해 큰 것으로 계산되었고, 5-포인트 MOS 실험을 실시한 결과 VSELP가 RPE-LTP에 비해 음질이 동등하거나 보다 우수한 것으로 평가되었다.

  • PDF

Low Bit Rate을 고려한 8kbps FBD-MPC 방식에 관한 연구 (A Study on 8kbps FBD-MPC Method Considering Low Bit Rate)

  • 이시우
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.271-276
    • /
    • 2014
  • 유성음원과 무성음원을 사용하는 음성부호화 방식에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 음질저하현상이 나타난다. 본 연구에서는 연속음성에서 무성자음을 포함한 천이구간을 탐색, 추출하고 주파수대역에서 근사합성하는 8kbps의 멀티펄스 음성부호화 방식(FBD-MPC)를 제안하였다. 기존의 8kbps MPC와 FBD-MPC의 SNRseg를 평가한 결과, FBD-MPC의 남자음성에서 0.5dB, 여자음성에서 0.2dB 개선된 것을 확인할 수 있었다. 결국, MPC에 비해 FBD-MPC의 SNRseg가 개선되어 음성파형의 일그러짐을 제어할 수 있었으며, 본 방법은 셀룰러폰이나 스마트폰과 같이 Low Bit Rate의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

연속음성에서 천이구간의 탐색, 추출, 근사합성에 관한 연구 (A Study on a Searching, Extraction and Approximation-Synthesis of Transition Segment in Continuous Speech)

  • 이시우
    • 한국정보처리학회논문지
    • /
    • 제7권4호
    • /
    • pp.1299-1304
    • /
    • 2000
  • In a speed coding system using excitation source of voiced and unvoiced, it would be involved a distortion of speech quality in case coexist with a voiced and an unvoiced consonants in a frame. So, I propose TSIUVC(Transition Segment Including UnVoiced Consonant) searching, extraction ad approximation-synthesis method in order to uncoexistent with a voiced and unvoiced consonants in a frame. This method based on a zerocrossing rate and pitch detector using FIR-STREAK Digital Filter. As a result, the extraction rates of TSIUVC are 84.8% (plosive), 94.9%(fricative), 92.3%(affricative) in female voice, and 88%(plosive), 94.9%(fricative), 92.3%(affricative) in male voice respectively, Also, I obain a high quality approximation-synthesis waveforms within TSIUVC by using frequency information of 0.547kHz below and 2.813kHz above. This method has the capability of being applied to speech coding of low bit rate, speech analysis and speech synthesis.

  • PDF

13kbps QCELP에서 8kbps QCELP로의 음성 패킷 변환 기술 (Voice Packet Conversion from 13kbps QCELP to 8kbps QCELP Speech Codecs)

  • 박호종;권상철
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.71-76
    • /
    • 1999
  • 디지털 이동 통신 시스템에서 서로 다른 음성 압축기를 사용하는 단말기 사이의 통신은 음성 신호를 두 번의 압축/복원 과정을 거쳐 전달하므로 음질 저하, 계산량 증가, 전달 지연 증가 등의 문제를 발생시킨다. 본 논문에서는 이와 같은 단말기 사이의 통신에서의 문제점을 해결하기 위하여 음성 패킷 변환 방법을 제안하고, 13kbps QCELP 패킷을 8kbps QCELP 패킷으로 변환하는 방법을 개발한다. 여러 음성 신호를 이용한 모의 실험 결과, 본 논문에서 개발된 패킷 변환기가 짧은 음성전달 지연과 약 33%의 계산량으로 일반적인 이중 압축 방법과 동등한 음질의 음성 신호를 합성하는 것을 확인하였다.

  • PDF

멀티펄스의 위치보정 방법을 이용한 8kbps PC-MPC에 관한 연구 (A Study on 8kbps PC-MPC by Using Position Compensation Method of Multi-Pulse)

  • 이시우
    • 디지털융복합연구
    • /
    • 제11권5호
    • /
    • pp.285-290
    • /
    • 2013
  • 유성음원과 무성음원을 사용하는 멀티펄스 음성부호화 방식에 있어서, 대표구간의 멀티펄스를 사용하는 경우에 유성음의 합성음성파형에서 일그러짐이 나타난다. 이것은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성신호가 정규화되는 것이 원인으로 작용한다. 이것을 해결하기위하여 본 논문에서는 피치구간마다 멀티펄스의 위치를 보정하는 방법(PC-MPC)을 제시하였으며, 기존의 MPC와 멀티펄스 위치를 보정한 PC-MPC의 $SNR_{seg}$를 평가한 결과, PC-MPC의 남자음성에서 0.4dB, 여자음성에서 0.5dB 개선된 것을 확인할 수 있었다. 결국, MPC에 비해 PC-MPC의 $SNR_{seg}$가 개선되어 음성파형의 일그러짐을 제어할 수 있었으며, 본 방법은 셀룰러폰이나 스마트폰과 같이 Low Bit Rate의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

FIR-STREAK 디지털 필터를 사용한 피치추출 방법에 관한 연구 (A Study on Pitch Extraction Method using FIR-STREAK Digital Filter)

  • 이시우
    • 한국정보처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.247-252
    • /
    • 1999
  • 낮은 Bit Rate의 음성부호화 방식을 구현하기 위해 필요한 파라메터로서 피치정보가 있다. 연속음성에서 정규화 된 피치정보를 추출하는 방법에서는 음성의 시작이나 끝부분, 무성음 혹은 무성자음과 유성음이 같이 존재하는 프레임, 프레임 경계부에서 피치추출 오류가 발생한다. 이러한 오류를 억제하기 위하여 본 연구에서는 FIR-STREAK 필터의 출력 잔차신호에서 피치정보를 얻는 개별 피치추출법을 제안하였다. 이 방법은 피치정보를 정규화하지 않고 연속적으로 변위하는 피치간격을 적절하게 나타낼 수 있다. 실험결과, 개별 피치추출법은 음성의 시작이나 끝부분, 무성음 혹은 무성자음과 유성음이 같이 존재하는 프레임, 프레임 경계부에서도 유효한 피치정보를 얻을 수 있음을 알 수 있었다. 이 방법은 음성부호화방식, 음성분석, 음성합성, 음성인식등에 응용할 수 있을 것으로 기대된다.

  • PDF