보이스 전보 시스템 구현을 위한 저가형 음성파형 부호화 알고리즘

On a Speech Coding Algorithm for Low Cost Implementation of Voice Telegram System

  • 발행 : 2000.02.01

초록

전보는 우리에게 아주 필요한 생활수단으로 긴급한 내용을 전달하거나, 바쁜 생활을 대신하여 애경사를 맞은 상대방에게 뜻을 전달하는 중요한 수단으로 활용되고 있다. 전보를 처리하는 과정이 첨단 정보통신의 발달로 인해 점점 편리해 지고 있는 반면 전보의 내용은 여전히 문자위주의 정보전달에서 벗어나지 못하고 있다. 보이스 전보는 사용자의 목소리를 문자와 함께 전달하는 것이다. 목소리가 함께 전달됨으로써 발신자의 정감과 분위기를 수신자에게 전달하여 보다 다양한 의미의 메시지를 알릴 수 있다. 그러나 목소리 정보는 데이터량이 많아 그대로 사용하게 되면 큰 메모리와 고가의 프로세서가 필요하게 된다. 본 논문에서는 보이스 전보 시스템에 필요한 간단하고 저가인 음성파형 부호화 알고리즘을 새로이 제안한다. 먼저 유성음 부분에서, 파형의 피치 주기별로 유사도를 측정하여 유사도가 높은 파형은 피치와 진폭 값만 저장하여 압축하고 유사도가 낮은 파형은 형태를 저장한다. 실험결과 45%로 압축할 때 MOS 4의 음질을 얻을 수 있었다.

A telegram has been used to transmit the emergency news or celebration message. So, it has been very important media in our life. Although the telegram processing is more and more convenient, on the other hand, the telegram service contains only text message. The voice telegram is that delivering user's voice with text message. So, the voice telegram can be delivered sender's emotions and feelings. However, since voice information contains lots of data, large memory size and high cost processor are needed to deliver itself. In this paper, we proposed a new speech waveform coding method that has low complexity and low cost implementation for the voice telegram system. First, we fixed one basic speech waveform per pitch period and measured the waveform similarity between basic and neighbor speech waveform. Second, if the similarity satisfied threshold values, we compress the neighbor speech waveform with pitch and magnitude value per pitch period and if not, we save speech waveform. When the compression is about 45%, we obtained about 4 point in MOS.

키워드

참고문헌

  1. Digital Coding of Wave forms-Principles and Applicants to Speech and Video N. S. Jayant;P. Noll
  2. IEEE Proc. of ISCA'94 v.6 no.3 On a new predictor for the waveform coding of speech signal by using the dual autocorrelation and the sigma-dalta technique M. J. Bae;D. S. Kim;H. Y. Jeon;S. G. Ann
  3. 대한전자공학회지 v.14 no.1 On Detecting the Steady State Segments of Speech Waveform by using the Normallized AMDF 배명진;김을제;안수길
  4. Digital Speech A. M. Kondoz
  5. Digital Processing of Speech Signals L.R. Rabiner;R.W. Schafer
  6. 디지탈 음성부호화 배명진
  7. ICASSP v.86 Diphone Synthesis Using Overlap-add Technique for Speech Waveforms Concatination F. Chapentier;M. G.Stella
  8. Speech Comm. v.9 no.r Pitch-synchronous waveform processing techniques of test to-speech synthesis using diphones E. Moulines;F. Charpentier