• Title/Summary/Keyword: 고음질 음성

Search Result 30, Processing Time 0.022 seconds

A Study on the Compression Method for Restricted DB in High Quality Speech Synthesis (제한된 고음질 음성 합성용 DB 압축법에 관한 연구)

  • 박형빈
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.265-268
    • /
    • 1998
  • 일반적으로 음성 합성용 데이터 베이스에서는 고음질을 유지할 수 있는 파형 부호화법을 주로 사용한다. 그것은 파형 부호화법이 발성자의 개성과 메시지 정보를 보존하기 때문에 음질의 명료성이 우수하기 때문이다. 그러나 기존에는 파형 부호화법을 적용해서 음성 파형 자체의 잉여성분만을 제거한 후 합성용 데이터 베이스로 사용하기 때문에 음성 합성용 데이터 베이스의 크기가 커지는 단점을 가진다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해서 기존의 운율조절법을 통해서 음성 합성용 데이터 베이스를 압축하는 방법을 제안한다. 결과적으로 제안한 방법을 사용함으로써 고음질을 갖는 음성 합성용 데이터 베이스를 가질 수 있었고 데이터 베이스의 크기도 줄일 수 있었다.

  • PDF

On a pitch alteraton of speech technique using the asymmetry weighting (비대칭 weighting을 사용한 음성 피치변경법)

  • 함명규;나덕수;정찬중;배명진
    • Proceedings of the IEEK Conference
    • /
    • 1998.06a
    • /
    • pp.615-618
    • /
    • 1998
  • 음성부호화의 주요목적은 대역 제한된 전송 대역폭에 전송을 하기위한 음성압축, 명료성과 자연성을 유지하는 고음질 음성합성, 그리고 처리 속도등의 요소에 따라 달라진다. 일반적으로 음성 부호화 방법은 파형 부호화범, 신호원 부화화법, 그리고 혼성 부호화법으로 나누어질 수 있다. 이러한 방법으로 전송되어진 음성은 다시 합성을 하게되는데, 이때 고음질을 유지할 수 있는 PSOLA법을 사용하였다. 본 논문에서 제안한 방법으로 전송되어진 음성은 다시 합성을 하게되는데, 이때 고음질에 유지 할 수 있는 PSOLA법을 사용하였다. 본 논문에서 제안한 방법은 기존의 PSOLA 합성법에서 사용되어지는 hanning 윈도우가 음성이 갖는 golttal wave shape의 특성에 적합하지 않다는 것을 이용하여 기존의 hanning 윈도우가 아닌 비대칭성을 가진 새로운 형태의 비대칭 윈도우(asymmetry window)를 제안하였다. 비대칭 윈도우의 형태는 위도우를 중심으로 왼쪽편은 기울기가 심하고, 오른쪽은 기울기가 완만하여 음성의 기울기에 적합한 웨이팅을 갖는 형태이다. 제안한 비대칭 윈도우를 사용하여 PSOLA 합성을 하였을 경우 SNR 2~3dB 정도 향상되었음을 알 수 있다.

  • PDF

A Study on Speech Synthesizer Using Distributed System (분산형 시스템을 적용한 음성합성에 관한 연구)

  • Kim, Jin-Woo;Min, So-Yeon;Na, Deok-Su;Bae, Myung-Jin
    • The Journal of the Acoustical Society of Korea
    • /
    • v.29 no.3
    • /
    • pp.209-215
    • /
    • 2010
  • Recently portable terminal is received attention by wireless networks and mass capacity ROM. In this result, TTS(Text to Speech) system is inserted to portable terminal. Nevertheless high quality synthesis is difficult in portable terminal, users need high quality synthesis. In this paper, we proposed Distributed TTS (DTTS) that was composed of server and terminal. The DTTS on corpus based speech synthesis can be high quality synthesis. Synthesis system in server that generate optimized speech concatenation information after database search and transmit terminal. Synthesis system in terminal make high quality speech synthesis as low computation using transmitted speech concatenation information from server. The proposed method that can be reducing complexity, smaller power consumption and efficient maintenance.

On the Pitch Alteration Methods for a High Quality Speech Synthesis (고음질 합성을 위한 피치변경법)

  • 배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.12 no.2
    • /
    • pp.66-77
    • /
    • 1993
  • 고음질 합성을 위해서는 파형부호화법이 바람직하다. 파형부호화법을 규칙에 의한 음성합성기법에 적용하기 위해서는 메모리용량의 문제와 피치변경법이 해결되어져야 한다.메모리 용량의 문제는 최근 반도체 기술에 의해 극복되어 졌으며 이제는 음원피치변경의 문제가 남아있다. 따라서 본 논문에서는 성도 포먼트의 특성은 변화시키지 않고, 음원피치를 변경시키는 문제에 대해 정리하였다. 먼저 기존의 제안된 몇가지 기법들의 장단점들을 열거한 다음에 우리 연구실에서 제안했던 방법들에 대해 논의하고자 한다.

  • PDF

Design and Implementation of the low power and high quality audio encoder/decoder for voice synthesis (음성 합성용 저전력 고음질 부호기/복호기 설계 및 구현)

  • Park, Nho-Kyung;Park, Sang-Bong;Heo, Jeong-Hwa
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.13 no.6
    • /
    • pp.55-61
    • /
    • 2013
  • In this paper, we describe design and implementation of audio encoder/decoder for voice synthesis. It uses the encoding of difference value of successive samples instead of the original sample value. and has the compression ratio of 4. The function is verified by using FPGA and the performance is measured by the fabricated chip using $0.35{\mu}m$ standard CMOS process. The system clock is 16.384MHz. The measured THD+n is from -40dB to -80dB with frequency variation and the power consumption is about 80mW. It is suited for the mobile application of high audio quality and low power consumption.

Development of G.723.1 Speech Codec Using a Fixed-point DSP(ADSP-2181) (ADSP-2181 DSP를 이용한 G.723.1 음성부호화기 개발)

  • 박정재
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.121-126
    • /
    • 1998
  • 고정 소수점 DSP 인 analog devices 사의 ADSP-2181을 이용하여 실시간 G.723.1 음성부호화기를 개발한 사례이다. G.723.1은 ITU에서 개발한 세계 표준 음성 부호화기로 낮은 전송율에서 고음질을 얻을 수 있다. 본 논문에서는 고정 소수점 DSP를 이용하여 부호화기를 갭라하는데 필요한 사항들을 제시하였다. 먼저 1절에서는 DAM성 부호화기의 특성에 대한 개괄을 설명하고, 2절에서는 G.723.1 부호화기의 특징을, 3절에서는 고정소수점 DSP를 이용하여 개발하는 과정을, 4절에서는 구현결과를 분석하였으며, 마지막으로 5절에서 결론을 맺는다.

  • PDF

On a Pitch Alteration Technique in the V/UV Spectrum for High Quality Speech Synthesis Technique (고음질 합성방식용 V/UV 스펙트럼상의 피치변경법에 관한 연구)

  • Jo, Wang-Rae;Bae, Myung-Jin;Kim, Dong-Sung
    • The Journal of the Acoustical Society of Korea
    • /
    • v.15 no.6
    • /
    • pp.99-103
    • /
    • 1996
  • Most waveform coding techniques attempt to reduce redundancy of speech signal while preserving the shape of the waveform. In speech synthesis, wavefrom coding methods are used to the synthesis by rule for high quality speech. However, it is difficult to apply the waveform coding to the synthesis by rule because the parameters of the wavefrom coding cannot be classified as either the excitation or the vocal tract parameters. The proposed method shows little spectrum distortion of 2.7% or less for 50% pitch changes. It also achieves smooth connection of wavefrom magnitudes among the frames by compensating the phase in time domain.

  • PDF

Development of portable game device with uncompressed HD video and high quality sound output (비압축 HD급 영상 및 고음질 음성 출력을 지원하는 휴대용 게임기 구현)

  • Lee, Chung-Hee;Lee, Jong-Hun;Jung, Woo-Young
    • Proceedings of the KIEE Conference
    • /
    • 2006.10c
    • /
    • pp.391-393
    • /
    • 2006
  • In this paper, we develop a portable game device with uncompressed HD video and high quality sound output. Portable game devices support not only game function but also various complex functions recently. It especially supports TV-Out port to play realistic game, connecting a large screen display device. But the video and audio output signals of conventional TV-out port have the low performance and these signals are analog output. So, it is difficult that the users enjoy realistic game with benefit of high resolution digital TV. We propose the game device output with uncompressed digital signal, which has no delay of video/audio signal, also has strong immunity to external noise. Since it supports a high resolution video and high quality sound, users can playa realistic game. First, we implement the HDMI to the game device and we test reliability with the various resolutions video inputs and audio inputs. The proposed method can be applied multimedia devices requiring high performance output function as well as portable devices.

  • PDF

Design and Implementation of a DAB Mobile for DAB Reception (DAB 수신을 위한 DAB 모바일 단말기 설계 및 구현)

  • 정상진;은성배
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.855-858
    • /
    • 2004
  • DAB(Digital Audio Broadcasting)는 음성, 동영상 및 데이터 신호를 디지털 방식으로 변조 위성 망이나 지상 망을 통해 고정 또는 휴대용 및 차량용 수신기에 제공하는 방송 서비스이며, 이동 중에도 PDA나 차량용 단말기를 통해 CD 및 DVD 급의 고음질, 고화질 양방향 데이터 신호를 주고 받을 수 있는 서비스 이다. 이에 본 논문은 모바일 단말기에서 DAB 방송을 수신하기 위해 폰과 DAB 모듈사이의 SPI 통신을 연구하며, 사용자 인터페이스 기능을 위한 메뉴를 추가하여 DAB 방송 수신이 가능하도록 디자인 한다. 결과적으로, DAB 모듈을 이용하여 차세대 서비스로 각광 받고 있는 DAB 방송을 수신 할 수 있다.

  • PDF

Speech Codec Standardization for Super-wideband Communication (초광대역 음성통화 서비스를 위한 압축 기술 및 표준화)

  • O, Eun-Mi
    • Broadcasting and Media Magazine
    • /
    • v.19 no.1
    • /
    • pp.48-55
    • /
    • 2014
  • One of the recent noticeable evolutions in mobile communication systems is that wideband-codec is deployed rapidly in VoLTE (Voice over Long Term Evolution) service or HD voice. This paper is concerned with next generation HD voice or VoLTE service that is coined to describe high quality communication with super-wideband voice codec. 3GPP EVS (Enhanced Voice Service) Codec is being standardized to develop the super-wideband voice codec. This paper deals with the codec design constraints, performance requirements, the status of standardization, and finally perspective on VoLTE service in future.