• Title/Summary/Keyword: 음성신호

Search Result 1,512, Processing Time 0.029 seconds

Speech synthesis using acoustic Doppler signal (초음파 도플러 신호를 이용한 음성 합성)

  • Lee, Ki-Seung
    • The Journal of the Acoustical Society of Korea
    • /
    • v.35 no.2
    • /
    • pp.134-142
    • /
    • 2016
  • In this paper, a method synthesizing speech signal using the 40 kHz ultrasonic signals reflected from the articulatory muscles was introduced and performance was evaluated. When the ultrasound signals are radiated to articulating face, the Doppler effects caused by movements of lips, jaw, and chin observed. The signals that have different frequencies from that of the transmitted signals are found in the received signals. These ADS (Acoustic-Doppler Signals) were used for estimating of the speech parameters in this study. Prior to synthesizing speech signal, a quantitative correlation analysis between ADS and speech signals was carried out on each frequency bin. According to the results, the feasibility of the ADS-based speech synthesis was validated. ADS-to-speech transformation was achieved by the joint Gaussian mixture model-based conversion rules. The experimental results from the 5 subjects showed that filter bank energy and LPC (Linear Predictive Coefficient) cepstrum coefficients are the optimal features for ADS, and speech, respectively. In the subjective evaluation where synthesized speech signals were obtained using the excitation sources extracted from original speech signals, it was confirmed that the ADS-to-speech conversion method yielded 72.2 % average recognition rates.

Speech Enhancement using the Neural Network Filter (신경망필터를 이용한 음질향상)

  • 김종우;공성곤
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.102-105
    • /
    • 2000
  • 본 논문에서는 잡음환경에서의 음성신호복원(Speech Enhancement) 시스템 구현을 목적으로 한다 이를 위한 적응필터로서 LMS(Least Mean Square)알고리즘 FIR필터를 제안한다. 또 정밀 필터로서 신경망 필터를 제안한다. 잡음환경에서의 음성신호 복원 시스템은 잡음에 의해 왜곡된 음성신호에서 잡음성분만을 제거함으로써 음성신호를 복원하는 시스템이다. 일반적으로 잡음은 시변특성과, 비선형적인 전달특성을 갖는다. 그러므로 파라미터가 고정된 필터로는 제어하기가 힘들다. 이러한 이유로 본 논문에서는 LMS알고리즘 적응필터를 적용한다. 신경망 필터는 오차 역전파 학습 알고리즘에 의해 오차를 최소화하는 방향으로 필터의 파라미터를 수정한다. 제안한 필터로 잡음환경에서의 음성신호복원 시스템을 구성하고, 실험을 통해 필터의 성능을 확인한다.

  • PDF

Noise reduction by whitening of colored noise and Kalman filter (잡음 백색화와 Kalman 필터를 이용한 잡음제거)

  • Jeong Sang-Bae;Hahn Minsoo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.201-204
    • /
    • 2000
  • 음성신호에 섞인 잡음을 처리하기 위해서 단 일 마이크로폰을 이용한 방법이 많이 연구되고 있는데, 그 중에서 Kalman 필터를 이용한 방법은 먼저 음성신호의 모델을 검출하고 잡음이 섞인 신호에서 표준 Kalman 필터를 이용해서 음성신호 성분만을 검출하게 된다. 본 논문에서는 음성신호에 섞인 유색잡음을 백색화하는 방법을 적용하여 Kalman 필터의 잡음제거 성능을 향상시키는 방법을 제안하였다.

  • PDF

Spectrum Filter Algorithm based on Acoustic Model (음향학적 모델에 의한 스펙트럼 필터 알고리즘)

  • Choi, Jae-seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.10a
    • /
    • pp.770-772
    • /
    • 2016
  • 본 논문에서는 음성신호처리 시스템에 유용하게 사용되는 음성신호의 특징 파라미터를 출력하는 스펙트럼 필터모델을 사용하여, 배경잡음 환경 하에서 음성신호 중의 잡음을 제거하는 알고리즘을 제안한다. 따라서 본 논문에서는 배경잡음을 제거할 때 고려해야 할 인간의 청각특성이 포함된 음성의 진폭 스펙트럼에 의한 청각필터의 특성을 도입한다. 본 논문의 실험에서 사용한 성능평가의 방법으로는 음절 명료도의 테스트에 적합한 주관적인 평가인 주파수 영역에서의 스펙트럼 왜곡률(Spectral Distortion, SD)을 사용하여 실험결과를 비교하고 고찰한다.

  • PDF

Analysis of Eigenvalues of Covariance Matrices of Speech Signals in Frequency Domain (음성 신호의 주파수 영역에서의 공분산행렬의 고유값 분석)

  • Kim, Seonil
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.05a
    • /
    • pp.47-50
    • /
    • 2015
  • Speech Signals consist of signals of consonants and vowels, but the lasting time of vowels is much longer than that of consonants. It can be assumed that the correlations between signal blocks in speech signal is very high. Each speech signal is divided into blocks which have 128 speech data. FFT is applied to each block. Low frequency areas of the results of FFT is taken and Covariance matrix between blocks in a speech signal is extracted and finally eigenvalues of those matrix are obtained. It is studied that what the distribution of eigenvalues of various speech files is. The differences between speech signals and noise signals from cars are also studied.

  • PDF

Chaotic Speech Secure Communication Using Feedback Masking Techniques (피드백 마스킹 기법을 사용한 카오스 음성비화통신)

  • 이익수;여지환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.353-356
    • /
    • 2002
  • 본 논문은 카오스 신호를 이용하여 안전한 음성신호의 전송을 위한 아날로그 비화통신 시스템의 성능분석에 관한 연구이다. 기존의 카오스 동기화 및 카오스 변조통신 알고리즘을 개선하여 실제 통신환경에서 발생하는 다양한 조건들을 적용하여 음성신호의 복원능력을 모의실험으로 분석하였다. 일반적인 PC 제어기법과 제안한 피드백 마스킹 기법을 사용하여 송신단에서 음성신호를 카오스 신호로 마스킹하여 변조하고, 통신채널에 잡음신호를 추가하여 전송하였다. 수신단에서는 카오스 응답시스템을 이용하여 음성신호를 복조하고, 복원성능을 계산하기 위하여 아날로그 복원 에러신호의 평균전력을 제안하여 계산하였다. 실험결과 마스킹 정도, 파라미터들의 민감성, 채널잡음 등에 대하여 PC 제어기법보다 피드백 제어기법의 복원성능이 우수함을 확인할 수 있었다. 또한 로렌쯔 카오스 시스템을 비화통신시스템에 사용할 경우 파라미터들의 조합으로 암호키를 구성해야 하므로 키값들의 선정에 기준이 되는 파라미터 변화율에 대응하는 복원에러율의 관계를 실험 값으로 구하였다.

On Detecting the Transition Regions of Speech Signal by Pitch Synchronization (피치동기에 의한 음성신호의 전이구간 검출)

  • 나덕수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.454-459
    • /
    • 1998
  • 연속된 음성의 인식을 위해서는 음성신호를 음성학적인 단위인 단어, 음절, 음소 등으로 분할하여야 한다. 이러한 분할을 위해서는 전이구간의 검출이 선행되어야 한다. 본 논문에서는 음성신호에서 전이구간을 검출하기 위해 피치동기로 된 상관관계 계수의 변화를 나타내는 파라미터를 새로이 제안하였다. 이 파라미터는 음성신호의 안정구간에서는 매우 작은 값을 나타내지만 음성의 시작이나 유성음과 무성음의 경계에서는 큰 값을 나타내어 전이구간검출용 파라미터로 매우 용이하다.

  • PDF

Modeling and Analysis of Delay Bound for Voice Traffic in the IEEE 802.11 Wireless LAN (IEEE 802.11 무선랜에서 음성신호의 딜레이 바운드에 관한 분석)

  • Choi, Won-Suk;Kim, Young-Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.1485-1488
    • /
    • 2003
  • IEEE 802.11 무선 랜 환경에서 멀티미디어 트래픽이 효과적으로 전송퇴기 위해서는 정해진 딜레이 바운드내에서 전송이 완료되어야 한다 대표적인 멀티미디어 트래픽인 음성신호를 전송할 때의 단방향 딜레이 바운드는 echo canceller를 쓰지 않았을 경우 $25ms{\sim}30ms$ 이다. 딜레이 바운드를 지키지 못하고 전송된다면 시간에 민감한 음성신호의 특성 때문에 음성품질이 유지되지 않을 뿐만 아니라 채널의 혼잡을 유발하게 된다. 본 논문에서는 음성의 품질이 보장되는 기준을 95%이상의 패킷이 성공적으로 전달되는 경우로 제한하여 음성의 딜레이 바운드에 관한 분석을 시도하였다. 이를 위해 음성패킷이 drop될 확률을 수학적인 분석을 통해 유도하고 시뮬레이션을 통한 검증을 시도하였다. 시뮬레이션에서는 IEEE 802.11의 두 가지 기본적인 MAC(Multiple Access Control) 프로토콜인 DCF와 PCF를 사용해서 음성신호를 전송할 때 딜레이 바운드를 지키지 못하는 음성 패킷을 사전에 drop 시킴으로써 몇 개의 음성 노드가 손실율 5% 이내 (음성의 품질이 유지되는 한계)를 만족시키는지를 음성신호를 발생시키는 STA 수와 손실율의 관계를 통해 알아보았다.

  • PDF

Speech Secure Communication Control System Using Chaos Generation Circuit (카오스 발생회로를 이용한 음성비화통신 제어시스템)

  • 여지환;이익수
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.6 no.2
    • /
    • pp.72-80
    • /
    • 1996
  • 본 논문은 카오스 발생회로(chaos generation circuit)를 설계 및 구현하고, 카오스 회로들간의 카오스 동기화(chaos synchronization) 알고리즘을 기초로 하여 카오스 변조통신을 구성하여 음성비화시스템의 구현에 관하여 실험적으로 검증했다. Pecorra와 Carroll 은 카오스 신호로서 카오스 시스템을 구동하면 카오스 동기화가 가능하다고 발표했다. 이러한 제어기법은 카오스 신호의 마스킹과 복원 알고리즘의 등장을 초래했다. 본 연구는 카오스 신호를 발생하기 위하여 상태변수 기법을 이용하여 로렌쯔(Lorenz) 카오스 발생회로를 하드웨어로 구현했다. 수치 실험 및 보드상의 실험에서 카오스 회로는 카오스의 동적특성을 나타냈으며, 카오스 발생회로들간의 카오스 동기제어를 아루었다. 음성비화를 위한 카오스 신호의 변조는 카오스 신호에 음성신호를 가산하여 송신하며, 광대역)spread spectrum)의 카오스 변조통신 (chaotic modulation communication)에서 음성정보는 수신시스템의 카오스 부시스템에서 카오스 신호를 빼내어 신호를 복원한다. 보드상에서 하드웨어로 구현한 카오스 변.복조 통신시스템을 구성하여 음성신호와 비화통신에 카오스 지능제어기법을 적용하였다.

  • PDF

Signal Processing of Disordered Speech (장애음성 신호처리)

  • 조철우
    • Proceedings of the IEEK Conference
    • /
    • 1999.11a
    • /
    • pp.647-650
    • /
    • 1999
  • 본 논문에서는 음성신호처리 기법을 이용하여 장애음성을 진단, 개선하는 데 필요한 다양한 신호처리방법에 대하여 다루고자 한다. 음성장애중 성대장애를 중심으로 신호에 나타나는 현상과 이를 이용한 신호처리 방법들을 소개하며 응용사례로 음성을 이용한 성대질환의 진단에 관한 내용을 소개한다.

  • PDF