• 제목/요약/키워드: Speech signal bandwidth

검색결과 37건 처리시간 0.023초

가변 대역폭 LPF를 이용한 피치 검출 (Pitch Detection Using Variable Bandwidth LPF)

  • 금홍;백금란;배명진;장호성
    • 한국음향학회지
    • /
    • 제13권5호
    • /
    • pp.77-82
    • /
    • 1994
  • 음성신호 처리에서, 피치를 정확하게 찾아내는 것이 매우 중요하다. 현재까지 많은 피치 검출 방법들이 제안되어 왔지만, 광범위한 화자와 다양한 음성 데이터로부터 정확한 피치를 찾는 것은 어렵다. 따라서 본 논문에서는 G-peak 검출을 이용한 새로운 피치 검출 알고리즘을 제안한다. 이 방법은 G-peak 의 MZCI (최대 영교차 간격) 을 LPF (low-pass filter)의 차단대역폭으로 결정하여 음성신호의 피치를 검출하는 방법이다. 본 알고리즘은 0dB SNR 환경 하에서 3.36%의 그로스 에러를 나타내는 잡음에 강인한 방법이다. 또한 잡음이 없는 음성의 그로스 에러는 0.18%였고, 모든 과정은 고속 처리가 가능하다.

  • PDF

포만트 밴드폭 정규화를 이용한 음성인식 (Speech Recognition Using Formant Bandwidth Normalization)

  • 홍종진;강석건;박군작;박규태
    • 한국통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.458-467
    • /
    • 1991
  • 본 논문에서는 기존의 선형예측기법의 문제점을 선형예측계수, ar필터의 POLE위치, 포만트-밴드폭의 관점에서 분석하고, 정문반사계수의 영향을 정도추정이론에 따라 분석했으며, 이러한 분석을 근거로 하여 포만트 밴드폭 정규화 방법을 보완하였다. 정분반사계수를 1로 변경하여 정문의 영향을 정규화되어 포만트가 최적으로 강조된 스펙트럽이 된다. 이 전형예측계수는 앞뒤로 대칭되면서, 표준편차가 정문반사계수를 변경시키지 않은 성형예측계수보다 증가하므로써, 음성부호화시에 bit rate을 50%로 줄일 수있으면서 정보의 양을 그대로 보존하고 있음을 알수 있었다. 이러한 포만트 밴드폭을 0으로 정규화하는 방법을 이용하여 한국어 5개 모음을 포만트에 의해서 소음환경에서 인식하기 위한 실험을 실시하여 96.7%의 인식율을 얻을 수 있었다.

  • PDF

High Frequency Enhancement of Sound Using Wavelet Transform

  • Yoon Won-Jung;Lee Kang-Kyu;Park Kyu-Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.233-236
    • /
    • 2004
  • This paper proposes new method for the enhancement of nonexistent high frequency spectral contents from low sample rate audio signal. For example, Due to the protocol constraint, the audio bandwidth of MP3 is restricted to 16Khz. Although band-restricted MP3 audio provide savings of storage space and network bandwidth, it suffers a major problem of a loss in high frequency fidelity such as localization, ambient information, and bright nature of audio. This paper provides a new mathematical analysis for the adaptive estimation of the high frequency contents based on the nature of the input low sample rate audio. Proposed method can be worked globally to any kind of audio such as speech and music that are restricted by sampling rate and bandwidth.

  • PDF

VQ Codebook Index Interpolation Method for Frame Erasure Recovery of CELP Coders in VoIP

  • Lim Jeongseok;Yang Hae Yong;Lee Kyung Hoon;Park Sang Kyu
    • 한국통신학회논문지
    • /
    • 제30권9C호
    • /
    • pp.877-886
    • /
    • 2005
  • Various frame recovery algorithms have been suggested to overcome the communication quality degradation problem due to Internet-typical impairments on Voice over IP(VoIP) communications. In this paper, we propose a new receiver-based recovery method which is able to enhance recovered speech quality with almost free computational cost and without an additional increment of delay and bandwidth consumption. Most conventional recovery algorithms try to recover the lost or erroneous speech frames by reconstructing missing coefficients or speech signal during speech decoding process. Thus they eventually need to modify the decoder software. The proposed frame recovery algorithm tries to reconstruct the missing frame itself, and does not require the computational burden of modifying the decoder. In the proposed scheme, the Vector Quantization(VQ) codebook indices of the erased frame are directly estimated by referring the pre-computed VQ Codebook Index Interpolation Tables(VCIIT) using the VQ indices from the adjacent(previous and next) frames. We applied the proposed scheme to the ITU-T G.723.1 speech coder and found that it improved reconstructed speech quality and outperforms conventional G.723.1 loss recovery algorithm. Moreover, the suggested simple scheme can be easily applicable to practical VoIP systems because it requires a very small amount of additional computational cost and memory space.

음성신호처리 기술을 적용한 음식물이 인체 장기에 미치는 영향 분석 (Influence Analysis of Food on Body Organs by Applying Speech Signal Processing Techniques)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제37권5A호
    • /
    • pp.388-394
    • /
    • 2012
  • 본 논문에서는 음성신호처리 기술을 적용하여 음식물이 인체 장기에 미치는 영향에 대해 분석하는 방법을 제안한다. 그 간 음식물이 장기에 미치는 영향에 대한 연구는 그 음식물에 A라는 성분이 있음으로 이것이 B장기에 좋은 영향을 미칠 수 있다는 연구가 주를 이루어왔다. 그러나 그 음식물을 섭취했을 때 그것이 실제 인체 장기에 어느 정도 영향을 미치는지에 대한 수치화, 정량화된 연구는 전무한 실정이었다. 이에 본 논문에서는 음식물이 인체 장기에 미치는 영향을 수치화된 자료로 규명하고 이를 정량화하여 새로운 사실과 정보를 취득해 내는 방법에 대해 제안한다. 특히 본 논문은 우리가 흔히 접하는 음식물 중 심장 기능 강화에 도움이 된다는 토마토를 대상으로 이것이 인체에 미치는 영향을 수치화, 정량화를 행하고 이를 통해 새로운 사실을 규명해 내는 방법에 대해 제안한다. 실험은 심장에 이상이 없는 20대 남성 15명을 피실험자로 선정하고 토마토 섭취 전과 섭취 5분후, 30분 후, 1시간 후의 음성 자료를 각각 수집하고 심장 상태 변화를 측정하는 음성 분석 요소를 적용하여 토마토가 심장에 미치는 영향을 수치화, 정량화 그리고 이를 통한 새로운 사실을 규명한다.

벡터 양자화를 위한 학습 알고리즘을 이용한 음성 전송 기술에 관한 연구 (A study on the competitive learning algorithm for robust vector qantization to transmit speech signal)

  • 홍강유;박상희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.3150-3152
    • /
    • 1999
  • The efficient representation and encoding of signals with limited resources, e.g., finite storage capacity and restricted transmission bandwidth, is a fundamental problem in technical information processing systems. Typically under realistic circumstances, the encoding and communication of message has to deal with different sources of noise and disturbances. In this paper, I propose a unifying approach to data compression by robust vector quantization, which explicitly deals with channel noise, and random elimination of prototypes. The resulting algorithm is able to limit the detrimental effect of noise in a very general communication scenario. In this paper, based on the robust vector quantization I have an experiment about speech coding.

  • PDF

특정 대역 에너지를 이용한 한국어 기본 수자 음성의 백동 인식에 관한 연구 (A Study on the Automatic Recognition of Korean Basic Spoken Digit Using Energy of Special Bandwidth)

  • 한희;김순협;박규태
    • 대한전자공학회논문지
    • /
    • 제19권3호
    • /
    • pp.5-12
    • /
    • 1982
  • 기본 모음의 분석을 위한 특징 파라미터로 특정 대역의 에너지의 비를 이용하는 방법을 사용하여 이 파라미터와 영통과률(zero crossing rate;ZCR) 그리고 에너지 파라미터의 논리 조합으로 한국어 기본산자 음성의 인식을 시도하였다. 본 실험을 위해서 음성 신호는 차단 주파수 10KHz의 저역 여파기로 여파되었고 20KHz의 표본화율로 표본화 되어 IBM 370으로 시뮬레이션 되었다. 본 시뮬레이션에서는 리메쯔 교환 알고리즘[l3].[14]에 의해 61차, 120차, 25차, 25차 등 4개의 FIR 디지탈 여파기를 설계하여 사용하였다. 실험 결과 3인의 화자에 대해서 92%의 인식률을 얻었다.

  • PDF

여성 뉴스 앵커의 발성 특성 분석 (The Characteristics of the Vocalization of the Female News Anchors)

  • 견두헌;배명진
    • 한국음향학회지
    • /
    • 제30권7호
    • /
    • pp.390-395
    • /
    • 2011
  • 본 논문은 각 방송사의 메인 뉴스인 평일 저녁뉴스의 여성 앵커 음성 분석을 통하여 공통적인 음성 요소와 각 방송국별 상대적인 음성 및 음향에는 어떠한 차이가 있는지 연구하였다. 전반적인 음성 특성을 알아보기 위해 6가지 요소를 분석한 결과, 각 방송국별 아나운서는 발화속도를 제외하면 모든 영역에서 뚜렷한 음성 및 발성 특징을 가지고 있었으며 음향시스템적인 차이도 발견 되었다. 주요 분석 요소는 기본 피치 외에 제1포만트와 피치비율에 따른 음색과 피치대역폭을 통한 정감도 요소, 피치대역폭내의 평균피치위치를 통한 문장 끝맺음 양상, 평균 발화속도, 주파수 대역별 에너지 분포를 통한 음향적인 음색 분석이다. 분석된 수치 및 결과는 국내 여성 앵커의 발성 특징의 기준으로 참고 및 활용될 수 있다.

한국 정상 성인의 저주파수 임계 주파수 대역 특성에 관한 연구 (Low frequency critical bandwidths of Korean normal hearing adults)

  • 문지현;전경언;임덕환
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.70-75
    • /
    • 2022
  • 임계 주파수 대역은 복합음을 구성하는 주파수가 인접한 대역과 나타내는 인지 간섭 차폐 범위를 반영하는 심리음향적 지표이다. 현재는 서구권의 자료만 일부 존재하며, 한국인을 대상으로 한 임상적으로 중요한 저주파수에 대한 임계 주파수 대역 자료는 없는 실정이다. 본 연구에서는 정상 청력을 가진 한국 성인 남녀 20명의 저주파수 순음 500 Hz에 대한 임계 인지주파수 대역 특성을 회화음 강도인 60 dB HL에서 분석하였다. 자료 수집 과정에 기본 주파수 500 Hz 신호를 중심으로한 대역소거잡음과 두 대안 강제선택 방식을 적용하였다. 분석 결과에서 임계 주파수 대역폭은 기존 영어권 자료보다 넓은 상호간섭 인지 폭을 보였고(95 Hz), 피검자 성별이나 좌우 측 간의 유의한 차이는 없음이 확인되었다(p > 0.05). 이 결과는 효과적 이명 차폐 등 관련 임상 분야에 응용될 수 있을 것으로 판단된다.

G-peak의 특성을 이용한 성문폐쇄시점 검출 (Detection of Glottal Closure Instant using the property of G-peak)

  • 금홍;김대식;배명진;김영일
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권1E호
    • /
    • pp.82-88
    • /
    • 1994
  • 음성신호의 처리에서 GCI를 정확하게 검출하는 것은 중요하다. 따라서 이에 대한 연구가 부분적으로 진행되어 왔다. 이러한 방법은 광범위한 화자와 다양한 단어에 대해 적합하지 못하기 때문에 우리는 G-peak를 사용하여 GCI를 검출하는 새로운 기법을 제안하였다. 우선 음성 신호 파형을 가변 저역 통과 여파기에 통과 시킨다. 여파된 신호를 사용하여 G-peak를 검출하고 이를 기준으로 GCI를 검출하게 된다. 제안된 방법으로 검출한 GCI와 눈으로 찾은 GCI의 차이가 1ms이내이면 고려의 대상으로 삼았다. 제안된 방법은 검출율이 각각 0dB SNR하에서 94%, 20dB SNR하에서 96.5%, 무잡음에서 97.9%를 나타내었다. 결론적으로 제안된 방법은 잡음 환경하에서도 우수한 수행결과를 보였다.

  • PDF