Search | Korea Science

A Low Rate VQ Speech Coding Algorithm with Variable Transmission Frame Length (가변 전송 Frame 길이를 갖는 저 전송속도 VQ 음성부호화 알고리즘에 대한 연구)

좌정우;이성로;이황수
- The Journal of the Acoustical Society of Korea
- /
- v.12 no.1E
- /
- pp.32-38
- /
- 1993
본 논문에서는 저 전송속도의 음성 부호화기를 제안하였고 컴퓨터 시뮬레이션을 통하여 성능분석과 유연성을 입증하였다. 제안된 부호화 방식은 입력 음성신호의 Stationarity에 따라 전송 프레임의 길이를 가변하고, 전송 프레임의 대표적인 특징 벡터를 Vector Quatization으로 부호화하였다. 제안된 부호화 방식에서 특징 벡터열은 입력 음성신호를 샘플단위로 Prewindowed RLS Lattice 알고리즘을 통해 구한 PARCOR 계수로 구성된다. 입력 음성신호는 Subsegment로 분할되고, 각 Subsegment에서 대표적인 PARCOR 계수를 구한다. Likelihood Ratio Distortion Measure를 사용하여 유사도에 따라 Subsegment를 병합함으로써 전송프레임을 결정한다. 컴퓨터 시뮬레이션 결과로부터 제안된 VTEL 음성 부호화 방식은 좋은 음질을 유지하면서 전체 전송속도를 크게 줄일 수 있다.
PDF

A Korean Speech Database for Use in Automatic Translation (자동통역용 한국어 음성 데이터베이스)

최인정
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1994.06c
- /
- pp.287-290
- /
- 1994
음성 인식 시스템의 개발을 위해서는 음성 데이터베이스구축이 중요한 과제의 하나로서, 많은 시간과 노력이 요구된다. 개별적인 음성데이타베이스 구축에 따른 중복 투자를 줄이고 다양한 인식 알고리듬의 성능 비교와 국내 음성 인식 기술의 발전을 위해서는 벤치마크 시험을 위한 공통의 음성 데이터베이스가 필수적이다. 본 논문에서는 한국과학기술원 통신연구실에서 제작한 한국어 음성 데이터베이스에 관하여 기술한다. KAIST 음성데이타베이스는 자동통ㅇ역을 N이한 무역 상담과 관련되 3,000 단어 규모의 연속어를 비롯하여, 가변 길이 연결 숫자음, phoneme-balanced 75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다. 이 음성 데이터베이스의 구축을 위하여 사용된 태스크선정 절차, 녹음 방법, 규격, 및 기대효과 등 세부사항을 기술한다.
PDF

Variable Time-Scale Modification with Voiced/Unvoiced Decision (유/무성음 결정에 따른 가변적인 시간축 변환)

손단영
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1994.06c
- /
- pp.111-115
- /
- 1994
In this paper, a variable time-scale modification using SOLA is proposed, which takes into consideration the different time-scaled characteristics of voiced and unvoiced speech. The conventional method performs time-scale modifiction at a uniform rate for all speech. For this purpose, voiced and unvoiced speech duration at various taling speeds were statistically analyzed. A clipping autocorrelation functio was applied to each analysis frame to detemine voiced and unvoiced speech to obtain respective variation rates. The results were used to perform variable time-scale modification to evaluate performance, a MOS test was conducted to compare the proposed voiced/unvoiced variable time-scale modification and the uniform SOLA method. Results indicate that the proposed method produces sentence quality superior to that of the conventional method.
PDF

A Study on the Enhanced Time Domain Aliasing Cancellation Transform of the AC-3 Algorithm (AC-3오디오 알고리듬의 시간축 영역 에일리어징 제거 변환부 성능향상에 관한 연구)

김준성;강현철;변윤식
- The Journal of the Acoustical Society of Korea
- /
- v.19 no.2
- /
- pp.13-18
- /
- 2000
This paper presents the result of a technique to enhance TDAC in the AC-3 algorithm. To reduce block boundary noise without decreasing the performance of transform coding, We propose new special windows which improve the defect of the AC-3 algorithm that could not properly cancel aliasing in the transient period. In addition, a fast MDCT calculation algorithm based on a fast Fourier transform, is adopted.
PDF

시간특성을 고려한 음성신호의 발성율 검출에 관한 연구

김익성;서지호;배명진
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.109-111
- /
- 2004
발성율은 일정한 시간동안 발성되는 음성신호 내에 몇 개의 음절이 포함되어 있는 지를 나타낸다. 발성율은 화자마다 다르고 각 음소들의 특징에 따라 변화할 수 있다. 발성율의 사전 측정이 이루어 진다면 음성부호화 측면에서도 중용한 정보로 사용될 수 있다. 기존의 음성부호화기는 발성율에 관계없이 고정적인 분석 구간을 정하여 전송률을 결정하고 있다. 따라서, 발성율을 미리 측정한다면, 발성율이 느린 부분과 빠른 부분에 각기 다른 부호화 방법을 적용하여 음질을 향상할 수도 있고 전송률을 가변적으로 적용할 수 도 있게 된다. 정확한 발성율을 측정하기 위해서는 음절의 변화를 추정하여야 한다. 음절의 변화를 추정하기 위한 방법으로 음성신호의 에너지 포락선 측정법과 LSP를 이용한 측정법이 각각 제안된 바 있으나, 본 논문에서는 위 두 가지 방법을 혼합한 방법을 사용하였다. 에너지 변동은 음성신호의 시간영역 처리방법으로 LSP 파라미터는 음성신호의 선형예측 분석에 의해 구해질 수 있다.
PDF

A Study on a comparison and analysis of Speaking rate estimation for adaptive bit rate on CELP vocoder (가변전송률 CELP 부호화기 설계를 위한 발성률 비교 분석에 관한 연구)

Jang KyungA;Min SoYeon;Bae MyungJin
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.105-108
- /
- 2004
음성 부호화 기술은 전송률과 복잡도를 줄이고 음질을 향상시키는 방향으로 진행되고 있다. 현재 상용화되고 있는 CELP형 보코더는 낮은 전송률에 비해 우수한 음질을 제공한다. 본 논문에서는 기존의 방식과 다르게 보코더 단에 입력 음성이 들어가기 앞서 전처리 기법을 수행하는 전처리단을 부가하여 전송률을 낮추는 방법을 소개하고, 소개된 방법들을 각기 비교하고 분석하고자 한다. 전처리기법들을 음성 인식이나 합성에서 사용되는 파라미터들을 적용시켰으며, 처리시간이나 계산시간에 있어 기존의 방식에서 많은 영향을 미치지 않은 간단한 알고리즘으로 구현하였다. 소개하는 전처리단에서는 기존의 코딩방식에서 사용하지 않은 파라미터들, 발성율, 지속시간, PSOLA 방식들을 이용하였다.
PDF

A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment (실시간 윈도우 환경에서 DMS 모델을 이용한 자동 음성 제어 시스템에 관한 연구)

남동선
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06e
- /
- pp.361-364
- /
- 1998
본 논문은 인식 속도의 개선을 위해 단어의 지속시간에 따라 Section의 수를 변경한 가변섹션 수 DMS모델을 사용한 실시간 인식 시스템을 연구하고 인식된 결과를 실제 수행하도록 하는 시스템을 구현하는 것이 목적이다. 이러한 윈도우 음성 제어 시스템 구현을 위해 음성의 자동 검출, 윈도우 제어 모듈 구현, 동적 모델 재구성을 이용하여 적용된 단어 단위인식 시스템의 단점을 장점으로 수용하는 시스템을 구현하였고 본 시스템의 이름은 “VocManagerII”라 명명하였다. 구현된 시스템의 성능 평가 결과 인식 및 제어 수행 속도는 1초이내에 이루어지며 인식율은 66개의 기본 명령어에 대하여 화자 종속 99.36%, 화자 독립 99.08%의 좋은 인식율을 보여 주었다.
PDF

Adaptive Active Noise Control Using Error Compensated NLMS Algorithm (오차보상 NLMS 알고리듬을 이용한 적응 능동소음제어)

Kwon, Ki-Lyong;Heo, Kwan;Sohng, Kyu-Ik;Lee Kuhn-Il
- The Journal of the Acoustical Society of Korea
- /
- v.12 no.5
- /
- pp.47-53
- /
- 1993
능동소음제어를 위하여 수렴속도가 빠르면서 정상상태오차를 최소화하는 오차보상 NLMS 알고리듬인 CNLMS 알고리듬을 제안하였다. 이 CNLMS 알고리듬에서는 수렴속도를 빠르게 하기 위하여 입력소음과 오차소음의 전력에 따라 수렴인자를 가변시킨 NLMS 알고리듬을 사용하였다. 도한 정상상태오차를 최소화하기 위하여 소음발생기를 사용하지 않고 오차경로에서 발생하는 소음오차를 더욱 작아지도록 보상하는 보조시스템을 사용하여 안정된 능동소음제어가 되도록 하였다. 이와 같은 시스템의 성능을 기존의 적응디지틀필터인 LMS 및 NLMS 알고리듬을 이용한 필터의 그 성능과 비교하였다. 각 알고리듬에 대한 시뮬레이션을 행한 결과, 제안한 CNLMS 알고리듬의 소음레벨은 LMS 및 NLMS 알고리듬의 것보다 각각 평균 14dB 및 6dB 정도 더 큰 감쇄효과가 있음을 확인하였다.
PDF

A Study of Frequency variable Ultrasonic Transducer for the Variation of Echo Characteristics in Reflecte Wave (반사파의 주파수 성분변화에 대응한 주파수 가변 초음파 트랜스듀서)

김무준
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1997.06a
- /
- pp.40-43
- /
- 1997
It is known tat the echoes from the most objects differ from the incident pulses in amplitude and frequency .Especially, the frequency in echoes from moving target is shiftby the Doppler effect. it causes to reduce the receiving sensitivity of piezoelectric transducers that have definite band width. The electric impedance, whichis connected to the electrical terminals, notably changes the resonant frequency of a thickeness mode piezoelectric vibrator with high electromechanical doupling due to the electroelastic effect. Using this effect, we have developed a frequency controllable ultrasonic transducer which is mad eof multi-layered PZT disks to adjust to frequency shifted by Doppler effect. The characteristics of transducer can be obtained by using the equivalent circuit of transmission line model. It was confirmed experimentally that the center frequency and band width of the trasducer could be controlled by the conditions of the electrical terminals. These results coincided with theoretical results.
PDF

State-Dependent Feature-Parameter Weighting By the Contribition of the feature parameter to the performance of the Speech Recongition (음성인식에 있어서 특징 파라미터의 기여도에 기반한 상태별 특징 파라미터 가중)

최환진
- The Journal of the Acoustical Society of Korea
- /
- v.17 no.1
- /
- pp.39-48
- /
- 1998
본 논문에서는 은닉 마르코프 모델에 기반한 음성인식에 있어서 특징 파라미터의 인식 성능에 미치는 영향의 차이를 인식 시스템에 반영하여 인식성능을 향상시키기 위한 방 법을 제안하였다. 특징 파라미터별 가중치를 유도하기 위해서 우선 상태별 특징 파라미터의 인식율에 대한 기여도를 가중치로 변환하고, 이를 특징 파라미터 각각의 상태에서의 출력확 률에 곱하여 상태별 출력확률을 재 추정하게 된다. 실험결과, "가변가중"방법이 "고정가중" 방법에 비해서 단어 인식의 경우 3.3%, 그리고 문장 인식율의 경우 5.3%의 성능향상을 보 임으로써 상태별 특징 파라미터의 가중이 인식 성능 향상에 유효함을 알 수 있었다.
PDF

Search Result 188, Processing Time 0.021 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)