• Title/Summary/Keyword: 음향상

Search Result 505, Processing Time 0.027 seconds

Real-time implementation of speaker dependent speech recognition hardware module using the TMS320C32 DSP (TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드뒈어 모듈 구현)

  • Chung, Hoon;Chung, Ik-joo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas instruments 사의 저가형 부동소수점 디지털 신호 처리기인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하드웨어 모듈을 개발하였다. 하드웨어 모듈의구성은 40MHz 의 TMS320C32, 14bit 코덱인 TLC32044, EPROM 과 SRAM 등의 메모리와 호스트 인터페이스를 위한 로직회로로 이루어져 있다. 뿐만 아니라 이 하드웨어 모듈을 PC 상에서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리즘은 C 및 어셈블리를 이용한 최적화를 통하여 계산속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 30단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF

On Performance Improvement of Adaptive Delta Modulation Using High-Order Prediction and Delayed-Decision (고차 예측기와 지연 결정을 이용한 ADM 부호화기의 성능 개선)

  • 조동호;은종관
    • The Journal of the Acoustical Society of Korea
    • /
    • v.9 no.6
    • /
    • pp.5-13
    • /
    • 1990
  • 본 논문에서는 16Kbps 및 32 Kbps 전송속도에서 ADM의 음질을 개선하기 위하여 두 가지 방 식을 적용한다. 첫째로, 고차 예측기 또는 적응 예측기를 ADM에 활용한다. ADM의 경우에 2차 또는 3 차 예측기를 사용하면 16Kbps 전송속도에서는 별로 개선이 없지만 32Kbps 전송속도에서는 SQNR\sub SEG\척도로 약 3-4dB의 상당한 이득이 얻어진다. 또한 ADM에 적응 예측기를 활용하면 최대 성능은 SZNR\sub SEG\ dir 2dB 정도 개선되지만 양자화 잡음의 축적 때문에 동작 범위가 매우 좁아진다. 둘 째로, 지연 결정 방식을 ADM에 이용한다. 지연 결정 방식을 2차 예측기를 갖고 있는 ADM에 적용하면 약 2dB 정도 개선되지만 양자화 잡음의 축적 때문에 동작 범위가 매우 좁아진다. 둘째로 지연 결정 방 식을 ADM 에 이용한다. 지연 결정 방식을 2차 예측기를 갖고 있는 ADM에 적용하면 1차 예측기를 갖 고 있는 ADMDP 적용했을 때 보다 16또는 32Kbps일 때 SQNR\sub SEG\척도로 재래의 ADM 보다 약 5dB 정도의 성능 개선이 얻어진다.

  • PDF

On the Classification of Voice Sound and the Recognition of Vowels for Korean Continuous Speech (한국어 연속음인식에 관한 연구(유성음 분류 및 단모음 인식 ))

  • 하판봉;이철희;방승찬;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • v.5 no.3
    • /
    • pp.28-35
    • /
    • 1986
  • 우리나라 음성의 유성음을 모음, 비음 및 유성화 자음으로 분류하는 알고리즘을 기술하였다. 먼 저 기존의 PITCH 검출 알고리즘에 의하여 음성을 유성음과 무성음으로 나눈 뒤, 단지 정규화된 1차 상 관계수, 영교차율, LOG 에너지 및 LPG 에너지의 골짜기 검출만을 이용하여, 유성음은 모음, 비음 및 유 성화자음으로 분류하고 무성음은 실제의 무성음과 묵음으로 분류하였다. 그리고 이렇게 분류된 모음에 대하여 단모음 인식을 행하였다. 단지 한 FRAME으로 모음을 대표하였기 때문에 메모리 크기와 인식 시간을 줄였다. 여기서 UP & DOWN 및 수정된 영교차율을 새로이 정의하여 적용한 결과 만족한 결과 를 얻을 수 있었다. LPC 매개변수 및 전력 스펙트럼도 단모음 인식의 FEATURE로 사용하였다. 그리고 각 FEATURE 의 성능을 비교하였다. 이들 FEATURE을 잘 조합하여 2단계 인식을 행한 결과 92%의 높은 인식율을 얻을 수 있었다.

  • PDF

Pitch-based Intensity Control Models Considering Phonetic Environments (음운환경을 고려한 피치 기반 세기 제어 모델)

  • 김기중;김진영;진달복
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.80-85
    • /
    • 1998
  • 본 논문에서는 음성합성기에서 합성음의 자연성을 향상시키기 위한 한 방법으로 운 율 제어요소중 세기 제어 모델을 통계적인 방법을 이용하여 제안하였다. 세기 제어 모델을 구성하기 위하여, 음성의 세기는 피치에 비례한다는 사실에 기반하여, 녹음된 음성 데이터에 서 음절의 각 모음에 대한 평균파워와 평균피치를 구하고, 피치를 종속변수로 하는 모음의 세기 예측식을 만들었다. 예측식에 의하여 얻어진 세기값과 실제 측정된 세기값과의 상관도 는 전체모음에 대하여 약 0.63으로 나타났다. 본 논문에서는 예측 세기와 실제 세기와의 상 관도를 향상시키기 위하여 피치만을 고려하여 예측된 세기값을 음운환경을 고려하여 선형 오차를 보정하는 방법을 제안하였고, 이 방법을 이용하여 얻어진 세기값은 전체모음에 대하 여 실제 세기값과 0.71의 상관도로 향상시킬 수 있었다.

  • PDF

On the Effects of Places of Articulation of Stops on Their Closure Duration in Korean (한국어 폐쇄음의 조음장소가 폐쇄구간의 음성학적 길이에 미치는 영향에 관하여)

    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.6
    • /
    • pp.8-13
    • /
    • 1998
  • 본 논문은 Gesturewndcjq 이론에 근거한 폐쇄음의 조음장소와 폐쇄음의 폐쇄구간 길이와의 상관관계에 대한 가설 즉, 연구개음의 폐쇄구간이 양순음이나 치음의 폐쇄구간에 비해 짧을 것이라는 가설을 실험음성학적으로 검증하였다. 본 연구의 결과는 이 가설을 완 전히 뒷받침해주지는 않는 것으로 나타났다. 폐쇄음의 조음방법에 따라 약간의 차이를 보이 긴 하나 세 조음방법 상에서 적어도 양순음과 연구개음의 폐쇄구간 길이에 있어서는 본 연 구가 예측한대로 양순음의 폐쇄구간 길이가 연구개음의 폐쇄구간 길이보다 긴 것으로 나타 났다. 그러나 치음의 경우는 연구개음의 폐쇄구간과 통계적으로 유의한 차이를 보이지 않았 다. 본 논문은 Gesture 이론이 폐쇄음 조음에 있어 폐쇄음 gesture와 주위 모음의 gesture와 의 중첩정도 외에 여러 다른 음성학적 사실들을 동시에 고려할 필요가 있음을 보여주었다. 즉, 폐쇄음 조음시 폐쇄강의 크기, 조음기관의 움직임 속도, 폐쇄강 내 압력 형성에 걸리는 시간, 그리고 폐쇄음 조음시 턱의 높이 등에 대한 고려의 필요성을 제시하였다.

  • PDF

Identification and Visualization of Sound Sources with Non-regular Shapes (불규칙한 형상을 가진 소음원의 파악 및 가시화)

  • 이정권
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 2004.05a
    • /
    • pp.63-63
    • /
    • 2004
  • 기계류는 대개 부정형의 형상을 지니고 있으며, 또 표면이 모두 연결되어 있으므로, 진동하는 물체 표면상에서의 소음원 특성을 세밀히 파악하는 일은 매우 어려운 일이다. 음향 인텐시티나 공간 푸리에 변환을 이용하는 홀로그래피 기법 등의 어레이 마이크에 의한 기법들이 제안되었고 또 활용되고 있으나, 이는 어디까지나 음원에서 가까운 음장을 가상적인 음원면이라 보고 재구성하는 것이어서 실제 음원의 특성을 파악하는데 어려움이 있다. 이러한 문제점을 해결하기 위해 음원표면을 경계요소화 모델링을 하고, 어레이 마이크로 측정될 음장의 지점과 표면간의 관계를 수학적으로 정리한 후, 마이크에서 측정된 신호를 이용해 역으로 경계요소해석 계산을 수행하여 음원 특성을 파악하는 기법이 제안되었다. 본 발표에 있어서는 이와 같은 취지에서 ‘개발된 Inverse BEM을 이용한 NAH 기법’에 관한 개괄적인 내용을 설명하고, 그 적용 가능성 및 이 기법의 미래에 대해 설명하며, 다음과 같은 내용의 순서대로 설명된다: $\textbullet$ 각종 음원 파악 기법들의 특성과 이 방법이 필요한 이유 $\textbullet$일반 음향 holography 기법 (STSF)과의 차이점 $\textbullet$ 이론적 배경 개괄 $\textbullet$ 실제 적용 순서에 따른 방법의 설명 $\textbullet$ 후처리 결과물 $\textbullet$ 본 기법의 향후 과제 및 적용 방법의 개선

  • PDF

The Control of Impedance System By A Cone Type Loudspeaker (콘형 스피커의 임피던스 제어시스템)

  • Ryu Sung-Ho;Lee Baek-Lyeol;Kim Jung-Hwa;Kim Chun-Duck
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.229-232
    • /
    • 2001
  • 콘형 스피커를 사용한 임피던스 흡음 제어시스템에서는 진동판의 진동속도와 음압 모두를 궤환하는데 이는 궤환 이득이 큰 반면에 궤환 루프상의 요소들 때문에 안정한 동작이 곤란하였다. 이 연구에서는 전기단 접속형 제어시스템과 속도 궤환형 제어시스템의 적용에 대해 그 가능성을 확인하였다.

  • PDF

The implementation of UE AMR Codec using Teak-Lite DSP chip (Teak-Lite DSP 칩을 사용한 UE AMR 코덱 개발)

  • Kim HyungJung;Jee Dock-Gu;Park Man-Ho;Yoon Byung-Sik;Choi Song-In
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.13-16
    • /
    • 2001
  • 본 논문에서는 3GPP 규격에 따른 IMT-2000 시스템용 UE AMR 코덱의 소프트웨어 및 하드웨어 개발에 관하여 논한다 UE AMR 코덱은 ASIC 개발을 고려하여 Teak-Lite DSP 칩을 사용하여 개발하였다 AMR 코덱을 구현하기 위한 효율적인 소프트웨어 개발 기법을 설명하고 하드웨어 디자인도 논한다 개발된 UE AMR 코덱에는 음성 데이터 입출력 기능은 물론 리부 호스트 프로세서와의 통신 기능도 포함된다. Teak-Lite EVM보드를 사용하여 실시간으로 동작하는 AMR 코덱 소프트웨어를 개발하였다. 또한 동시에 UE AMR 코덱용 하드웨어도 개발하였다. ETRI에서 개발 및 시험 중인 IMT-2000 시스템 상에서 개발한 UE AMR 코덱의 동작 및 기능을 검증하였다.

  • PDF

Reduction of Mimic Sound in Outside Mirrors Using Jury Test (청음 평가를 이용한 자동차 OUTSIDE MIRROR 의 MIMIC 소음 개선)

  • Lee Jeonghan;Ih Kangduck;Jeong Seung Gyun
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.393-396
    • /
    • 2001
  • 차량 주행시 발생되는 소위 mimic 소음은 접이식 outside mirror의 접합부에서 발생하는 이음(異音)으로서 예민한 승객에게 지적된다. Mimic 소음은 2kHz이 상의 고주파 영역에서 특정 대역에 간헐적으로 발생하는 소음이며, 시간에 대해 앙상블 에버리지를 하는 일반적인 분석 방법으로는 나타나지 않는다. 그러나 주의 깊은 청취에 의해 그 존재를 분명히 느낄 수 있으므로 다꾸찌 시험 계획법에 의거 실험 샘플을 제작하여 녹음한 뒤, 청음 평가를 통하여 개선하는 과정을 거쳤다. 분석 결과 mimic 소음은 folding gap의 폭보다는 균일도를 유지하는 것이 중요하며, gap내의 공동(공동, cavity)을 메워 주는 것이 효과적이라는 결론을 얻었다.

  • PDF

A Study on the Epoch Extraction of Voicd Speech (유성음 구간에서의 Epoch 추출에 관한 연구)

  • 강동규
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.216-220
    • /
    • 1995
  • 음성 신호처리분야의 기반을 이루고 잇는 선형예측기법으로 성대폐쇄구간 분석이 가능해질 경우 특히 음성합성가 부호화 시스템의 상당한 성능개선을 기대할 수 있기 때문에 최근 관련 분야에서 높은 신뢰도를 갖는 GCI 검출 알고리즘 개발에 많은 관심을 보이고 있다. 성대폐쇄구간 검출에서 가장 중요한 것은 성대폐쇄시점에 관한 정보이며, 본 논문에서는 이에 대응될 수 있는 정보인 epoch를 음성신호에서 직접 추출할 수 있는 기법을 제안하였다. 제안된 방법은 프레임 단위별 평균 피치를 참조하여 저역통과된 유성음 신호에서 3구간 영교차점별 평균진폭 변동율에 의해 pseudo-epoch를 검출한다. 대역 통과된 유성음 신호를 이용하여 pseudo-epoch 부근에 존재하는 보다 정밀한 실제 epoch을 최종적으로 결정하였다. 제안된 방법은 단계적으로 epoch가 존재할 수 있는 연역을 좁혀 나아가면서 처리하므로 검출오차를 줄일 수 있었고, 시간영역에서 처리되어 계산량이 적으므로 고속 처리가 가능하였다. 성능평가를 위해 처리결과를 EGG 신호와 비교한 결과 약 2샘플 정도의 오차만을 갖는 우수한 성능을 나타내었다.

  • PDF