• 제목/요약/키워드: 음성명료도

검색결과 188건 처리시간 0.021초

회의실내 유리창 진동의 도청에 대한 연구 (A Study on the Eavesdropping of the Glass Window Vibration in a Conference Room)

  • 김석현;김윤호;허욱
    • 산업기술연구
    • /
    • 제27권A호
    • /
    • pp.55-60
    • /
    • 2007
  • Possibility of the eavesdropping is investigated on a conference room-glass window coupled system. Speech intelligibility analysis is performed on the eavesdropping sound of the glass window. Using MLS(Maximum Length Sequency) signal as a sound source, acceleration and velocity responses of the glass window are measured by accelerometer and laser doppler vibrometer. MTF(Modulation Transfer Function) is used to identify the speech transmission characteristics of the room and window system. STI(Speech Transmission Index) is calculated by using MTF and speech intelligibility of the vibration sound is estimated. Speech intelligibilities by the acceleration signal and the velocity signal are compared.

  • PDF

청각장애 성인의 말명료도 평가방법의 비교 (Comparisons of Utility of Various Speech Intelligibility Evaluations of Adults with Hearing Impairment)

  • 도연지;김수진
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.173-184
    • /
    • 2004
  • This study aims to discuss the test methodologies that evaluate the speech intelligibility of hearing-impaired adults using various contexts. Seven adults with severe hearing loss participated in the experiment. The context of the speech intelligibility consists of 77 pairs of one-syllable words with phonemic contrasts, 30 two-syllable words and the list of each 12 and 10 sentences. The speech intelligibility of various contexts had significant correlation, and both one-syllable words with phonemic contrasts and the sentence 1 had higher correlation than other tests. The one-syllable words with phonemic contrasts took longer to test than others, and it demanded more effort to select the pair of words. However, from the point of view of the identification of segmental difficulties, the one-syllable words with phonemic contrasts that reflected segmental factors contributing to the intelligibility was useful.

  • PDF

청각장애 성인의 말명료도 예측 요인: 조음정확도를 중심으로 (Predicting Variables of Speech Intelligibility in Adults with Hearing Impairment: Focusing on Correct Articulation)

  • 성희정;최은아;윤미선
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.1-14
    • /
    • 2007
  • The purpose of this study was to analyze the relationship between segmental correctness and speech intelligibility in adults with hearing impairment. Segmental correctness was measured by percentage of correct vowels(PCV) and percentage of correct consonants(PCC). The results were shown as follows: First, PCV and PCC could predict speech intelligibility with statistical significance. Second, in consonant classes divided by place and manner of articulation, the PCC of plosives and alveolar sounds were significant predicting variables in each group ($R^{2}=50%;\;59%$). According to this study, the importance of segmental correctness on speech intelligibility of adults with hearing impairment was confirmed. Also correctness of plosive sounds in manner and alveolar sounds in place were significant factors to speech intelligibility.

  • PDF

시험적 의치형 전기후두의 어음명료도 및 소나그라프 검사 (Speech Intelligibility and Sonagraphic Evaluation of Experimental Model of Obturator-type Electrolarynx)

  • 김기령;홍원표;김광문;심윤주;이승철;김경수;이문재
    • 대한후두음성언어의학회지
    • /
    • 제3권1호
    • /
    • pp.6-12
    • /
    • 1989
  • Methods of voice rehabilitation in laryngectomees include training of esophageal speech, use of electrolarynx and pneumatic speech aid and surgical methods, etc. In this paper, we introduce the experimental model of obturator-type electrolarynx which has several advantages for use such as ease of learning, no disagreeable appearance, and both hands not being occupied. We compared it to normal voice and other voice rehabilitation methods such as esophageal voice, japanese pneumatic speech aid and cervical electrolarynx in intelligibility and sonagraphic evaluation. The results are as follows; 1) Obturator-type electrolarynx exhibited the lowest intelligibility. 2) In sonagraphic evaluation, the spectrogram produced by the obturator-type electrolarynx was the most different from those of normal voice.

  • PDF

디지털음성명료도 향상을 위한 적응형 잡음제거 기법에 관한 연구 (A study on adaptive noise cancellation for enhancement of digital speech articulation)

  • 김수용;지석근
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.961-968
    • /
    • 2007
  • 오늘날, 우리는 어디엔가 엔제나 무전기 통신 장치를 사용할수 있다. 때때로, 우리는 음향잡음환경에서 장치를 사용하였다. 그 음향잡음은 통신장치에서 많은 문제를 만들었다. 음향잡음환경에서는, 말은 음성신호와 잡음신호 양쪽에 신호를 포함하고, 받았기 때문에 깨끗한 정보를 받기위해 보낼수가 없었다. 디지털필터는 바라는 신호를 얻기 위해 옮기는 잡음으로서 유용하였다. 방법의 하나는 자동적으로 맞추는 필터 파라미터로서 적응 잡음 망상조직으로 적응디지털필터를 사용하는 것이다. 본 논문은 두 적응필터 방법에 의하여 현실에서 음향잡음으로서 명료도 알고리즘의 번지라고 할 수가 있다. 하나는 두 입력 채널과 함께 적응잡음 망상조직이라 할 수 있고, 또 다른 것은 하나 입력 채널과 함께 스펙트럼 빼기필터이다. 이 실험의 결과는 제안된 필터로부터 스펙트럼 진폭필터는 움직이지 않는 잡음은 효력이 있는 동안 움직이는 것을 줄이기 위해 사용되어지는 것은 적응잡음망상조직으로 보여준다.

음성 합성기를 위한 문맥 적응 스무딩 필터의 구현 (Context-adaptive Smoothing for Speech Synthesis)

  • 이기승;김정수;이재원
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.285-292
    • /
    • 2002
  • 문자-음성 합성기 (Text-To-Speech, TTS)에서 해결되어야 할 문제점 중의 하나는 음소의 연결 부위에서 발생하는 불연속성이다. 이러한 문제점을 해결하기 위한 방안으로 본 논문에서는 저역 여파기를 이용한 스무딩 기법을 적용하였다. 제안된 스무딩 기법은 스무딩의 정도를 제어하는 필터 계수를 현재 합성하고자 하는 문맥에 따라 결정하여, 경계에서의 불연속성을 효과적으로 제거하고 스무딩으로 인하여 발생할 수 있는 음성의 왜곡을 억제하였다. 스무딩 정도는 현재 합성된 음성의 불연속 정도와 주어진 문맥으로부터 예측된 불연속 정도를 통해 결정하였으며, 문맥으로부터 불연속 정도의 예측은 음소 정보를 입력, 불연속 값을 출력으로 하는 CART(Classification And Regression Tree)를 통해 이루어진다. 제안된 기법의 성능 평가를 위해 코퍼스 기반 연결(corpus-based concatenative) 문자-음성 합성기를 기본 시스템으로 사용하였으며, 청취 테스트에서 60%이상 의 청취자가 제안된 스무딩 기법을 통해 합성된 음성이 스무딩 기법이 사용되지 않은 경우와 비교하여 명료성과 자연성 면에서 우수하다고 판단하였다.

칼만필터를 이용한 음성신호에 중첩된 유색잡음의 감쇠 (An Application of the Kalman Filter for Attenuation of Colored Noise Superimposed on Speech Signal)

  • 구본응
    • 한국음향학회지
    • /
    • 제13권2호
    • /
    • pp.76-85
    • /
    • 1994
  • 정체형 칼만필터와 간단한 음성-비음성 판별알고리즘을 사용하여 비정체형 유색잡음을 감쇠시키는 방법을 제안하였다. 종래의 잡음감쇠알고리즘들이 대부분 백색 또는 정체형 잡음을 다룬데 비하여 본 연구는 대부분의 실제 잡음환경, 즉, 비백색 비정체성 잡음을 다루었다는 점이 다르다. 잡음감쇠기로서는 AR모델에 의거한 백터형 칼만필터를 사용하였고, 음성/비음성 판별에는 단구간에너지의 임계값논리를 사용하였다. 칼만필터에 필요한 잡음의 계수는 비음성구간에서 추산하였고, 음성의 계수는 EM반복법을 적용하여 추산하였다. 실험결과는 신호대 잡음비와 청취테스트로 제시하였다. 차량잡음을 사용한 실험결과, 비음성구간의 배경잡음은 거의 완전히 제거할 수 있었고, SNR이 0dB내지 -5dB로 낮아짐에 따라 왜곡이 심화 되는 경향을 보였으나, 음성의 명료도를 저하시키지는 않았다.

  • PDF

기존 가수 및 신세대 가수의 소리지속시간 분석에 관한 연구 (A Study on Analysis of Speech Duration Between the Existing Singer and New Generation Singer)

  • 정영훈;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.119-122
    • /
    • 2002
  • 음악을 함에 있어서 정확하고 매력적인 발성을 하는 것도 중요하지만 더욱 기본적이고 중요한 것이 정확한 발음을 내는 것이다. 정확한 발음이 해결되지 않은 상태에서는 아무리 발성법을 꿰뚫고 있다하더라도 많은 사람들에게 자신이 전달하고자 하는 메시지를 제대로 전달하지 못하게 된다. 보통 노래를 잘 부르기 위해서 노래방 같은 곳을 찾아가 노래 연습을 하는 사람들이 많이 있는데, 무엇보다 기본적인 발음이 명확하지 않으면 노래를 잘 부른다고 볼 수는 없는 것이다. 랩을 주로 하는 신세대 가수들의 음악을 들어 보면 자막을 보지 않고서는 무슨 말인지 알아들을 수가 없다. 그들이 노래할 때 입 크기의 변화 없이 입술모양만 변화시키면서 발성하기 때문이다. 음성은 기본적으로 여기성분과 성도성분으로 구분할 수 있다. 성도는 인두강과 구강을 합쳐서 일컫는다. 따라서 입 모양을 어떻게 하느냐에 따라서 같은 말이라도 명료성이 달라지게 된다. 본 논문에서는 이 소리지속시간을 비교 평가하기 위해서 기존가수와 신세대 가수의 한 음절에 대한 지속시간을 비교하여 보았고 8Khz까지의 스펙트로그램을 비교하였다. 비교결과 기존 가수가 신세대 가수에 비하여 말의 의사 전달에 있어서 명료하게 전달 할 수 있다는 것을 알 수 있었다.

  • PDF

Eigenvoice를 이용한 이진 마스크 분류 모델 적응 방법 (Eigenvoice Adaptation of Classification Model for Binary Mask Estimation)

  • 김기백
    • 방송공학회논문지
    • /
    • 제20권1호
    • /
    • pp.164-170
    • /
    • 2015
  • 본 논문에서는 잡음 환경에서 취득된 음성 신호에서 잡음을 제거하기 위한 방법으로 사용되는 이진 마스크 분류 모델의 적응과정에 대해 다루고자 한다. 기존 연구결과에 의하면, 잡음 환경 데이터에 이진 마스크 기법을 적용하면 음성 명료도를 향상시킬 수 있다고 알려져 있다. 하지만 이진 마스크 분류 모델 학습 시 테스트 환경 데이터가 포함되어야 한다는 단점을 안고 있다. 본 논문에서는 새로운 잡음 환경에서 이진 마스크 분류 모델을 적응하기 위해, 음성 인식에서 널리 사용되는 화자 적응 기법인 eigenvoice 방법을 적용하고자 한다. 실험결과에서는 모델 적응에 사용되는 데이터량에 따른 성능을 정검출율과 오검출율 관점에서 평가하였고, 그 결과 새로운 잡음 환경에서 데이터량을 증가시켜 모델을 적응함으로써 향상된 성능을 나타냄을 확인할 수 있었다.

초등학교 교실의 음환경 평가에 관한 실험적 연구 (An Experimental Research on the Room Acoustical Environment of the Elementary School Classrooms)

  • 한찬훈;문규천
    • 교육시설
    • /
    • 제11권1호
    • /
    • pp.5-14
    • /
    • 2004
  • Since 1990s in Korea, elementary school classrooms have been designed toward open education system in pursuit of variety of educational purpose. Also, the architectural designs of schools have been acomplished for individual school not based on the standard design code. The present paper aims to investigate the acoustic environment of existing classrooms and to compare the sound insulation capacity between the ordinary classrooms and the newly built classrooms for open education. The current acoustical situation of elementary classrooms was analyzed using field measurements and questionnaire survey. In order to this, Three elementary schools were selected which were built in 1978, 1996 and 2000 respectively. Room acoustical parameters including Reverberation time(RT), Definition(D50), Speech Intelligibility(RASTI), Transmission loss(TL) and STC were measured in a classroom in each elementary school classroom. Each measurement was undertaken with the windows and doors being open or closed. As the result, it was found that the transmission loss between rooms in open classrooms is, $5{\sim}6dB$ in average, inferior than the ordinary classrooms. The RASTI of 0.70 was measured in newly built classrooms which is better than old classrooms(0.70) and open classrooms(0.73). This was shown as same in the speech definition measurements. This results from the condition of sealing and airtightness of classrooms and floor materials. The results denote that open classrooms have poor acoustic condition in sound insulation and speech intelligibility.