• 제목/요약/키워드: 음성의 명료도

검색결과 189건 처리시간 0.027초

회의실 유리창 진동음의 명료도 분석 (Speech Intelligibility Analysis on the Vibration Sound of the Window Glass of a Conference Room)

  • 김윤호;김희동;김석현
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 추계학술대회논문집
    • /
    • pp.150-155
    • /
    • 2006
  • Speech intelligibility is investigated on a conference room-window glass coupled system. Using MLS(Maximum Length Sequency) signal as a sound source, acceleration and velocity responses of the window glass are measured by accelerometer and laser doppler vibrometer. MTF(Modulation Transfer Function) is used to identify the speech transmission characteristics of the room and window system. STI(Speech Transmission Index) is calculated by using MTF and speech intelligibility of the room and the window glass is estimated. Speech intelligibilities by the acceleration signal and the velocity signal are compared and the possibility of the wiretapping is investigated. Finally, intelligibility of the conversation sound is examined by the subjective test.

  • PDF

딥러닝을 이용한 오디오 콘텐츠 분석 기반의 자동 음량 제어 기술 개발 (Development of Automative Loudness Control Technique based on Audio Contents Analysis using Deep Learning)

  • 이영한;조충상;김제우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.42-43
    • /
    • 2018
  • 국내 디지털 방송 프로그램은 2016년 방송법 개정 이후, ITU-R / EBU에서 제안한 측정 방식을 활용하여 채널 및 프로그램 간의 음량을 맞추어 제공되고 있다. 일반적으로 뉴스나 중계와 같이 실시간으로 음량을 맞춰야 하는 분야를 제외하고는 평균 음량을 규정에 맞춰 송출하고 있다. 본 논문에서는 일괄적으로 평균 음량을 맞출 경우 발생하는 저음량의 명료도를 높이기 위한 기술을 제안한다. 즉, 방송 음량을 조절하는 기술 중의 하나로 오디오 콘텐츠를 분석하여 구간별 음량 조절 정도를 달리함으로써 저음량에서의 음성은 상대적으로 높은 음량을 가지고 배경음악 등을 상대적으로 낮음 음량을 가지도록 생성함으로써 명료도를 높이는 방식을 제안한다. 제안한 방식의 성능을 확인하기 위해 오디오 콘텐츠 분석 정확도 측정과 오디오 파형 분석을 실시하였으며 이를 통해 기존의 음량 제어 기술과 비교하여 음성 구간에 대해 음량을 증폭시키는 것을 확인하였다.

  • PDF

강의실의 실내흡음력 증가에 따른 한국어 및 중국어의 음성요해도 비교 (Comparison of the Korean and Chinese Speech Intelligibility with Increasing Sound Absorption in a Classroom)

  • 딩웨이;박찬재;한찬훈
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.129-141
    • /
    • 2012
  • 본 논문은 강의실의 실내흡음력이 증가함에 따라 발생하는 물리적 음명료도 (D50, STI)의 변화가 한국어와 중국어의 주관적 음이해도 (음성요해도)에 미치는 영향을 조사하였다. 이를 위해 중규모 강의실에서 흡음재를 설치하기 전과 후의 물리적 음향성능을 측정하고, 음절요해도 테스트 법을 사용해 음성요해도를 평가하였다. 음성요해도 평가시 한국어와 중국어의 두 가지 언어를 대상으로 진행함으로써 두 언어의 특성에 따른 음성요해도의 차이를 비교하였다. 실험결과 흡음재를 설치함에 따라 물리적 음명료도가 증가하였으며, 음성요해도 또한 증가함을 알 수 있었다. 또한 동일한 조건에서 음절요해도 테스트를 수행한 결과 한국어보다 중국어의 음성요해도가 더 높은 것으로 평가되었으며 이것은 한국어와 중국어의 발음특성의 차이에 기인한 것으로 사료된다. 한편 물리적 음명료도와 주관적 음명료도의 상관관계 분석결과 ($R^2$) D50의 경우 한국어는 0.696, 중국어는 0.707로 나타났으며 STI의 경우 한국어는 0.651, 중국어는 0.665로 매우 높은 상관관계가 있음을 알 수 있었다.

Car Navigation용 음성합성시스템 최저가 구현 (Low-cost implementation of text to speech(TTS) system for car navigation)

  • 나지훈;성정모;양윤기
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.141-144
    • /
    • 2000
  • 최근에 무선통신망을 이용한 데이터 서비스가 폭넓게 제공되면서, 이동체(MS:mobile station)에 대한 위치정보나 교통상황 둥의 부가 정보 서비스가 제공되고 있다. 이와 같이 이동체가 자동차와 같은 운행수단일 때 사용자가 디스플레이 되는 문자정보를 확인하게 되면 운전의 안정성이 저하되어 실용적이지 못하다. 이를 위해서 문자를 음성으로 전환하여 주는 문자-음성변환기(text to speech : TTS)가 필요하다. 본 논문은 car navigation용 '한국어 무제한 어휘 음성합성기' 를 저가의 DSP chip(ADSP-2185)과 저용량의 4M bits ROM을 사용하여 low-cost system으로 하드웨어를 구성하였다. 본 연구에서 개발된 실시간 한국어 음성 합성기는 저가의 통신 단말기로서 사용 될 수 있으나, 반음절 연결부분의 연결이 불완전한 경우가 많았다. 그러나 종성이 없는 음절에 대해서는 명료도가 비교적 우수하였다.

  • PDF

적응 웨이블릿 패킷 기반 스펙트럼 차감법을 이용한 음성신호 개선에 관한 연구 (A study on Speech Enhancement Using Adaptive Wavelet Packet Based Spectral Subtraction)

  • 김진호;박정재;장성욱;권영헌;양성일
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.43-46
    • /
    • 2004
  • 본 논문에서는 최근에 제안된 음성신호 개선을 위한 적응 웨이블릿 패킷 기반의 스펙트럼 차감법을 이용하여 다양한 측면에서의 성능평가 결과를 제시한다. 사용된 음성신호 개선 방식은 적응 웨이블릿 패킷의 불균등 주파수 해상도와 높은 에너지 집중도로 인해 발생하는 극대, 극소값의 영향을 피하기 위해 기하평균을 이용하는 스펙트럼 추정법을 사용하였다. 다양한 측면의 성능평가를 위해 주관적 평가 척도인 MOS 와 높은 상관도를 갖는 것으로 알려진 log likelihood ratio, log area ratio, segmental SNR, weighted spectral slope 등을 평가 척도로 사용하였다. Fourier 기저를 사용한 방식과의 비교에서 적응 웨이블릿 패킷 방식은 SegSNR 과 음성의 명료도를 비교적 잘 반영하는 weighted spectral slope 측면에서 우수한 성능을 보였다.

  • PDF

선천성 청각장애 아동의 와우이식 후 말 명료도에 관한 문헌 고찰 (The Literature Review of Speech Intelligibility in Congenitally Deafened Children with Cochlear Implantation)

  • 윤미선
    • 대한음성학회지:말소리
    • /
    • 제47호
    • /
    • pp.141-151
    • /
    • 2003
  • The speech intelligibility of congenitally deafened children shows the change after cochlear implantation. The predicting factors of change in speech intelligibility are the age of implantation, the duration of implant use, and communication mode etc.. Among these factors, the age of implantation seems to be one of the most important predictors. But those factors including age of implantation can explain only some parts of the variance. Therefore, the further study to find the factors which affect the speech intelligibility should be done.

  • PDF

근전위 제어형 전기 인공후두의 시작 (Development of an Electrolarynx Controlled by EMG)

  • 민혜정;봉정표;최홍식;윤형로
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1996년도 제6회 학술대회 심포지움
    • /
    • pp.91-91
    • /
    • 1996
  • 현재 시판되고 있는 전기 인공후두는 손으로 인공후두를 경부에 장착하고, 음의 intensity와 pitch를 변하기 위하여 스위치를 손가락으로 조절해야만 하는데, 실제 회화 중에 잘 조절한다는 것은 거의 불가능하므로, 음질과 명료도가 나쁘며, 발성을 의도했을 때 자유롭게 발성하는 것도 어렵다. 또한 회화 중에는 한손은 항상 전기 인공후두를 위해 사용해야 한다. 이러한 단점을 개선하기 위해, 본 연구에서는 흉골설골근 근전위에 의해 제어되는 인공후두를 제작하여 그 성능을 평가하였다. (중략)

  • PDF

명료도 평가용 단음절 목록의 개발 (On the Development of Monosyllable Lists for Articulation Tests)

  • 김정환;강성훈;장대영;김천덕
    • 한국음향학회지
    • /
    • 제13권4호
    • /
    • pp.69-76
    • /
    • 1994
  • 본 연구에서는 일상회화에서 103,581개의 단음절 목록을 표집하고, 한국에 특성에 맞는 5가지 선정규칙을 적용하여, 국내의 명료도 평가용 단음절 목록을 개발하였으며, 이를 이용하여 음성품질 열화요인에 대한 타당성 검증을 수행하였다. 한귀요인인 S/N비와 차단주파수 변화에 대한 타당성 검증결과, 명료도 점수는 열화요인에 따라 체계적인 변화를 보였다. 또한, 명료도 점수에 미치는 두귀요인의 영향을 살펴보기 위해, 방해잡음의 수평 제시각도 효과에 대해서도 검증한 결과, 명료도는 방해잡음의 수평 제시각도에 따라 변화하였다. 그리고, 모든 실험조건에서 목록간에 어떠한 유의미한 차이도 보이지 않았다.

  • PDF

멜로디 억양 치료에서 실어증 환자의 조음 명료도에 대한 호흡 훈련 효과: 초기 실험 (Effects of breathing training in melodic intonation therapy on articulation intelligibility of aphasics: pilot study)

  • 김선식;홍금나;최민주
    • 한국음향학회지
    • /
    • 제35권4호
    • /
    • pp.319-329
    • /
    • 2016
  • 본 논문에서는 브로카 실어증 환자에 대한 멜로디 억양 치료(Melodic Intonation Therapy, MIT)에서 호흡훈련이 조음 명료도를 개선하는지를 평가했다. 실험군은 MIT에 선행하는 2단계 호흡 훈련을 받도록 했다. 중재 효과를 평가하기 위해, 피실험자의 폐쇄음의 폐쇄 길이(VOT), 단어 전체의 발화 길이(TD), 음성 강도 및 호기량을 중재 전과 후에 측정하여 비교 했다. 실험 결과 폐쇄음의 폐쇄 길이 및 단어 전체의 발화 길이는 양순음/p/, 치조음/t/, 연구개음/k/에서 증가했으나(p < 0.05) 파찰음/c/와 마찰음/s/은 변화가 없는 것으로 나타났다(p > 0.05). 반면 대조군에서는 폐쇄음의 폐쇄 길이 및 단어 전체의 발화 길이가 증가하지 않는 것으로 나타났다(p > 0.05). 조음 명료도에 영향을 주는 호기량과 음성 강도는 실험군에서 증가했으나(p < 0.01) 대조군에서는 유의한 변화가 없었다. 결론적으로, 브로카 실어증 환자의 MIT에서 호흡 훈련은 환자의 조음 명료도를 개선하고 있음을 확인할 수 있었다.

잡음환경 음성명료도 향상을 위한 이진 마스크 추정 후처리 알고리즘 (A Post-processing for Binary Mask Estimation Toward Improving Speech Intelligibility in Noise)

  • 김기백
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.311-318
    • /
    • 2013
  • 시간-주파수 영역에서의 이진 마스킹을 이용하여 잡음환경에서 잡음을 제거하여 음질을 향상하는 방법에 대해 논하고자 한다. 잡음이 섞여 있는 음성신호를 시간-주파수 영역으로 분해하여, 상대적으로 잡음이 많이 섞여 있는 시간-주파수 영역 (시간-주파수 유닛의 신호 대 잡음 비 (Signal-to-Noise Ratio: SNR)가 낮은 영역)의 신호에 마스크 "0"을 할당하여 제거함으로써 음성명료도를 향상시킬 수 있다. 이전의 연구에서는 가우시안 혼합 모델을 이용하여 마스크 "0"과 마스크 "1"을 분류하는 방법을 사용하였다. 각 주파수 밴드별로 수집된 데이터를 이용하여 가우시안 혼합 모델을 학습하고 테스트 데이터가 들어오면 현재의 시간-주파수 마스크가 "0"인지 "1"인지 판별하게 된다. 본 논문에서는 이러한 알고리즘에 주파수 영역에서의 종속성을 고려하여 추정된 마스크에 대해 후처리를 수행하는 알고리즘을 제안한다. 주파수 영역에서의 종속성에 관한 후처리는 비터비 (Viterbi) 알고리즘을 이용하며, 제안된 후처리 알고리즘을 적용하여 이진 마스크 추정 오차를 줄여 음성 명료도 향상을 기대할 수 있다.