• 제목/요약/키워드: 음성명료도 평가

검색결과 70건 처리시간 0.022초

Text-to-Speech 합성음 품질 평가 (Assessment of Synthesized Speech by Text-to-Speech Conversion)

  • 정유현
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.98-101
    • /
    • 1993
  • 본 논문은 한국전자통신연구소 음성응용연구실에서 개발한 문자-음성변환 시스팀(Text-to-Speech Conversion System)의 음질개선 연구의 일환으로 Phoneme-Balanced Words 110개에 대해서 개선전 시스팀(V.1)과 개선 후 시스팀(v.2)을 대상으로 각각 실시한 명료도 실험결과에 대하여 기술하고 있다. 본 실험의 목적은 연구개발자 입장에서 합성음 개선에 대한 정량적 성과 및 문제점 파악을 위한 진단형 평가이며 남자 5명, 여자 5명을 대상으로 1회 실시한 청취 실험결과 V.1에 대해서는 최저 37.3%(41개) ~ 최고 55.5%(61개)이고, V.2에 대해서는 최고 39.1%(43개) ~ 최고 60.9%(67개) 결과를 얻었다.

  • PDF

PVQ를 이용한 RPE 구동 시퀀스 양자화 연구 (A Study on Excitation Sequence Quantization in RPE Speech Coding)

  • 강상원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.164-167
    • /
    • 1995
  • RPE 음성부호화기에서 합성 필터로 인한 구동벡터 양자화잡음의 증폭효과를 분석하고 regular pulse 시퀀스의 양자화로 인한 성능감쇄를 줄이기 위해 pyramid vector 양자화방식을 도입하였다. 제안된 방식의 성능평가는 구동시퀀스 양자화를 위해 adaptive PCM을 이용하는 GSM 표준 RPE 방식과의 객관적 및 주관적 성능비교를 통해 수행하였다.T JDSMDQLRY 결과 제안된 방식은 대략 1dB의 SNR 및 segmental SNR 값 증가를 가져왔고, 또한 비공식 청취시험결과 명료도의 증가를 느낄 수 있었다.

  • PDF

유리창 도청방지 장치의 성능평가 (Performance Estimation of a Window Shaker)

  • 김석현;김희동;허욱
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2007년도 춘계학술대회논문집
    • /
    • pp.649-654
    • /
    • 2007
  • Eavesdropping prevention performance is evaluated on a commercial window shaker, which is used to prevent a glass window from eavesdropping. Speech transmission index (STI) is introduced in order to estimate quantitatively the speech intelligibility of the sound detected on the glass window. Objective test by IEC standard using modulation transfer function (MTF) is performed to determine STI. Using Maximum Length Sequency (MLS) signal as a sound source, MTF is measured by accelerometers and laser doppler vibrometer. STI under different level of disturbing wave are compared to confirm the disturbing effect on the speech intelligibility.

  • PDF

레이저센서를 이용한 유리창 도청 및 도청방지기의 성능 평가 (Eavesdropping of the Glass Window Using a Laser Sensor and Performance Estimation of a Window Shaker)

  • 김석현;허욱;김희동
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2008년도 춘계학술대회논문집
    • /
    • pp.551-556
    • /
    • 2008
  • Possibility of the remote eavesdropping through window glass is investigated using a laser sensor. Various thicknesses and types of glass windows are excited by maximum length sequency (MLS) signal and the vibration sound is detected by a laser doppler vibrometer. Intelligibility of the detected sound is evaluated using the speech transmission index (STI), which is based on the modulation transfer function (MTF). In order to identify the disturbing effect, different level of disturbing wave is generated by an outside speaker and a window shaker attached on the glass window. On the different thickness of glass windows, decrease effect of the speech intelligibility is analysed.

  • PDF

청각장애 성인의 말명료도 평가방법의 비교 (Comparisons of Utility of Various Speech Intelligibility Evaluations of Adults with Hearing Impairment)

  • 도연지;김수진
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.173-184
    • /
    • 2004
  • This study aims to discuss the test methodologies that evaluate the speech intelligibility of hearing-impaired adults using various contexts. Seven adults with severe hearing loss participated in the experiment. The context of the speech intelligibility consists of 77 pairs of one-syllable words with phonemic contrasts, 30 two-syllable words and the list of each 12 and 10 sentences. The speech intelligibility of various contexts had significant correlation, and both one-syllable words with phonemic contrasts and the sentence 1 had higher correlation than other tests. The one-syllable words with phonemic contrasts took longer to test than others, and it demanded more effort to select the pair of words. However, from the point of view of the identification of segmental difficulties, the one-syllable words with phonemic contrasts that reflected segmental factors contributing to the intelligibility was useful.

  • PDF

VoIP 음질의 주관적 평가에 관한 연구 (A Study of Subjective Speech Quality Measurement in VoIP)

  • 강영도;강진석;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제5권2호
    • /
    • pp.279-287
    • /
    • 2001
  • 본 논문은 초고속 인터넷을 이용한 음성전송 방식인 VoIP(Voice over IP) 서비스에서의 음질의 주관적 평가에 관한 연구이다. PSNR이나 지터 갊은 멀티미디어 서비스의 객관적 파라미터는 명료히 정의되어 있고 쉽게 측정되나, 그것이 이용자의 지각적 인지도와는 일치하지 않는다. 본 연구에서는 송화자 내용 발생과정에 있어서 어느 정도 완전히 표현되었는가를 나타내는 송화 품질과 음성이 전송계를 통해 수화자에게 전달되는 과정에서 왜곡이나 잡음 등의 방해요인에 의해 열화 되는 정도를 나타내는 전송 품질, 그리고 수화자가 청각에서 신호처리 과정을 거친 송화자의 내용을 어느 정도 이해할 수 있는지를 나타내는 수화 품질에 대한 주관적 평가법과 그 척도를 제시한다. 또한 제안된 방법으로 실험하여 그 유효성을 검증한다.

  • PDF

원단 잡음 환경에서 Soft Decision에 기반한 새로운 음성 강화 기법 (Speech Reinforcement Based on Soft Decision Under Far-End Noise Environments)

  • 최재훈;장준혁
    • 한국음향학회지
    • /
    • 제27권7호
    • /
    • pp.379-385
    • /
    • 2008
  • 본 논문에서는 근단 (Hear-End)및 원단 (Far-End) 잡음 환경에서 효과적인 음성 강화 기법을 제시한다. 일반적으로 배경 잡음이 존재하는 근단 환경에서 수신하는 원단 화자 음성의 명료도가 매우 감소하므로, 이를 극복하기 위한 원단 화자 음성 강화 기법이 필요하다. 구체적으로, 추정된 근단 화자의 배경 잡음 전력을 기반으로 원단 화자의 음성 전력을 강화시키는데, 특별히 근단 환경에서도 잡음이 존재하는 일반적인 경우를 고려하여, 잡음에 오염된 원단 음성 신호중 잡음을 제외한 실제 음성 신호만 강화하는 개선된 알고리즘을 제안한다 제안된 음성 강과 기법의 성능은 다양한 잡음 환경 하에서 ITU-T P.800의 주관적 음질 측정 방법인 CCR (Comparison Category Rating) 테스트에 의해 평가되었으며, 기존의 음성 강화기법과 비교해서 우수한 성능을 보여주었다.

정상압 수두증 환자와 정상 노인의 조음교대운동 수행력 비교 (Characteristics of accurate token and all token diadochokinesis in patients with normal pressure hydrocephalus)

  • 윤성희;박기수;강경훈;윤장혁;하지완
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.57-65
    • /
    • 2024
  • 정상압 수두증(normal pressure hydrocephalus, NPH)은 뇌의 뇌척수압은 정상 범위에 있지만 뇌척수액이 정상 수준보다 증가해 뇌실확장증을 유발하는 질환으로, 조음기관의 운동성과 범위가 감소해 조음교대운동(diadochokinesis, DDK)과 말명료도에 영향을 줄 수 있다. 본 연구에서는 NPH 환자 38명과 정상 노인 38명을 대상으로 /파/, /타/, /카/ 및 /파타카/에 대한 DDK 과제를 실시한 후, 정확한 산출만 측정한 DDK(accurate token-DDK)와 부정확한 산출 포함, 모든 산출시도를 측정한 DDK(all token-DDK)의 두 방법을 모두 사용해 그 결과를 비교하였다. 또한 DDK가 NPH와 정상 노인의 두 집단을 얼마나 정확하게 분류 가능한지, 그리고 DDK와 말명료도 간 상관관계는 어떠한지에 대해서도 알아보았다. 연구결과, NPH 집단과 정상 노인 집단 간에는 accurate token-DDK와 all token-DDK 모두에서 유의한 차이가 있었고, 집단 분류정확도는 accurate token-DDK의 경우 75.0%, all token-DDK의 경우 77.6%로 비교적 높았다. 그러나 NPH 집단에서 DDK 속도와 말명료도 측정값 간에는 유의한 상관관계가 없었다. 본 연구는 NPH 환자의 말운동능력을 민감하게 평가하는 데에 DDK가 유용한 방법임을 시사한다.

PCMM 기반 특징 보상 기법에서 변별력 향상을 위한 Minimum Classification Error 훈련의 적용 (Minimum Classification Error Training to Improve Discriminability of PCMM-Based Feature Compensation)

  • 김우일;고한석
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.58-68
    • /
    • 2005
  • 본 논문에서는 잡음 환경에서 강인한 음성 인식을 위하여 특징 보상 기법의 성능을 향상시킬 수 있는 방법을 제안한다. 기존의 음성 모델 기반의 특징 보상 기법에서 이용되는 오염 음성 모델 추정 방식은 입력 음성에 대한 변별력 있는 사후 확률 예측을 보장하지 못하며, 부정확하게 계산된 사후 확률은 복구된 음성에서 명료도 하락의 문제를 일으킨다. 제안하는 기법에서는 오염 음성 모델 추정 과정에 분별적 훈련 방식의 하나인 최소 분류 오류 (MCE) 훈련 기법을 도입한다. MCE 훈련 기법을 적용하기 위해 변별력 하락의 가능성을 가지는 '경쟁 요소' 를 결정하는 기법을 제안한다. 병렬결합된 혼합 모델 (PCMM) 기반의 특징 보상에 MCE 훈련 기법을 적용하는 과정을 제안하고 변별력 향상의 영향을 관찰한다. Aurora 2.0 데이터베이스와 실제 자동차 주행 환경에서 수집된 음성 데이터베이스에 대한 성능 평가를 실시한다. 실험 결과는 제안한 기법이 음성 인식 성능 향상에 도움이 되는 것을 입증한다.

기존 가수 및 신세대 가수의 소리지속시간 분석에 관한 연구 (A Study on Analysis of Speech Duration Between the Existing Singer and New Generation Singer)

  • 정영훈;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.119-122
    • /
    • 2002
  • 음악을 함에 있어서 정확하고 매력적인 발성을 하는 것도 중요하지만 더욱 기본적이고 중요한 것이 정확한 발음을 내는 것이다. 정확한 발음이 해결되지 않은 상태에서는 아무리 발성법을 꿰뚫고 있다하더라도 많은 사람들에게 자신이 전달하고자 하는 메시지를 제대로 전달하지 못하게 된다. 보통 노래를 잘 부르기 위해서 노래방 같은 곳을 찾아가 노래 연습을 하는 사람들이 많이 있는데, 무엇보다 기본적인 발음이 명확하지 않으면 노래를 잘 부른다고 볼 수는 없는 것이다. 랩을 주로 하는 신세대 가수들의 음악을 들어 보면 자막을 보지 않고서는 무슨 말인지 알아들을 수가 없다. 그들이 노래할 때 입 크기의 변화 없이 입술모양만 변화시키면서 발성하기 때문이다. 음성은 기본적으로 여기성분과 성도성분으로 구분할 수 있다. 성도는 인두강과 구강을 합쳐서 일컫는다. 따라서 입 모양을 어떻게 하느냐에 따라서 같은 말이라도 명료성이 달라지게 된다. 본 논문에서는 이 소리지속시간을 비교 평가하기 위해서 기존가수와 신세대 가수의 한 음절에 대한 지속시간을 비교하여 보았고 8Khz까지의 스펙트로그램을 비교하였다. 비교결과 기존 가수가 신세대 가수에 비하여 말의 의사 전달에 있어서 명료하게 전달 할 수 있다는 것을 알 수 있었다.

  • PDF