• 제목/요약/키워드: 음향학적 평가

검색결과 137건 처리시간 0.021초

주파수 영역에서 구간조건을 이용한 음향학적 반향 제거 (Frequency Domain Acoustic Echo Suppression Based on Boundary Condition)

  • 이규호;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제46권5호
    • /
    • pp.162-166
    • /
    • 2009
  • 본 논문은 적응 반향 제거기인 parametric wiener filter (PWF)의 반향신호 제거 파라미터를 구간 조건에 따라 차등적으로 적용시키는 새로운 음향학적 반향제거 (Acoustic Echo Suppression, AES) 알고리즘을 제안한다. PWF는 반향 신호 추정의 부정확성을 보상하고자 반향신호 제거 파라미터를 사용한다. 기존의 방법은 단일통화 구간과 동시통화 구간에 관계없이 동일한 반향신호 제거파라미터 값을 적용하여 동시통화 환경에서 근단 신호의 왜곡을 발생 시킨다. 본 논문에서는 상관계수 (Correlation Coefficient)를 이용한 동시통화(Double-Talk) 검출 알고리즘과 음성구간검출기 (Voice Activity Detector, VAD)의 결과로부터, 원단 화자만 있는 구간과 동시통화 구간을 구분하고 각각의 경우에 반향제거 파라미터를 달리 적용하여 동일한 반향신호 제거 파라미터를 사용함에 따른 동시통화 구간내의 근단 화자신호의 음질 저하 없이 반향신호를 보다 효과적으로 제거하는 방법을 제안한다. 제안된 방법의 결과는 객관적인 실험을 통해 비교 평가한 결과 우수한 성능을 보였다.

TM Joint의 물리치료를 통한 훈련이 모음의 음향학적 특성에 미치는 영향 (Influence of Temporo-mandibular Joint Training Using Physical Therapy on the Vowel Acoustic Characteristics)

  • 민동기;이재홍
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2203-2208
    • /
    • 2011
  • 턱관절의 물리치료를 통한 훈련으로 모음 조음에 관여하는 구강 공명강을 증가시켜, 턱관절의 정상적인 발성패턴을 유지하도록 하여 턱관절장애 환자의 모음의 음향학적 특성 변화를 보고자 하였다. 연구 대상은 턱관절장애로 진단 받은 3명의 20~30대 성인 남자를 대상으로 하였다. 실험방법은 대상자간 중다기초선 설계를 이용하여 기초선 단계, 치료 단계, 유지 단계로 진행하였다. 치료는 한 회기를 30분으로 하여 주 3회 실시하였고 3회기를 한 평가단위로 5회의 중간평가를 실시하였다. 평가방법은 Praat 음성 분석프로그램을 이용하여 /ㅏ/ 모음의 연장 발성에 대한 제 1포먼트 주파수(F1), 제 2포먼트 주파수(F2) 그리고 기본주파수(F0)를 분석하였다. 물리치료를 통한 훈련 프로그램을 실시한 결과 턱관절장애 환자의 제 1포먼트 주파수(F1), 제 2포먼트 주파수(F2) 그리고 기본주파수(F0)는 치료 전 보다 증가하는 변화를 보였고, 이는 모음의 개구도와 관계된 제 1 포먼트 주파수(F1) 뿐만 아니라 모음의 전후설, 성대의 움직임과 관련이 있는 제 2포먼트 주파수(F2) 그리고 기본주파수(F0)의 변화도 함께 보임으로써 턱관절과 모음 및 음성 산출의 연관성을 보여주었다.

한국어 음성인식을 위한 음성 데이터 수집 (Speech Data Collection for korean Speech Recognition)

  • 박종렬;권오욱;김도영;최인정;정호영;은종관
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.74-81
    • /
    • 1995
  • 본 논문에서는 한국과학기술원(KAIST) 통신연구실에서 개발한 한국어 음성 데이터베이스의 개발에 관하여 기술한다. 음성 데이터베이스의 구축을 위하여 사용된 절차와 환경, 및 데이터베이스의 음성학적, 언어학적 성질들이 상세히 기술된다. 데이터베이스는 음성인식 알고리듬의 개발 및 평가를 위하여 사용되도록 고안되었다. 데이터베이스는 5종류의 음성 데이터, 즉 3천단어 규모의 무역관련 연속음성, 가변길이 연결 숫자음, phoneme-balanced75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다.

  • PDF

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.233-237
    • /
    • 1993
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 cluster로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사사에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means 클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해, 먼저, 우리말 음소들을 모음, 파열음, 마찰음, 파찰음, 유음 및 비음, 종성의 6개 음소군으로 분류하고 각 음소군에 대한 특징 지도를 구성하여 labeler의 기능을 수행하게 하였다. 화자 종속 인식실험 결과 87.2%의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

발음평가용 멀티미디어 시스템 구현을 위한 구어 프랑스어의 음향학적 단서 (Acoustic Cues in Spoken French for the Pronunciation Assessment Multimedia System)

  • 이은영;송미영
    • 음성과학
    • /
    • 제12권3호
    • /
    • pp.185-200
    • /
    • 2005
  • The objective of this study is to examine acoustic cues in spoken French for the assessment of pronunciation which is necessary to realization of the multimedia system. The corpus is composed of simple expressions which consist of the French phonological system include all phonemes. This experiment was made on 4 male and female French native speakers and on 20 Korean speakers, university students who had learned the French language more than two years. We analyzed the recorded data by using spectrograph and measured comparative features by the numerical values. First of all, we found the mean and the deviation of all phonemes, and then chose features which had high error frequency and great differences between French and Korean pronunciations. The selected data were simplified and compared among them. After we judged whether the problems of pronunciation in each Korean speaker were either the utterance mistake or the interference of mother tongue, in terms of articulatory and auditory aspects, we tried to find acoustic features as simplified as possible. From this experiment, we could extract acoustic cues for the construction of the French pronunciation training system.

  • PDF

성별에 따른 한국 정상 성인 음성의 음향학적 평가 기준치 (Acoustic Characteristics of the Voices of Korean Normal Adults by Gender on MDVP)

  • 김재옥
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.147-157
    • /
    • 2009
  • The purpose of the study is to develop the normal voice database and to analyze the acoustic characteristics of Korean adults' voices by gender using MDVP. Eight categories in the 34 parameters of MDVP were analyzed in the voices of 170 Korean normal adults taken from /a/ vowel. Among them, Fundamental Frequency Parameters and Frequency Perturbation Parameters were significantly different by gender. In addition, Fundamental Frequency Parameters of our data were remarkably different from the data suggested in the MDVP program which currently used in clinics. Therefore, the data obtained from the current study can be effectively used for the diagnosis of voice disorders of Korean adults as the standard parameter values of MDVP.

  • PDF

연극 배우의 음성 관리 및 음성 사용에 관한 연구

  • 조성미;정옥란
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.137-137
    • /
    • 2003
  • 본 연구는 직업적 음성 사용자인 연극 배우의 음성 관리, 극중 인물 특징을 표현하기 위한 요소 중 음성이 차지하는 비중과 적합한 발성 및 발화 방법에 대하여 살펴보았다. 본 연구에는 대구광역시 소재 K극예술연구회의 연극 배우 9명이 참여하였다. 연극 배우의 음성 관리 및 극중 인물의 특성을 표현하기 위한 발성 및 발화 방법에 대한 설문지를 작성하여 조사하였다. 여러 가지 인물에 적합한 발성법으로 '산책' 문단을 발화하도록 한 뒤, 대상자들에게 각 인물에 대한 발성 방법을 설문지에 기록하도록 하였다. 대상자들이 발화한 음성 샘플을 음향학적, 지각적 측면에서 평가하여 대상자들이 기술한 발성 및 발화 방범과의 상관을 살펴보았다. 음성 샘플은 Windows용 Praat(4.1.7)으로 수집 및 분석하였다. (중략)

  • PDF

자동 음성 분할 시스템의 성능 향상 (An improved automatic segmentation algorithm)

  • 김무중;권철홍
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.45-48
    • /
    • 2002
  • 본 논문에서는 한국어 음성 합성기 데이터베이스 구축을 위하여 HMM을 이용하여 자동으로 음소경계를 추출하고, 음성 파라미터를 이용하여 그 결과를 보정하는 반자동 음성분할 시스템을 구현하였다. 개발된 시스템은 16KHz로 샘플링된 음성을 대상으로 삼았고, 레이블링 단위인 음소는 39개를 선정하였고, 음운현상을 고려한 확장 모노폰도 선정하였다. 그리고 언어학적 입력방식으로는 음소표기와 철자표기를 사용하였으며, 패턴 매칭 방법으로는 HMM을 이용하였다. 유성음/무성음/묵음 구간 분류에는 ZCR, Log Energy, 주파수 대역별 에너지 분포 등의 파라미터를 사용하였다. 개발된 시스템의 훈련된 음성은 정치, 경제, 사회, 문화, 날씨 등의 코퍼스를 사용하였으며, 성능평가를 위해 훈련에 사용되지 않은 문장 데이터베이스에 대해서 자동 음성 분할 실험을 수행하였다. 실험 결과, 수작업에 의해서 분할된 음소경계 위치와의 오차가 10ms 이내가 $87\%$, 30ms 이내가 $91\%$가 포함되었다.

  • PDF

급성 COVID-19 감염의 음성 변화 추적 관찰 1예 (A Follow-Up Case of Voice Changes in Acute COVID-19 Infection)

  • 이승진
    • 대한후두음성언어의학회지
    • /
    • 제33권3호
    • /
    • pp.183-187
    • /
    • 2022
  • Dysphonia is well known as one of the otolaryngological symptoms of coronavirus disease 2019 (COVID-19) infection. The vocal changes of the COVID-19 condition have been reported in terms of parameters of multi-dimensional voice assessment, including acoustic analysis, auditory-perceptual evaluation, and psychometric assessment. However, there has not been a daily followup study in patients with acute COVID-19 infection. In this study, a 41-year-old male performed daily voice recordings of vowel phonation and passage-reading tasks during the self-quarantine period of one week. Compared to the normal voice status of the prepandemic period, voice abnormalities peaked on day two after the diagnosis of COVID-19 infection and recovered after one week.

체외 충격파 치료술을 위한 솔레노이드 코일을 이용한 전자기식 충격파 발생기: 구성 및 음향학적 특성 (An Electromagnetic Shock Wave Generator Employing a Solenoid Coil for Extracorporeal Shock Wave Therapy: Construction and Acoustical Properties)

  • 최민주;이종수;강관석;팽동국;이윤준;조주현;임근희
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.271-281
    • /
    • 2005
  • 솔레노이드 코일을 이용하여 체외 충격파 치료술에 적합한 전자기식 충격파 발생기를 구성하였다. 충격파 발생기의 충격파의 특성은 바늘형 하이드로폰을 이용하여 평가하였다 충격파 발생기 방전 전압이 8에서 18 kV로 증가할 때 측정된 충격파의 최대 양압 (P+)은 $10\~77\;MPa$사이를 비선형적으로 증가하는 것으로 나타났다. 반면, 충격파 최대 음압 (P-)은 $-3.2\~-6.8\;MPa$ 에서 변화하고 있으며, 방전 전압이 14 kV에서 -6.9 MPa로 가장 낮은 값을 보였다. 동일한 설정에서 반복 측정된 충격파의 크기 P+는 평균값의 $5\;\%$ 이내에서 변화하며, 전기 수력학적 방식 충격파 발생기 경우의 $50\;\%$ 정도와 비교하여, 매우 작은 것으로 나타났다. 시간 축에서 1 ms 동안 측정한 하이드로폰 신호로부터 충격파에 의해 야기된 음향 공동 현상, 즉, 기포의 파열 현상으로 발생된 다수의 순차적인 음향 임펄스를 관찰할 수 있었다. 웨이블렛 변환 기법을 이용하여, 충격파 강도와 밀접한 관련이 있는 것으로 알려진, 첫 번째와 두 번째 기포 파열 시간 지연을 정확히 측정하였다. 충격파 크기 P+가 10 에서 77 MPa로 증가할 때 측정된 기포 파열 지연 시간은 120부터 $700\;{\mu}s$ 로 거의 선형적으로 증가함을 관찰할 수 있었다.