• 제목/요약/키워드: 포먼트

검색결과 96건 처리시간 0.031초

구개인두부전증 환자와 모의 음성의 모음과 자음 분석 (Analysis on Vowel and Consonant Sounds of Patent's Speech with Velopharyngeal Insufficiency (VPI) and Simulated Speech)

  • 성미영;김희진;권택균;성명훈;김우일
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1740-1748
    • /
    • 2014
  • 본 논문에서는 구개인두부전증 (VPI) 환자 발음과 정상인의 모의 발음에 대한 듣기 평가와 음향 분석을 실시한다. 본 연구를 위해 음성 데이터 수집을 위해 50개의 단어, 모음 및 단음절로 이루어진 발음 목록을 설정한다. 듣기 평가실험의 편의를 위해 웹 기반의 듣기 평가 시스템을 구축한다. 듣기 평가 결과는 실제 VPI 환자의 발음에 대한 오인식 경향과 모의 발음의 오인식 경향이 유사함을 나타낸다. 이러한 유사성은 모음의 포먼트 위치와 자음의 스펙트럼의 비교를 통해서도 확인할 수 있다. 실험 결과는 본 연구에서 사용한 정상인의 VPI 모의 발화 기법이 실제 환자의 음성을 비교적 효과적으로 모의하는 것을 반영하는 결과이다. 향후 VPI 환자의 음성 인식 과정에서 정상인의 모의 발화음성 데이터를 음향 모델의 적응 기법과 같은 분야에 유용하게 사용할 수 있을 것으로 기대한다.

음성파형의 평균진폭 변동율에 의한 주기별 피치검출 (Period-to-Period Pitch Estimation Using Average Magnitude Fluctuation Rate)

  • 강동규
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.125-128
    • /
    • 1994
  • 선형예측기법으로 피치동기식 분석을 하기 위해 우선적으로 필요한 정보로서 유성음 신호의 영교차 구간별 평균 진폭변동율 추출에 의한 주기별 피치를 검출할 수 있는 기법을 제안하였다. 유성음의 제1포먼트 성분에 대한 각 영교차 구간에서의 평균진폭값은 성대 폐쇄시점에서 주기별 최대치를 나타내며, 평균진폭변동율은 "+" 영역의 평균진폭값과 선행하는 "-" 영역 값의 차로 표시한다. 이 평균 진폭 변동율은 성대파형의영향이 반영되어 주기성이 더욱 강조되므로 분석구간에 대한 구간별 평균피치와 변화의 정도를 이용하여 주기별피치정보를 추출할 수 있다. 검출결과는 구간별 평균피치와 비교하였으며, 좋은 결과가 나타나는 것을 확인할 수 있다.과가 나타나는 것을 확인할 수 있다.

  • PDF

한국인 학습자의 영어 강세 실현과 모음 포먼트에 관한 연구 (A Study on Realizations of English Stress and Vowel Formant Frequency by Korean Learners)

  • 김지은
    • 말소리와 음성과학
    • /
    • 제6권1호
    • /
    • pp.39-45
    • /
    • 2014
  • This study investigates twenty four Korean females' production of English front vowels focusing on the distinction in /i/ vs /ɪ/ and /ɛ/ vs /${\ae}$/ and formant values of stressed and unstressed vowels compared with those of native English speakers. The Korean learners were asked to read a textbook passage which includes ten sentences including target vowels. The major results indicate that: (1) Korean learners have trouble producing a distinct version (tense and lax) of front vowels in the paragraph reading; (2) The vowel space of the stressed vowels in a paragraph is smaller than that of embedded sentences; and (3) The vowel quality of the unstressed vowels produced by the Korean learners is similar to that of the native English speakers. The findings from this study can be applied to the pronunciation teaching for the Korean learners of English vowels and realization of English stress.

연령 및 성별에 따른 한국인 단모음 포먼트 비교에 관한 연구 -한방병원 내원환자를 중심으로- (A Study on the Formant Comparison of Korean Monophthongs according to Age and Gender -A Survey on Patients in Oriental Hospitals-)

  • 김영수;김근호;김종열;장준수
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.73-80
    • /
    • 2013
  • Formant is one of the essential vocal features for research of voice production, recognition and synthesis. Numerous studies were established on foreign languages including English vowels. However, studies related to Korean were done with a limited number of voice data. In this study, we compare four formants according to age and gender using a large number of Korean monophthongs. A total of 2614 Korean speakers participated in our experiments. We summarize statistical results by mean and standard deviation for each formant of five monophthongs. The results show a notable difference in each age and gender group. A quantitative study based on a large dataset is suggested for future studies on Korean speech sounds.

모음의 포먼트 변형에 따른 인공와우 이식 아동의 청각적 인지변화 (Perception Ability of Synthetic Vowels in Cochlear Implanted Children)

  • 허명진
    • 대한음성학회지:말소리
    • /
    • 제64호
    • /
    • pp.1-14
    • /
    • 2007
  • The purpose of this study was to examine the acoustic perception different by formants change for profoundly hearing impaired children with cochlear implants. The subjects were 10 children after 15 months of experience with the implant and mean of their chronological age was 8.4 years and Standard deviation was 2.9 years. The ability of auditory perception was assessed using acoustic-synthetic vowels. The acoustic-synthetic vowel was combined with F1, F2, and F3 into a vowel and produced 42 synthetic sound, using Speech GUI(Graphic User Interface) program. The data was deal with clustering analysis and on-line analytical processing for perception ability of acoustic synthetic vowel. The results showed that auditory perception scores of acoustic-synthetic vowels for cochlear implanted children were increased in F2 synthetic vowels compaire to those of F1. And it was found that they perceived the differences of vowels in terms of distance rates between F1 and F2 in specific vowel.

  • PDF

중국인 한국어 학습자와 한국인의 'ㄹ' 발음의 길이와 포먼트에 대한 연구 (A Study on the Length and Formant Structures of the Korean Liquid 'ㄹ' Pronounced by Chinese Learners and Koreans)

  • 범류
    • 대한음성학회지:말소리
    • /
    • 제57호
    • /
    • pp.43-58
    • /
    • 2006
  • This study aims to investigate whether Chinese learning Korean and Korean native speakers show any difference in length and formant structures of the Korean liquid 'ㄹ' in the environments of v_v and v_# through the acoustic analysis of 10 Chinese learners' and 10 Koreans' utterances. The acoustic analysis of L2KSC DB shows that the length and formant structures of 'ㄹ' produced by Chinese learners are significantly different from the ones by Koreans. I explain these differences by contrasting the liquids and syllable structure constraints of the two languages, Chinese and Korean. In addition, I relate the F1 and F2's values to the tongue's movement when making a constriction, and conclude that Chinese learners pronounce the 'ㄹ' in the v_# environment with the tongue lower and backer than Koreans do.

  • PDF

성대마이크를 이용한 ASR 시스템 개발을 위한 인식기 최적화 (Recognizer Optimization for a Isolated-word Recognition system using Throat Microphone)

  • 정영규;한문성;이상조
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.406-410
    • /
    • 2007
  • 성대마이크는 디바이스의 특성상 환경 잡음을 최소화하는 장점이 있다. 그러나 고주파정보의 손실과 부분적인 포먼트 정보의 손실 때문에, 성대마이크를 이용한 명령어 인식기는 표준마이크를 이용한 명령어 인식기보다 낮은 성능을 보인다. 본 논문은 한국어 음운자질의 특성을 적용한 특징추출 알고리즘과 최적화된 인식모델을 이용하여 높은 성능을 갖는 명령어 인식시스템을 제안한다. 성대 울림 특성이 한국어 내의 분포 분석하여 성대 울림 정보만으로 명령어 인식기 개발이 가능함을 보이고 음성인식에 높은 성능을 보이는 Time Delay Neural Network(TDNN)[1]을 성대신호 명령어 인식에 최적화한 구조를 제안한다. 실험을 통해 찾은 최적 TDNN 구조를 성대신호에 적용한 했을 때 약 87%의 높은 성능을 보였다.

  • PDF

강세에 따른 영어 모음의 포먼트 변이와 모음 발음 교육에의 응용 (The Formant Frequency Differences of English Vowels as a Function of Stress and its Applications on Vowel Pronunciation Training)

  • 김지은;윤규철
    • 말소리와 음성과학
    • /
    • 제5권2호
    • /
    • pp.53-58
    • /
    • 2013
  • The purpose of this study is to compare the first two vowel formants of the stressed and unstressed English vowels produced by ten young males (in their twenties and thirties) and ten old males (in their forties or fifties) from the Buckeye Corpus of Conversational Speech. The results indicate that the stressed and unstressed vowels, /i/ and $/{\ae}/$ in particular, from the two groups are different in their formant frequencies. In addition, the vowel space of the unstressed vowels is somewhat smaller than that of the stressed vowels. Specifically, the range of the second formant of the unstressed vowels and that of the first formant of the unstressed front vowels were compressed. The findings from this study can be applied to the pronunciation training for the Korean learners of English vowels. We propose that teachers of English pay attention to the stress patterns of English vowels as well as their formant frequencies.

한국어 전설 모음의 포먼트 전이 형태 (Formant Transition Shapes of Korean Front Vowels)

  • 오은진
    • 말소리와 음성과학
    • /
    • 제5권4호
    • /
    • pp.195-200
    • /
    • 2013
  • This study investigates formant transition shapes of Korean front vowels produced by native speakers of Seoul Korean. Sixteen speakers (eight male and eight female speakers) produced [pVt] syllables where the vowels were [i, e, ɛ]. F1, F2, and F3 transition shapes were estimated by presenting formant values at 11 points by dividing the vowel duration into 10 different time intervals. The results indicated that the male and female speakers overall demonstrated similar formant transition shapes and measurement points arriving at the maximum and minimum formant values for the three front vowels. As for the vowels [e] and [ɛ], both male and female speakers showed similar formant values across the 11 measurement points and similar measurement points arriving at the maximum and minimum values, indicating that the two Korean vowels have been merged not only in the steady-state formant values, but also in the dynamic transition shapes.

LSP를 이용한 음소단위 PSOLA 음성합성에 관한 연구 (A Study on Phoneme-Based PSOLA Speech Synthesis Using LSP)

  • 권혁제;조순계;김종교
    • 한국음향학회지
    • /
    • 제17권2호
    • /
    • pp.3-10
    • /
    • 1998
  • 본 논문에서는 음소단위 PSOLA 한국어 합성을 LSP line의 조절과 자모음 분석을 통해서 실시하였다. 음성합성에서 많이 사용하는 triphone, diphone, demisyllable등과 같은 합성단위들은 자연스러운 합성음을 위해 다양한 음운환경에서 수집된다. 그러나, 이런 방법 은 많은 시간과 메모리가 요구된다. 본 논문에서는 합성단위로서 자음17개, 모음 16개로 총 33개의 음소를 이용하였다. 자음은 후위모음/이/인 CV에서 segment되고, 모음은 단음절의 단모음과 이중모음을 1인의 화자로부터 합성데이터를 수집하였다. 또한, 10명의 화자가 발성 한 CV에서 각 모음에 따라 변하는 자음의 주파수를 분석하였고, CV+VC 또는 CV+CV에서 각 자음에 따라 변하는 모음의 포먼트변화를 분석하였다. 분석결과를 토대로 모음은 LSP line을 조절해서 PSOLA합성을 하고, 자음은 합성하려는 모음과 결합하였다. 그 결과 6개의 합성단어에 대한 청취율은 65%를 보였다.

  • PDF