통합 검색 | Korea Science

포르만트를 이용한 한국어 단모음 분류 시스템의 개발에 관한 연구 (A Study on The Development of the Korean Vowel Discrimination System Using Formant)

최윤석;김기석;황희용
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
- /
- pp.1107-1110
- /
- 1987
한국어 음소 인식 시스템의 구현을 위한 한 단체로써 한국어 모음의 분류를 위한 시스템을 설계하였다. 특징 파라미터로는 에너지, 영교차율 그리고 제 1, 제 2, 제 3 포르만트를 사용하였다. [아, 어, 오, 우, 으, 이, 에, 애]의 8개의 단모음에 해당하는 총 132개의 음성 데이터에 대하여 실험하였다. 각각의 모음에 대한 포르만트의 평균치를 구한 뒤 이들의 값을 표준 패턴으로 갖는 인식 시스템을 구현한다. 구현된 인식 시스템에 의하여 새로운 음성의 모음부가 어떤 모음인지를 인식하며 결정할 때의 거리 측정 방식으로는 선형분류 함수를 사용하였다. 132개의 모음에 대하여 62.9%의 인식율을 나타내었다.
PDF

한국어 단모음 8개에 대한 음향분석 - F1/F2 모음공간에서의 음향변수를 중심으로 - (An Acoustic Analysis on the Korean 8 Monophthongs - With Respect to the Acoustic Variables on the F1/F2 Vowel Space -)

성철재
- 한국음향학회지
- /
- 제23권6호
- /
- pp.454-461
- /
- 2004
This paper describes the acoustic characteristics of 8 Korean monophthongs. Two acoustic variables were newly manipulated the distance between Fl and F2 (Δ［F2-Fl］). which might be of help for the judgement of the vowel backness. and Euclidian distance between two vowels. ［에］ & ［애］ were observed to be merged in both male vowel space and the female's. respectively. The merger of ［우］ & ［오］, on the other hand, was only seen in the female space. In case of Fl, which concerns the vowel height. the scope of the females' was 1.36 times longer than that of the males' Regarding F2, which is related to the vowel backness. the females used a space 1.29 times longer than the males. The observation of Euclidian distance between the basic 3 vowels (이. 아. 우) showed that the females have longer distance than the males: ［이-아］ 1.25 times, ［아-우］ 1.45 times, and ［이-우］ 1.35 times. respectively.
PDF KSCI

SCHMM 기반 7연속 숫자음 인식에 관한 연구 (A Study on 7-Connected Digits Speech Recognition using SCHMM)

김세용;정희석;강철호
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.127-130
- /
- 2002
본 연구에서는 우리말 연속 숫자음 인식에서 본래의 숫자음을 변이 시키는 주된 요인인 연음현상에 대한 인식을 높이기 위해 별도의 연음부분의 레퍼런스를 작성하여 매칭 시키는 방식을 제안한다 또한 단모음으로 이루어진 /2/와 /5/의 연속된 음에 대하여도 레퍼런스를 작성하였다. 제안한 방식에 의하여 전체적으로 $1.4\%$정도 인식률이 상승됨을 볼 수 있다. 특히 발성 목록중 /82/, /62/, /31/, /15/, /75/ 등의 연음과 /226/, /755/등과 같이 모음의 연속된 발성이 포함된 숫자 열에서 제안된 방식이 인식률에 영향을 미치는 것을 볼 수가 있었다. 이는 연음에서 발생하는 오류가 연속 숫자음에 많은 영향을 미치는 것을 알 수 있다. 그 외에 /22/, /55/등과 같이 단모음으로 이루어진 숫자음의 연속 발성 또한 인식률을 저하시키는데 한 요인으로 작용함으로서 이에 대한 레퍼런스도 작성하여 인식률이 상승되는 것을 볼 수 있었다.
PDF

베트남인 고급 학습자의 한국어 단모음에 대한 실험음성학적 연구 (Experimental Study on the Korean Monophthongs by Vietnamese Advanced Korean Learners.)

장혜진
- 한국어학
- /
- 제80권
- /
- pp.211-234
- /
- 2018
This study aims to research the acoustic properties of Korean and Vietnamese monophthongs by Vietnamese advanced Korean learners, and to discuss the realization of Korean monophthongs compared to Koreans. The Vietnamese advanced Korean learners do not distinguish between /e/ and /${\varepsilon}$/, which are the same as Korean. They pronounce Korean /e(${\varepsilon}$)/ close to /e/ in their native language. In the case of /ʌ/, it is reported that many errors are observed in previous studies. However, /ʌ/ of Vietnamese advanced learners is realized similar to /ʌ/ spoken by Koreans. /ɯ/ of Vietnamese advanced Korean learners is pronounced in the back of the tongue, whereas in the central by Koreans. In the case of /o/ and /u/, there is no significant difference by the Vietnamese advanced Korean learners. /ɯ/ and /u/ are pronounced in relatively front side of the tongue in Korean, but it is not observed in the Vietnamese advanced Korean learners.
https://doi.org/10.20405/kl.2018.08.80.211 인용

Fuzzy를 이용한 VQ/NN에 기초를 둔 음성 인식 (Speech Recognition Based on VQ/NN using Fuzzy)

안태옥
- 한국음향학회지
- /
- 제15권6호
- /
- pp.5-11
- /
- 1996
본 논문은 불특정 화자의 단모음 인식에 관한 연구로써, fuzzy개념를 이용한 VQ(Vector Quantization)/NN(Neural Network)에 의한 음성 인식 방법을 제안한다. 이 방법은 fuzzy를 이용하여 VQ codebook에 의해 다중 관측열(multi-observation sequence)을 구해 각 symbol이 데이타로부터 가질 수 있는 확률값을 계산하여 이 값을 신경 회로망의 입력으로 사용하는 방법이다. 인식 대상어로는 한국어 단모음을 선정하였으며 10명의 남성 화자가 8개의 단모음을 10번씩 발음한 음성 데이터베이스를 이용하여 fuzzy를 이용하지 않은 VQ/NN과 fuzzy를 이용한 VQ/HMM(hidden Markov model)에 의한 인식률과 비교 실험한다. 실험 결과에 의하며, VQ/NN에 의한 인식률은 92.3%이며, fuzzy를 이용한 VQ/HMM에 의한 인식률은 93.8%이고, fuzzy를 이용한 VQ/Nn에 의한 인식률은 95.7%이다. 그러므로, 본 연구의 fuzzy를 이용한 VQ/NN이 학습 능력이 뛰어난 관계로 fuzzy를 이용한 VQ/HMM과 일반적인 VQ/NN 보다 인식률이 향상됨을 보여준다.
PDF

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

이성희;박준호;고한석
- 한국음향학회지
- /
- 제25권7호
- /
- pp.312-318
- /
- 2006
기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.
https://doi.org/10.7776/ASK.2006.25.7.312 인용 PDF KSCI

현대 중국어 모음 'o'의 음가 고찰 및 발음지도 제언

김선화
- 중국학논총
- /
- 제63호
- /
- pp.29-45
- /
- 2019
现代汉语普通话中单元音'o'在不同韵母中的音值有差别, 但对此专家议论纷纷, 对学汉语的学生, 教汉语的老师是个难点之一. 本论文对'o'的音值和与'o'结合的二合复元韵母, 三合复元韵母进行考察, 寻找不同韵母中的'o'的正确的音值. 本论文把韩国教材里的关于'o'的说明进行分析, 再对中国学者的解释进行对照检查. 分析调查结果说明, 'o'是不同韵母中的音值不一样, 单元音'o'的实际音值是[o]和[ɔ]之间, 'ou'和'iou'的'o'的实际音值可以说是[o]或[ə]. 对于'ou', 'iou', 'uo'的'o'的音值, 有的韩国学者主张跟韩国语中[오]比较接近, 还有的学者主张跟韩国语中[어]更接近. 本论文还对怎样教好韵母'o'的发音提出方案.

ICA로 분리한 신호의 분류 (Classification of Signals Segregated using ICA)

김선일
- 전자공학회논문지 IE
- /
- 제47권4호
- /
- pp.10-17
- /
- 2010
ICA(Independent Component Analysis)를 이용하여 신호를 분리했을 때 그 중 어느 것이 원하는 신호인지 알아낼 수 있는 일반적인 방법이 없다. 본 논문에서는 자동차 배기음에 오염된 음성 신호를 가정하고 이를 ICA를 이용해 분리했을 때 분리된 신호에서 어느 것이 배기음이고 음성 신호인지 구별할 수 있는 방법을 제시하였다. 음성 신호는 음성 선호와의 상관계수가 가장 크게 나타날 것으로 예상되므로 오염된 음성 선호와 같은 동일인의 단모음 '아', '오', '우' 신호와 타인의 단모음 선호를 이용하여 분리된 각 신호와의 상관계수를 구하되 일괄 방식, 최대값 방식, 평균값 방식 등 세가지 방식으로 구하고 각 방식마다 '아', '오', '우'와의 상관 계수로 구분하고 이외에 투표 방법, 합산 방법을 추가한 다섯 가지 방법을 시도하여 가정 좋은 분류율을 나타내는 방식 및 방법을 제시하였다.
PDF KSCI

국어의 음운규칙

이상억
- 대한음성학회:학술대회논문집
- /
- 대한음성학회 1994년도 2월 학술대회지
- /
- pp.45-53
- /
- 1994
음 변화 규칙을 음성규칙(A)와 음운규칙(B)와 기타(C)로 분류한다면, A.음성규칙의 발생 총계는 B.음운규칙의 발생 총계보다 2배 이상 더 많다. 여기에 가장 발생 빈도가 높은 규칙부터 순서대로 10개만 정리하면 다음과 같다. 순위 규칙부류 명칭 백분율 1 A 음절 말 유성자음의 불파화 31.84, 2 A 유성음화 19.37 3 B 장모음화 10.00, 4 A 설측음화 9.78, 5 B 경음화 6.43, 6 B 음절말 장애음 중화 5.16, 7 A ㅅ 구개음화 3.71, 8 C 음절 조정 규칙 3.10, 9 B 단모음화 1.60, 10 A ㄴ 구개음화 1.42 별도로 진행한 총체적 연구(이상억에 의하면, 음성규칙, 즉 A가 총 6개 있는데 그 중 5규칙이 10위 내에 나타나 상위 쪽에 3번이나 포함되어 있는 점이 주목된다. 특히 규칙 1과 2의 합계는 전체 중 51.2%를 넘는다. 규칙 10위까지의 합계는 전체 중 92.4%를 차지한다. 13.장모음화(10%)는 12.단모음화(1.6%)보다 훨씬 높은 출현빈도를 보인다. 또 각종 구개음화 규칙의 순위는 ㅅ(7위), ㄴ(10위), ㄹ(17위), ㄷ(26위) 구개음화로 분포되어 있음이 밝혀졌다. 한편 삭제규칙(음운탈락 및 단순화) 계열이 14, 15, 19, 21, 25, 28위에 널리 나열되어 있는 데 반해, 삽입규칙은 23위에 ㄴ삽입 하나가 보일 뿐이다.
PDF

음향음성학 파라메터를 이용한 이중모음의 분류 (Classification of Diphthongs using Acoustic Phonetic Parameters)

이석명;최정윤
- 한국음향학회지
- /
- 제32권2호
- /
- pp.167-173
- /
- 2013
본 논문은 이중모음을 분류하기 위한 음향음성학적 파라메터를 연구하였다. 음향음성학적 파라메터는 성도를 통해 음성이 발성될 때 나타나는 특징을 기반으로 하여 분산분석(ANOVA) 방법을 통해 선별한 모음의 길이, 에너지 궤적, 그리고 포먼트의 차이를 이용하였다. TIMIT 데이터 베이스를 사용하였을 때, 단모음과 이중모음만을 구분하는 실험에서는 17.8% 의 밸런스 에러율(BER)을 얻을 수 있었고, /aw/, /ay/, 그리고 /oy/를 단모음과 분류하는 실험에서는 각각 32.9%, 29.9%, 그리고 20.2%의 에러율을 얻을 수 있었다. 추가적으로 진행한 실험에서, 음향음성학적 파라메터와 음성인식에 널리 쓰이고 있는 MFCC를 함께 사용하였을 경우 역시 성능향상이 나타나는 것을 확인하였다.
https://doi.org/10.7776/ASK.2013.32.2.167 인용 PDF KSCI

검색결과 72건 처리시간 0.032초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)