통합 검색 | Korea Science

통계적 방법과 인지실험을 통한 한국어 초성파열음의 음소단위 분석에 관한 연구 (A Study on the Phoneme Based Analysis of Korean Initial Plosives Using Statistical Method and Perception Tests)

조철우;이우선;이규호;김종안;임광일;이태원
- 한국음향학회지
- /
- 제8권5호
- /
- pp.78-85
- /
- 1989
본 논문에서는 한국어의 규칙합성에 관한 연구중 파열음의 함성 파라미터를 추정하기 위하여 사용한 통계적 방법과 인지실험에 의한 방법에 관하여 기술하고 있다. 합성기로는 직렬 포만트 합성기를 구성하여 사용하였고 통제적 분석에 사용된 음성시료는 9개의 초성 파열음과 8개의 모음으로 구성되는 72개의 독립 CV형태를 갖는 단음절을 만일 화자를 통하여 수집하였다. 음성의 분석은 시간 및 주파수 평면에서 파라미터의 변화를 중심으로 행하였으며, 인지실험을 통한 파라미터 추정방법을 통하여 독립적으로 포만트 파라미터의 변화에 관하여 조사하였다.
PDF

백오프 통계정보를 이용한 미등록어 포함 복합명사의 분해 (Segmenting Korean Nominal Compounds with an Unknown Morpheme Using Back-off Statistics)

박재한;김명선;노대욱;나동열
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
- /
- pp.65-72
- /
- 2004
본 논문에서는 백오프 통계 정보를 이용하여 일반적인 복합명사 뿐만 아니라 외래어 미등록어를 포함한 복합명사도 잘 분해하는 방법을 제안한다. 본 시스템은 입력으로 형태소분석기가 내주는 많은 분석 후보들을 받는다. 단음절 명사를 포함한 분석 후보도 포함되므로 입력 분석 후보의 수는 대단히 많게 된다. 본 모듈의 주요 작업은 이 중에서 가장 좋은 분석후보를 선택하는 것이 된다. 미등록어가 포함된 경우 이에 부합되는 분석 후보를 잘 선택하는 시스템의 개발을 목표로 한다. 이를 위해서 본 시스템에서 사용하는 주요 정보는 단어간 어휘 바이그램 통계정보이다. 또한 외래어 미등록어의 인식 정확성을 높이기 위해 음절 바이그램 정보도 이용한다. 통계정보는 대량의 품사 태깅 말뭉치에서 추출하였다. 데이터 부족 문제를 해소하기 위해서 우리는 백오프(back-off) 평탄화(smoothing) 기법을 이용하였다. 미등록어가 포함된 복합명사의 분석 후보의 수를 줄이기 위한 기술도 연구하였다.
PDF

안면 움직임 분석을 통한 단음절 음성인식 (Monosyllable Speech Recognition through Facial Movement Analysis)

강동원;서정우;최진승;최재봉;탁계래
- 전기학회논문지
- /
- 제63권6호
- /
- pp.813-819
- /
- 2014
The purpose of this study was to extract accurate parameters of facial movement features using 3-D motion capture system in speech recognition technology through lip-reading. Instead of using the features obtained through traditional camera image, the 3-D motion system was used to obtain quantitative data for actual facial movements, and to analyze 11 variables that exhibit particular patterns such as nose, lip, jaw and cheek movements in monosyllable vocalizations. Fourteen subjects, all in 20s of age, were asked to vocalize 11 types of Korean vowel monosyllables for three times with 36 reflective markers on their faces. The obtained facial movement data were then calculated into 11 parameters and presented as patterns for each monosyllable vocalization. The parameter patterns were performed through learning and recognizing process for each monosyllable with speech recognition algorithms with Hidden Markov Model (HMM) and Viterbi algorithm. The accuracy rate of 11 monosyllables recognition was 97.2%, which suggests the possibility of voice recognition of Korean language through quantitative facial movement analysis.
https://doi.org/10.5370/KIEE.2014.63.6.813 인용 PDF KSCI KPUBS HTML

다문화아동과 일반아동의 작업기억 및 음운인식 능력 비교 연구 (A Comparative Study on the Working Memory and the Phonological Awareness between Children with Multi-cultural Families and General Families)

박유린;권도하
- 한국산학기술학회논문지
- /
- 제13권11호
- /
- pp.5025-5032
- /
- 2012
본 연구는 다문화아동과 일반아동의 작업기억과 음운인식능력이 집단 간에 차이가 있는지를 알아보고자 하였다. 연구대상은 전라남도 D시에 거주하며 초등학교 1~3학년에 재학중인 다문화 아동 15명과 일반아동 15명이었다. 작업기억을 검사하기 위하여 K-TTFC-2를 실시하였고, 음운인식능력을 검사하기 위하여 아동들의 연령을 고려하여 음소수준의 검사만을 실시하였다. 연구결과는 첫째, 다문화아동과 일반아동의 작업기억의 차이를 비교한 결과 유의미한 차이가 있었다. 둘째, 다문화아동과 일반아동의 음운인식능력 중에서 음소 수준의 차이를 비교한 결과 통계적으로 유의미한 차이가 있었다. 셋째, 다문화 아동과 일반아동의 하위과제별 차이를 비교한 결과 음 짝짓기(어중 종성), 단음절 단어에서 중성 대치하기, 음 전환하기에서 통계적으로 유의미한 차이가 있었다. 따라서 본 연구를 통해 다문화 아동의 음운 및 작업기억 결과를 고려한 치료를 위한 기초자료로 활용할 수 있을 것으로 사료된다.
https://doi.org/10.5762/KAIS.2012.13.11.5025 인용 PDF KSCI

한국어 단음절에서 자음과 모음 자질의 비선형적 지각 (Nonlinear Interaction between Consonant and Vowel Features in Korean Syllable Perception)

배문정
- 말소리와 음성과학
- /
- 제1권4호
- /
- pp.29-38
- /
- 2009
This study investigated the interaction between consonants and vowels in Korean syllable perception using a speeded classification task (Garner, 1978). Experiment 1 examined whether listeners analytically perceive the component phonemes in CV monosyllables when classification is based on the component phonemes (a consonant or a vowel) and observed a significant redundancy gain and a Garner interference effect. These results imply that the perception of the component phonemes in a CV syllable is not linear. Experiment 2 examined the further relation between consonants and vowels at a subphonemic level comparing classification times based on glottal features (aspiration and lax), on place of articulation features (labial and coronal), and on vowel features (front and back). Across all feature classifications, there were significant but asymmetric interference effects. Glottal feature.based classification showed the least amount of interference effect, while vowel feature.based classification showed moderate interference, and place of articulation feature-based classification showed the most interference. These results show that glottal features are more independent to vowels, but place features are more dependent to vowels in syllable perception. To examine the three-way interaction among glottal, place of articulation, and vowel features, Experiment 3 featured a modified Garner task. The outcome of this experiment indicated that glottal consonant features are independent to both the place of articulation and vowel features, but the place of articulation features are dependent to glottal and vowel features. These results were interpreted to show that speech perception is not abstract and discrete, but nonlinear, and that the perception of features corresponds to the hierarchical organization of articulatory features which is suggested in nonlinear phonology (Clements, 1991; Browman and Goldstein, 1989).
PDF

음소판별필터를 이용한 한국어 단음절 음성인식 (Speech Recognition on Korean Monosyllable using Phoneme Discriminant Filters)

허성필;정현열;김경태
- 한국음향학회지
- /
- 제14권1호
- /
- pp.31-39
- /
- 1995
선형판별함수를 이용하여 음소단위의 판별필터를 구성하였다. 음소판별필터를 이용한 음성인식 시스템은 발성구간의 검출에 유용하고, 음성의 구분과 식별을 동시에 시행할 수 있으며 모든 음소를 동일한 인식모델로 취급하는 것이 가능하였다. 이 때 전문가의 경험적 지식을 이용하지 않고 수리적인 반복학습방법으로 시스템을 구성한 것이 특징이다. 모든 음소판별필터는 독립적으로 동작하므로 하나의 음소구간에 대해 복수필터 출력이 발생될 수 있으며, 발성구간의 음소가 탈락하는 경우도 있다. 따라서 본 연구에서는 무게벡터와 패턴벡터와의 내적에 통합계수를 이용하여 최대값을 선택하는 방법으로 다수개의 경합출력을 하나로 통합하였으며, 동시에 시간적인 정보와 중간값필터를 이용하여 탈락과 오인식되는 음소를 보상하므로써 인식율을 향상시켰다. 인식실험결과 모음의 경우 학습용자료에서는 $96.5\%$, 평가용자료에서는 $87.6\%$의 인식율을 얻었고, 자음은 각각 $84.0\%,70.8\%$의 음소인식율을 얻었다.
PDF

DHMM 음성 인식 시스템을 위한 양자화 기반의 화자 정규화 (Quantization Based Speaker Normalization for DHMM Speech Recognition System)

신옥근
- 한국음향학회지
- /
- 제22권4호
- /
- pp.299-307
- /
- 2003
화자독립 음성인식기에서 화자사이의 성도 길이의 영향을 최소화시켜 인식 성능을 개선하는 화자 정규화에 대한 많은 연구가 있어 왔다. 본 연구에서는 벡터양자화기를 이용하여 화자 검증이 가능하다는 사실에 착안하여 벡터 양자화기를 이용한 비교적 간단한 선형 워핑 화자정규화방법을 제안한다. 제안하는 방법에서는 먼저 정규화에 이용될 최적의 코드북을 생성한 다음, 이 코드 북을 이용하여 화자의 선형 워핑계수를 추출하고 추출된 워핑계수는 멜 켑스트럼 추출시에 사용되는 멜스케일 필터뱅크를 워핑하기 위해 이용된다. 본고에서 제안한 워핑계수 추출 및 적용 방법의 성능을 확인하기 위해 이산 HMM을 이용한 13가지의 단음절 한글 숫자음 인식기를 이용하여 인식실험을 수행하였으며, 실험 결과 약 29%의 오인식률 감소를 보여 제안하는 화자 정규화방법이 다른 라인서치 워핑계수추출 방법보다 간단한 동시에 효용가치가 있음을 확인하였다.
PDF KSCI

우리말 100단음절의 명료도와 오청상에 관한 연구 (Articulation Scores and Confusion Patterns of the 100 Monosyllable Korean Speech Sounds)

유방환;김홍기;노관택
- 대한기관식도과학회:학술대회논문집
- /
- 대한기관식도과학회 1972년도 춘계종합 학술대회 초록집
- /
- pp.1.1-1
- /
- 1972
청력검사의 검사자료로는 어음이 가장 적당하지만 검사어음의 선택에는 많은 어려운 문제점이 있어 우리말 어음에 대한 공인된 검사용어표가 아직도 없다. 때문에 저자는 이 표 작성에 필요한 기초자료를 얻기 위해 정상인, 각종향음하에서 정상인 및 난청자에 있어서 각각 그 명료도와 오청상에 관한 연구를 시행하였다. 사용어로는 일상생활에서 사용빈도가 많은 박의 498어음중 100개를 선택하여 정상인에서 60㏈의 어음강도로 검사하였을 경우와, 여러 강도의 white noise와 speech noise를 어음과 동시에 주었을 경우와, 난청자에서 여러 강도의 어언을 주었을 때 반응결과를 검토하여 보았다. 일반적으로 얻은 결과는 명료도가 불량한 감음성난청자를 제외하고는 정상인, 소음하에서 정상인 및 난청자에서의 오청상은 어두자음, 모음, 어미자음 각각 그들 음소의 판별적 자질에 따라 혼동하는 경향이 있었다. 명료도가 불량한 난청에서는 상기 변화규칙에 예외 되는 경우가 많았다. 명료도가 불량한 감음성 난청에서는 상기 변화규칙에 예외 되는 경우가 많았었다. 비교적 강한 소음하에서는 소음의 종류에 따라 같은 강도라도 오청률의 차를 현저히 볼 수 있었다.
PDF

구개인두부전증 환자와 모의 음성의 모음과 자음 분석 (Analysis on Vowel and Consonant Sounds of Patent's Speech with Velopharyngeal Insufficiency (VPI) and Simulated Speech)

성미영;김희진;권택균;성명훈;김우일
- 한국정보통신학회논문지
- /
- 제18권7호
- /
- pp.1740-1748
- /
- 2014
본 논문에서는 구개인두부전증 (VPI) 환자 발음과 정상인의 모의 발음에 대한 듣기 평가와 음향 분석을 실시한다. 본 연구를 위해 음성 데이터 수집을 위해 50개의 단어, 모음 및 단음절로 이루어진 발음 목록을 설정한다. 듣기 평가실험의 편의를 위해 웹 기반의 듣기 평가 시스템을 구축한다. 듣기 평가 결과는 실제 VPI 환자의 발음에 대한 오인식 경향과 모의 발음의 오인식 경향이 유사함을 나타낸다. 이러한 유사성은 모음의 포먼트 위치와 자음의 스펙트럼의 비교를 통해서도 확인할 수 있다. 실험 결과는 본 연구에서 사용한 정상인의 VPI 모의 발화 기법이 실제 환자의 음성을 비교적 효과적으로 모의하는 것을 반영하는 결과이다. 향후 VPI 환자의 음성 인식 과정에서 정상인의 모의 발화음성 데이터를 음향 모델의 적응 기법과 같은 분야에 유용하게 사용할 수 있을 것으로 기대한다.
https://doi.org/10.6109/jkiice.2014.18.7.1740 인용 PDF KSCI

한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상 (Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles)

송명규;김형순
- 한국음향학회지
- /
- 제21권4호
- /
- pp.401-406
- /
- 2002
한국어 숫자는 모두 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 이러한 문제점들과 더불어 배경잡음이나 채널에 의한 왜곡에 따른 문제점들로 인해 한국어 연결숫자의 인식 성능은 만족스럽지 못한 것이 현실이다. 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운변화를 고려하여 유사음소 (phonelike units: PLUs)군을 정의하고, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수할 수 있도록 인식 시스템을 구성하는 방식을 검토하였다. 전화망 4연숫자를 이용한 화자독립 인식 실험을 수행한 결과 제안된 방법의 숫자열 인식률은 상태당 믹스쳐 (mixture) 개수가 1인 경우 83.2%로, 기준 시스템 (baseline)에 대한 오류감소률이 7.2%였고 가장 높은 성능을 나타낸 믹스쳐 개수가 11인 경우 숫자열 인식률은 91.8% 오류감소율은 4.7%였다.
PDF KSCI

검색결과 52건 처리시간 0.02초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)