• 제목/요약/키워드: 파열음

검색결과 84건 처리시간 0.024초

언어별, 연령별, 경험별 영어 어말 파열음을 통한 발화-인지 구조 연구 (A study of language structure on the relationship between production and perception through English stop word-finals by effects of language, age, and experience.)

  • 강석한
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.139-141
    • /
    • 2006
  • Korean college students' experience in studying English overseas playes the significant role to their perception, not production. Korean Group which experiences foreign-stay for almost 1 year shows the similar pattern with its counterpart, Korean Non- Experiencing Group, in producing the signal of pre-vowel. On the contrary, Korean Experiencing Group shows the similar perceptual pattern with Native Speakers in word-final non-release stops.

  • PDF

한국인 영어 학습자의 수준별 영어 파열음 시구간 신호 지각 연구 (A Perceptual Study of the Temporal Cues for Leveled Groups of Korean English Learners)

  • 강석한;박한상
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.189-192
    • /
    • 2005
  • This study investigates the asymmetry effect between acoustics and perception. The examined cues are closure duration, closure voicing, VOT, release, pre-vowel duration, post-vowel duration. Five native speakers of English and 30 Korean college students participated in the present study. The results showed that high level Korean English learners parallels native speakers in their responses, while mid and low level Korean learners are substantially different from natives.

  • PDF

러시아어 파열음에 나타나는 연자음의 음향음성학적 연구 (A Phonetic Study of Russian Soft Plosives)

  • 변군혁
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.15-29
    • /
    • 2007
  • The present study investigates acoustic cues of russian soft plosive consonants. In previous studies, russian soft consonants are distinguished from hard consonants by F1, F2 of following vowels. The result showed: (1) that F0 of soft plosive consonants in following vowels were lower than those of hard plosive consonants; (2) and that VOT of soft plosive consonants were longer than those of hard plosive consonants. Hence, the present that, in addition to F1, F2, VOT and F0 are detected as acoustic cues that differentiate soft plosive consonants from hard plosive consonant in Russian.

  • PDF

음성 인식 신경망을 위한 음성 파라키터들의 성능 비교 (A Comparative Study of Speech Parameters for Speech Recognition Neural Network)

  • 김기석;임은진;황희융
    • 한국음향학회지
    • /
    • 제11권3호
    • /
    • pp.61-66
    • /
    • 1992
  • 음성 인식에 신경망 모델을 적용하는 많은 연구들이 있었지만, 주된 관심은 음성인식에 적합한 구조와 학습 방법이었다. 그러나 음성인식에 신경망 모델을 적용한 시스템의 효율 향상은 모델 자체의 구조뿐 아니라, 신경망 모델의 입력으로 어떤 음성 파라미터를 사용하는가에 따라서도 큰 영향을 받는다. 본 논문은 기존 음성인식에 신경망 모델을 적용한 많은 연구들에서 사용한 음성 파라미터를 살펴보고, 대표적인 음성 파라미터 6개를 선정하여, 같은 데이타와 같은 신경망 모델 하에서 어떻게 성능이 달라지는지를 분석한다. 인식 실험에 있어서는 한국어 파열음 9개에 대한 8개 데이터 집합과 모음 8개에 대한 18개 데이터 집합을 음성 파라미터로 하고 신경망 모델은 순환 신경망 모델을 사용하여 노드의 수를 일정하게 한뒤 다양한 입력 파라미터의 성능을 비교하였다. 그 결과 선형 예측 계수로부터 얻어진 delta cepstrum의 음성 파라미터가 가장 좋은 성능을 보였으며 이때 인식률은 같은 학습 데이터에 대해 파열음 100.0%, 모음 95.1%이었다.

  • PDF

저자원 환경의 음성인식을 위한 자기 주의를 활용한 음향 모델 학습 (Acoustic model training using self-attention for low-resource speech recognition)

  • 박호성;김지환
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.483-489
    • /
    • 2020
  • 본 논문에서는 저자원 환경의 음성인식에서 음향 모델의 성능을 높이기 위한 음향 모델 학습 방법을 제안한다. 저자원 환경이란, 음향 모델에서 100시간 미만의 학습 자료를 사용한 환경을 말한다. 저자원 환경의 음성인식에서는 음향 모델이 유사한 발음들을 잘 구분하지 못하는 문제가 발생한다. 예를 들면, 파열음 /d/와 /t/, 파열음 /g/와 /k/, 파찰음 /z/와 /ch/ 등의 발음은 저자원 환경에서 잘 구분하지 못한다. 자기 주의 메커니즘은 깊은 신경망 모델로부터 출력된 벡터에 대해 가중치를 부여하며, 이를 통해 저자원 환경에서 발생할 수 있는 유사한 발음 오류 문제를 해결한다. 음향 모델에서 좋은 성능을 보이는 Time Delay Neural Network(TDNN)과 Output gate Projected Gated Recurrent Unit(OPGRU)의 혼합 모델에 자기 주의 기반 학습 방법을 적용했을 때, 51.6 h 분량의 학습 자료를 사용한 한국어 음향 모델에 대하여 단어 오류율 기준 5.98 %의 성능을 보여 기존 기술 대비 0.74 %의 절대적 성능 개선을 보였다.

한국 EFL 학생들의 영어 순자음 인지 (Identification of English Labial Consonants by Korean EFL Learners)

  • 초미희
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.186-191
    • /
    • 2006
  • 기존의 유표성 이론에 따르면 마찰음이 파열음보다 유표적이므로 발음하기 어렵다는 것은 잘 알려진 사실이다. 따라서 본 연구에서는 한국 EFL 학습자들이 발음하기 어려운 마찰 [f, v]를 어떻게 인지하는지 살펴보기 위해서 영어 순자음 [p, b, f, v]를 판별하는 실험을 기획하였다. 40명의 한국 학생들이 영어 순자음이 들어간 임시어를 인지하는 테스트를 실행한 결과, 순자음의 운율적 위치가 인지 정확도를 결정짓는데 영향을 마침을 발견하였다. 특히 유표성 이론의 예상과 달리, 무성 마찰음 [f]의 정확도가 강세 뒤 모음사이의 위치를 제외한 모든 위치에서 높게 나왔다. 영어 순자음의 평균 인지 정확도는 강세 앞 모음사이 위치와 어두 초성에서 높은 반면에 어말 종성과 강세 뒤 모음사이 위치에서는 낮았다. 한국 학생들의 영어 순자음 인지에는 유표성 이론뿐 만 아니라 음향학적 두드러짐과 강세를 포함하는 청각적인 요소도 작용함을 보여주고 있다.

  • PDF

인도네시아어의 파열음의 발성유형 연구 (A Study of Phonation Types of the Plosives in Bahasa Indonesia)

  • 전태현;박한상
    • 대한음성학회지:말소리
    • /
    • 제52호
    • /
    • pp.15-48
    • /
    • 2004
  • The present study investigates phonation types of the plosives in Bahasa Indonesia in terms of VOT, F0, durations of intervocalic closure, the preceding vowel, and the following vowel. The results showed that two speaker groups have distinct phonation types. Speaker Group I was characterized by a short voice lag for voiceless plosives and a considerable amount of voice lead for voiced ones. Speaker Group II was characterized by a short lag for both voiceless and voiced plosives. Although both groups showed a significant difference in F0 and the durations of individual segments between voiceless and voiced plosives, they had a remarkable difference in the temporal structure of the segments. Speaker Group I had temporal compensation between the intervocalic closure and the surrounding vowels across voice, such that the shorter the intervocalic closure the longer the surrounding vowels, while Speaker Group 2 didn't. This means that there are two different phonation type systems within a language.

  • PDF

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.233-237
    • /
    • 1993
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 cluster로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사사에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means 클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해, 먼저, 우리말 음소들을 모음, 파열음, 마찰음, 파찰음, 유음 및 비음, 종성의 6개 음소군으로 분류하고 각 음소군에 대한 특징 지도를 구성하여 labeler의 기능을 수행하게 하였다. 화자 종속 인식실험 결과 87.2%의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

한국어 음소인식을 위한 기준 프레임 추출 (Typical Frame Etraction for Korean Phoneme Recognition)

  • 김범국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.121-124
    • /
    • 1994
  • 음소를 인식의 기본으로 하는 한국어 음성인식 시스템을 구현하기 위한 기초 연구의 일환으로서 각 음소의 특징 가장 잘 표현하는 기준프레임 추출을 위한 연구를 수행하였다. 이를 위하여 먼저 선행 실험과 분산비 분석을 통해서 인식에 필요로한 시간 패턴의 길이를 추출한 후 이를 바탕으로 통계적 인식방법인 베이즈 결정법칙을 이용하여 시단 프레임으로부터 3프레임씩 시점을 1프레임씩 옮기면서 인식 실험을 해?여, 각 음소별 특징이 가장 풍부한 기준 프레임을 추출하였다. 그리고 이 기준 프레임을 중심으로 각 음소군별 인식 실험을 수행하여 그 결과를 시단을 기준으로 한 경우와 비교 검토하고 한국어 전 음소별로 확장하여 인식 실험을 실시하였다. 이 실험 결과 모음의 경우 시단으로부터 5프레임, 파열음은 시단에서부터 5프레임사이, 마찰음은 3프레임에서부터 10프레임까지, 파찰음은 5프레임까지, 비음과 유음의 경우 초성은 시단 프레임에서 6프레임, 종성은 종단으로부터 전 4프레임 구간이 인식률이 높게 나타나 이 부분의 특징이 인식에 가장 유효함을 알 수 있었다.

  • PDF