• 제목/요약/키워드: articulatory rate

검색결과 29건 처리시간 0.023초

Word-boundary and rate effects on upper and lower lip movements in the articulation of the bilabial stop /p/ in Korean

  • Son, Minjung
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.23-31
    • /
    • 2018
  • In this study, we examined how the upper and lower lips articulate to produce labial /p/. Using electromagnetic midsagittal articulography, we collected flesh-point tracking movement data from eight native speakers of Seoul Korean (five females and three males). Individual articulatory movements in /p/ were examined in terms of minimum vertical upper lip position, maximum vertical lower lip position, and corresponding vertical upper lip position aligned with maximum vertical lower lip position. Using linear mixed-effect models, we tested two factors (word boundary [across-word vs. within-word] and speech rate [comfortable vs. fast]) and their interaction, considering subjects as random effects. The results are summarized as follows. First, maximum lower lip position varied with different word boundaries and speech rates, but no interaction was detected. In particular, maximum lower lip position was lower (e.g., less constricted or more reduced) in fast rate condition and across-word boundary condition. Second, minimum lower lip position, as well as lower lip position, measured at the time of maximum lower lip position only varied with different word boundaries, showing that they were consistently lower in across-word condition. We provide further empirical evidence of lower lip movement sensitive to both different word boundaries (e.g., linguistic factor) and speech rates (e.g., paralinguistic factor); this supports the traditional idea that the lower lip is an actively moving articulator. The sensitivity of upper lip movement is also observed with different word boundaries; this counters the traditional idea that the upper lip is the target area, which presupposes immobility. Taken together, the lip aperture gesture is a good indicator that takes into account upper and lower lip vertical movements, compared to the traditional approach that distinguishes a movable articulator from target place. Respective of different speech rates, the results of the present study patterned with cross-linguistic lenition-related allophonic variation, which is known to be more sensitive to fast rate.

Korean /l/-flapping in an /i/-/i/ context

  • Son, Minjung
    • 말소리와 음성과학
    • /
    • 제7권1호
    • /
    • pp.151-163
    • /
    • 2015
  • In this study, we aim to describe kinematic characteristics of Korean /l/-flapping in two speech rates (fast vs. comfortable). Production data was collected from seven native speakers of Seoul Korean (four females and three males) using electromagnetic midsagittal articulometry (EMMA), which provided two dimensional data on the x-y plane. We examined kinematic properties of the vertical/horizontal tongue tip gesture, the vertical/horizontal (rear) tongue body gesture, and the jaw gesture in an /i/-/i/ context. Gestural landmarks of the vertical tongue tip gesture are directly measured. This serves as the actual anchoring time points to which relevant measures of other trajectories referred. The study focuses on velocity profiles, closing/opening spatiotemporal properties, constriction duration, and constriction minima were analyzed. The results are summarized as follows. First, gradiently distributed spatiotemporal values of the vertical tongue tip gesture were on a continuum. This shows more of a reduction in fast speech rate, but no single instance of categorical reduction (deletion). Second, Korean /l/-flapping predominantly exhibited a backward sliding tongue tip movement, in 83% of production, which is apparently distinguished from forward sliding movement in English. Lastly, there was an indication of vocalic reduction in fast rate, truncating spatial displacement of the jaw and the tongue body, although we did not observe positional variations with speech rate. The present study shows that Korean /l/-flapping is characterized by mixed articulatory properties with respect to flapping sounds of other languages such as English and Xiangxiang Chinese. Korean /l/ flapping demonstrates a language-universal property, such as the gradient nature of its flapping sounds that is compatible with other languages. On the other hand, Korean /l/-flapping also shows a language-particular property, particularly distinguished from English, in that a backward gliding movement occurs during the tongue tip closing movement. Although, there was no vocalic reduction in V2 observed in terms of jaw and tongue body height, spatial displacement of these articulators still suggests truncation in fast speech rate.

취학 전 정상구어발달 아동의 조음교대운동 특성 (The study of diadochokinetic (DDK) rate and accuracy in typically developing children)

  • 서경희
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.321-327
    • /
    • 2013
  • 본 논문은 자연스럽고 빠르게 모델링했을 때 4~6세 37명이 산출한 조음교대운동(DDK) 결과를 통해 모음구조의 DDK도 임상적 가치가 있음을 확인했고, DDK속도와 함께 조음오류 빈도와 유형 및 규칙성도 분석해야 말장애 아동의 조음능력에 대한 더 정확한 정보를 얻을 수 있음을 제안하고 있다. 자모음(예: '퍼')과 모음(예: '아이')의 음운구조를 반복 산출한 자료에서 각 검사음을 반복한 횟수, 오류 빈도, 오류 유형 및 규칙성(DDKsdp)을 측정했다. 그 결과, 조음교대운동 평균 속도는 연령과 함께 증가했으나, 음운 구조나 연령에 따른 유의한 차이는 없었다. DDK 수행시 나타난 실수를 분석한 결과, 4세의 오류빈도는 5세 및 6세에 비해 유의하게 높았다. DDKsdp에서 표준화된 발음검사 점수와 연령에 따른 차이는 없었다.

Automatic Vowel Sequence Reproduction for a Talking Robot Based on PARCOR Coefficient Template Matching

  • Vo, Nhu Thanh;Sawada, Hideyuki
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권3호
    • /
    • pp.215-221
    • /
    • 2016
  • This paper describes an automatic vowel sequence reproduction system for a talking robot built to reproduce the human voice based on the working behavior of the human articulatory system. A sound analysis system is developed to record a sentence spoken by a human (mainly vowel sequences in the Japanese language) and to then analyze that sentence to give the correct command packet so the talking robot can repeat it. An algorithm based on a short-time energy method is developed to separate and count sound phonemes. A matching template using partial correlation coefficients (PARCOR) is applied to detect a voice in the talking robot's database similar to the spoken voice. Combining the sound separation and counting the result with the detection of vowels in human speech, the talking robot can reproduce a vowel sequence similar to the one spoken by the human. Two tests to verify the working behavior of the robot are performed. The results of the tests indicate that the robot can repeat a sequence of vowels spoken by a human with an average success rate of more than 60%.

음향음성학 파라미터를 사용한 비음 위치 검출 (Nasal Place Detection with Acoustic Phonetic Parameters)

  • 이석명;최정윤;강홍구
    • 한국음향학회지
    • /
    • 제31권6호
    • /
    • pp.353-358
    • /
    • 2012
  • 논문은 지식기반의 음성인식 시스템에서 비음 위치를 검출하기 위한 음향음성학적 파라미터를 제시하였다. 음향음성학적 파라미터는 앞선 연구자들의 연구내용을 토대로 비강을 통해 음성이 발성될 때 나타나는 특징을 기반으로 하여 선별하였다. 선별된 파라미터들은 대역별 에너지 비율, 대역별 에너지의 차이, 포먼트 그리고 포먼트의 차이로써, 비음 위치에 따라 변화하는 조음기관의 영향을 잘 나타내 주었다. 이러한 음향음성학 파라미터를 이용하여 비음을 순비음(/m/), 치경비음(/n/), 그리고 연구개비음(/ng/)으로 나누는 실험을 진행하였고, TIMIT 데이터베이스로 실험하였을 때 57.5%의 검출률을 얻을 수 있었다.

치료적 노래부르기를 통한 두경부암 환자의 말산출 기능 향상 사례 (Therapeutic Singing on Speech Production Parameters in Head and Neck Cancer Patients: Case Studies)

  • 김주희;김수지
    • 재활복지
    • /
    • 제22권3호
    • /
    • pp.189-208
    • /
    • 2018
  • 본 연구는 세 명의 두경부암 환자들을 대상으로 말산출 관련 기능 개선을 목표로 치료적 노래부르기 중심의 음악중재를 시행하고, 각 사례 별로 변화를 관찰 기술한 사전-사후 개별 사례연구이다. 중재는 개별 세션의 형태로 매 회기 30분, 주 2회씩 총 12회기 동안 진행되었으며, 시행된 프로그램은 호흡근 이완을 위한 신체움직임, 조음기관의 운동범위 확장 및 성대이완을 위한 발성훈련과 치료적 노래부르기의 총 3단계로 구성되었다. 중재에 따른 대상자들의 말산출 관련 기능의 변화를 알아보기 위해 음성의 질, 길항반복운동속도(diadochokinesis, DDK), 모음공간면적(vowel space area, VSA) 변화 등의 음향학적 분석과 <산책>문단 읽기 과제 시의 청지각적 평가를 시행하였고, 프로그램 참여 시의 관찰 및 사전 사후 면담을 통해 대상자의 심리정서적 변화를 추가적으로 살펴보았다. 중재 과정에서 모든 대상자의 재활동기 및 음성 사용에 대한 긍정적 변화 양상이 관찰되었고, 중재 후에는 음성의 질, DDK에 변화가 있었으며, VSA의 확대가 나타났다. 본 연구를 통해 치료적 노래부르기 중심의 음악중재프로그램이 두경부암 환자들의 음성 기능 및 잔존하는 조음기관 운동성을 향상시키는데 긍정적인 영향을 미칠 수 있음을 알 수 있었다.

Diphone 단위 의 hidden Markov model을 이용한 한국어 단어 인식 (Korean Word Recognition Using Diphone- Level Hidden Markov Model)

  • 박현상;은종관;박용규;권오욱
    • 한국음향학회지
    • /
    • 제13권1호
    • /
    • pp.14-23
    • /
    • 1994
  • 본 논문에서는 한국어 음성인식에 적합한 음성 인식 단위에 대해서 연구하였다. 좋은 음성 인식 시스템을 구현하기 위해서는 발음된 음성내의 조음화현상을 처리할 수 있는 인식단위를 선택해야만 한다. 따라서 음소보다 개념적으로 확대된 인식단위가 필요하게 되는데, diphone은 음소간의 전이영역을 modeling하기때문에 좋은 인식 단위가 될 수 있다. Diphone을 인식 단위로 할 경우에 안정적인 음소영역을 diphone사이에 삽입할 수도 있다. 7명의 남성화자가 발음한 74단어로 구성된 고립단어 인식 실험결과 diphone을 2-state HMM으로, 터짐소리 `ㅂ',`ㄷ','ㄱ'와 묵음을 제외한 음소에 대해서 1-state HMM으로 나타냈을 때 가장 높은 인식률을 보였다. 이때 드물게 발생하는 diphone들을 하나의 단위로 merging했을 때 인식률이 $93.98\%$에서 $96.29\%$로 향상되었다. 또한 merging된 diphone과 제안한 국소보간법 (local interpolation technique)을 사용함으로써 $97.22\%$까지 인식률이 향상되었다.

  • PDF

소아감기와 소아폐렴간의 울음소리 스펙트럼 특징 분석 (Spectrum Feature Analysis of Crying Sounds of Infant Cold and Pneumonia)

  • 김봉현;이세환;조동욱
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.301-306
    • /
    • 2008
  • 최근 들어 저출산으로 인한 사회적 현상의 변화로 소아의 건강관리 및 유지는 다양한 방법으로 제시되고 있다. 본 논문에서는 이러한 시대적 요구를 반영하기 위해 흔히 발병하는 소아 호흡기 질환을 조기에 진단할 수 있는 방법을 제안하고자 한다. 그 중에서 소아감기 및 소아폐렴에 관한 진단 방법을 연구하고자 한다. 이를 위해 소아의 유일한 표현 수단인 울음소리를 통한 소아감기 집단과 소아폐렴 집단간의 비교를 행하였으며 정상 소아 집단과의 차이점을 추출하고자 한다. 따라서 본 논문에서는 호흡기 질환이 영향을 미치는 인체의 기관과 음성을 표현하는 조음기관간의 연관성을 분석하고 성분음을 추출하는 스펙트럼을 통해 각각의 집단별 결과 파형 및 주파수 영역대를 비교, 분석하여 소아감기와 소아폐렴을 진단하고자 한다. 최종적으로 실험에 의해 제안한 방법의 유용성을 입증하고자 한다.

Phonetic Functionalism in Coronal/Non-coronal Asymmetry

  • Kim, Sung-A.
    • 음성과학
    • /
    • 제10권1호
    • /
    • pp.41-58
    • /
    • 2003
  • Coronal/non-coronal asymmetry refers to the typological trend wherein coronals rather than non-coronals are more likely targets in place assimilation. Although the phenomenon has been accounted for by resorting to the notion of unmarkedness in formalistic approaches to sound patterns, the examination of rules and representations cannot answer why there should be such a process in the first place. Furthermore, the motivation of coronal/non-coronal asymmetry has remained controversial to date even in the field of phonetics. The present study investigated the listeners' perception of coronal and non-coronal stops in the context of $VC_{1}C_{2}V$ after critically reviewing the three types of phonetic accounts for coronal/non-coronal asymmetry, i.e., articulatory, perceptual, and gestural overlap accounts. An experiment was conducted to test whether the phenomenon in question may occur, given the listeners' lack of perceptual ability to identify weaker place cues in VC transitions as argued by Ohala (1990), i.e., coronals have weak place cues that cause listeners' misperception. 5pliced nonsense $VC_{1}C_{2}V$ utterances were given to 20 native speakers of English and Korean. Data analysis showed that majority of the subjects reported $C_{2}\;as\;C_{1}$. More importantly, the place of articulation of C1 did not affect the listeners' identification. Compared to non-coronals, coronals did not show a significantly lower rate of correct identifications. This study challenges the view that coronal/non-coronal asymmetry is attributable to the weak place cues of coronals, providing evidence that CV cues are more perceptually salient than VC cues. While perceptual saliency account may explain the frequent occurrence of regressive assimilation across languages, it cannot be extended to coronal/non-coronal asymmetry.

  • PDF