• 제목/요약/키워드: perceptual cue

검색결과 35건 처리시간 0.024초

Articulatory Attributes in Korean Nonassimilating Contexts

  • Son, Minjung
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.109-121
    • /
    • 2013
  • This study examined several kinematic properties of the primary articulator (the tongue dorsum) and the supplementary articulator (the jaw) in the articulation of the voiceless velar stop (/k/) within nonassimilating contexts. We examined in particular the spatiotemporal properties (constriction duration and constriction maxima) from the constriction onset to the constriction offset by analyzing a velar (/k/) followed by the coronal fricative (/s/), the coronal stop (/t/), and the labial (/p/) in across-word boundary conditions (/k#s/, /k#t/, and /k#p/). Along with these measurements, we investigated intergestural temporal coordination between C1 and C2 and the jaw articulator in relation to its coordination with the articulation of consonant sequences. The articulatory movement data was collected by means of electromagnetic midsagittal articulometry (EMMA). Four native speakers of Seoul Korean participated in the laboratory experiment. The results showed several characteristics. First, a velar (/k/) in C1 was not categorically reduced. Constriction duration and constriction degree of the velar (/k/) were similar within nonassimilating contexts (/k#s/=/k#t/=/k#p/). This might mean that spatiotemporal attributes during constriction duration were stable and consistent across different contexts, which might be subsequently associated with the nontarget status of the velar in place assimilation. Second, the gestural overlap could be represented as the order of /k#s/ (less) < /k#p/ (intermediate) < /k#t/ (more) as we measured the onset-to-onset lag (a longer lag indicated shorter gestural overlap.). This indicates a gestural overlap within nonassimilating contexts may not be constrained by any of the several constraints including the perceptual recoverability constraint (e.g., more overlap in Front-to-Back sequences compared to the reverse order (Back-to-Front) since perceptual cues in C1 can be recovered anytime during C2 articulation), the low-level speech motor constraint (e.g., more overlap in lingual-nonlingual sequences as compared to the lingual-lingual sequences), or phonological contexts effects (e.g., similarity in gestural overlap within nonassimilating contexts). As one possible account for more overlap in /k#t/ sequences as compared to /k#p/, we suspect speakers' knowledge may be receptive to extreme encroachment on C1 by the gestural overlap of the coronal in C2 since it does not obscure the perceptual cue of C1 as much as the labial in C2. Third, actual jaw position during C2 was higher in coronals (/s/, /t/) than in the labial (/p/). However, within the coronals, there was no manner-dependent jaw height difference in C2 (/s/=/t/). Vertical jaw position of C1 and C2 was seen as inter-dependent as higher jaw position in C1 was closely associated with C2. Lastly, a greater gap in jaw height was associated with longer intergestural timing (e.g., less overlap), but was confined to the cluster type (/kp/) with the lingual-nonlingual sequence. This study showed that Korean jaw articulation was independent from coordinating primary articulators in gestural overlap in some cluster types (/k#s/, /k#t/) while not in others (e.g., /k#p/). Overall, the results coherently indicate the velar stop (/k/) in C1 was robust in articulation, which may have subsequently contributed to the nontarget status of the velar (/k/) in place assimilation processes.

화자 연령 지각과 음성적 특성: 음높이와 발화 속도를 중심으로 (Speaker age estimation and acoustic characteristics: According to pitch and speech rate)

  • 서윤정;신지영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.9-18
    • /
    • 2019
  • 본고는 한국인 피험자를 대상으로 지각 실험을 진행하여 화자의 실제 연령(Chronological age)과 지각 연령(Perceived age) 간의 상관관계를 살피고, 한국인 피험자가 얼마나 정확하게 익명의 화자의 연령을 지각할 수 있는지를 밝히고자 한다. 또한, 이러한 연령 지각에 음성적 단서가 되는 음높이와 발화 속도와 지각 연령 간의 영향 관계를 검토하고자 한다. 이를 위해, 성인 80명을 대상으로 3가지 과제로 구성된 지각 실험을 진행하였다. 실험 자극은 표준어 화자 40명에게서 추출되었으며, 자유 발화, 낭독 발화, 모음 연장 발성으로 구성되었다. 각 실험은 10초 내외의 음성을 듣고 연령을 구체적인 숫자로 답하는 방식으로 진행되었다. 분석 결과, 한국인 피험자들은 상당히 높은 판단 정확도를 보였으며, 모음 연장 발성을 들었을 때보다 자유 발화와 낭독 발화를 들었을 때 화자의 연령을 더욱 정확하게 짐작하였다. 이러한 결과는 음성이 포함하고 있는 정보량의 차이에 기인한 것으로 보인다. 또한, 음성 분석을 수행한 결과 피험자들은 화자의 음높이와 발화 속도를 참고하여 화자의 연령을 추정하는 것으로 나타났으며, 음높이보다는 발화 속도가 연령 지각에 더 적극적으로 기여한 것으로 나타났다.

Listener Auditory Perception Enhancement using Virtual Sound Source Design for 3D Auditory System

  • Kang, Cheol Yong;Mariappan, Vinayagam;Cho, Juphil;Lee, Seon Hee
    • International journal of advanced smart convergence
    • /
    • 제5권4호
    • /
    • pp.15-20
    • /
    • 2016
  • When a virtual sound source for 3D auditory system is reproduced by a linear loudspeaker array, listeners can perceive not only the direction of the source, but also its distance. Control over perceived distance has often been implemented via the adjustment of various acoustic parameters, such as loudness, spectrum change, and the direct-to-reverberant energy ratio; however, there is a neglected yet powerful cue to the distance of a nearby virtual sound source that can be manipulated for sources that are positioned away from the listener's median plane. This paper address the problem of generating binaural signals for moving sources in closed or in open environments. The proposed perceptual enhancement algorithm composed of three main parts is developed: propagation, reverberation and the effect of the head, torso and pinna. For propagation the effect of attenuation due to distance and molecular air-absorption is considered. Related to the interaction of sounds with the environment, especially in closed environments is reverberation. The effects of the head, torso and pinna on signals that arrive at the listener are also objectives of the consideration. The set of HRTF that have been used to simulate the virtual sound source environment for 3D auditory system. Special attention has been given to the modelling and interpolation of HRTFs for the generation of new transfer functions and definition of trajectories, definition of closed environment, etc. also be considered for their inclusion in the program to achieve realistic binaural renderings. The evaluation is implemented in MATLAB.

LIDAR 데이터로부터 지표점 추출을 위한 피쳐 기반 방법 (A Feature Based Approach to Extracting Ground Points from LIDAR Data)

  • 이임평
    • 대한원격탐사학회지
    • /
    • 제22권4호
    • /
    • pp.265-274
    • /
    • 2006
  • 지표점의 추출은 DTM 생성을 위한 가장 중요한 과정이다. 기존의 지표점 추출 방법은 대부분 점기반방법으로 분류될 수 있다. 점기반방법은 모든 개별점(point)에 대하여 해당 점이 지표를 구성하는 점인지를 시험하는 방법이다. 이 때 시험의 회수는 점의 개수와 동일하기 때문에, 특히 점의 수가 많은 데이터를 처리할 경우 계산량이 심각하게 늘어나 시험에 보다 정교한 기준과 전략을 사용하는데 어려움이 있었다. 이로 인해 많은 연구에도 불구하고 아직 만족할만한 결과를 제공하는 방법이 개발되지 못하였다. 이에 본 연구는 시험하는 개체의 수를 줄이면서 보다 안정적인 결과를 얻을 수 있도록 점이 아닌 피쳐에 기반한 방법을 제안한다. 여기서, 피쳐란 점을 그룹화하여 얻을 수 있는 개체를 의미한다. 제안된 방법에서는 먼저 점들로부터 표면패치들을 생성하고, 이어서 표면패치들로부터 표면집단들을 구성한다. 구성된 표면집단들로부터 지표에 해당하는 표면집단을 식별한 후 식별된 표면집단에 포함된 모든 점들을 지표점으로 명시한다. 이 방법을 항공 LIDAR 실측데이터에 적용하여 제안된 방법의 뛰어난 성능을 실험적으로 증명하였다.

음 변화 관점에서 바라본 한국어 어두 폐쇄음의 발화 및 지각 (Production and perception of Korean word-initial stops from a sound change perspective)

  • 김진우
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.39-51
    • /
    • 2021
  • 본고에서는 2020년에 수집된 자유 발화 자료를 바탕으로 어두 폐쇄음 평음, 격음, 경음의 발화가 어떻게 달라지고 있는지 그리고 지각은 어떻게 이루어지고 있는지에 대해 자세히 살펴보았다. 기존 연구의 통제된 실험에서와 다르게, 자유 발화에서는 30대 남성까지도 VOT(voice onset time)에 의해 평음과 격음의 변별이 이루어지지 않았다. 지각실험은 언어 변화의 주도 계층인 젊은 여성 세대를 대상으로 하였다. 그 결과 어두 폐쇄음의 지각에서 F0이 평음과 나머지 둘을 변별하는 역할을 하였고, 그 다음 VOT가 격음과 경음을 변별하는 역할을 하였다. 특히 F0이 낮을 때에는 VOT의 길이가 짧든 길든 간에 항상 평음으로 지각되었다는 점은 평음의 지각에서 F0이 절대적인 역할을 한다는 것을 보여주었다. 그러나 어떤 F0의 경우에는 VOT에 따라 평음과 격음이 변별되기도 하였는데, 이는 20대 여성의 발화와 지각 체계가 일치하지 않기 때문이다. 음 변화의 관점에서 발화와 지각 체계가 일치하지 않는다는 것은 음 변화가 진행 중이라는 것을 의미하는데, 특히 20대 여성에서처럼 발화의 변화가 지각의 변화에 앞서는 경우는 음 변화가 후반 단계에 있을 때이다. 이처럼 언어 변화를 주도하는 계층에서 여전히 지각에서 이전의 체계를 유지하고 있는 이유는 그들의 부모 세대의 발화에서 VOT에 의한 평음과 격음의 변별이 이루어졌기 때문이며 이를 습득한 것이라고 볼 수 있다. 즉 다른 집단과의 소통을 위해 여전히 VOT를 지각에 사용하고 있는 것이다.