• 제목/요약/키워드: 말소리 연장

검색결과 15건 처리시간 0.021초

한국어 평마찰음 /s/ 연장음에 대한 비유창성 양상 연구 (Korean listeners' mode of perceiving the durational variations of /s/ as prolongations)

  • 박진;고복순;박소현
    • 말소리와 음성과학
    • /
    • 제14권2호
    • /
    • pp.67-76
    • /
    • 2022
  • 본 연구는 한국어 화자의 말소리 연장에 대한 비유창성 양상(즉, 단속적 vs. 연속적)을 알아보기 위해 진행되었다. 총 35명의 성인(남자 17명, 여자 18명)이 한국어 평마찰음 /s/를 원래 길이에서 20 ms씩 980 ms까지 연장 변조한 총 50개의 자극이 들어 있는 문장을 듣고, 비유창성 정도에 대해 1에서 100점(100에 가까울수록 매우 비유창함) 척도로 평가하였다. 연장음 길이에 따른 비유창함 정도의 지각 양상을 알아보기 위해 곡선추정회귀분석을 실시하였으며, 수정된 R 제곱값(adjusted R2)이 가장 높은 수치의 모형을 선정하였다. 각 연장음에서의 비유창함 정도에 대해 남녀 간 차이를 알아보기 위해 일변량분석[one-way analysis of variance(ANOVA)]을 실시하였다. 또한 혼합분산분석(mixed ANOVA)을 통해 전체 연장음 구간을 10분위(decile)로 나누어 각 분위와 남녀 간의 효과, 그리고 두 변수 간 상호작용 유무를 알아보았다. 연구 결과, 연장음의 길이와 비유창함 정도 점수 간의 관계는 S자형 모형의 연속적인 지각 특성을 보였다. 비유창함 정도 지각에 있어 각 연장음에서 유의한 남녀 간 차이가 나타나지 않았다. 분위 분석결과, 연장음 길이가 짧아 상대적으로 유창하게 들리는 구간(1분위)에서는 남녀 간 유의한 차이가 나타나지 않았다. 하지만 연장음 길이가 길어 상대적으로 비유창하게 들리는 구간(10분위)에서는 남자가 여자보다 더 비유창하게 지각하였다. 본 연구결과를 바탕으로 이전 연구들과 비교를 통한 논의와 함께 말더듬 평가와 관련해 임상적 제언도 기술하였다.

연장음 길이에 따른 비유창성 정도 평가: 등간척도와 직접크기평정 비교 연구 (The perceptual judgment of sound prolongation: Equal-appearing interval and direct magnitude estimation)

  • 박진;차화정;배세진
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.59-67
    • /
    • 2023
  • 본 연구는 연장음의 길이에 따른 비유창성 지각 정도에 대해 각각 등간척도와 직접크기평정을 통한 청지각적 평가를 실시한 후, 두 평가의 결과치가 선형적인 또는 비선형적인 관계를 보이는지를 알아보고자 진행되었다. 이를 통해 연장음의 길이에 따른 비유창성 지각 정도에 대한 적절한 평가 방법을 제안하고자 하였다. 이를 위해 한국어를 모국어로 하는 만 19세 이상 성인 남녀 34명(남: 9명, 여: 25명, 평균연령: 32.9세)이 평가자로 참여였다. 실험참여자는 먼저 한국어 평마찰음 /s/를 원래 길이에서 80 ms씩 연장하여 2,000 ms(i.e., 285 ms, 365 ms., ..., 2,125 ms, 2,205 ms)까지 연장 변조한 총 25개의 자극이 들어 있는 문장을 듣고, 등간척도(1-7점, 1은 '정상', 7은 '심도')로 평가하였다. 이후에 등간척도 평가 결과, '경중도'(4점)에 해당하는 음성샘플을 선정해 이를 기준 평가치(modulus)로 하여 직접크기평정을 실시하였다. 두 평가 결과치에 대한 산포도를 작성한 후, 모형 분석을 통해 두 측정치 간의 관계가 선형적(linear)인지 비선형적(curvilinear)인지 R2값을 통해 조사하였다. 연구 결과, 두 평가 결과치의 관계가 비선형적인 양상을 보이는 것으로 나타났으며 이는 연장음의 길이에 따른 비유창성 정도 평가에 있어 등간척도보다는 직접크기평정이 적절한 평가 방법임을 보여주는 결과이다.

한국인의 영어 발음 학습상 문제점 개관 (A Survey or The Korean Learner's Problems in Mastering English Pronunciation)

  • 유만근
    • 대한음성학회지:말소리
    • /
    • 제42호
    • /
    • pp.47-56
    • /
    • 2001
  • 이 글은 제2회 서울 국제 음성학 학술대회(SICOPS 2000) 기조강연 내용을 조금 손질한 것인데, 한국인 영어 학습자가 저지르기 쉬운 발음상 잘못을 모음, 자음별로 관찰하고 그 대책을 논의한다. 모음에서는 주로 i:l, u:$-\sigma$, (equation omitted) 흔동이 문제이며, 또한 90종이 넘는 여러 철자로 나타나는 쭉정모음(schwa) 식별과 정복한 발음도 큰 문제다. 자음에서는 음소 연결방식에서 생기는 자음접변 둥 한 국어 특유 현상을 영어에까지 연장하는 바람에 많은 오류가 생긴다는 것과 영어 sp-, st-, sk-에서 /p t k/는 연한소리(lenis)로 [(equation omitted)]인데, 된소리로 잘못알고 있는 수가 많다는 것도 지적된다. 무룻 영어학습자는 철자만 보고 발음을 속단하지 말고 단어마다 반드시 발음을 사전에서 확인할 것과 아울러 거기에 음성학적 훈련이 수반되어야 함을 역설하며, 정확한 발음을 아는 것은 실제 영어 청취i구사에 뿐 아니라 또한 언어연구 기초확립에 필수적이라는 말로 글을 맺는다.

  • PDF

모음 연장 발성이 보이는 연령대별 음향음성학적 특성 연구 (Acoustic characteristics of the sustained vowel phonation according to age groups)

  • 서윤정;신지영
    • 말소리와 음성과학
    • /
    • 제10권4호
    • /
    • pp.67-76
    • /
    • 2018
  • This study was performed to investigate acoustic characteristics of sustained vowels produced by Seoul Korean speakers. For this study, three hundred nine healthy adults were chosen as participants from Korean Standard Speech Database. These subjects were divided into five chronological age groups (20s, 30s, 40s, 50s, 60-70s) and two gender groups (male and female). Fundamental frequency (f0), jitter, shimmer, and NHR (noise-to-harmonics ratio) was measured with 8 Korean vowels (/ɑ/, /æ/, /ʌ/, /e/, /o/, /u/, /ɯ/, /i/) by using Praat. The results showed that the vowel type significantly affected all acoustic parameters. Gender affected f0, jitter, and NHR significantly. The mean female speakers' f0 was greater than the males', and the mean jitter and NHR of male speakers was greater than the females'. Moreover, age affected shimmer and NHR significantly; in particular, the shimmer and NHR of elderly speakers was greater than the young speakers.

화자 연령 지각과 음성적 특성: 음높이와 발화 속도를 중심으로 (Speaker age estimation and acoustic characteristics: According to pitch and speech rate)

  • 서윤정;신지영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.9-18
    • /
    • 2019
  • 본고는 한국인 피험자를 대상으로 지각 실험을 진행하여 화자의 실제 연령(Chronological age)과 지각 연령(Perceived age) 간의 상관관계를 살피고, 한국인 피험자가 얼마나 정확하게 익명의 화자의 연령을 지각할 수 있는지를 밝히고자 한다. 또한, 이러한 연령 지각에 음성적 단서가 되는 음높이와 발화 속도와 지각 연령 간의 영향 관계를 검토하고자 한다. 이를 위해, 성인 80명을 대상으로 3가지 과제로 구성된 지각 실험을 진행하였다. 실험 자극은 표준어 화자 40명에게서 추출되었으며, 자유 발화, 낭독 발화, 모음 연장 발성으로 구성되었다. 각 실험은 10초 내외의 음성을 듣고 연령을 구체적인 숫자로 답하는 방식으로 진행되었다. 분석 결과, 한국인 피험자들은 상당히 높은 판단 정확도를 보였으며, 모음 연장 발성을 들었을 때보다 자유 발화와 낭독 발화를 들었을 때 화자의 연령을 더욱 정확하게 짐작하였다. 이러한 결과는 음성이 포함하고 있는 정보량의 차이에 기인한 것으로 보인다. 또한, 음성 분석을 수행한 결과 피험자들은 화자의 음높이와 발화 속도를 참고하여 화자의 연령을 추정하는 것으로 나타났으며, 음높이보다는 발화 속도가 연령 지각에 더 적극적으로 기여한 것으로 나타났다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.

경직형과 불수의운동형 뇌성마비아동의 /아/ 모음 음향학적 비교 (A comparative study of the acoustic characteristics of the vowel /a/ between children with spastic and dyskinetic cerebral palsy)

  • 정필연;심현섭
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.65-74
    • /
    • 2020
  • 본 연구의 목적은 경직형과 불수의운동형 뇌성마비 아동의 음향학적 특성에서 차이가 있는지 알아보는 것이다. 연구대상은 만 4~12세의 뇌성마비 아동 34명이 참여하였다(경직형 26명, 불수의운동형 8명). 연구과제는 모음 '아' 연장발성하기이고, Praat을 사용하여 MPT, F0, Jitter, Shimmer, NHR과 F1, F2를 측정하였다. 두 유형 간 음향학적 차이를 알아보기 위해 두 독립표본 t-검정과 등분산가정이 충족되지 않는 경우 Welch-Aspin 검정을 사용하여 통계분석을 실시하였다. 연구결과, 첫째, 경직형 뇌성마비아동에 비해 불수의운동형에서 유의하게 낮은 MPT를 나타내었다. 둘째, Shimmer에서 불수의운동형의 측정치가 유의하게 높았다. 셋째, F1과 F2에서는 두 유형 간에 유의한 차이를 보이지 않았다. 이러한 결과는 경직형에 비해 불수의운동형의 호흡능력과 호흡조절능력이 더 제한적이고, 음성의 불안정성과 불규칙성도 더 많이 나타난다는 것을 시사한다. 본 연구의 결과는 뇌성마비 유형 간 말운동통제능력의 차이를 확인하고, 유형에 따른 중재계획을 수립하는데 필요한 정보를 제공해 줄 수 있을 것이다.

켑스트럼 변수와 랜덤포레스트 알고리듬을 이용한 MTD(근긴장성 발성장애) 여성화자 음성과 정상음성 분류 (Classification of muscle tension dysphonia (MTD) female speech and normal speech using cepstrum variables and random forest algorithm)

  • 윤주원;심희정;성철재
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.91-98
    • /
    • 2020
  • 근긴장성 발성장애(cepstral peak prominence, MTD) 환자의 모음 발성과 문장읽기 과제를 켑스트럼 기반 변수를 이용하여 분석하였으며 음성장애 환자의 GRBAS청지각적 특성과 음향학적 특성의 상관관계를 살펴보고, 랜덤포레스트 머신러닝 분류 알고리듬을 이용한 MTD 감별 진단 가능성을 논의하였다. 내원 시 MTD로 진단받은 여성 36명과 정상음성을 사용하는 여성 36명이 연구에 참여했으며, 수집한 음성샘플은 ADSVTM를 사용하여 분석하였다. 연구 결과, 음향학적 측정치 중 MTD의 CSID(cepstral spectral index of dysphonia)는 대조군보다 높았으며, CPP(cepstral peak prominence), CPP_Fo 값이 대조군보다 유의하게 낮았다. 이는 모음 발성과 읽기 과제에서 모두 동일하게 나타났다. MTD 환자의 음질 특성은 전반적인 음성중증도(G)가 가장 두드러졌으며, 조조성(R), 기식성(B), 노력성(S)순으로 음성 특성을 보였다. 이 특성이 높아질수록 CPP가 감소하는 부적 상관을 보이고, CSID는 증가하는 정적 상관이 관찰되었다. 켑스트럴 변수 중 모음과 문장읽기과제 모두에서 집단간 유의한 차이를 보여준 CPP와 CPP_F0를 이용하여 MTD와 대조군의 음성분류를 시도하였다. 머신러닝 알고리듬인 랜덤포레스트로 모델링한 결과 문장읽기 과제에서 모음연장발성보다 조금 더 높은 분류 정확도(83.3%)가 나왔으며, 모음 발성과 문장 읽기 과제 모두에서 CPP변수가 더 중심적 역할을 수행하였음을 알 수 있었다.

자폐스펙트럼장애 아동의 후두 높이 및 음성 특성 (Laryngeal height and voice characteristics in children with autism spectrum disorders)

  • 이정헌;김고운;김성태
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.91-101
    • /
    • 2021
  • 본 연구의 목적은 자폐스펙트럼장애를 가진 아동의 후두 특성을 확인하고자 하였다. 자폐스펙트럼장애로 진단받은 2~4세 아동 8명과 같은 연령의 정상 대조군 42명을 포함하여 총 50명의 아동이 실험에 참여하였다. 모든 아동들은 경추와 후두의 중앙시상면의 X-ray 영상을 촬영하여 두 군의 후두 위치를 비교하였다. 또한 모음 연장발화 시 음성 샘플을 수집하여 음향 매개 변수들을 분석하였다. X-ray 검사 결과, 정상군의 설골 높이는 3세가 가장 낮았으며, 4세에 후두 높이가 상승하였다. 다른 한편으로, 외이도에서 설골까지의 거리는 4세가 가장 긴 것으로 나타났다. 이와는 대조적으로, 모든 연령대의 자폐스펙트럼장애군의 설골 높이는 정상군보다 낮았으며, 연령에 따른 설골 위치의 차이는 없었다. 음향학적 평가 결과, PFR, vFo, vAm은 정상 대조군에 비해 자폐스펙트럼장애군이 통계적으로 유의미하게 높게 나타났다. 결론적으로, 자폐스펙트럼장애 아동들의 낮은 후두 높이는 언어발달의 지연과 관련이 있는 것으로 사료된다. 음향학적 변수들 중 음성 조절기능을 보여주는 PFR, vFo, vAm은 정상 아동과 자폐스펙트럼장애 아동의 음질 차이를 보여주는 voice marker로 생각된다.