• 제목/요약/키워드: 발화속도

검색결과 126건 처리시간 0.026초

발화자별 발화 속도를 고려한 실시간 동시통역 분절 방법론 (Segmentation Methods for Different Speech Rate in Simultaneous Interpretation)

  • 구영은;김지연;홍정표;홍문표;최승권
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.369-374
    • /
    • 2020
  • 동시통역은 원천텍스트의 의미를 잘 전달하는 것 뿐만 아니라, 순차통역이나 번역과 달리, 지연 시간없이 즉각적으로 번역하는 것이 매우 중요하다. 따라서 적절한 길이의 지점에서 원천텍스트를 분절해야 한다. 그러나 발화자마다 발화 속도가 서로 다르며, 이 발화 속도는 전체 발화에서 늘 일정하지 않기 때문에, 분절단위의 적절한 길이를 설정하는 것은 상당히 어려운 과제이다. 본 연구에서는 발화자마다 발화 속도가 다른 상황과 발화가 진행되는 동안 실시간으로 발화 속도가 변화하는 상황에 적응 가능한 동시통역 분절 방법론(개인화 기법)을 제안한다. 이를 위해 본 논문에서는 먼저 동시통역 데이터를 이용하여 기준 발화 속도를 설정하였다. 그 다음 이를 원천 발화의 현재 속도와 비교하여 실시간으로 해당 발화자에게 있어 최적의 분절길이가 얼마인지 계산한다. 제안한 개인화 기법의 효력을 검증하기 위해 실험을 진행하였고, 그 결과 개인화를 적용하면 분절 성능이 높아졌다.

  • PDF

발화속도와 한국어 분절음의 음향학적 특성 (Speech Rate and the Acoustic Features of Korean Segments)

  • 이숙향;고현주
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.162-172
    • /
    • 2004
  • 본 연구에서는 산출실험을 통해 발화속도와 한국어의 분절음의 지속시간 및 포만트 특성과의 관계와 모음의 지속시간과 포만트 간의 상관관계를 살펴보았다. 빠른 발화일수록 음절 및 자음과 모음의 지속시간은 짧게 나타났으며 대부분의 화자에서 폐쇄음의 폐쇄구간 대 기식구간의 비율이나 한 음절 내의 모음 대 자음 지속시간의 비율은 발화속도의 영향을 받지 않는 반면 일부 화자들은 발화속도의 영향을 받는 것으로 나타났다. 발화속도의 영향을 받는 화자들에서 폐쇄음의 경우 폐쇄구간이 기식구간보다 영향을 더 받으며 음절의 경우 모음이 자음보다 더 영향을 받는 것으로 나타났다. 발화속도와 모음의 포만트값과의 관계 분석 결과 발화속도가 모음약화에 영향을 미치는 정도가 화자간에 차이를 보였으며 이는 화자마다 모음의 포만트값 구현에 관하여 다른 발화기재를 이용하고 있다는 것을 간접적으로 시사해주는 것이라고 할 수 있다. 즉, 발화속도의 증가에 따라 조음기관의 움직임의 속도를 증가시키는 화자가 있는 반면 발화속도의 변화에 관계없이 일정한 속도를 유지하는 화자가 있다는 것을 의미한다.

발화속도에 따른 한국어 모음의 음향적 특성 (Effects of Speaking Rate on Korean Vowels)

  • 이숙향;고현주;한양구;김종진
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.14-22
    • /
    • 2003
  • 본 연구는 발화속도에 따른 한국어 모음의 음향적 특성에 관한 것으로 보통, 느림. 빠름의 발화속도 변화에 따라 단모음과 이중모음의 반모음 성분과 단모음성분의 지속시간적 특성과 포만트 특성을 살펴보았다. 지속시간은 전체적으로 발화속도가 빨라짐에 따라 짧아지는 경향을 보였으나 포만트는 단모음과 이중모음의 단모음 성분의 경우 큰 차이가 없었고 이중모음의 반모음 성분의 경우는 반모음의 종류에 따라 서로 다른 결과를 보여주었다.

다문화가정 이주여성의 발화속도와 쉼 (Speech Rate and Pauses in the Speech of Migrant Women from Multicultural Families)

  • 황지성;이숙향
    • 한국음향학회지
    • /
    • 제31권2호
    • /
    • pp.63-72
    • /
    • 2012
  • 본 연구는 다문화가정 베트남과 필리핀 이주여성의 발화속도와 쉼 특성에 대한 음향학적인 분석을 통하여 이주여성 대상 한국어교육 프로그램 개발의 기초자료를 제공하고자 하였다. 이주여성은 한국여성에 비해 느린 발화속도, 긴 쉼 지속시간과 높은 쉼 빈도를 나타냈다. 베트남집단보다 상대적으로 한국 거주기간이 긴 필리핀집단은 한국집단에 보다 가까운 특성을 보였다. 이주여성의 발화속도가 느리게 나타난 것은 조음속도가 느리고 거의 어절마다 쉼을 두고 읽는 습관에 기인한 것으로 보인다.

발화속도 적응적인 한국어 연속음 인식기 (Adaptive Korean Continuous Speech Recognizer to Speech Rate)

  • 김재범;박찬규;한미성;이정현
    • 한국정보처리학회논문지
    • /
    • 제4권6호
    • /
    • pp.1531-1540
    • /
    • 1997
  • 본 논문에서는 발화속도 측정과 이를 통한 보상방법을 통하여 성능 향상된 한국어 연속음 인식 시스템을 제안한다. 연속음 인식은 다양한 조음화 현상과 발화속도의 변화로 인하여 고립단어 인식에 비하여 어렵다. 따라서, 연속음 인식을 위해서는 조음화 현상과 발화속도의 변화를 모델링할 수 있는 방법이 필요하다. 본 논문에서는 발화속도를 포만트의 변화율로서 측정하였고, 이 정보를 이용하여 빠른 발화에서는 상대적으로 많은 특징벡터를 발생시켜 보상을 시도하였다. 또한 조음화 현상을 모델링하기 위하여 한국어의 다이폰 집합을 514개로 정의하였고, 훈련을 위한 음성 DB론느 ETRI의 445 단어 DB를 사용하였다. 이러한 방법을 결합한 한국어 연속음 인식기를 DHMM (Discrete Hidden Markov Model)으로 구현하여 인식률이 향상됨을 보였다.

  • PDF

철자 기반과 음절 기반 속도가 한국인 영어 학습자의 발음 평가에 미치는 영향 비교 (Comparing the effects of letter-based and syllable-based speaking rates on the pronunciation assessment of Korean speakers of English)

  • 정현성
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.1-10
    • /
    • 2023
  • 본 연구에서는 AI Hub에 구축된 '교육용 한국인의 영어 음성 데이터'에 있는 발음 평가 데이터를 활용하여 철자 기반 발화 속도 및 조음 속도와 음절 기반 발화 속도 및 조음 속도 중 발음 정확성 및 운율 유창성, 합산 점수를 예측하는 모델에 어떤 요소가 더 유의미한 영향을 미치는지 분석하였다. 이를 위해 13세, 19세, 26세 연령별, 성별, 수준별로 이 코퍼스의 훈련 데이터에서 총 900개 발화를 추출하여 데이터에 포함된 다양한 요소를 활용해 평가 점수를 예측하는 선형효과분석을 실행하였다. 선형효과분석에서 최적의 세 개 모델을 통해 예측된 평가 점수를 검증 데이터에서 추출한 총 180개 발화의 평가 점수와 얼마나 상관관계가 있는지도 분석하였다. 분석 결과 발음의 정확성과 운율의 유창성, 합산 점수 예측 모델 모두 철자 기반 발화 속도와 조음 속도보다 음절 기반 발화 속도와 조음 속도가 평가 점수를 예측하는데 더 큰 영향을 주는 것으로 밝혀졌다. 모델에서 예측한 점수와 검정 데이터의 실제 점수와의 상관계수는 .65에서 .68 사이로 각 모델의 평가 점수 예측력이 나쁘지 않았다. 발화 속도와 조음 속도 간에 어떤 요소가 더 큰 영향을 미치는지는 본 연구를 통해 밝혀내지 못하였다.

발화 속도와 말차례 교체 빈도에 따른 운율 단위 변화에 관한 연구 (A study on the change of prosodic units by speech rate and frequency of turn-taking)

  • 원유권
    • 말소리와 음성과학
    • /
    • 제14권2호
    • /
    • pp.29-38
    • /
    • 2022
  • 이 연구는 국립국어원 일상 대화 음성 코퍼스(2020)에서 나타나는 발화를 분석하여 발화 속도 및 말차례 교체 빈도가 운율 단위 변화에 어떤 영향을 끼치는지 밝히는 것을 목적으로 하였다. 분석 결과, 발화 속도가 증가할수록 억양구, 어절 빈도, 발화 길이가 증가하는 양의 상관관계를 보였으나 상관관계가 낮았고, 회귀모형의 적합도는 3%-11%로 설명력이 약했다. 말차례 교체 빈도에 따른 평균 발화 속도는 유의미한 차이가 있었고, 말차례 교체 빈도가 증가할수록 발화 속도는 감소하였다. 또한 말차례 교체 빈도가 증가할수록 억양구 및 어절 빈도와 발화 길이는 감소하였으며 높은 음의 상관관계가 있는 것으로 나타났다. 회귀 모형의 적합도는 27%-32%로 계산되었다. 말차례 교체 빈도가 발화 속도와 운율 단위를 변화시키는 요인으로 작용했을 수 있다. 이는 대화체에서 나타나는 비유창성, 말차례 교체 특성, 화자 간 활발한 상호작용 등이 영향을 미쳤을 것이라 추측된다.

동영상 학습에서 교수자 출연여부와 발화속도가 학습몰입과 교수실재감에 미치는 효과 (Effects of Lecturer Appearance and Speech Rate on Learning Flow and Teaching Presence in Video Learning)

  • 태효하;제혜금;김보경
    • 한국산학기술학회논문지
    • /
    • 제22권1호
    • /
    • pp.267-274
    • /
    • 2021
  • 본 연구는 동영상 학습에서 교수자 출연 여부와 교수자 발화속도가 학습몰입과 교수실재감의 효과에 차이를 나타내는지를 실험을 통해 밝히는 것이다. 실험 대상자는 중국 형태대학교 1학년 183명이며, 이들에게 교수자가 출연여부와 발화속도 고저의 4가지 동영상을 학습하도록 한 후, 학습몰입과 교수실재감을 측정하였다. 수집된 자료는 다변량분산분석을 통해 분석하였다. 분석결과 첫째, 교수자가 출연한 동영상을 학습한 집단이 그렇지 않은 집단보다 학습몰입과 교수실재감이 모두 높게 나타났다. 둘째, 교수자의 발화속도가 높은 동영상으로 학습한 집단이 낮은 동영상으로 학습한 집단보다 학습몰입과 교수실재감이 모두 높게 나타났다. 셋째, 교수자 출연여부와 발화속도의 학습몰입과 교수실재감에 대한 상호작용 효과는 유의한 차이가 없는 것으로 나타났다. 이러한 연구결과는 대학 수업에서 효과적인 학습을 위한 강의 동영상을 개발할 때 교수자의 출연여부와 발화속도를 어떻게 설계할 것인지에 대한 이론적·실천적 근거를 제공한다. 즉 가급적 동영상에 교수자가 출연하여 표정, 몸짓과 같은 비언어적 방식으로 사회적 단서를 제시하는 것이 중요하다. 또한 교수자는 동영상에서 약간 빠른 속도로 설명함으로써 학생이 학습에 더 집중하여 몰입하게 할 수 있다. 교수자 출연과 빠른 발화속도는 학습에 몰입하게 하고, 동영상에서 교수행위가 실재로 이루어지고 있다는 느낌을 주게 한다는 것을 시사한다.

음절 별 발화속도 조절을 통한 노인 음석인식 개선 (Syllabic Speech Rate Control for Improving Elderly Speech Recognition of Smart Devices)

  • 경주원;손귀영;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1711-1714
    • /
    • 2015
  • 스마트 디바이스가 사회와 소통할 수 있는 도구가 되었음에도 불구하고 아직까지 노인들이 사용하기에는 어려움이 있다. 여기에 음성인식 기술을 이용한 음성인터페이스를 활용함으로써 노인들의 스마트 디바이스에 대한 사용성을 높일 수 있다. 하지만 일반적인 음성인식 시스템은 청장년의 발성 스타일에 맞춰져 있기 때문에, 노화된 노인의 발성이 그대로 입력될 경우 음성인식률이 하락한다. 본 연구에서는 노인의 음절 별 발화속도가 일반적인 음성인식 시스템의 성능을 보증할 수 있는 범위를 벗어나는 경우가 많다는 분석 결과를 토대로 노인의 음절 별 발화속도를 조정한 결과 노인남녀 평균 음성인식률이 15.3% 상승하였다. 이처럼 노인의 음성인식 오류 원인들 중 하나인 발화속도의 재조정으로 음성 인식률을 높일 수 있는 토대를 마련하였다. 이는 노인들이 스마트 디바이스를 이용하여 쉽고 정확한 작업을 수행할 수 있게 됨으로써, 노인들의 사회 참여와 정보 획득이 용이해 지고 더 나아가 세대 간의 소통에도 이바지할 것으로 기대한다.

한국 중학생의 영어 읽기 발화에서 문장유형에 따른 유창성 등급과 초분절 요소의 관계 (The relationship between fluency levels and suprasegmentals according to the sentence types in the English read speech by Korean middle school English learners)

  • 김화영
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.51-66
    • /
    • 2022
  • 본 연구의 목적은 한국인 영어 학습자가 영어문장을 읽을 때 어떠한 초분절 요소가 영어 원어민 화자에 가깝게 구현되는데 영향을 미치는지를 밝혀 영어 발음교육에 도움이 되고자 하는 것이다. 본 연구에서는 연구대상자를 중학생 영어학습자로 선택하고, 다양한 유형의 문장(평서문, 의문문, 명령문, 감탄문)과 음절수로 연구 자료를 구성하였다. 이들 영어 문장 발화의 분석대상으로는 초분절 요소 중 발화속도, 휴지빈도, 휴지길이, F0 범위, 리듬을 이용하였고 음성분석 결과는 평균분석, 상관분석 및 회귀분석을 실시하였다. 그 결과, 발화속도, 휴지빈도, 휴지길이, F0 범위가 유창성 등급 평가에 영향을 미친다는 결과를 얻었다. 모든 초분절 요소와 유창성 등급 간의 회귀분석에서는 유창성 등급에 영향을 미치는 초분절 요소는 발화속도와 F0 범위이다. 리듬은 유창성 등급과의 관계에서 통계적으로 유의미하지 않았다. 따라서, 영어 발음교육을 할 때 발화속도를 높이고, F0 범위를 크게 하도록 교육하는 것이 필요하다. 또한, 발화시 휴지개수와 휴지시간을 줄이도록 하는 교육이 유창성을 높이는데 도움이 된다. 문장유형을 분류하여 분석한 결과, 감탄문의 경우 다른 문장유형에 비해 발화속도가 더 빠르고, 휴지빈도는 더 적고, 휴지길이는 더 짧으며, 리듬값은 더 높았다.