• Title/Summary/Keyword: 음성언어분석

Search Result 383, Processing Time 0.027 seconds

Categorization and Analysis of Error Types in the Korean Speech Recognition System (한국어 음성 인식 시스템의 오류 유형 분류 및 분석)

  • Son, Junyoung;Park Chanjun;Seo, Jaehyung;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.144-151
    • /
    • 2021
  • 딥러닝의 등장으로 자동 음성 인식 (Automatic Speech Recognition) 기술은 인간과 컴퓨터의 상호작용을 위한 가장 중요한 요소로 자리 잡았다. 그러나 아직까지 유사 발음 오류, 띄어쓰기 오류, 기호부착 오류 등과 같이 해결해야할 난제들이 많이 존재하며 오류 유형에 대한 명확한 기준 정립이 되고 있지 않은 실정이다. 이에 본 논문은 음성 인식 시스템의 오류 유형 분류 기준을 한국어에 특화되게 설계하였으며 이를 다양한 상용화 음성 인식 시스템을 바탕으로 질적 분석 및 오류 분류를 진행하였다. 실험의 경우 도메인과 어투에 따른 분석을 각각 진행하였으며 이를 통해 각 상용화 시스템별 강건한 부분과 약점인 부분을 파악할 수 있었다.

  • PDF

Analysis of the durational characteristics of monosyllabic interjections in Natural spoken language (자연발화상에 나타난 단음절 단일간투사의 길이특성 분석)

  • 김기호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.95-98
    • /
    • 1994
  • 자연발화상에 포함되어, 음성언어 인식에 장애를 초래하는 간투사의 음성적 특성 중 가장 뚜렷이 구별되는 길이특성얼 분석하여 음성언어 인식에 도움을 주는 것을 목적으로 한다. 이 연구에서는 간투사의 대부분을 차지하는 단음절 단일 간투사에 한정하여, 실제 대화의 녹음자료에서 나타나는 간투사의 빈도수와, 그 길이특성을 신분별, 성별, 간투사 유형별로 분석하였다. 또 간투사를 위치에 따라, 음운구초 간투사, 음운구말 간투사로 나누고, 그 길이를 음절 평균, 음운 구초 음절이나 음운구말 음절의 길이와 비교하여 간투사의 증가율을 측정하였다. 분석결과 가장 높은 빈도수를 보이는 단음절 단일 간투사는 어 이며, 간투사 길이 증가율은, 음절평균에 대해서는 그가, 음운구초 평균에 대해서는 응이 가장 큰 증가율을 나타낸다. 전체적을 음운구초 음절길이에 대한 간투사 길이 증가율이 음절평균 길이에 대한 간투사 길이 증가율보다 더 크게 나타났다. 이러한 분석결과를 통해 하위레벨에서 제거할 수 있는 간투사와, 통사적 또는 의미론적 분석이 필요한 상위레벨에서 처리해야할 간투사를 구별할 수 있다. 이와 같은 길이 특성외에 간투사에 대한 다양한 음성적 특성과, 다음절 단일 간투사와, 이중 간투사에 대한 연구가 진척된다면 음성언어 인식에 장애가 되는 간투사의 효과적 배제가 가능할 것으로 보인다.

  • PDF

Acoustic Features and Structural Disorders in Korean Singers (가수들에 대한 음향음성학적 특성 및 성대병변에 대한 분석)

  • 홍기환
    • Proceedings of the KSLP Conference
    • /
    • 1998.11a
    • /
    • pp.211-212
    • /
    • 1998
  • 소리란 인간만이 가지는 특유한 발성구조에 의해 생성되는 음으로서 주로 언어소통을 목적으로 발성된다. 소리의 생성은 일정한 성문하압과 성대의 긴장 및 내전운동이 형성되면 공기가 성대를 통과하면서 성대가 진동하여 발생되며 발성된 음은 후두, 인두 구강등의 발성기관에서 공명되고 증폭되므로서 특이한 음색을 가진 소리로 발생되는 것이다. 그 중에서 노래소리란 이러한 발성기관의 종합적이고 이상적인 조화에 의해 발생되는 소리의 극치이다. 그러나 이러한 발성기관이 이상적으로 조화되지 않을 경우 소리의 변화 및 성대에 병변이 초래되어 치료를 요하는 경우도 있다. (중략)

  • PDF

Acoustic measures from normal and vocal polyp patients (정상인과 후두폴립환자 음성의 음향적 분석)

  • 최흥식;장미숙;이정준
    • Proceedings of the KSLP Conference
    • /
    • 1993.12a
    • /
    • pp.15-15
    • /
    • 1993
  • 정상 성대는 규칙척인 진동을 보이지만 병변이 있는 사람들은 진폭과 시간에 있어서 주기마다의 불규칙성을 보여준다. 이 때 각 주기마다의 시간의 불규칙성은 Jitter를 의미하며 강도의 불규칙성은 Shimmer로 표현된다. 본 연구는 우리나라 정상인 음성의 떨림을 객관적으로 조사해보고 이에 따라 병변이 있는 사람들의 음성의 떨림을 판별할 수 있는 가능성을 알아보기 위하여 저자들은 CSpeech를 이용해 정상인과 후두폴립환자의 jitter, shimmer, S R를 비교해보았다.(중략)

  • PDF

범죄음성의 식별

  • 고도흥
    • Proceedings of the KSLP Conference
    • /
    • 2003.11a
    • /
    • pp.176-179
    • /
    • 2003
  • 범인의 음성을 녹취하여 본격적으로 컴퓨터를 이용하여 음향분석을 하는 것은 스펙트로그래프가 등장하는 1940년대 말 이전에는 없었다고 해도 과언이 아니다. 그러나 청지각적인 문제는 아마 수 백년 전부터 법정에서 논란이 있었을 것으로 추정한다. 영국에서는 이미 1660년에 법정에서 청지각적인 검사를 시행하였다는 기록이 있으며, 미국에서는 20세기 초엽에 플로리다 주에서 이미 청지각적인 증거를 법정에서 채택하였다는 기록이 있다. 오늘날 범죄음성에 대한 연구는 무고한 어린이의 유괴와 폭발물 설치협박 등과 같은 죄질이 무거운 범죄에 이용되기 때문에 문제가 심각한 실정이다. (중략)

  • PDF

음성검사 및 음성재활장치의 개발

  • 이상준;성명훈;김광현;권택균;최종민;김욱은;김희찬;박광석;김동영
    • Proceedings of the KSLP Conference
    • /
    • 2003.11a
    • /
    • pp.212-214
    • /
    • 2003
  • 후두는 호흡, 발성, 기도의 보호기능을 한다. 이 중 발성은 의사소통의 수단으로 인간에게 매우 중요한 의미를 가진다. 본 교실에서 개발한 발성기능을 객관적이고 정량적으로 평가할 수 있는 Videostrobokymorgraphy(VSK), 다채널 음성분석장치, 그리고 발성재활장치인 Hands free 전기후두에 대해 소개하고자 한다.

  • PDF

A clustering algorithm of statistical langauge model and its application on speech recognition (통계적 언어 모델의 clustering 알고리즘과 음성인식에의 적용)

  • Kim, Woo-Sung;Koo, Myoung-Wan
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.145-152
    • /
    • 1996
  • 연속음성인식 시스템을 개발하기 위해서는 언어가 갖는 문법적 제약을 이용한 언어모델이 요구된다. 문법적 규칙을 이용한 언어모델은 전문가가 일일이 문법 규칙을 만들어 주어야 하는 단점이 있다. 통계적 언어 모델에서는 문법적인 정보를 수작업으로 만들어 주지 않는 대신 그러한 모든 정보를 학습을 통해서 훈련해야 하기 때문에 이를 위해 요구되는 학습 데이터도 엄청나게 증가한다. 따라서 적은 양의 데이터로도 이와 유사한 효과를 보일 수 있는 것이 클래스에 의거한 언어 모델이다. 또 이 모델은 음성 인식과 연계시에 탐색 공간을 줄여 주기 때문에 실시간 시스템 구현에 매우 유용한 모델이다. 여기서는 자동으로 클래스를 찾아주는 알고리즘을 호텔예약시스템의 corpus에 적용, 분석해 보았다. Corpus 자체가 문법규칙이 뚜렷한 특성을 갖고 있기 때문에 heuristic하게 클래스를 준 것과 유사한 결과를 보였지만 corpus 크기가 커질 경우에는 매우 유용할 것이며, initial map을 heuristic하게 주고 그 알고리즘을 적용한 결과 약간의 성능향상을 볼 수 있었다. 끝으로 음성인식시스템과 접합해 본 결과 유사한 결과를 얻었으며 언어모델에도 음향학적 특성을 반영할 수 있는 연구가 요구됨을 알 수 있었다.

  • PDF

Declaritive Morphological Analysis of Spoken Korean Recognition Results (한국어 음성인식 결과의 선언적 형태소 분석)

  • Lee, Won-Il;Lee, Geun-Bae;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.322-325
    • /
    • 1994
  • 한국어 음성인식 결과의 형태소 분석은 한국어 문서의 분석보다 더 많은 문제점을 가지고 있다. 음성 인식의 낮은 인식률, 여러 개의 후보를 제시하는 경우의 지수적 가능성, 말하는 단위와 띄어쓰기 단위의 불일치, 형태소 안에서 그리고 형태소와 형태소 사이에서 일어나는 음운 변동등이 음성 인식 결과를 분석할 때 추가되는 문제점이다. 본 논문에서는 한 음소에 대해 여러 개의 후보를 제시하는 음성 인식 결과에 대하여, TRIE 인덱싱, 어절 간의 접속을 위한 확장된 접속 검사, 음운 변동을 고려한 사전구성, 음운 접속 정보를 사용하는 형태소 분석 방법을 제안한다.

  • PDF