• 제목/요약/키워드: Co-articulation

검색결과 15건 처리시간 0.02초

조음결합을 고려한 4연 숫자음 인식에 관한 연구 (A Study on the Recognition of Korean 4 Connected Digits Considering Co-articulation)

  • 이종진;이광석;허강인;김명기;고시영
    • 한국통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.20-28
    • /
    • 1992
  • 조음결합은 연결단어 음성인식에서 오인식을 발생시키는 주된 요인이다. 본 연구에서는 표준패턴의 접속 부분에서 선행단어의 영향을 받아 후속단어의 선두 부분하는 것을 고려해 조음결합 모델을 적용하여 후속단어에 변형을 주었다. 조음결합 모델은 임계제동형 선형 2차계를 이용하였으며 1단 DP매칭 인식 알고리즘에 이 모델을 조합하여 효과를 조사했다. 그 결과 화자 5명에 의한 4연 숫자음 35어의 인식 실험에서 조음결합 처리에 의한 인식율이 평균 4.7%개선 되었다.

  • PDF

한국어 파찰음과 영어 파찰음의 조음적 차이에 관한 연구 (An EPG Study of the Articulatory Difference between Korean and English Affricates)

  • 백운일
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.57-62
    • /
    • 2003
  • Using EPG, the stop and fricative portions of the Korean and English afficates were examined to find out whether the stop and fricative portions of Korean affricates are the same as those of English ones in articulation, as generally assumed in the literature. The English affricate in the word 'choose' is classified as alveopalatal just like the Korean affricate in the word 'cam'. The results of the EPG data showed that Korean affricates were not articulated the same as those in English, especially in the stop portion. In English, the stop portion of 'choose' was quite similar to /t/ as 'tooth', but in Korean, the stop portion of 'cam' was somewhat different from /t/ in 'tam'. More specifically, the stop portion of /t/ in 'tam' was articulated with the contact at the upper teeth and the alveolar ridge, but the stop portion of /t/ in 'cam' was articulated with the contact in the alveopalatal region. This shifting in the place of articulation of the stop portions of the Korean affricate (from dental and alveolar to alveopalatal) can be explained. Unlike English affricates, the stop portions of Korean affricates and the fricative portions of Korean affricates are co-articulated at the same place of articulation.

  • PDF

수치해석을 통한 급곡선 구간 Shield TBM의 중절잭 및 스킨플레이트 구조에 관한 연구 (Study on the structure of the articulation jack and skin plate of the sharp curve section shield TBM in numerical analysis)

  • 강신현;김동호;김훈태;송승우
    • 한국터널지하공간학회 논문집
    • /
    • 제19권3호
    • /
    • pp.421-435
    • /
    • 2017
  • 최근 국내 지상 구조물의 포화 및 파이프 라인 시설 과밀화 현상과 난개발로 인해 지상 구조물의 대안으로 지하 구조물에 대한 개발이 지속적으로 요구되고 있다. 도심지 인프라 구축을 위한 NATM 터널 공사에 발생하는 진동 및 소음 문제를 예방하기 위해 기계식 터널 공법인 쉴드 TBM 공법의 기계화 터널 시공이 증가하는 추세이다. 따라서 본 연구에서는 기계화 터널의 직선 시공과 급곡선 시공 시 쉴드 TBM의 구조적 안정성을 위한 쉴드 TBM 추력에 대한 중절잭, 쉴드 잭, 스킨 플레이트의 구조적 안정성 기술에 대해 연구하였다. 시공 사례 및 쉴드 TBM의 작동원리를 이론적 접근 방법으로 검토, 분석한 결과, 쉴드 TBM의 직선 및 급곡선 시공시 주요 인자에 의해 커터헤드의 회전력, 중절잭, 쉴드 잭에 대한 추력 및 커터헤드의 여굴량이 중요한 것으로 나타났다. 또한 굴진 내부 작업자의 안전 및 장비의 원활한 작동을 위해 스킨 플레이트 구조의 안정성 확보는 매우 중요 사안이므로 이번 연구를 통해 장비의 일반적인 구조 및 구성을 검토하여 직선 및 급곡선 시공 시 스킨 플레이트 구조에 미치는 주요 인자 및 구조 안정성을 실험적인 시뮬레이션 수치해석을 통해 검토하였다. 이에 직선 및 급곡선 시공 시 작용 되는 가상의 토질을 선정하여 중절잭의 하중을 비교 검토 하여 스킨 플레이트의 구조 안정성을 평가하고 형상을 최적화 하였다. 현재 국내 시공 중인 쉴드 TBM 타입의 구조 및 작동 방식이 매우 유사하므로, 추후 국산화 기술 개발 및 신규 장비 개발과 쉴드 TBM의 취약부 및 안정성을 검토하는데 기여 할 것으로 기대된다.

한국어 동시조음 모델에 기반한 스피치 애니메이션 생성 (Speech Animation Synthesis based on a Korean Co-articulation Model)

  • 장민정;정선진;노준용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권3호
    • /
    • pp.49-59
    • /
    • 2020
  • 본 논문에서는 규칙 기반의 동시조음 모델을 통해 한국어에 특화된 스피치 애니메이션을 생성하는 모델을 제안한다. 음성에 대응되는 입 모양 애니메이션을 생성하는 기술은 영어를 중심으로 많은 연구가 진행되어 왔으며, 자연스럽고 사실적인 모션이 필요한 영화, 애니메이션, 게임 등의 문화산업 전반에 널리 활용된다. 그러나 많은 국내 콘텐츠의 경우, 스피치 애니메이션을 생략하거나 음성과 상관없이 단순 반복 재생한 뒤 성우가 더빙하는 형태로 시각적으로 매우 부자연스러운 결과를 보여준다. 또한, 한국어에 특화된 모델이 아닌 언어 비의존적 연구는 아직 국내 콘텐츠 제작에 활용될 정도의 퀄리티를 보장하지 못한다. 따라서 본 논문은 음성과 텍스트를 입력받아 한국어의 언어학적 특성을 반영한 자연스러운 스피치 애니메이션 생성 기술을 제안하고자 한다. 한국어에서 입 모양은 대부분 모음에 의해 결정된다는 특성을 반영하여 입술과 혀를 분리한 동시조음 모델을 정의해 기존의 입술 모양에 왜곡이 발생하거나 일부 음소의 특성이 누락되는 문제를 해결하였으며, 더 나아가 운율적 요소에 따른 차이를 반영하여 보다 역동적인 스피치 애니메이션 생성이 가능하다. 제안된 모델은 유저 스터디를 통해 자연스러운 스피치 애니메이션을 생성함을 검증하였으며, 향후 국내 문화산업 발전에 크게 기여할 것으로 기대된다.

Phonetic investigation of epenthetic vowels produced by Korean learners of English

  • Shin, Dong-Jin;Iverson, Paul
    • 말소리와 음성과학
    • /
    • 제6권4호
    • /
    • pp.17-26
    • /
    • 2014
  • The present study examined epenthetic vowels produced by Korean learners of English in read sentences, in terms of acoustic measures and extra-phonological factors. The results demonstrated three main findings. First, epenthetic vowels had relatively high F1 values and a wide range of F2 values. Most of the epenthetic vowels were inserted near Korean high central vowels, but some vowels were inserted near front vowels due to co-articulation with surrounding vowels. Second, vowel epenthesis was affected by the context. The results showed that the epenthesis was frequently seen with word junctions between obstruents (e.g., stops-fricatives). Third, Korean learners were not affected by English background and were very weakly affected by orthography. English experience, which is one of the extra-phonological factors, was not related to epenthesis production. However, orthography, the other extra-phonological factor, very weakly affected the amount of epenthesis production. Nine percent of all epenthesis production was affected by the English past-tense suffix '-ed'; approximately 70% of the participants were affected by this suffix. The findings of the present study contributed to understanding vowel epenthesis. First, the study revealed that the epenthetic vowels produced by Korean learners of English were close to the high central vowel, supporting previous studies that the epenthetic vowel is quite close to the shortest vowel. Second, the study examined the various phonetic environments of epenthetic vowels, revealing that vowel epenthesis occurred more frequently in a certain phonetic circumstance.

은닉 마르코프 모델과 레벨 빌딩을 이용한 한국어 연속 음성 인식 (Recognition of Continuous Spoken Korean Language using HMM and Level Building)

  • 김경현;김상균;김항준
    • 전자공학회논문지C
    • /
    • 제35C권11호
    • /
    • pp.63-75
    • /
    • 1998
  • 한국어 연속 음성에서 발생하는 조음결합문제를 해결하기 위하여 단어를 기본 인식 단위로 사용할 경우 각 단어의 효율적인 표현 방법, 연속된 단어로 이루어진 여러 문장의 표현 방법 그리고 입력된 연속음성을 연속된 여러 단어로의 정합 방법에 관한 연구가 선행되어야 한다. 본 논문에서는 은닉 마르코프 모델과 레벨빌딩 알고리즘을 이용한 한국어 연속 음성 인식 시스템을 제안한다. 각 단어는 은닉 마르코프 모델로 표현하고 문장을 표현하기 위하여 단어 모델을 연결한 형태인 인식 네트워크를 구성한다. 인식네트워크의 탐색 알고리즘으로는 레벨 빌딩 알고리즘을 사용한다. 제안한 방법은 항공기 예약 시스템에 적용한 실험에서 인식율과 인식속도면에서 실용적이었으며 또한 비교적 적은 저장공간으로 전체 문장을 표현하고 쉽게 확장할 수 있다는 장점을 가지고 있다.

  • PDF

음소 질의어 집합 생성 알고리즘 (Phonetic Question Set Generation Algorithm)

  • 김성아;육동석;권오일
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.173-179
    • /
    • 2004
  • 음소 질의어 집합은 문맥 속에서 비슷한 조음 효과를 보이는 음소들을 분류해 놓은 것으로서, 음성 인식 시스템 학습 시 결정트리를 기반으로 HMM (hidden Markov model)의 상태들을 클러스터링할 때 사용된다. 현재까지의 음소 질의어 집합은 대부분 음성학자나 언어학자들에 의해 수작업으로 제시되어 왔는데, 이러한 지식 기반음소 질의어들은 언어 또는 유사음소 단위 (PLU: phone like unit)에 종속될 뿐 아니라 생성된 클러스터 내의 동질성을 저하시킬 수 있다는 단점이 있다. 본 논문에서는 이와 같은 문제점들을 해결하기 위해 음성 데이터를 사용하여 측정한 음소들 사이의 유사도를 기반으로 언어나 유사음소단위에 상관없이 자동으로 음소 질의어 집합을 생성하는 알고리즘을 제안한다. 실험결과, 제안한 방법으로 생성된 음소 질의어들을 사용한 인식기의 에러율이 약 14.3%감소하여 데이터 기반의 음소 질의어 집합이 상태 클러스터링에 효율적임을 관측하였다.

한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상 (Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles)

  • 송명규;김형순
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.401-406
    • /
    • 2002
  • 한국어 숫자는 모두 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 이러한 문제점들과 더불어 배경잡음이나 채널에 의한 왜곡에 따른 문제점들로 인해 한국어 연결숫자의 인식 성능은 만족스럽지 못한 것이 현실이다. 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운변화를 고려하여 유사음소 (phonelike units: PLUs)군을 정의하고, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수할 수 있도록 인식 시스템을 구성하는 방식을 검토하였다. 전화망 4연숫자를 이용한 화자독립 인식 실험을 수행한 결과 제안된 방법의 숫자열 인식률은 상태당 믹스쳐 (mixture) 개수가 1인 경우 83.2%로, 기준 시스템 (baseline)에 대한 오류감소률이 7.2%였고 가장 높은 성능을 나타낸 믹스쳐 개수가 11인 경우 숫자열 인식률은 91.8% 오류감소율은 4.7%였다.

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.