• 제목/요약/키워드: Tagalog

검색결과 3건 처리시간 0.018초

Implementation and Evaluation of an HMM-Based Speech Synthesis System for the Tagalog Language

  • ;김경태;김종진
    • 대한음성학회지:말소리
    • /
    • 제68권
    • /
    • pp.49-63
    • /
    • 2008
  • This paper describes the development and assessment of a hidden Markov model (HMM) based Tagalog speech synthesis system, where Tagalog is the most widely spoken indigenous language of the Philippines. Several aspects of the design process are discussed here. In order to build the synthesizer a speech database is recorded and phonetically segmented. The constructed speech corpus contains approximately 89 minutes of Tagalog speech organized in 596 spoken utterances. Furthermore, contextual information is determined. The quality of the synthesized speech is assessed by subjective tests employing 25 native Tagalog speakers as respondents. Experimental results show that the new system is able to obtain a 3.29 MOS which indicates that the developed system is able to produce highly intelligible neutral Tagalog speech with stable quality even when a small amount of speech data is used for HMM training.

  • PDF

AutoCor: A Query Based Automatic Acquisition of Corpora of Closely-related Languages

  • Dimalen, Davis Muhajereen D.;Roxas, Rachel Edita O.
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.146-154
    • /
    • 2007
  • AutoCor is a method for the automatic acquisition and classification of corpora of documents in closely-related languages. It is an extension and enhancement of CorpusBuilder, a system that automatically builds specific minority language corpora from a closed corpus, since some Tagalog documents retrieved by CorpusBuilder are actually documents in other closely-related Philippine languages. AutoCor used the query generation method odds ratio, and introduced the concept of common word pruning to differentiate between documents of closely-related Philippine languages and Tagalog. The performance of the system using with and without pruning are compared, and common word pruning was found to improve the precision of the system.

  • PDF

동남아시아 언어의 모음체계 보편성 연구 - 타갈로그어, 말레이어, 타이어를 대상으로 - (A Study on the Vowel System Universals of Southeast Asian Languages: The Cases of Tagalog, Malay and Thai.)

  • 허용
    • 비교문화연구
    • /
    • 제48권
    • /
    • pp.391-417
    • /
    • 2017
  • 동남아시아 언어들은 모음체계가 매우 복잡한 것으로 알려져 있어 자연언어 모음체계의 보편성을 논의하는 데 매우 중요한 위치를 차지하고 있다. 본 연구는 이를 위한 기초연구로 7개의 동남아시아 국어 또는 공식어 중 우선적으로 그 체계가 비교적 단순한 타갈로그어, 말레이어, 타이어의 3개 언어를 대상으로 모음체계의 보편성에 대해 논의한 것이다. 모음의 보편성에 대해서는 여러 학자들의 견해가 있지만 본 연구에서는 209개 언어의 분절음을 구축한 SPAP(Stanford Phonology Archive Project)나 451개 언어의 분절음을 구축한 UPSID(UCLA Phonological Segment Inventory Database)와 같은 대규모 말뭉치를 이용하여 모음체계의 보편성을 논의한 선행연구들을 바탕으로, 그 연구들에 제시된 6가지의 보편성 분석 기준을 위 세 언어의 모음체계에 실험적으로 적용하여 분석을 시도하였다. 그 6가지 기준은 유형적 보편성에 속하는 (1) 모음 수(또는 모음 목록 크기)와 (2) 단계성에 따른 모음 구성의 두 가지, 그리고 음성적 보편성이라 할 수 있는 (3) 저설성 (4) 균형성과 대칭성 (5) 전설성 (6) 원순성의 네 가지이다. 그리고 위의 세 언어에 이 6가지 기준을 적용함에 있어 보편성을 판별하는 또 다른 기준인 기술적 보편성과 분석적 보편성의 두 가지 관점 모두에서 분석하였다. 논의의 결과 분석적 보편성의 관점에서는 세 언어 모두 6가지 기준에서 '높음' 단계의 보편성을 보이지만 기술적 보편성에서는 타갈로그 어는 모음 수와 단계성에 따른 모음 구성, 그리고 저설성에서 상대적으로 보편성이 낮으며, 타이어는 균형성은 다른 두 언어와 마찬가지로 높은 보편성을 보이지만 대칭성에 있어서는 '보통' 단계의 보편성을 보이고 있다. 한편, 말레이어는 모든 기준에서 '높음' 단계의 보편성을 보이는 매우 안정적인 모음체계를 가지고 있음을 확인하였다.