• 제목/요약/키워드: TTS system

검색결과 148건 처리시간 0.019초

시각 장애인을 위한 Bluetooth 4.0 기반의 실내 위치 추정 및 안내 시스템 (An Indoor Localization and Guidance System for the Visually Impaired Person Based on Bluetooth 4.0)

  • 배선영
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.202-208
    • /
    • 2016
  • 시각장애인의 활동범위가 늘어나면서 복잡하고 대형화된 건물들 속에서 목적지까지 안전하게 찾아가기란 쉽지 않다. 시각장애인을 위해 GPS 신호나 음성 알림 정보, 점자 유도 블록, 음향 신호기 등을 활용한 안내 시스템이 있지만 이는 대부분 실외 안내 시스템으로 실내에서는 적합하지 않다. 이에 본 논문에서는 보편화된 스마트 폰을 이용하여 시각장애인에게 해당 목적지에 대한 방향, 거리, 높이, 장애물 등의 목적지까지의 다양한 정보를 음성기술인 TTS(Text to Speech)와 촉각기술인 햅틱(Haptic) 그리고 블루투스 4.0기반의 근거리 무선통신 기술인 비콘을 이용하여 사용자에게 알려 줄 수 있는 실내 위치 추정 및 안내 시스템을 제안한다. 제한된 시스템의 실험 결과에서 사용자는 목적지까지의 최적 경로를 검색하여 TTS와 Haptic 기술을 이용해 안전하고 정확하게 안내받을 수 있었다.

ETRI 소용량 대화체 음성합성시스템 (ETRI small-sized dialog style TTS system)

  • 김종진;김정세;김상훈;박준;이윤근;한민수
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.217-220
    • /
    • 2007
  • This study outlines a small-sized dialog style ETRI Korean TTS system which applies a HMM based speech synthesis techniques. In order to build the VoiceFont, dialog-style 500 sentences were used in training HMM. And the context information about phonemes, syllables, words, phrases and sentence were extracted fully automatically to build context-dependent HMM. In training the acoustic model, acoustic features such as Mel-cepstrums, logF0 and its delta, delta-delta were used. The size of the VoiceFont which was built through the training is 0.93Mb. The developed HMM-based TTS system were installed on the ARM720T processor which operates 60MHz clocks/second. To reduce computation time, the MLSA inverse filtering module is implemented with Assembly language. The speed of the fully implemented system is the 1.73 times faster than real time.

  • PDF

대용량 한국어 TTS의 결정트리기반 음성 DB 감축 방안 (UA Tree-based Reduction of Speech DB in a Large Corpus-based Korean TTS)

  • 이정철
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권7호
    • /
    • pp.91-98
    • /
    • 2010
  • 대용량 음성 DB를 사용하는 음편접합 TTS는 부가적인 신호처리 기술을 거의 사용하지 않고, 문맥을 반영하는 여러 합성유닛들을 결합해 합성음을 생성하기 때문에 높은 자연성을 가진다는 장점이 있다. 그러나 자연성, 개인성, 어조, 감정구현 등에서 활용성을 높이기 위해서는 음성DB의 크기가 비례적으로 증가하게 되므로 음운환경과 음향적 특성이 유사한 다수의 음편들을 제거하여 음성DB의 크기를 감축하기 위한 연구가 필수적이다 본 논문에서는DB감축을 위해 결정 트리 기반의 새로운 음소 군집화 방법을 이용하여 한국어 TTS용 합성단위음편 데이터베이스 구축 방법을 제안한다. 그리고 클러스터링방법에 대한 성능 평가를 위해서 언어 처리기, 운율 처리기, 음편 선택기, 합성음 생성기, 합성단위 음편데이터베이스, 음성신호 출력기로 구성되는 한국어 TTS 기본 시스템을 이용하여 합성음을 생성하였고 트리 클러스터링 방법 CM1, CM2와 전체 DB (Full DB)와 감축된 DB(Reduced DB)의 4가지 조합별로 제작된 음편 데이터베이스를 이용하여 각 조합에 대한 MOS 테스트를 수행하였다. 실험결과 제안된 방법을 사용할 경우 전체 음성DB의 크기를 23%로 줄일 수 있었고, 청취실험 결과 높은 MOS를 보이므로 향후 소용량 DB TTS에 적용 가능성을 보였다.

스코폴라민의 흰쥐 피부투과에 대한 투과촉진제들의 영향 (Effect of Various Enhancers on Permeation of Scopolamine through Excised Rat Skin)

  • 정재영;감성훈;김건남;지상철;박은석
    • Journal of Pharmaceutical Investigation
    • /
    • 제33권2호
    • /
    • pp.141-144
    • /
    • 2003
  • The transdermal therapeutic system (TTS) of scopolamine has various advantages over its oral dosage forms. The ideal scopolamine TTS requires high skin permeation rate in short time after it is applied on the skin. In order to increase the initial skin permeation rate of scopolamine from TTS, various permeation enhancers were employed. Enhancers employed were fatty acids (oleic and linolenic acids), cyclic monoterpenes (menthol, camphor, cineole and limonene) and others (isopropyl myristate, sodium lauryl sulfate and glyceryl monostearate). The concentration of enhancers in the base were fixed to 5% (w/w). While fatty acids had little enhancing effect on the skin permeation of scopolamine, cyclic monoterpenes, isopropyl myristate and sodium lauryl sulfate resulted in $1.5{\sim}2.6-fold$ higher skin permeation rate of the drug compared to the control. However, lag time was not affected by enhancers studied.

Prosodic Contour Generation for Korean Text-To-Speech System Using Artificial Neural Networks

  • Lim, Un-Cheon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제28권2E호
    • /
    • pp.43-50
    • /
    • 2009
  • To get more natural synthetic speech generated by a Korean TTS (Text-To-Speech) system, we have to know all the possible prosodic rules in Korean spoken language. We should find out these rules from linguistic, phonetic information or from real speech. In general, all of these rules should be integrated into a prosody-generation algorithm in a TTS system. But this algorithm cannot cover up all the possible prosodic rules in a language and it is not perfect, so the naturalness of synthesized speech cannot be as good as we expect. ANNs (Artificial Neural Networks) can be trained to learn the prosodic rules in Korean spoken language. To train and test ANNs, we need to prepare the prosodic patterns of all the phonemic segments in a prosodic corpus. A prosodic corpus will include meaningful sentences to represent all the possible prosodic rules. Sentences in the corpus were made by picking up a series of words from the list of PB (phonetically Balanced) isolated words. These sentences in the corpus were read by speakers, recorded, and collected as a speech database. By analyzing recorded real speech, we can extract prosodic pattern about each phoneme, and assign them as target and test patterns for ANNs. ANNs can learn the prosody from natural speech and generate prosodic patterns of the central phonemic segment in phoneme strings as output response of ANNs when phoneme strings of a sentence are given to ANNs as input stimuli.

Trainable TTS System을 위한 음운 지속시간 모델링 (An Analysis on the Phoneme Duration Modeling For the Trainable TTS System)

  • 서지인;이양희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.109-112
    • /
    • 2001
  • 본 논문에서는 한국어 Trainable TTS System의 자연스러운 음성 합성을 위해 400문장(어절수 : 6,220, 음운수: 총43,701: 자음 23,899,모음: 19,802)에 대하여 단일 남성화자가 발성한 문 음성 데이터를 음운레벨세그먼트, 음운 라벨링 ,어절간의 띄어쓰기 ,어절에 대한 음운별 품사가 태깅된 문 음성 코퍼스를 사용하여 음운 환경과 품사에 의하여 음운의 지속시간이 어떻게 변화하는가에 대하여 통계적으로 분석하였다. 그리고 음운 지속시간을 보다 정교하게 예측하기 위하여, 각 음운에 대한 고유 지속시간의 영향이 배제된 정규화 음운지속시간에 대한 회귀트리를 이용하여 정규화 지속시간에 영향을 미치는 특징요소들 간의 관계를 통계적인 방법으로 분석하였다. 그 결과 문법적인 특징요소를 나타내는 요소들간에 서로 상관이 높게 나타나는 것을 알 수 있었다 그리고 이러한 경우 유사한 특징 요소들간에 상관이 1에 가까울 정도로 상관이 높은 요소들의 경우 예측지수가 낮은 요소들을 제거하여도 지속시간변화에 영향을 미치지 못하는 것으로 나타났다. 그 결과 문법적 성질이 유사한 특징 요소들을 회귀트리를 통해 모델링할 경우에 요소들간의 상관정도를 분석하여 최소한의 특징요소들을 선택 할 수 있는 방법을 제시하였다 그리고 이를 토대로 한 정규화 회귀트리의 모델링이 지속시간 회귀트리 모델링보다 우수함을 입증하였다.

  • PDF

시각 장애인을 위한 정보접근 임베디드 시스템의 구현 (Implementation of Information Access Embedded System for the Blind People)

  • 김시우;이재균;이채욱
    • 한국통신학회논문지
    • /
    • 제33권2C호
    • /
    • pp.167-172
    • /
    • 2008
  • 2차원 바코드는 많은 정보와 데이터를 빠르게 검색할 수 있기 때문에 여러 산업분야에서 유용한 도구로써 인식되고 널리 사용되어지고 있다. 하지만 의 저장 용량은 아직도 제한적이다. 현재 사용되고 있는 바코드 중에서 최대의 용량을 저장 할 수 있는 인 Analog-Digital (AD)코드가 최근 개발되었다. 바코드의 데이터 저장 용량의 한계점을 극복하게 됨에 따라 바코드의 응용 범위를 더욱 확대할 수 있게 되었다. 본 논문에서는 AD코드와 Text To Speech (TTS)엔진을 이용하여 바코드에 저장된 정보를 음성으로 들려주는 임베디드 시스템을 구현하였다. 이 시스템은 시각장애인 뿐만 아니라 고령자들이 책 또는 신문의 정보를 손쉽게 획득하는 것을 가능하게 해준다.

자연어 처리 기반 한국어 TTS 시스템 구현 (Implementation of Korean TTS System based on Natural Language Processing)

  • 김병창;이근배
    • 대한음성학회지:말소리
    • /
    • 제46호
    • /
    • pp.51-64
    • /
    • 2003
  • In order to produce high quality synthesized speech, it is very important to get an accurate grapheme-to-phoneme conversion and prosody model from texts using natural language processing. Robust preprocessing for non-Korean characters should also be required. In this paper, we analyzed Korean texts using a morphological analyzer, part-of-speech tagger and syntactic chunker. We present a new grapheme-to-phoneme conversion method for Korean using a hybrid method with a phonetic pattern dictionary and CCV (consonant vowel) LTS (letter to sound) rules, for unlimited vocabulary Korean TTS. We constructed a prosody model using a probabilistic method and decision tree-based method. The probabilistic method atone usually suffers from performance degradation due to inherent data sparseness problems. So we adopted tree-based error correction to overcome these training data limitations.

  • PDF

천연고분자 기재에 의한 수용성 항고지단백혈증제의 흰쥐 피부투과 특성 (Skin Permeation Characteristics of Antihyperlipoproteinemic Agent using Natural Polymer Bases in Rats)

  • 공승대;황성규;정덕채
    • 한국응용과학기술학회지
    • /
    • 제17권2호
    • /
    • pp.126-131
    • /
    • 2000
  • Transdermal therapeutic system(TTS) is often used as the method of drug dosage into the epidermic skin. Natural polymer were selected as ointment material of TTS. We investigated the permeation of natural polymer ointment containing drug in rat skin using horizontal membrane cell model. Permeation properties of materials were investigated for water-soluble drug such as oxiniacic acid in vitro. These results showed that skin permeation rate of drug across the composite was mainly dependent on the property of ointment base and drug. Proper selection of the polymeric materials which resemble and enhance properties of the delivering drug was found to be important in controlling the skin permeation rate. This result suggests a possible use of natural polymer ointment base as TTS of antihyperlipoproteinemic agent.

한국어 음성 합성을 이용한 이메일 매니저 (Using of The Korean Language Voice Synthesis For E-Mail Manager System)

  • 조규상;이영훈;이병렬;서대영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.266-270
    • /
    • 2009
  • IT 관련 산업의 발전에 의한 저변의 확대로 장애우들의 IT 사용 수요가 늘고 있다. 본 논문에서는 IT분야에서 가장 기초적으로 활용되는 E-Mail을 시각 장애우가 활용 하는 데에 불편함이 없도록 하는 이메일 매니저 개발에 관련된 기법에 대해 논하고자 한다. TTS(Text-To Speech : 문자 텍스트를 음성으로 전환하여 들려줌)와 음성키보드(키보드 입력 시 입력한 문자를 음성으로 알려줌) 기능으로 시각 장애우가 이메일을 사용함에 있어 불편함을 느끼지 않도록 하였으며 본 시스템의 TTS 알고리즘은 국어 표준발음법을 참고로 하여 자바로 구현 하였다.

  • PDF