• Title/Summary/Keyword: TTS system

Search Result 148, Processing Time 0.03 seconds

Passivation of organic light emitting diodes with $Al_2O_3/Ag/Al_2O_3$ multilayer thin films grown by twin target sputtering system

  • Jeong, Jin-A;Kim, Han-Ki
    • 한국정보디스플레이학회:학술대회논문집
    • /
    • 2008.10a
    • /
    • pp.420-423
    • /
    • 2008
  • The characteristics of $Al_2O_3/Ag/Al_2O_3$ multilayer passivaton prepared by twin target sputtering (TTS) system for organic light emitting diodes. The $Al_2O_3/Ag/Al_2O_3$ multilayer thin film passivation on a PET substrate had a high transmittance of 86.44 % and low water vapor transmission rate (WVTR) of $0.011\;g/m^2$-day due to the surface plasmon resonance (SPR) effect of Ag interlayer and effective multilayer structure for preventing the intrusion of water vapor. Using synchrotron x-ray scattering and field emission scanning electron microscope (FESEM) examinations, we investigated the growth behavior of Ag layer on the $Al_2O_3$ layer to explain the SPR effect of the Ag layer. This indicates that an $Al_2O_3/Ag/Al_2O_3$ multilayer passivation is a promising thin film passivation scheme for organic based flexible optoelectronics.

  • PDF

Investigation of IZO/Al multilayer anode grown on PEN substrate by a twin target sputtering system for flexible top emitting organic light emitting diodes (TTS를 이용하여 PEN 기판 상에 성막한 플렉시블 전면 발광 OLED용 IZO/Al multilayer 애노드의 특성)

  • Oh, Jin-Young;Moon, Jong-Min;Jeong, Jin-A;Kim, Han-Ki
    • Proceedings of the Korean Institute of Electrical and Electronic Material Engineers Conference
    • /
    • 2007.11a
    • /
    • pp.444-445
    • /
    • 2007
  • IZO/Al multilayer anode films for flexible top emitting organic light emitting diodes (TOLEDs) were grown on PEN (polyethylen-enaphthelate) substrate using twin target sputter (TTS) system. To investigate electrical and optical properties of IZO/Al multilayer films, 4-point probe method and UV/Vis spectrometer were used, respectively. From a IZO/Al multilayer films with 100nm-thick Al, sheet resistance of $1.4{\Omega}/{\square}$ and reflectance of above 62% at a range of 500~550nm wavelength could be obtained, In addition, structural and surface properties of IZO/Al multilayer films were analyzed by XRD (X-ray diffraction) and FESEM (field emission scanning electron microscopy) and AES (auger electron spectroscope), respectively. Moreover, flexibility of IZO/Al multilayer anode films were examined by bending test method.

  • PDF

A study on the improvement of generation speed and speech quality for a granularized emotional speech synthesis system (세밀한 감정 음성 합성 시스템의 속도와 합성음의 음질 개선 연구)

  • Um, Se-Yun;Oh, Sangshin;Jang, Inseon;Ahn, Chung-hyun;Kang, Hong-Goo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.453-455
    • /
    • 2020
  • 본 논문은 시각 장애인을 위한 감정 음성 자막 서비스를 생성하는 종단 간(end-to-end) 감정 음성 합성 시스템(emotional text-to-speech synthesis system, TTS)의 음성 합성 속도를 높이면서도 합성음의 음질을 향상시키는 방법을 제안한다. 기존에 사용했던 전역 스타일 토큰(Global Style Token, GST)을 이용한 감정 음성 합성 방법은 다양한 감정을 표현할 수 있는 장점을 갖고 있으나, 합성음을 생성하는데 필요한 시간이 길고 학습할 데이터의 동적 영역을 효과적으로 처리하지 않으면 합성음에 클리핑(clipping) 현상이 발생하는 등 음질이 저하되는 양상을 보였다. 이를 보안하기 위해 본 논문에서는 새로운 데이터 전처리 과정을 도입하였고 기존의 보코더(vocoder)인 웨이브넷(WaveNet)을 웨이브알엔엔(WaveRNN)으로 대체하여 생성 속도와 음질 측면에서 개선됨을 보였다.

  • PDF

Break Predicting Methods Using Phonetic Symbols Combined with Accents Information in a Japanese Speech Synthesizer (일본어 합성기에서 악센트 정보가 결합된 발음기호를 이용한 Break 예측 방법)

  • Na, Deok-Su;Lee, Jong-Seok;Kim, Jong-Kuk;Bae, Myung-Jin
    • MALSORI
    • /
    • no.62
    • /
    • pp.69-84
    • /
    • 2007
  • Japanese is a language having intonations, which are indicated by the relative differences in pitch heights and the accentual phrases (APs) are placed according to the changes of the accents while a break occurs on a boundary of the APs. Although a break can be predicted by using J-ToBI, which is a rule-based or statistical approach, it is very difficult to predict a break exactly due to the flexibility. Therefore, in this paper, a method which can enhance the quality of synthesized speech by reducing the errors in predicting break indices (BI), are proposed. The method is to use a new definition for the phonetic symbols, which combine the phonetic values of Japanese words with the accents information. Since a stream of defined phonetic symbols includes the information on the changes in intonations, the BI can be easily predicted by dividing the intonation phrase (IP) into several APs. As a result of an experiment, the accuracy of break generations was 98 % and the proposed method contributed itself to enhance the naturalness of synthesized speeches.

  • PDF

Development of English Education System Using TTS (TTS를 활용한 영어 교육용 시스템 구현)

  • Youn, Yong-Heum;Lim, Soon-Yong;Lim, Sung-Su;Min, Ji-Sun;Song, Han-Sol;Kim, Bong-Hyun;Ka, Min-Kyoung;Cho, Dong-Uk;Bae, Young-Lae J.
    • Proceedings of the KAIS Fall Conference
    • /
    • 2011.05b
    • /
    • pp.892-896
    • /
    • 2011
  • 영어 교육용 소프트웨어는 다양한 기법을 적용하여 개발, 활용되고 있으며 영어 능력을 중요시하는 현재의 시대상을 반영하듯 학교, 학원, 직장 외에 개인 PC를 이용해 시간과 장소의 제약 없이 쉽고, 재미있게 영어 공부를 돕는데 목적이 두고 지속적으로 개발되고 있다. 따라서 본 논문에서는 영어 교육의 중요성을 높게 판단하여 영어 단어를 중점적으로 학습하는데 목표를 둔 시스템을 구현하였다. 즉, TTS를 활용하여 음성적 교육 방식을 적용하였으며 영어 단어 학습 과정과 문제 풀이 과정으로 분류하여 영어 공부에 대한 흥미를 유발시키는 시스템을 설계하였으며 개인 계정을 통한 학습 과정 진도를 저장 및 관리하는 시스템 환경을 구현하였다.

  • PDF

A Study on Visual Feedback Control of a Dual Arm Robot with Eight Joints

  • Lee, Woo-Song;Kim, Hong-Rae;Kim, Young-Tae;Jung, Dong-Yean;Han, Sung-Hyun
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 2005.06a
    • /
    • pp.610-615
    • /
    • 2005
  • Visual servoing is the fusion of results from many elemental areas including high-speed image processing, kinematics, dynamics, control theory, and real-time computing. It has much in common with research into active vision and structure from motion, but is quite different from the often described use of vision in hierarchical task-level robot control systems. We present a new approach to visual feedback control using image-based visual servoing with the stereo vision in this paper. In order to control the position and orientation of a robot with respect to an object, a new technique is proposed using a binocular stereo vision. The stereo vision enables us to calculate an exact image Jacobian not only at around a desired location but also at the other locations. The suggested technique can guide a robot manipulator to the desired location without giving such priori knowledge as the relative distance to the desired location or the model of an object even if the initial positioning error is large. This paper describes a model of stereo vision and how to generate feedback commands. The performance of the proposed visual servoing system is illustrated by the simulation and experimental results and compared with the case of conventional method for dual-arm robot made in Samsung Electronics Co., Ltd.

  • PDF

An Optical Character Recognition Method using a Smartphone Gyro Sensor for Visually Impaired Persons (스마트폰 자이로센서를 이용한 시각장애인용 광학문자인식 방법)

  • Kwon, Soon-Kak;Kim, Heung-Jun
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.21 no.4
    • /
    • pp.13-20
    • /
    • 2016
  • It is possible to implement an optical character recognition system using a high-resolution camera mounted on smart phones in the modern society. Further, characters extracted from the implemented application is possible to provide the voice service for the visually impaired person by using TTS. But, it is difficult for the visually impaired person to properly shoot the objects that character information are included, because it is very hard to accurately understand the current state of the object. In this paper, we propose a method of inducing an appropriate shooting for the visually impaired persons by using a smartphone gyro sensor. As a result of simulation using the implemented program, we were able to see that it is possible to recognize the more character from the same object using the proposed method.

Design and Implementation of the CAMUS system based Proactive Service (능동형 서비스를 제공하는 CAMUS 시스템에 관한 설계 및 구현)

  • Jung, In-Cheol;Joo, Jun-Myun;Lee, Kang-Woo;Kim, Hyung-Sun
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2007.11a
    • /
    • pp.373-377
    • /
    • 2007
  • 유비쿼터스 환경에서 사용자에게 유용한 서비스를 제공하기 위해서는 기능을 명시적으로 제공하기 보다는 사용자의 요구에 따라서 능동형으로 제공하는 기능이 필요하다. 이러한 능동형 서비스는 알아서 서비스를 수행하는 기능으로 CAMUS 시스템에서는 서비스 탐색 부분에서 사용된다. 즉 시스템의 상황에 따라서 메시지 시스템을 구현하는 경우에 자원의 형태에 따라서 영상 메세징, TTS 기능을 이용한 메세징, Text 기반 메세징 시스템으로 자동적으로 처리할 수 있다. 이를 위해 CAMUS 서버에는 SAM(Service Agent Manager) 과의 통신을 통해 환경 내에 존재하는 센서와 장치들 (Service Agent)을 관리 및 제어한다. 이러한 Service Agent Manager 는 여러 다양한 환경에 설치되어 환경 내에 위치한 다양한 센서로부터 정보를 얻고 그 정보를 CAMUS 메인 서버에 전달하는 한편 CAMUS 메인 서버로부터 실행명령을 받아 환경 내 장치를 제어하는 역할을 한다. 이러한 Service Agent Manager는 임의의 공간 내에 설치될 수 있으며 로봇단말이나 개인 휴대단말 등에도 설치될 수 있다 이 논문에서는 SAM(Service Agent Manager) 과 CAMUS 서버에서 원하는 서비스를 탐색하는 방법에 대한 내용을 기술하였다.

  • PDF

Development of Automatic Creating Web-Site Tool for the Blind (시각장애인용 웹사이트 자동생성 툴 개발)

  • Baek, Hyeun-Ki;Ha, Tai-Hyun
    • Journal of Digital Contents Society
    • /
    • v.8 no.4
    • /
    • pp.467-474
    • /
    • 2007
  • This paper documents the design and implementation of an automatic creating web-site tool for the blind to build their own homepage by using both voice recognition and voice mixed technology with equal ease as the non-disabled. The blind can make voice mails, schedules, address lists and bookmarks by making use of the tool. It also facilitates communication between the non-disabled with the help of their information management system. This tool converts basic commands into voice recognition, also making an offer of text-to-speech which supports voice output. In the end, the tool will remove the blind's social isolation, allowing them to enjoy the information age like the non-disabled.

  • PDF

Prosodic-Boundary Prediction for Korean Text-to-Speech System (한국어 TTS 시스템을 위한 운율구 경계 예측)

  • Chun Jin-wook;Kim Han Woo;Kim Dong gun;Lee Yanghee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.77-82
    • /
    • 2002
  • 운율은 음성의 초분절적인 면에 연관하는 음성의 한 성으로서 통상적으로 화자는 음성을 달하는 과정에서 청자의 이해를 돕기 위해 운율을 사용하게 된다. 본 논문은 이러한 운율을 이루는 성분 중의 하나인 운율구의 위치 예측에 대한 성능을 향상시키는 것에 그 목적을 둔다. 한국어 운율 정보에 대한 표기 방법 중의 하나인 K-ToBI를 기반으로 하여, 운율구의 경계와 그에 대한 레벨을 Break Indices 정보로서 나타내었고, 통계학 분야에서 제안된 Support Vector Machine(SVM)을 이용하여 시스템의 예측률 향상을 꾀하였다. 기존의 방법에서 사용된 트리 기반 모델을 이용하여 한국어 운율에 가장 많은 영향을 끼치는 언어 정보들을 추출하였고 이를 실험에 적용하였다. 기존의 트리 모델과 SVM 모델에 대한 예측률을 비교한 결과, 경계 유무 정보 예측과 4단계의 레벨을 가지는 경계 정보의 예측에서 모두 본 방법이 보다 높은 예측률을 보여 주어 본 연구에서 제시한 접근법이 운율구의 경계 정보를 예측하는 데에 있어 더욱 효과적인 접근법임을 실험적으로 입증하였다.

  • PDF