• Title/Summary/Keyword: 텍스트/음성변환

Search Result 74, Processing Time 0.028 seconds

Design and implementation of workbench for spoken language data acquisition (음성 언어 자료 확보를 위한 Workbench의 설계 및 구현)

  • 김태환
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.375-379
    • /
    • 1998
  • 음성 언어 자료의 확보 및 활용을 위해서는 다양한 소프트웨어의 도움이 필요하다. 본 논문에서는 본 연구실에서 설계 및 개발한 PC용 Workbench에 대하여 기술한다. Workbench는 음성 언어 자료의 확보를 위한 텍스트 처리 모듈들과 음성 데이터의 처리를 위한 신호처리 모듈들로 구성되어 있다. Workbench에 포함된 모듈로는 텍스트를 자동 읽기 변환하는 철자 음운 변환기, 발성 목록 선정 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 다단계 레이블링 시스템, 텍스트에서 원하는 음운 환경을 포함하고 있는 문자열을 다양한 조건으로 검색할 수 있는 음운 환경 검색기를 포함하고 있다.

  • PDF

Development of a Korean-English Text-to-Speech Application for Android Supporting Language Study and Book Reading (어학 공부와 전자책 읽기 기능을 제공하는 안드로이드용 한영 텍스트-음성 변환 애플리케이션 개발)

  • Yu, Miyeon;Kim, Suji;Kim, Somin;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1490-1492
    • /
    • 2013
  • 최근 들어 스마트폰과 같은 휴대용 장치에 안드로이드 운영체제가 널리 탑재되면서, 안드로이드용 애플리케이션이 활발히 개발되고 있다. 본 논문에서는 텍스트를 음성으로 변환하는 안드로이드용 TTS(Text-to-Speech) 애플리케이션을 개발한다. 기존의 유사 TTS 애플리케이션들과 달리, 본 논문에서 개발한 애플리케이션은 사용자가 직접 입력한 임의의 텍스트를 음성으로 읽어주는 기능과 미리 저장되어 있는 전자책을 불러와 음성으로 읽어주는 기능을 모두 제공한다. 또한 한글과 영어를 모두 지원하기 때문에, 한글 텍스트와 영어 텍스트를 모두 사용할 수 있다. 따라서 본 애플리케이션은 여러 사용자에 의해 다양한 용도로 사용될 수 있다.

The Design and Implementation of Korean Text-to-Speech Conversion System on a Rule-Based Framework (한국어(韓國語) 규칙(規則) 음성(音聲) 합성(合成) 시스템의 구현(具現))

  • Son, Yung-Taek;Kim, Yong-Kap;Matsumoto, Tatsuro
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.141-148
    • /
    • 1993
  • 본고는, 한글 한자가 혼용된 입력 텍스트를 음성으로 변환 출력하는 포르만트 음성 합성 방식 즉, 한국어 규칙 음성 합성(이하에는 KTTS[Korean Text To Speech System]이라고 함)의 전반적인 처리 흐름에 대하여 소개한다. 특히, 입력 텍스트에 있어서, 한자 또는 각종 부호의 한글 변환 기능, 음성 출력용 문법 정보 추출에 필요한 입력문의 해석 및 구문경계 설정 기능, 또한 음소 기호 변환 및 파라메터 값 생성과 변경 처리기능을 중심으로 설명하고자 한다. 또한 본 시스템의 완성과 더불어 실시하였던 청취 실험 평가 결과에 대하여 덧붙이겠다.

  • PDF

The Design and Implementation of Mobile Dictionary App based on Voice Recognition Server (음성 인식 서버를 이용한 모바일 사전 설계 및 구현)

  • Yu, Jae-Seung;Park, Hee-Tae;Park, Mi-So;Song, Min-kyu;Yun, Sung-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1698-1701
    • /
    • 2012
  • 음성 인식은 사용자의 음성을 문자로 변환하는 기술로 최근 스마트폰의 사용자 인터페이스로 사용되면서 그 활용도가 높아지고 있다. 기존의 스마트폰용 사전 프로그램은 좁은 자판으로 인하여 입력과정에 오타가 많이 발생하고, 찾고자 하는 단어의 발음은 알고 있지만 철자를 알지 못 하는 경우에 검색할 수 없다. 본 논문에서는 음성 명령을 이용한 스마트폰용 영한사전 앱을 설계 및 구현하였다. 외부 음성 인식 서버를 이용하여 음성 명령을 이해하고 클라이언트에 SQLite를 이용하여 사전 데이터 베이스를 구축한다. 클라이언트는 서버로 사용자 음성을 전달하고, 서버는 음성 정보를 텍스트로 변환하여 클라이언트에게 제공한다[1]. 클라이언트는 서버로부터 전송받은 텍스트를 이용하여 사전 데이터베이스를 검색하고, 그 결과를 사용자에게 보여준다.

Implementation of Voice Support Calendar Management System Using TTS (TTS를 이용한 음성지원 일정관리 시스템의 구현)

  • Lee Se-Hwan;Kim Bong-Hyun;Kim Seung-Youn
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.501-504
    • /
    • 2006
  • 본 논문에서는 텍스트로 구성된 문서에 대한 음성 변환 시스템의 각 분야에 대해 기술하고, 음성합성 기술인 TTS기반의 음성지원 일정관리 시스템 설계 및 구현 부분에 대하여 설계한다. 이를 위해서 음성합성 기술의 개념 및 원리와 구조 등을 이해하고, 시스템 설계 및 구현을 하고자 한다. 시스템 설계 구현부에는 Speech SDK 5.1(음성합성엔진)을 사용하여 음성합성 기술부분을 처리하고, 이를 바탕으로 C# 언어를 사용하여 구현한다. 기존 텍스트기반의 일정관리 시스템 설계 부분에다가 음성합성 기능을 추가하여 텍스트의 지루함을 탈피하고, 음성 기술을 접목시켰다. 본 논문에 사용되는 엔진은 영문위주의 음성합성이므로 시스템 설계 부분에 있어 음성처리 부분을 영문으로 하여 결과물을 산출하였다. 최종적으로 실험에 의해 제안한 방법의 유용성을 입증한다.

  • PDF

Subtitle Highlighting System for Video Streaming using Speech Interface STT (Speech to Text) (음성 인터페이스 STT(Speech to Text)를 활용한 동영상 스트리밍 자막 강조 시스템)

  • Lee, Kang-Chan;Cho, Dae-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.567-568
    • /
    • 2021
  • 자막은 자막을 볼 수 있는 모든 사람들의 정보전달, 의사소통을 할 수 있는 유용한 도구로 사용 되고 있지만 자막은 평범한 텍스트로 있어 자막에서 강조된 부분, 감정 등을 전달 할 수 없다는 단점을 가지고 있다. 그러므로 청각 장애인들은 해당 컨텐츠의 감정, 강조 되는 부분을 알 수 없어 대화의 숨은 의미가 다른 방향으로 이해 할 수 있다는 위험성을 가지고 있다. 본 논문에서는 음성을 텍스트로 변환하는 STT(Speech To Text)를 이용하여 동영상 스트리밍 서비스를 실시간으로 음성을 텍스트로 변환과 동시에 강조하는 부분까지 개발하여 청각장애인 입장에서 기존 자막보다 효율적인 시각적 효과를 주는 미디어 접근을 위한 동영상 스트리밍 자막 서비스를 개발하고자 한다.

  • PDF

듀얼모드지원 응용 서비스 설계 및 구현

  • Kim, Do-Hyung;Yun, Min-Hong;Kim, Sun-Ja;Lee, Cheol-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10d
    • /
    • pp.411-414
    • /
    • 2006
  • 본 논문에서는 임베디드 리눅스 기반의 응용 서비스인 모바일 이야기꾼의 설계 및 구현에 대해서 기술한다. 모바일 이야기꾼은 음성 통신을 위해 CDMA 네트워크와 데이터 통신을 위해 와이브로 네트워크를 동시에 사용한다. 송신자가 CDMA와 WiBro를 지원하는 듀얼모드 단말에서 텍스트를 입력하면 텍스트는 와이브로 네트워크를 통해 인터넷 상에 위치한 TTS 서버에 전달된다. 텍스트를 전달받은 TTS 서버는 텍스트를 음성으로 변경하고, 듀얼모드 지원 단말에 음성 데이터를 전송하게 된다. 마지막으로, 듀얼모드 지원 단말은 변환된 음성을 CDMA 네트워크를 통해 수신자에게 전달하게 된다. 모바일 이야기꾼은 주변환경이 시끄럽거나, 송신자가 언어장애가 있는 경우에도 사용자로 하여금 음성 통화를 할 수 있도록 지원한다.

  • PDF

The Extraction of Effective Index Database from Voice Database and Information Retrieval (음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색)

  • Park Mi-Sung
    • Journal of Korean Library and Information Science Society
    • /
    • v.35 no.3
    • /
    • pp.271-291
    • /
    • 2004
  • Such information services source like digital library has been asked information services of atypical multimedia database like image, voice, VOD/AOD. Examined in this study are suggestions such as word-phrase generator, syllable recoverer, morphological analyzer, corrector for voice processing. Suggested voice processing technique transform voice database into tort database, then extract index database from text database. On top of this, the study suggest a information retrieval model to use in extracted index database, voice full-text information retrieval.

  • PDF

An Implementation of Speech Recognition and Synthesis System using Japanese-Korean Phonetic Transcription (일한 음차 변환을 이용한 음성인식 및 합성기의 구현)

  • 이용주;이현구;윤재선;양원렬;홍광석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.401-403
    • /
    • 2000
  • 본 논문에서는 일한 음차 변환을 이용한 음성인식 및 합성기를 구현하였다. 음성인식의 경우 CV, VCCV, VCV, VV, VC 단위를 사용하였다. 이와 같이 단위별로 미리 구축된 모델을 결합함으로써 음성인식 시스템을 구축하였다. 따라서 일한 음차 변환을 적용하게 되면 인식 대상이 일어단어일 경우에도 이를 한글 발음으로 변환한 후 그에 해당하는 모델을 생성함으로써 인식이 가능하다. 음성 합성기의 경우 합성에 필요한 한국어 음성 데이터 베이스를 구축하고, 입력되는 텍스트에 따라 이를 연결하여 합성음을 생성한다. 일어가 입력될 경우 일한 음차 변환 규칙을 이용하여 입력된 일어 발음을 한글로 바꾸어 준 후 입력하게 되므로 별도의 일어 합성기 없이도 합성음을 생성할 수 있다.

  • PDF

An Implementation of Unlimited Speech Recognition and Synthesis System using Transcription of Roman to Hangul (영한 음차 변환을 이용한 무제한 음성인식 및 합성기의 구현)

  • 양원렬;윤재선;홍광석
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.08a
    • /
    • pp.181-184
    • /
    • 2000
  • 본 논문에서는 영한 음차 변환을 이용한 음성인식 및 합성기를 구현하였다. 음성인식의 경우 CV(Consonant Vowel), VCCV, VCV, VV, VC 단위를 사용하였다. 위의 단위별로 미리 구축된 모델을 결합함으로써 무제한 음성인식 시스템을 구축하였다. 따라서 영한 음차 변환을 이용하게 되면 인식 대상이 영어단어일 경우에도 이를 한글 발음으로 변환한 후 그에 해당하는 모델을 생성함으로써 인식이 가능하다. 음성 합성기의 경우 합성에 필요한 한국어 음성 데이터 베이스를 구축하고, 입력되는 텍스트에 따라 이를 연결하여 합성음을 생성한다. 영어가 입력될 경우 영한 음차 변환을 이용하여 입력된 영어발음을 한글로 바꾸어 준 후 입력하게 되므로 별도의 영어 합성기 없이도 합성음을 생성할 수 있다.

  • PDF