• Title/Summary/Keyword: 문자-음성 변환

Search Result 52, Processing Time 0.034 seconds

A Study on the Korean Text-to-Speech Conversion Using the Formant Synthesizer(I) (포만트 합성방식에 의한 한국어 문자/음성 변환에 관한 연구 (I))

  • 김민년
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.119-122
    • /
    • 1995
  • 음소단위의 포만트 합성방식을 이용하여 한국어의 규칙합성에 대해 시험하였다. 포만트 합성방식으로는 Klatt가 제안한 직/병렬 합성기를 수정하여 사용하였으며, 운율 정보를 나타내는 피치값의 제어는 Fujisaki 모델을 이용하였다. 합성에 사용되는 각 파라미터들이 합성음의 음질 및 파형에 미치는 영향을 분석할 수 있도록 합성 파라미터와 음성파형 및 스펙트로그램을 화면에 나타내고 마우스를 이용하여 파라미터 값을 사용자가 적절히 변경한 후 합성할 수 있는 포만트 방식의 합성 Tool을 개발하였으며, 이를 이용하여 한국어 문자/음성변환 시스템을 지속적으로 연구하고자 한다.

  • PDF

인쇄물에 도형형태 표시하는 음성변환용 바코드 법제화 추진

  • 박성권
    • 프린팅코리아
    • /
    • v.7 no.9
    • /
    • pp.104-107
    • /
    • 2008
  • 최근 장애인들의 사회참여가 점점 늘어나고 있는 상황에서 장애인들에 대한 관심과 권리보호에 대한 사회적인 관심이 높아지고 있다. 우리나라의 경우 국민들의 생활 및 의식수준이 높아지고, 사회복지 및 사회안전망에 대한 관심이 증가하면서 장애인들의 복지 문제가 중요한 이슈로 대두되고 있으며, 세계 최고 수준의 IT기술을 활용하여 장애인들의 복지를 향상하는 방안이 적극적으로 전개되고 있다. 이에 한나라당 김소남 의원은 시각장애인, 노인 등을 위해 문자를 음성으로 출력할 수 있도록 인쇄물 등에 도형 형태로 표시하는 '음성변환용 바코드' 정의를 규정하고, 이를 지원하는 것을 골자로 하는 장애인.노인.임산부 등의 편의증진보장에 관한 법률 개정안을 지난 7월 24일 대표 발의했다. 이와 관련 음성변환용 바코드의 대해 알아보았다.

  • PDF

Design and implementation of workbench for spoken language data acquisition (음성 언어 자료 확보를 위한 Workbench의 설계 및 구현)

  • 김태환
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.375-379
    • /
    • 1998
  • 음성 언어 자료의 확보 및 활용을 위해서는 다양한 소프트웨어의 도움이 필요하다. 본 논문에서는 본 연구실에서 설계 및 개발한 PC용 Workbench에 대하여 기술한다. Workbench는 음성 언어 자료의 확보를 위한 텍스트 처리 모듈들과 음성 데이터의 처리를 위한 신호처리 모듈들로 구성되어 있다. Workbench에 포함된 모듈로는 텍스트를 자동 읽기 변환하는 철자 음운 변환기, 발성 목록 선정 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 다단계 레이블링 시스템, 텍스트에서 원하는 음운 환경을 포함하고 있는 문자열을 다양한 조건으로 검색할 수 있는 음운 환경 검색기를 포함하고 있다.

  • PDF

한국어 문자음성 변환시스템 : 가라사대

  • 권철홍;정원국;구준모;김형순
    • Information and Communications Magazine
    • /
    • v.11 no.9
    • /
    • pp.17-25
    • /
    • 1994
  • 본 논문에서는 국내 최초의 상용 한국어 무제한 음성합성 시스템인 가라사대에 관하여 기술한다. 우선, 음성합성 과정의 각 단계에 이용된 알고리즘을 설명한다. 즉, 문장의 분석을 위해서는 문장 전처리, parsing 발음표기 변환 등의 규칙에 의하여 순차적으로 수행된다. 문장 분석후에는 강세, 억양과 지속시간 등의 운율을 제어하는 요소가 계산되고 음성신호는 확장된 diphone 단위의 음성신호를 연결하여 생성된다. 다음으로 가라사대 하드웨어 및 소프트웨어의 구성에 관하여 서술한다. 범용의 디지탈 신호처리 IC를 이용하여 구현한 하드웨어와 가라사대의 소프트웨어뿐만 아니라 PC내의 소프트웨어의 구성과 역할에 관하여 살펴본다.

  • PDF

Low-cost implementation of text to speech(TTS) system for car navigation (Car Navigation용 음성합성시스템 최저가 구현)

  • Na Ji Hoon;Sung Jung Mo;Yang Yoon Gi
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.141-144
    • /
    • 2000
  • 최근에 무선통신망을 이용한 데이터 서비스가 폭넓게 제공되면서, 이동체(MS:mobile station)에 대한 위치정보나 교통상황 둥의 부가 정보 서비스가 제공되고 있다. 이와 같이 이동체가 자동차와 같은 운행수단일 때 사용자가 디스플레이 되는 문자정보를 확인하게 되면 운전의 안정성이 저하되어 실용적이지 못하다. 이를 위해서 문자를 음성으로 전환하여 주는 문자-음성변환기(text to speech : TTS)가 필요하다. 본 논문은 car navigation용 '한국어 무제한 어휘 음성합성기' 를 저가의 DSP chip(ADSP-2185)과 저용량의 4M bits ROM을 사용하여 low-cost system으로 하드웨어를 구성하였다. 본 연구에서 개발된 실시간 한국어 음성 합성기는 저가의 통신 단말기로서 사용 될 수 있으나, 반음절 연결부분의 연결이 불완전한 경우가 많았다. 그러나 종성이 없는 음절에 대해서는 명료도가 비교적 우수하였다.

  • PDF

Web-conferencing System Application using Internet (인터넷을 이용한 웹 컨퍼런싱 시스템의 응용)

  • 이소영;박만곤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.377-381
    • /
    • 2000
  • 하루가 다르게 변하고 있는 디지털, 정보화 시대의 네트워크회된 컴퓨터 시스템과 초고속 통신망의 대중화와 함께 정보통신 기술이 급속도로 발달함에 따라 원격지 상호간에 단순히 문자나 음성만을 전송하던 방식에서 화상, 음성, 문자, 그래픽 등을 동시에 전송하는 비디오 컨퍼런싱에 대한 관심이 상당히 높아졌다. 비디오 컨퍼런싱은 음성과 동영상을 이용한 회의방식으로 화상, 음성, 문자, 그래픽 등의 동화상 정보를 최신 멀티미디어 기술을 기반으로 한 컴퓨터, 코덱, 비디오 능의 상비를 이용하여 압축한 후, 디지털 통신에 적합하게 변환하여 실시간 양방향으로 전송하는 첨단 회의 방식이다. 이러한 기존의 MCU 상비를 사용하던 고가의 룸형 비디오 컨퍼런싱을 탈피하여 최근, 일반 사용자들을 위해 단지 웹브라우저와 카메라, 마이크, 스피커만을 사용하여 실시간 회의가 가능한 웹을 이용한 웹 컨퍼런싱 개념이 많이 부각되고 있고 또한 대중화를 위해 한발 다가서고 있다. 본 논문에서는 이러한 웹 컨퍼런싱의 현 상황과 응용들에 대해서 알아보고자 한다.

  • PDF

A Voice-enabled Chatbot Mobile Application (음성지원 챗봇 모바일 애플리케이션)

  • Choi, In-Kyung;Choi, Yun-Jeong;Lee, Ye-Rin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.438-439
    • /
    • 2019
  • 사회적 문제와 인공지능 기술의 발달로 챗봇 서비스에 대한 관심이 점점 증가하고 있으며, 그 결과 TTS(Text to Speech) 및 STT(Speech to Text) 기술을 기반으로 한 보조형 프로그램에 대한 개발이 다양한 모바일 환경에서 진행중이다. 본 논문에서는 문자를 소리로 변환해주는 TTS(Text to Speech) 기술과 소리를 문자로 변환해주는 STT(Speech to Text) 기술을 사용하여 음성지원 챗봇 시스템을 제작하고 이를 안드로이드 기반의 모바일 애플리케이션으로 구현한 '음성지원 챗봇 모바일 애플리케이션'을 제안하고, 이와 관련하여 관련 기술 및 기대효과에 대해 소개한다.

Establishment of the Korean Standard Vocal Sound into Character Conversion Rule (한국어 음가를 한글 표기로 변환하는 표준규칙 제정)

  • 이계영;임재걸
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.41 no.2
    • /
    • pp.51-64
    • /
    • 2004
  • The purpose of this paper is to establish the Standard Korean Vocal Sound into Character Conversion Rule (Standard VSCC Rule) by reversely applying the Korean Standard Pronunciation Rule that regulates the way of reading written Hangeul sentences. The Standard VSCC Rule performs a crucially important role in Korean speech recognition. The general method of speech recognition is to find the most similar pattern among the standard voice patterns to the input voice pattern. Each of the standard voice patterns is an average of several sample voice patterns. If the unit of the standard voice pattern is a word, then the number of entries of the standard voice pattern will be greater than a few millions (taking inflection and postpositional particles into account). This many entries require a huge database and an impractically too many comparisons in the process of finding the most similar pattern. Therefore, the unit of the standard voice pattern should be a syllable. In this case, we have to resolve the problem of the difference between the Korean vocal sounds and the writing characters. The process of converting a sequence of Korean vocal sounds into a sequence of characters requires our Standard VSCC Rule. Making use of our Standard VSCC Rule, we have implemented a Korean vocal sounds into Hangeul character conversion system. The Korean Standard Pronunciation Rule consists of 30 items. In order to show soundness and completeness of our Standard VSCC Rule, we have tested the conversion system with various data sets reflecting all the 30 items. The test results will be presented in this paper.

Arabic-Numerals to Korean Transliteration Disambiguation using BERT (BERT를 이용한 숫자-한국어 음역 모호성 해소)

  • Park, Jeong Yeon;Yuk, Dae Bum;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.42-44
    • /
    • 2020
  • TTS(Text-to-Speech) 시스템을 위해서는 한글 이외의 문자열을 한글로 변환해줄 필요가 있다. 이러한 문자열에는 숫자, 특수문자 등의 문자열이 포함되어 있다. 특히 숫자의 경우, 숫자가 사용되는 문맥에 따라 그 발음방법이 달라지는 문제점이 있다. 본 논문에서는 기존의 규칙기반과 한정된 문맥 정보만을 활용할 수 있는 방법이 아닌, 딥러닝을 이용한 방법으로 문맥에 따라 발음방법이 달라지는 숫자 음역의 모호성을 해소하는 방법을 소개한다.

  • PDF

A Vocoder Algorithm for Implementation of Voice Telegram System (음성전보 시스템 구현을 적합한 음성 부호화 알고리즘)

  • Jung Chan Joong;Bae Myung Jin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.71-74
    • /
    • 2000
  • 전보(Telegram)는 우리의 생활에서 필요한 정보통신 시스템이다. 지금까지 전보의 기능은 긴급하거나 짧은 정보의 내용을 전화국의 메신저를 통해 문자위주로 변환하여 수신자에게 전달하고있다. 이와는 달리 음성 전보 시스템(Voice Telegram System)은 기존의 문자전달방식에 음성을 가미한 것으로서 발신자의 목소리도 함께 기록하여 수신자에게 전달하는 방식이다. 본 논문에서 음성 전보에 적합한 알고리즘을 새로이 제안하다. 유/무성음 판별 후 유성음에 대해 피치주기별로 유사도를 측정하여 유사도가 낮은 파형은 전송하고 유사도가 높은 파형은 피치와 에너지 정보만 전송하는 방법이다. 실험결과 전체 음성에 대해서 $41\%$의 압축율과 MOS 테스트 결과 4.1을 얻을 수 있었다.

  • PDF