• 제목/요약/키워드: 음성문자변환

검색결과 52건 처리시간 0.041초

포만트 합성방식에 의한 한국어 문자/음성 변환에 관한 연구 (I) (A Study on the Korean Text-to-Speech Conversion Using the Formant Synthesizer(I))

  • 김민년
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.119-122
    • /
    • 1995
  • 음소단위의 포만트 합성방식을 이용하여 한국어의 규칙합성에 대해 시험하였다. 포만트 합성방식으로는 Klatt가 제안한 직/병렬 합성기를 수정하여 사용하였으며, 운율 정보를 나타내는 피치값의 제어는 Fujisaki 모델을 이용하였다. 합성에 사용되는 각 파라미터들이 합성음의 음질 및 파형에 미치는 영향을 분석할 수 있도록 합성 파라미터와 음성파형 및 스펙트로그램을 화면에 나타내고 마우스를 이용하여 파라미터 값을 사용자가 적절히 변경한 후 합성할 수 있는 포만트 방식의 합성 Tool을 개발하였으며, 이를 이용하여 한국어 문자/음성변환 시스템을 지속적으로 연구하고자 한다.

  • PDF

인쇄물에 도형형태 표시하는 음성변환용 바코드 법제화 추진

  • 박성권
    • 프린팅코리아
    • /
    • 제7권9호
    • /
    • pp.104-107
    • /
    • 2008
  • 최근 장애인들의 사회참여가 점점 늘어나고 있는 상황에서 장애인들에 대한 관심과 권리보호에 대한 사회적인 관심이 높아지고 있다. 우리나라의 경우 국민들의 생활 및 의식수준이 높아지고, 사회복지 및 사회안전망에 대한 관심이 증가하면서 장애인들의 복지 문제가 중요한 이슈로 대두되고 있으며, 세계 최고 수준의 IT기술을 활용하여 장애인들의 복지를 향상하는 방안이 적극적으로 전개되고 있다. 이에 한나라당 김소남 의원은 시각장애인, 노인 등을 위해 문자를 음성으로 출력할 수 있도록 인쇄물 등에 도형 형태로 표시하는 '음성변환용 바코드' 정의를 규정하고, 이를 지원하는 것을 골자로 하는 장애인.노인.임산부 등의 편의증진보장에 관한 법률 개정안을 지난 7월 24일 대표 발의했다. 이와 관련 음성변환용 바코드의 대해 알아보았다.

  • PDF

음성 언어 자료 확보를 위한 Workbench의 설계 및 구현 (Design and implementation of workbench for spoken language data acquisition)

  • 김태환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.375-379
    • /
    • 1998
  • 음성 언어 자료의 확보 및 활용을 위해서는 다양한 소프트웨어의 도움이 필요하다. 본 논문에서는 본 연구실에서 설계 및 개발한 PC용 Workbench에 대하여 기술한다. Workbench는 음성 언어 자료의 확보를 위한 텍스트 처리 모듈들과 음성 데이터의 처리를 위한 신호처리 모듈들로 구성되어 있다. Workbench에 포함된 모듈로는 텍스트를 자동 읽기 변환하는 철자 음운 변환기, 발성 목록 선정 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 끝점 검출기를 이용한 음성 데이터 편집 모듈, 다단계 레이블링 시스템, 텍스트에서 원하는 음운 환경을 포함하고 있는 문자열을 다양한 조건으로 검색할 수 있는 음운 환경 검색기를 포함하고 있다.

  • PDF

한국어 문자음성 변환시스템 : 가라사대

  • 권철홍;정원국;구준모;김형순
    • 정보와 통신
    • /
    • 제11권9호
    • /
    • pp.17-25
    • /
    • 1994
  • 본 논문에서는 국내 최초의 상용 한국어 무제한 음성합성 시스템인 가라사대에 관하여 기술한다. 우선, 음성합성 과정의 각 단계에 이용된 알고리즘을 설명한다. 즉, 문장의 분석을 위해서는 문장 전처리, parsing 발음표기 변환 등의 규칙에 의하여 순차적으로 수행된다. 문장 분석후에는 강세, 억양과 지속시간 등의 운율을 제어하는 요소가 계산되고 음성신호는 확장된 diphone 단위의 음성신호를 연결하여 생성된다. 다음으로 가라사대 하드웨어 및 소프트웨어의 구성에 관하여 서술한다. 범용의 디지탈 신호처리 IC를 이용하여 구현한 하드웨어와 가라사대의 소프트웨어뿐만 아니라 PC내의 소프트웨어의 구성과 역할에 관하여 살펴본다.

  • PDF

Car Navigation용 음성합성시스템 최저가 구현 (Low-cost implementation of text to speech(TTS) system for car navigation)

  • 나지훈;성정모;양윤기
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.141-144
    • /
    • 2000
  • 최근에 무선통신망을 이용한 데이터 서비스가 폭넓게 제공되면서, 이동체(MS:mobile station)에 대한 위치정보나 교통상황 둥의 부가 정보 서비스가 제공되고 있다. 이와 같이 이동체가 자동차와 같은 운행수단일 때 사용자가 디스플레이 되는 문자정보를 확인하게 되면 운전의 안정성이 저하되어 실용적이지 못하다. 이를 위해서 문자를 음성으로 전환하여 주는 문자-음성변환기(text to speech : TTS)가 필요하다. 본 논문은 car navigation용 '한국어 무제한 어휘 음성합성기' 를 저가의 DSP chip(ADSP-2185)과 저용량의 4M bits ROM을 사용하여 low-cost system으로 하드웨어를 구성하였다. 본 연구에서 개발된 실시간 한국어 음성 합성기는 저가의 통신 단말기로서 사용 될 수 있으나, 반음절 연결부분의 연결이 불완전한 경우가 많았다. 그러나 종성이 없는 음절에 대해서는 명료도가 비교적 우수하였다.

  • PDF

인터넷을 이용한 웹 컨퍼런싱 시스템의 응용 (Web-conferencing System Application using Internet)

  • 이소영;박만곤
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.377-381
    • /
    • 2000
  • 하루가 다르게 변하고 있는 디지털, 정보화 시대의 네트워크회된 컴퓨터 시스템과 초고속 통신망의 대중화와 함께 정보통신 기술이 급속도로 발달함에 따라 원격지 상호간에 단순히 문자나 음성만을 전송하던 방식에서 화상, 음성, 문자, 그래픽 등을 동시에 전송하는 비디오 컨퍼런싱에 대한 관심이 상당히 높아졌다. 비디오 컨퍼런싱은 음성과 동영상을 이용한 회의방식으로 화상, 음성, 문자, 그래픽 등의 동화상 정보를 최신 멀티미디어 기술을 기반으로 한 컴퓨터, 코덱, 비디오 능의 상비를 이용하여 압축한 후, 디지털 통신에 적합하게 변환하여 실시간 양방향으로 전송하는 첨단 회의 방식이다. 이러한 기존의 MCU 상비를 사용하던 고가의 룸형 비디오 컨퍼런싱을 탈피하여 최근, 일반 사용자들을 위해 단지 웹브라우저와 카메라, 마이크, 스피커만을 사용하여 실시간 회의가 가능한 웹을 이용한 웹 컨퍼런싱 개념이 많이 부각되고 있고 또한 대중화를 위해 한발 다가서고 있다. 본 논문에서는 이러한 웹 컨퍼런싱의 현 상황과 응용들에 대해서 알아보고자 한다.

  • PDF

음성지원 챗봇 모바일 애플리케이션 (A Voice-enabled Chatbot Mobile Application)

  • 최인경;최윤정;이예린
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.438-439
    • /
    • 2019
  • 사회적 문제와 인공지능 기술의 발달로 챗봇 서비스에 대한 관심이 점점 증가하고 있으며, 그 결과 TTS(Text to Speech) 및 STT(Speech to Text) 기술을 기반으로 한 보조형 프로그램에 대한 개발이 다양한 모바일 환경에서 진행중이다. 본 논문에서는 문자를 소리로 변환해주는 TTS(Text to Speech) 기술과 소리를 문자로 변환해주는 STT(Speech to Text) 기술을 사용하여 음성지원 챗봇 시스템을 제작하고 이를 안드로이드 기반의 모바일 애플리케이션으로 구현한 '음성지원 챗봇 모바일 애플리케이션'을 제안하고, 이와 관련하여 관련 기술 및 기대효과에 대해 소개한다.

한국어 음가를 한글 표기로 변환하는 표준규칙 제정 (Establishment of the Korean Standard Vocal Sound into Character Conversion Rule)

  • 이계영;임재걸
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.51-64
    • /
    • 2004
  • 표기 체계인 한글을 한국어 음가로 변환하는 음운변동 규칙을 역으로 적용하여, 한국어 음가를 한국어를 표기하는 문자 체계인 한글로 전환시키는 규칙을 고안하는 것이 본 연구의 목표이다. 제정된 규칙은 한국어 음성인식에 있어서 매우 귀중한 역할을 담당한다. 일반적인 음성인식 기법은 수회의 학습과정을 통하여 추출된 음성의 표준패턴과 인식 대상으로 입력된 음성을 비교하여 가장 유사한 패턴을 찾는 방법을 사용한다. 이 때 표준 음성패턴이 띄어쓰기 단위의 어절이라면 수백만 개의 표준 패턴이 수록되어야 하므로 표준패턴을 위한 방대한 데이터베이스의 구축은 물론 표준패턴과의 비교 회수도 너무 많아져서 실용화가 불가능하다. 이에 대한 대안인 음절 단위 인식의 경우는 인식된 음가가 실제의 한글 표기와 맞지 않으므로, 인식된 결과를 출력할 때에 실제의 한글표기로 변환해 주어야 하는 과제를 안게 된다. 이 과제를 해결하는 과정, 즉 일련의 한국어 음가들을 일련의 한글 표기 문자로 바꾸어 주는 과정에서는 본 논문에서 제안한 표준 한국어 음가 - 표기 문자 변환 규칙을 적용할 수 있을 것이다. 본 논문에서는 새롭게 제안된 표준 한글 음가-표기 문자 변환 규칙을 사용하여 한국어 음가를 한글 표기로 변환하는 시스템을 구현하였다. 그리고, 고안된 규칙의 무결성을 보이기 위하여 표준 발음규칙 30항을 반영하는 데이터 집합을 이용하여 구현된 시스템을 시험하였으며, 그 실험 결과를 제시한다.

BERT를 이용한 숫자-한국어 음역 모호성 해소 (Arabic-Numerals to Korean Transliteration Disambiguation using BERT)

  • 박정연;육대범;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.42-44
    • /
    • 2020
  • TTS(Text-to-Speech) 시스템을 위해서는 한글 이외의 문자열을 한글로 변환해줄 필요가 있다. 이러한 문자열에는 숫자, 특수문자 등의 문자열이 포함되어 있다. 특히 숫자의 경우, 숫자가 사용되는 문맥에 따라 그 발음방법이 달라지는 문제점이 있다. 본 논문에서는 기존의 규칙기반과 한정된 문맥 정보만을 활용할 수 있는 방법이 아닌, 딥러닝을 이용한 방법으로 문맥에 따라 발음방법이 달라지는 숫자 음역의 모호성을 해소하는 방법을 소개한다.

  • PDF

음성전보 시스템 구현을 적합한 음성 부호화 알고리즘 (A Vocoder Algorithm for Implementation of Voice Telegram System)

  • 정찬중;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.71-74
    • /
    • 2000
  • 전보(Telegram)는 우리의 생활에서 필요한 정보통신 시스템이다. 지금까지 전보의 기능은 긴급하거나 짧은 정보의 내용을 전화국의 메신저를 통해 문자위주로 변환하여 수신자에게 전달하고있다. 이와는 달리 음성 전보 시스템(Voice Telegram System)은 기존의 문자전달방식에 음성을 가미한 것으로서 발신자의 목소리도 함께 기록하여 수신자에게 전달하는 방식이다. 본 논문에서 음성 전보에 적합한 알고리즘을 새로이 제안하다. 유/무성음 판별 후 유성음에 대해 피치주기별로 유사도를 측정하여 유사도가 낮은 파형은 전송하고 유사도가 높은 파형은 피치와 에너지 정보만 전송하는 방법이다. 실험결과 전체 음성에 대해서 $41\%$의 압축율과 MOS 테스트 결과 4.1을 얻을 수 있었다.

  • PDF