• 제목/요약/키워드: 음합성

검색결과 333건 처리시간 0.023초

합성음 구현을 위한 음의 억양과 장단변화 연구 (A Study on Pitch-rate and Time-Rate Modifications for Speech Synthesis)

  • 하정호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.328-333
    • /
    • 1994
  • 합성의 궁극적 목표는 어휘의 제한 없이 어떠한 말이라도 자연스럽게 다양한 음색과 속도로 합성해 내는 것이다. 따라서 음성합성 시스템의 성능은 전하고자 하는 정보를 얼마나 정확한 발음으로, 자여스럽게 합성음을 만들 수 있는가에 달려있다. 우수한 성능을 갖는 음성합성 시스템을 구현하기 위해서는운율법에서 산출된 음의 억양과 장단변환을 효과적으로 적용시킬 수 있는 음향신호처리 알고리즘이 필요하다. 본 논문은 운율법에 따라 합성음을 적은 계산량을 유지하면서 시간영역에서 음색은 그대로 유지하면서 억양변환하고, 알맞는 속도로 장단변환하는 알고리즘을 개발하였다. 이를 이용하여 음편인 기본음만을 가지고 원하는 음 높이와 길이의 합성음을 산출하였다. 본 논문에서는 음의 억양과 장단변환을 위한 알고리즘을 제안하였으며, 이를 아카펠라음의 합성에 응용하였으며, 이러한 알고리즘은 자동음성서비스나 예약시스템 등을 적은 데이터베이스로 다양하게 합성할 수있음을 보였다.

  • PDF

Physical 모델을 이용한 단소 음 합성 (Synthesizing the ′Dan-So′ sound using the Physical Model)

  • 성덕현;김규년
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.658-660
    • /
    • 2001
  • 본 논문에서는 Physical Model을 이용해 단소의 음을 합성해 내는 방법에 대해서 연구하였다. 이러한 모델을 이용한다면 별도의 음원 데이터를 사용하지 않고도 일반적으로 사용되고 있는 Table-lookup방식보다 더 효율적으로 악기 음을 합성 할 수가 있다. 먼저 파동방정식을 이용하여 단소내부 공기의 움직임을 나타내고 Physical Model을 제시하였다. Physical Model을 구현하기 위해서 두 개의 delay line이 사용되었으며, 그 양쪽 끝에는 각각 파동의 reflectance를 모델링 하기 위해 Reflectance filter가, 입력 신호를 모델링 하기 위한 input function이 사용되었다. 합성된 음을 평가 하기 위하여 실제 녹음된 음과 주파수 및 시간 도메인 상에서의 비교가 이루어 졌고 실제 악기와 유사한 음을 합성해 내었음을 확인 할 수 있었다.

  • PDF

켑스트럼 분석합성형 음성합성 시스템에서의 피치변경에 따른 스펙트럼 포락 왜곡 현상에 관한 연구 (Distortion of Spectrum Envelope with Change of Pitch Period in the Cepstrum Analysis-synthesis System)

  • 김연준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.54-57
    • /
    • 1992
  • 음성합성에 있어서 음의 자연성을 합성시키는 문제는 크게 두가지로 나누어진다. 첫째는 합성음을 원음에 가깝게 구현하려는 합성방법 자체의 문제로, 언어 합성이 가지고 있는 일반적인 문제이다. 또 다른 문제는 운율에 관한 것으로 낱말 또는 문장 내에서의 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율의 조절에는 지속시간, 피치, 그리고 음의 세기 등이 이용된다. 켑스트럼을 이용하여 분석합성을 하는 경우, pole-zero 모델로 스펙트럼 포락을 근사하므로 원음에 충실하고, 필터계수와 구동정보를 분리하여 분석, 합성하므로 인위적인 운율의 조절이 용이하여 음성합성이 가지는 위의 두가지 문제를 해결하는데 적합하다고 판단된다. 본 연구에서는 켑스트럼을 이용하여 분석합성 시스템을 구성하였다. 음성 합성 과정에서, 운율 조절 파라미터중의 하나인 피치 주기의 변경에 따라 스펙트럼 포락의 왜곡에 대해 살펴보고, 왜곡을 최소화하는 방안을 제안한다.

  • PDF

FM 방식을 이용한 가야금 음의 합성에 관한 연구 (A Study of Synthesizing the Sound of Gayageum with FM Algorithm)

  • 김재용;권민도;장호근;우종식;박주성
    • 한국음향학회지
    • /
    • 제16권3호
    • /
    • pp.5-12
    • /
    • 1997
  • 본 논문에서는 가야금 음의 분석결과를 바탕으로 가야금 음의 합성에 적합한 3 오퍼레이터 FM 합성방식을 고안하였다. 고안된 알고리즘에 사용될 파라메터를 MATLAB을 이용하여 추출하여 C언어를 이용하여 음을 합성하였다. 합성된 음을 주관적인 방법과 객관적인 방법으로 비교한 결과 두 음이 아주 흡사함을 확인했다. 제안된 합성방식을 DSP를 이용하여 구현하여 만든 합성음도 원음과 비슷한 음질을 가지는 것을 확인했다.

  • PDF

한국어 음성 합성을 위한 VCV연쇄음 분석에 관한 연구 (VCV Chain Analysis for Korean Speech Synthesis)

  • 김승주;오영환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.173-184
    • /
    • 1992
  • 본 논문에서는 일반적인 음성 합성 시스템과 모음-자음-모음(VCV) 연쇄음을 단위로 한 규칙 합성에 대해 고찰하고, 한국어의 음성 합성을 위한 VCV 연쇄음의 종류와 각 연쇄음의 빈도 및 사용예를 조사하기 위하여 약11만 단어의 어휘 목록과 3만 6천행 가량의 한글 문서를 분석, 연구한 결과를 기술하였다. 본 연구의 결과, 한국어의 음성 합성에는 약 2500여 증류의 VCV 연쇄음이 필요함을 확인하였다.

  • PDF

FM 합성방식을 이용한 악기음 합성용 DSP 설계 (Design of the DSP for the FM Sound Synthesis)

  • 권민도;장호근;김재용;박주성;김형순;윤병우;백광렬;임창헌
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.63-73
    • /
    • 1995
  • 주파수 변조(FM)의 원리를 이용하여 악기음을 합성하면, 주파수, 진폭, 변조계수 등의 파라메터들을 적절히 선택하므로써 기존의 음향 악기음과 비슷한 음을 만들 수 있다. 본 논문에서는 기존의 2 캐리어 FM 합성방식 을 하드웨어적으로 구현이 용이하게 하기 위하여 합성 파라메터 수를 제한 했다. 조작된 알고리듬을 이용하여 16개 악기음을 합성할 수 있는 DSP(Digital Signal Processor)를 $0.8{\mu}m$의 CMOS 표준 셀을 이용하여 설계하였다. 설계된 DSP가 정상적으로 악기음을 합성하는 가를 확인하기 위하여 ASIC 에뮬레이터를 이용하여 2개의 음을 동시에 합성할 수 있는 DSP를 하드웨어적으로 구현하였다. 구현된 DSP로부터 합성된 음과 실제 악기음을 주관적인 평가와 객관적인 평가를 통하여 비교한 결과 두 음이 아주 근사함을 알았다. 최종적으로 VLSI 설계툴을 이용하여 설계된 DSP를 배치 배선한 후 시간 시뮬레이션한 결과 16개 악기음을 동시에 합성할 수 있음을 확인 했다.

  • PDF

음절 유형별 규칙합성음 음질평가 (The Evaluation of Speech Quality Synthesized by Rule According to Korean Syllable Types)

  • 강찬희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.93-97
    • /
    • 1993
  • 본 논문은 한국어 문어변환(TTS:Text-to-Speech) 시스템내에서의 음성합성시 음질 및 자연성 개선을 위한 연구 결과이다. 합성음 평가방법으로는 한국어 발음대사전에 수록된 빈도수 순위대로 추출한 음절(V형: 19개, CV형:80개, VC형:30개, CVC형: 100개, 총 229개)을 대상으로 규칙합성시킨 1음절어(합성음절수:229개)중 음절유형별로 15개씩 총 60개 음절을 20초간 3회 반복음의 녹음 테이프를 작성한 합성음에 대하여 사전지식이 없는 임의의 그룹을 선정하여 이해도, 명료도, 잡음감, 자연성 등 4 가지 항목에 대하여 오피니온 평가를 수행한 결과를 제시하였다.

  • PDF

한국어 운율 발생용 인공신경망의 구조 및 학습에 관한 연구 (A Study on the Architecture and Learning of the Artificial Neural Networks for Prosody Generation of Korean Sentence)

  • 민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.135-138
    • /
    • 2004
  • 음성처리기술은 정보화 시대를 위한 주요 기술의 하나이다. 이 중에서도 음성합성의 연구는 디지털 신호처리 기술과 컴퓨터의 발달로 활발히 진행되고 있다. 그러나 음성 합성기에 의해 발생된 합성음의 음질은 이해도 면에서는 상당한 진전이 있었지만, 자연감 면에서는 만족한 수준에 도달할 수 없었는데, 이러한 합성시스템의 문제점을 해결하는 방법은 다양하게 적용되는 언어정보와 합성음의 자연감을 결정하는 정확한 운율정보가 필요하다. 그러나 구한 운율 정보가 자연음에 존재하는 모든 운율 법칙을 포함할 수 없고, 또한 추출한 운율 법칙이 틀린 것이면 자연감이나 이해도가 떨어지는 합성음이 만들어지고 이것은 음성 합성 시스템의 실용화에 장애로 작용할 것이다. 본 논문은 한국어 음성 합성 시 문제가 되는 자연감을 높이기 위한 한 방법으로 자연음에 내재하는 운율 변화를 효율적으로 학습할 수 있는 인공 신경망을 제안하였다.

  • PDF

오디오 압축 방식을 적용한 사운드 합성 시스템의 설계 (Design of Sound Synthesis System using Audio Compression Method)

  • 장호근;김태훈;곽종태;박주성
    • 한국음향학회지
    • /
    • 제17권3호
    • /
    • pp.27-36
    • /
    • 1998
  • 현재 상용화된 사운드 합성 기기에서 널리 쓰이고 있는 PCM 방식에서의 문제점은 고음질의 음을 얻기 위해서 많은 메모리 용량을 필요로 하는 것이다. 이 논문에서는 이 문 제를 해결하기 위해 MPEG 오디오 압축 방식을 적용하여 샘플된 음을 압축하고, 실시간으 로 이를 복호화 해서 음을 합성해내는 사운드 합성 시스템을 설계하였다. 사운드 합성 시스 템은 마이크로프로세서, 음원 DSP, MPEG 오디오 복호화기로 구성되며, 44.1Khz의 샘플링 주파수로 32개의 음을 동시에 합성할 수 있도록 설계되었다. 설계 과정에서 각각의 기능 요 소를 C언어로 기술하여 사운드 합성 시스템에 대한 소프트웨어 모델을 작성하였다. 이것을 통해 미리 전체 시스템의 동작을 시뮬레이션하고, 압축 방식을 적용함으로써 발생될 수 있 는 여러 가지 문제점에 대한 해결 방안을 제시하였다. 시뮬레이터로 시스템의 동작을 검증 한 후, DSP와 MPEG 복호화기를 포함하는 사운드 합성 시스템을 VHDL로 설계하여 시뮬 레이션을 통해 하드웨어가 정상적으로 동작함을 확인하였다. MPEG 오디오 압축 방식을 이 용함으로써 메모리 용량 측면에서는 약8:1의 감소 효과를 얻을 수 있다.

  • PDF

HMM 기반 TTS와 MusicXML을 이용한 노래음 합성 (Singing Voice Synthesis Using HMM Based TTS and MusicXML)

  • 칸 나지브 울라;이정철
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.53-63
    • /
    • 2015
  • 노래음 합성이란 주어진 가사와 악보를 이용하여 컴퓨터에서 노래음을 생성하는 것이다. 텍스트/음성 변환기에 널리 사용된 HMM 기반 음성합성기는 최근 노래음 합성에도 적용되고 있다. 그러나 기존의 구현방법에는 대용량의 노래음 데이터베이스 수집과 학습이 필요하여 구현에 어려움이 있다. 또한 기존의 상용 노래음 합성시스템은 피아노 롤 방식의 악보 표현방식을 사용하고 있어 일반인에게는 익숙하지 않으므로 읽기 쉬운 표준 악보형식의 사용자 인터페이스를 지원하여 노래 학습의 편의성을 향상시킬 필요가 있다. 이 문제를 해결하기 위하여 본 논문에서는 기존 낭독형 음성합성기의 HMM 모델을 이용하고 노래음에 적합한 피치값과 지속시간 제어방법을 적용하여 HMM 모델 파라미터 값을 변화시킴으로서 노래음을 생성하는 방법을 제안한다. 그리고 음표와 가사를 입력하기 위한 MusicXML 기반의 악보편집기를 전단으로, HMM 기반의 텍스트/음성 변환 합성기를 합성기 후단으로서 사용하여 노래음 합성시스템을 구현하는 방법을 제안한다. 본 논문에서 제안하는 방법을 이용하여 합성된 노래음을 평가하였으며 평가결과 활용 가능성을 확인하였다.