• Title/Summary/Keyword: 음성 변화

Search Result 1,371, Processing Time 0.032 seconds

음성 합성과 동작 인식 기술을 활용한 CLOVA Dubbing과 Avatar 서비스

  • 배순민
    • 방송과미디어
    • /
    • 제26권1호
    • /
    • pp.31-37
    • /
    • 2021
  • 코로나로 인해 사회는 급속한 변화를 겪고 있고, 그 변화의 중심에는 온라인 플랫폼 기업과 서비스가 있다. AI 기술의 발전 속도는 여전히 가속되고 있고, 특히 음성 합성과 실시간 동작 인식, 아바타 생성 기술은 콘텐츠 생성 및 비대면 서비스에서 그 활용이 더욱 기대된다.

감정표현 음성합성 시스템을 위한 감정 분석 (An Analysis on the Emotional Speech for the Speech Synthesis System with Emotion)

  • 천희진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.350-355
    • /
    • 1998
  • 감정을 표현하는 음성 합성 시스템을 구현하기 위해서는 감정음성에 대한 분석이 필요하다. 본 논문에선,s 평상, 화남, 기쁨, 슬픔의 네 가지 감정에 대한 음성 데이터에 대해 음절 세그먼트, 라벨링을 행한 감정 음성 데이터베이스를 구축하였고, 감정표현이 음성에 영향을 미치는 요인에대하여, 운율, 음운적인 요소로 나누어 분석하였다. 또한 기본 주파수, 에너지, 음절지속시간에 대한 분석과 감정 음성의기본 주파수, 에너지, 음절지속시간, 스펙트럼 포락의 인지 정도를 측정하기 위하여 평상 음성에 감정 음성의 운율 요소를 적용하는 음성을 합성하여 ABX 방법으로 평가하였다. 그 결과, 기본 주파수의변화가 73.3%, 음절지속시간은 43.3% 로 올바른 감정으로 인지되었으며, 특히 슬픈 감정에서 음절지속시간은 76.6%가 올바르게 감정을 나타내는 것으로 인지되었다.

  • PDF

수영장에서 염소 가스에 노출된 후 발생한 음성장애 4예 (Four Cases of Dysphonia due to Acute Exposure to Chlorine by a Swimming Pool Accident)

  • 김지연;고영민;김정연;정성민
    • 대한후두음성언어의학회지
    • /
    • 제14권2호
    • /
    • pp.129-132
    • /
    • 2003
  • Chlorine gas is highly irritating gas that, when inhaled, can damage larger airways as well as distal lung structure. It occurs usually result in mild ocular, oropharyngeal, or respiratory symptom and recovery may proceed slow for several weeks. We reported four cases of dysphonia due to acute chlorine inhalation during a swimming pool accident were treated by voice therapy and medication.

  • PDF

구어체 정서표현에 있어서의 음성 특성 연구 (A study on the vocal characteristics of spoken emotional expressions)

  • 이수정;김명재;김정수
    • 감성과학
    • /
    • 제2권2호
    • /
    • pp.53-66
    • /
    • 1999
  • 현 연구에서는 음성합성의 기초자료 수집을 위하여 대화체 감정표현의 음성적인 패러미터를 찾아내려고 시도하였다. 이를 이하여 일단 가장 자주 사용되는 대화체 감정표현자료가 수집되었고 이들 표현을 발화할 때 가장 주의를 기울이는 발성의 특징들이 탐색되었다. 구어체적 감정표현의 타당한 데이터베이스를 작성하기 위하여 20대와 30대로 연령층을 구분하여 자료를 수집, 분석하였다. 그 결과 다양한 감정표현의 발화특성들은 음의 강도, 강도변화, 그리고 음색이 중요한 기준으로 작용하는 것으로 나타났다. 다차원분석 결과 산출된 20대와 30대의 음성표현이 도면은 개별정서들이 음성의 잠재차원 상에서 상당한 일관된 특징을 지님을 보여 주었다.

  • PDF

웨이브렛 변환을 이용한 피치검출 (Pitch Detection Using Wavelet Transform)

  • 손영호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1997년도 영남지회 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.5-8
    • /
    • 1997
  • 음성신호는 성대를 통과한 공기 흐름의 성질에 따라 유성음과 무성음으로 구분될 수 있다. 그 중 유성음에서는 성대의 규칙적인 지동이 존재하게 된는 데 이때 성대가 닫히는 순간을 GCI(Glotal Closure Instant)라 하며 성대 진동의 기본주기를 피치라고 한다. 이러한 피치는 음성합성, 음성인식, 피치동기 음성신호의 분석등에 중요한 파라미터 중의 하나이다. 본 논문에서는 가우시안 함수의 일차미분형태를 갖는 웨이브렛 함수를 사용할 경우 신호의 급격한 변화부분을 검출할 수 있다는 성질을 이용하여 음성 신호의 GCI를 찾아내고 이를 이용하여 피치를 검출하였다.

  • PDF

인공성대를 이용한 성대 진동의 모의 실험 (Simulation of Vocal Fold Vibation with Artificial Larynx)

  • 황병길
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1994년도 제2회 학술대회 연제순서 및 초록집
    • /
    • pp.82-82
    • /
    • 1994
  • 다양한 성대의 진동 형태와 조절 작용을 연구하기 위해서 실시간에서 움직이는 인공성대를 만들어 모델의 타당성을 검토하고 이를 이용하여 생리적 음성과 병적인 음성의 기전을 밝히는 것이 본 연구의 목적이다. 지금까지 연구되어온 정적 모델이나 후두절개 표본의 단점과 한계를 극복할 수 있는 모델을 제작하기 위해 고려해야 할 점은 모델을 이용한 성대 진동 파형의 수평적 수직적 요소의 관찰이 용이해야 하고 성대진동의 기본 요소들 즉 성대의 긴장도, 성문간격, 성문하압 등의 변화에 따른 음성 발현 양상의 차이를 쉽게 보여줄 수 있는 지에 관한 것이다. (중략)

  • PDF