DOI QR코드

DOI QR Code

A performance evaluation study of a deep learning-based voice synthesis technique using Mel-Conceptual Distortion (MCD).

멜-셉스트럴 왜곡(MCD)를 활용한 딥러닝 기반 목소리 합성 기술의 성능 평가 연구

  • Jaesang Han (School of Software, Soongsil University) ;
  • Yunseo Kang (School of Software, Soongsil University) ;
  • Sangwoo Na (School of Software, Soongsil University) ;
  • Hayeon Lee (School of Software, Soongsil University)
  • 한재상 (숭실대학교 소프트웨어학부) ;
  • 이하연 (숭실대학교 소프트웨어학부) ;
  • 강윤서 (숭실대학교 소프트웨어학부) ;
  • 나상우 (숭실대학교 소프트웨어학부)
  • Published : 2023.05.18

Abstract

노래 음성 변환(Singing Voice Conversion, SVC)은 오디오 처리 분야에서 최근 활발히 연구되는 분야 중 하나로, 원래의 멜로디와 가사를 유지하면서 소스 가수의 노래 음성을 대상 가수의 음성으로 변환하는 것을 목표로 한다. 본 논문에서는 딥러닝 기반 SVC 모델을 중심으로 멜 셉스트럴 왜곡 지표를 활용해 모델 간 성능 평가를 진행한다. 이를 통해 엔터테인먼트, 교육 등 분야에서 효율적인 SVC 모델을 찾아 활용할 수 있을 것이다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 SW중심대학사업의 연구결과로 수행되었음(2018-0-00209)