A performance evaluation study of a deep learning-based voice synthesis technique using Mel-Conceptual Distortion (MCD).

Jaesang Han;Yunseo Kang;Sangwoo Na;Hayeon Lee;

doi:10.3745/PKIPS.y2023m05a.488

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2023.05a
/
Pages.488-489
/
2023
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

A performance evaluation study of a deep learning-based voice synthesis technique using Mel-Conceptual Distortion (MCD).

멜-셉스트럴 왜곡(MCD)를 활용한 딥러닝 기반 목소리 합성 기술의 성능 평가 연구

Jaesang Han (School of Software, Soongsil University) ;
Yunseo Kang (School of Software, Soongsil University) ;
Sangwoo Na (School of Software, Soongsil University) ;
Hayeon Lee (School of Software, Soongsil University)

한재상 (숭실대학교 소프트웨어학부) ;
이하연 (숭실대학교 소프트웨어학부) ;
강윤서 (숭실대학교 소프트웨어학부) ;
나상우 (숭실대학교 소프트웨어학부)

Published : 2023.05.18

https://doi.org/10.3745/PKIPS.y2023m05a.488 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

노래 음성 변환(Singing Voice Conversion, SVC)은 오디오 처리 분야에서 최근 활발히 연구되는 분야 중 하나로, 원래의 멜로디와 가사를 유지하면서 소스 가수의 노래 음성을 대상 가수의 음성으로 변환하는 것을 목표로 한다. 본 논문에서는 딥러닝 기반 SVC 모델을 중심으로 멜 셉스트럴 왜곡 지표를 활용해 모델 간 성능 평가를 진행한다. 이를 통해 엔터테인먼트, 교육 등 분야에서 효율적인 SVC 모델을 찾아 활용할 수 있을 것이다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 SW중심대학사업의 연구결과로 수행되었음(2018-0-00209)

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

A performance evaluation study of a deep learning-based voice synthesis technique using Mel-Conceptual Distortion (MCD).

멜-셉스트럴 왜곡(MCD)를 활용한 딥러닝 기반 목소리 합성 기술의 성능 평가 연구

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)