Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2018.10a
- /
- Pages.673-676
- /
- 2018
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
Sound Enhancement with Generative Adversarial Network under Noise Conditions
잡음 환경에서 Generative Adversarial Network를 이용한 소리 음질 향상
- Choi, Yongju (Department of Computer and Information Science, Korea University) ;
- Lee, Jonguk (Department of Computer and Convergence Software, Korea University) ;
- Wang, Huasang (Department of Computer and Information Science, Korea University) ;
- Park, Daihee (Department of Computer and Convergence Software, Korea University) ;
- Chung, Yongwha (Department of Computer and Convergence Software, Korea University)
- 최용주 (고려대학교 컴퓨터정보학과) ;
- 이종욱 (고려대학교 컴퓨터융합소프트웨어학과) ;
- ;
- 박대희 (고려대학교 컴퓨터융합소프트웨어학과) ;
- 정용화 (고려대학교 컴퓨터융합소프트웨어학과)
- Published : 2018.10.31
Abstract
4차 산업혁명이 도래하면서 정보 통신 기술 및 융합 기술의 발전에 힘입어 소리 데이터를 이용한 연구가 활발하게 진행되고 있다. 소리 데이터를 이용한 학술적 프로토타입 연구들을 실제 환경에서 운용하기 위해서는 소리 취득 시 발생하는 다양한 잡음 환경에서도 원시 데이터(raw data)에 근접한 정보를 취득할 수 있는 시스템의 강인함이 보장되어야 한다. 본 논문에서는 SEGAN(Speech Enhancement Generative Adversarial Network) 모델을 활용하여, 전처리 및 후처리 과정이 필요 없이 원시 데이터를 대상으로 하는 end-to-end 방식의 소리 음질 향상 시스템을 제안한다. 제안하는 시스템은, 축산업 분야의 돼지 호흡기 질병 소리 데이터를 이용하여 실험하였으며, 여러 가지 잡음 상황(인위적인 잡음, 실제 환경 잡음)에서 소리 음질이 개선됨을 실험적으로 검증하였다.
Keywords