DOI QR코드

DOI QR Code

심층 신경망을 활용한 손상된 음성파일 복원 자동화

Restoration of damaged speech files using deep neural networks

  • 허희수 (서울시립대학교 컴퓨터과학부) ;
  • 소병민 (대검찰청) ;
  • 양일호 (서울시립대학교 컴퓨터과학부) ;
  • 윤성현 (서울시립대학교 컴퓨터과학부) ;
  • 유하진 (서울시립대학교 컴퓨터과학부)
  • 투고 : 2016.12.08
  • 심사 : 2017.03.29
  • 발행 : 2017.03.31

초록

본 논문에서는 심층 신경망을 이용하여 손상된 음성파일을 복원하는 방법을 제안한다. 본 논문에서 다루는 음성파일 복원은 기존의 파일 카빙(file carving) 기반의 복원과는 다른 개념으로, 기존 기법으로는 복원할 수 없었던 손실된 정보를 복원하는 것이 목적이다. 새로운 복원 기법을 수행하는 과정에서 필요한 작업이지만 사람이 직접 수행할 수 없거나 너무 많은 시간이 소요되는 작업을 심층 신경망을 활용해 자동화할 수 있는 방안을 제안하였으며 관련한 실험을 진행하였다. 실험 결과, 심층 신경망을 활용해 음성, 비음성 분류나 음성파일 부호화 방식의 식별이 가능해 기존 파일 카빙 기반 방법이 복원하지 못하는 파일을 복원할 수 있었다.

In this paper, we propose a method for restoring damaged audio files using deep neural network. It is different from the conventional file carving based restoration. The purpose of our method is to infer lost information which can not be restored by existing techniques such as the file carving. We have devised methods that can automate the tasks which are essential for the restoring but are inappropriate for humans. As a result of this study it has been shown that it is possible to restore the damaged files, which the conventional file carving method could not, by using tasks such as speech or nonspeech decision and speech encoder recognizer using a deep neural network.

키워드

참고문헌

  1. P. Rainer, S. Tjoa, and P. Tavolato, "Advanced file carving approaches for multimedia files," JoWUA 2, 42-58, (2011).
  2. G. Alex, A. Mohamed, and G. E. Hinton, "Speech recognition with deep recurrent neural networks," ICASSP, 6645-6649, (2013).
  3. H. Sepp and J. Schmidhuber, "Long short-term memory," Neural computation. 9, 1735-1780, (1997). https://doi.org/10.1162/neco.1997.9.8.1735
  4. Theano: new features and speed improvements, https://arxiv.org/abs/1211.5590, 2012.
  5. J. Bergstra, O. Breuleux, F. Bastien, P. Lamblin, R. Pascanu, G. Desjardins, J. Turian, D. Warde-Farley, and Y. Bengio, "Theano: a cpu and gpu math expression compiler," in Proc. Python for Scientific Computing Conference, 3-10, (2010).
  6. V. Nair and G. E. Hinton, "Rectified linear units improve restricted boltzmann machines," ICML, 807-814, (2010).