Automatic sentence segmentation of subtitles generated by STT

STT로 생성된 자막의 자동 문장 분할

  • 김기현 (한림대학교 소프트웨어융합대학) ;
  • 김홍기 (한림대학교 소프트웨어융합대학) ;
  • 오병두 (한림대학교 융합소프트웨어학과) ;
  • 김유섭 (한림대학교 소프트웨어융합대학)
  • Published : 2018.10.12

Abstract

순환 신경망(RNN) 기반의 Long Short-Term Memory(LSTM)는 자연어처리 분야에서 우수한 성능을 보이는 모델이다. 음성을 문자로 변환해주는 Speech to Text (STT)를 이용해 자막을 생성하고, 생성된 자막을 다른 언어로 동시에 번역을 해주는 서비스가 활발히 진행되고 있다. STT를 사용하여 자막을 추출하는 경우에는 마침표가 없이 전부 연결된 문장이 생성되기 때문에 정확한 번역이 불가능하다. 본 논문에서는 영어자막의 자동 번역 시, 정확도를 높이기 위해 텍스트를 문장으로 분할하여 마침표를 생성해주는 방법을 제안한다. 이 때, LSTM을 이용하여 데이터를 학습시킨 후 테스트한 결과 62.3%의 정확도로 마침표의 위치를 예측했다.

Keywords