Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
- 2020.11a
- /
- Pages.364-367
- /
- 2020
Development of Korean Audio Caption System
한국어 오디오 캡션 시스템 개발
- Kang, Taeho (Sogang University) ;
- Kim, Juhee (Sogang University) ;
- Lee, Joonha (Sogang University)
- Published : 2020.11.28
Abstract
오디오 캡셔닝(Audio Captioning)은 시스템이 입력으로 오디오 신호를 받아들이고 해당 신호의 텍스트 설명을 출력하는 중간 번역 작업이다. 이 논문에서는 컨볼루셔널 뉴럴 네트워크(CNN), 트랜스포머의 딥러닝 알고리즘을 사용하여 주변 환경 소리에 대한 오디오 캡셔닝을 자동으로 수행하고 한글화된 출력 결과를 제공하는 모델을 제시한다. 본 연구 결과, 모델의 성능 평가 척도인 SPIDEr 점수는 0.1977이 나왔다.
Keywords