Development of Korean Audio Caption System

Kang, Taeho;Kim, Juhee;Lee, Joonha;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2020.11a
/
Pages.364-367
/
2020

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Development of Korean Audio Caption System

한국어 오디오 캡션 시스템 개발

Kang, Taeho (Sogang University) ;
Kim, Juhee (Sogang University) ;
Lee, Joonha (Sogang University)

강태호 (서강대학교) ;
김주희 (서강대학교) ;
이준하 (서강대학교)

Published : 2020.11.28

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

오디오 캡셔닝(Audio Captioning)은 시스템이 입력으로 오디오 신호를 받아들이고 해당 신호의 텍스트 설명을 출력하는 중간 번역 작업이다. 이 논문에서는 컨볼루셔널 뉴럴 네트워크(CNN), 트랜스포머의 딥러닝 알고리즘을 사용하여 주변 환경 소리에 대한 오디오 캡셔닝을 자동으로 수행하고 한글화된 출력 결과를 제공하는 모델을 제시한다. 본 연구 결과, 모델의 성능 평가 척도인 SPIDEr 점수는 0.1977이 나왔다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Development of Korean Audio Caption System

한국어 오디오 캡션 시스템 개발

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)