Development of Korean Audio Caption System

Kang, Taeho;Kim, Juhee;Lee, Joonha;

한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference)

한국방송∙미디어공학회 (The Korean Institute of Broadcast and Media Engineers)

한국어 오디오 캡션 시스템 개발

Development of Korean Audio Caption System

강태호 (서강대학교) ;
김주희 (서강대학교) ;
이준하 (서강대학교)

Kang, Taeho (Sogang University) ;
Kim, Juhee (Sogang University) ;
Lee, Joonha (Sogang University)

발행 : 2020.11.28

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

오디오 캡셔닝(Audio Captioning)은 시스템이 입력으로 오디오 신호를 받아들이고 해당 신호의 텍스트 설명을 출력하는 중간 번역 작업이다. 이 논문에서는 컨볼루셔널 뉴럴 네트워크(CNN), 트랜스포머의 딥러닝 알고리즘을 사용하여 주변 환경 소리에 대한 오디오 캡셔닝을 자동으로 수행하고 한글화된 출력 결과를 제공하는 모델을 제시한다. 본 연구 결과, 모델의 성능 평가 척도인 SPIDEr 점수는 0.1977이 나왔다.

한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference)

한국어 오디오 캡션 시스템 개발

Development of Korean Audio Caption System

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)