DOI QR코드

DOI QR Code

Common ASR Interface format for increasing usability of cloud-based ASR services.

클라우드 기반 음성인식 서비스 활용도 향상을 위한 음성인식 공통 인터페이스 표준 포맷

  • Published : 2022.11.21

Abstract

음성인식은 컴퓨터가 사람의 언어를 이해하여, 소리로 발화하는 사람의 음성을 인식하여 텍스트로 바꾸는 과정을 의미하며, 최근 활용도가 높아지고 있다. 음성인식 엔진은 얼마나 많은 학습데이터를 기반으로 훈련을 했느냐에 따라서 그 성능이 결정되기 때문에, 자신의 서비스 에 맞는 음성인식 엔진을 적절히 선택할 수 있어야 한다. 음성인식 엔진의 성능이 수시로 변경될 수 있기 때문에 표준 인터페이스를 빠른 개발을 진행할 수 있도록 표준 포맷을 제안하였다.

Keywords

Acknowledgement

본 연구는 정보통신산업진홍원에서 주관하는 2022년 공개 SW 기업성장 지원사업(과제번호:R-20220404-014616)의 지원으로 수행되었습니다.