• 제목/요약/키워드: Speaker Adaptation

검색결과 122건 처리시간 0.016초

제한된 학습 데이터를 사용하는 End-to-End 음성 인식 모델 (End-to-end speech recognition models using limited training data)

  • 김준우;정호영
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.63-71
    • /
    • 2020
  • 음성 인식은 딥러닝 및 머신러닝 분야에서 활발히 상용화 되고 있는 분야 중 하나이다. 그러나, 현재 개발되고 있는 음성 인식 시스템은 대부분 성인 남녀를 대상으로 인식이 잘 되는 실정이다. 이것은 음성 인식 모델이 대부분 성인 남녀 음성 데이터베이스를 학습하여 구축된 모델이기 때문이다. 따라서, 노인, 어린이 및 사투리를 갖는 화자의 음성을 인식하는데 문제를 일으키는 경향이 있다. 노인과 어린이의 음성을 잘 인식하기 위해서는 빅데이터를 구축하는 방법과 성인 대상 음성 인식 엔진을 노인 및 어린이 데이터로 적응하는 방법 등이 있을 수 있지만, 본 논문에서는 음향적 데이터 증강에 기반한 재귀적 인코더와 언어적 예측이 가능한 transformer 디코더로 구성된 새로운 end-to-end 모델을 제안한다. 제한된 데이터셋으로 구성된 한국어 노인 및 어린이 음성 인식을 통해 제안된 방법의 성능을 평가한다.

결혼이주여성의 경제생활 의미에 관한 현상학적 연구 (A Phenomenological Study on the Meaning of Economic Life of Marriage Immigrant Women)

  • 이형하
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.149-157
    • /
    • 2013
  • 본 연구에서는 질적 연구방법 중 현상학적 연구방법으로 결혼이주여성들의 경제생활에 대한 생생한 이야기에 귀기울이고, 경제생활 경험의 역동성을 심층적인 면담을 통해 그 의미를 분석하고자 한다. 연구질문은 "결혼이주여성이 경험하는 경제생활의 의미는 무엇인가"이다. 연구결과, 의미 있는 진술 67개를 추출하였고, 15개의 중심 의미를 조직하였다. 15개의 중심 의미는 '팍팍한 삶', '자녀교육비, 보험료 등의 소득 불안', '적응을 위한 생활방식의 변화 도모', '일자리를 통한 경제안정을 추구', '친정가족에 대한 지원과 회귀 기대'라는 5개의 주제 묶음으로 범주화하였다. 연구자는 해석학적 글쓰기 적용을 위해 1인칭 화자를 통해 구조적 기술을 하였다. 즉, 결혼이주여성이 체험한 한국의 경제생활의 의미는 '팍팍한 현실을 적응해 나가기 위한 생활방식의 변화를 추구하며 가족중심의 힘겨운 대처과정' 이었다. 이러한 진술을 통해 결혼이주여성 부부의 안정적인 노후경제생활을 위해 국민연금의 (가칭)'부부합산' 제도의 적용으로 노령연금의 수급의 기회를 확대하는 정책의 적극 도입 등 다양한 실천적 함의를 제시하였다.