• 제목/요약/키워드: 가변 길이 발성

검색결과 3건 처리시간 0.015초

가변 길이 입력 발성에서의 화자 인증 성능 향상을 위한 통합된 수용 영역 다양화 기법 (Integrated receptive field diversification method for improving speaker verification performance for variable-length utterances)

  • 신현서;김주호;허정우;심혜진;유하진
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.319-325
    • /
    • 2022
  • 화자 인증 시스템에서 입력 발성 길이의 변화는 성능을 하락시킬 수 있는 대표적인 요인이다. 이러한 문제점을 개선하기 위해, 몇몇 연구에서는 시스템 내부의 특징 가공 과정을 여러가지 서로 다른 경로에서 수행하거나 서로 다른 수용 영역(Receptive Field)을 가진 합성곱 계층을 활용하여 다양한 화자 특징을 추출하였다. 이러한 연구에 착안하여, 본 연구에서는 가변 길이 입력 발성을 처리하기 위해 보다 다양한 수용 영역에서 화자 정보를 추출하고 이를 선택적으로 통합하는 통합된 수용 영역 다양화 기법을 제안한다. 제안한 통합 기법은 입력된 특징을 여러가지 서로 다른 경로에서 다른 수용 영역을 가진 합성곱 계층으로 가공하며, 가공된 특징을 입력 발성의 길이에 따라 동적으로 통합하여 화자 특징을 추출한다. 본 연구의 심층신경망은 VoxCeleb2 데이터세트로 학습되었으며, 가변 길이 입력 발성에 대한 성능을 확인하기 위해 VoxCeleb1 평가 데이터 세트를 1 s, 2 s, 5 s 길이로 자른 발성과 전체 길이 발성에 대해 각각 평가를 수행하였다. 실험 결과, 통합된 수용 영역 다양화 기법이 베이스라인 대비 동일 오류율을 평균적으로 19.7 % 감소시켜, 제안한 기법이 가변 길이 입력 발성에 의한 성능 저하를 개선할 수 있음을 확인하였다.

가변 템포를 고려한 자동 음악 채보 (Automatic Music Transcription Considering Time-Varying Tempo)

  • 주영호;바니야 바부카지;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제12권11호
    • /
    • pp.9-19
    • /
    • 2012
  • 시간에 따라 변화하는 노래의 템포는 자동 음악 채보의 음길이 부호화에 있어 오류를 발생시키는 원인중 하나이다. 본 논문에서는 변화하는 템포를 반영하여 음길이 부호화를 수행하는 개선된 자동 음악 채보방법을 제안하였다. 제안된 방법에서는 단음 노래에서 휴지기를 이용하여 마디를 찾고, 마디의 연주시간, 즉 템포를 추정하였다. 추정된 템포는 발성된 개별 음길이를 조정하는데 활용하여 음길이 인식에 반영하였으며, 악보와의 일치도를 증가시켰다. 남성 및 여성이 단음으로 부른 16곡의 동요에 대한 실험결과 14 곡에서 정확하게 마디위치를 찾을 수 있었으며, 음길이는 약 89.4%, 음정은 약 84.8%의 원본 악보와의 일치도를 달성하였다.

가변프레임 길이정규화를 이용한 단어음성인식 (Isolated-Word Speech Recognition using Variable-Frame Length Normalization)

  • 신찬후;이희정;박병철
    • 한국음향학회지
    • /
    • 제6권4호
    • /
    • pp.21-30
    • /
    • 1987
  • 단어음성인식에서 발성속도의 차이에 따른 단어음성 길이의 비선형적 변화는 정확한 인식을 어렵게 하는 주요한 원인이 되어 왔다. DP매칭은 시간축의 비선형 신축에 의해 시간정규화를 행함으로써 인식결과에 대한 신뢰성을 상당히 높였으나 시간정규화 파정에 요구되는 과도한 계산부담이 문제로 되어 있다. 본 논문에서는 시간정규화가 필요없는 방법으로 멀티섹션벡터양자화에 새로운 길이정규화법을 적용하는 방법을 제안한다. 이 방법은 종래의 고정프레임 길이정규화에 의해 멀티섹션코드북을 작성할 때보다. 정규화길이의 실정에 훨씬 융통성을 가질 수 있으므로 분석 및 거리계산의 양면에서 시간 단축을 가능케 하여 좀더 신속히 인식결과를 얻을 수 있는 장점이 있다

  • PDF