• 제목/요약/키워드: Cross-Entropy

검색결과 113건 처리시간 0.02초

단일 레이블 분류를 이용한 종단 간 화자 분할 시스템 성능 향상에 관한 연구 (A study on end-to-end speaker diarization system using single-label classification)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.536-543
    • /
    • 2023
  • 다수의 화자가 존재하는 음성에서 "누가 언제 발화했는가?"에 대해 레이블링하는 화자 분할은 발화 중첩 구간에 대한 레이블링과 화자 분할 모델의 최적화를 위해 심층 신경망 기반의 종단 간 방법에 대해 연구되었다. 대부분 심층 신경망 기반의 종단 간 화자 분할 시스템은 음성의 각 프레임에서 발화한 모든 화자의 레이블들을 추정하는 다중 레이블 분류 문제로 분할을 수행한다. 다중 레이블 기반의 화자 분할 시스템은 임계값을 어떤 값으로 설정하는지에 따라 모델의 성능이 많이 달라진다. 본 논문에서는 임계값 없이 화자 분할을 수행할 수 있도록 단일 레이블 분류를 이용한 화자 분할 시스템에 대해 연구하였다. 제안하는 화자 분할 시스템은 기존의 화자 레이블을 단일 레이블 형태로 변환하여 모델의 출력으로부터 레이블을 바로 추정한다. 훈련에서는 화자 레이블 순열을 고려하기 위해 Permutation Invariant Training(PIT) 손실함수와 교차 엔트로피 손실함수를 조합하여 사용하였다. 또한 심층 구조를 갖는 모델의 효과적인 학습을 위해 화자 분할 모델에 잔차 연결 구조를 추가하였다. 실험은 Librispeech 데이터베이스를 이용해 화자 2명에 대한 시뮬레이션 잡음 데이터를 생성하여 사용하였다. Diarization Error Rate(DER) 성능 평가 지수를 이용해 제안한 방법과 베이스라인 모델을 비교 평가했을 때, 제안한 방법이 임계값 없이 분할이 가능하며, 약 20.7 %만큼 향상된 성능을 보였다.

뉴트리아(Myocastor coypus) 분포밀도 및 잠재적 서식가능지역 예측에 따른 관리방향 (A Management Plan According to the Estimation of Nutria (Myocastorcoypus) Distribution Density and Potential Suitable Habitat)

  • 김아름;김영채;이도훈
    • 환경영향평가
    • /
    • 제27권2호
    • /
    • pp.203-214
    • /
    • 2018
  • 본 연구는 국내에 서식하는 뉴트리아의 집중분포지역과 잠재적인 서식가능지역을 예측하여 효과적인 관리방향 설정에 유용한 자료를 제공하고자 하였다. 뉴트리아의 전국 분포 자료를 토대로 CVh(가능도 교차타당성)값을 띠폭(bandwidth)에 적용하여 분포밀도를 분석한 결과, 부산광역시, 대구광역시, 경상남도 소재 11개 시 군, 경상북도 소재 1개 군 등 낙동강수계에 위치한 14개 행정구역 내에서 우선적인 제거가 필요한 집중분포지역이 확인되었다. MaxEnt 모델을 이용한 잠재적인 서식가능지역 예측에서는 낙동강 중 하류 일대와 섬진강 하류, 가화천 일대에서 출현 가능성이 나타났다. 모형의 변수별 기여도는 고도, 건조한 달의 강수량, 가장 추운달의 최저온도, 수계로부터의 거리 순으로 높은 기여도를 보였으며, 출현확률과의 관계를 살펴보면, 고도 34m 이하의 저지대, 가장 추운달의 최저온도가 $-5.7^{\circ}C$이상 $-0.6^{\circ}C$ 이하인 지역, 가장 건조한 달의 강수량이 15-30mm, 수계로부터 1,373m 이하인 지역에서 임계값보다 높은 출현확률을 보였다. 뉴트리아의 생태적 특성과 본 연구결과를 종합하면, 고도, 물과의 접근성 및 이용성, 겨울철 낮은 기온이 뉴트리아의 정착과 확산에 영향을 주는 주요 요인으로 판단되므로 향후 서식가능지역의 검출과 확산 예측 모델링에 있어 중요한 변수로 검토될 수 있다. 뉴트리아와 같은 침입외래생물의 집중분포지역과 관리대상지역을 구분하고 그에 적합한 관리전략을 수립하여 관리현장에 적용하는 것은 영구적인 제어 목적의 관리에 있어 필수적인 사항이다. 본 연구에서 제시된 결과는 우선관리대상지역의 신속한 관리와 확산가능지역에 대한 사전 예방적 관리 등 전략적인 관리의 실행에 있어 유용한 자료로 활용될 수 있다.

스마트폰 다종 데이터를 활용한 딥러닝 기반의 사용자 동행 상태 인식 (A Deep Learning Based Approach to Recognizing Accompanying Status of Smartphone Users Using Multimodal Data)

  • 김길호;최상우;채문정;박희웅;이재홍;박종헌
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.163-177
    • /
    • 2019
  • 스마트폰이 널리 보급되고 현대인들의 생활 속에 깊이 자리 잡으면서, 스마트폰에서 수집된 다종 데이터를 바탕으로 사용자 개인의 행동을 인식하고자 하는 연구가 활발히 진행되고 있다. 그러나 타인과의 상호작용 행동 인식에 대한 연구는 아직까지 상대적으로 미진하였다. 기존 상호작용 행동 인식 연구에서는 오디오, 블루투스, 와이파이 등의 데이터를 사용하였으나, 이들은 사용자 사생활 침해 가능성이 높으며 단시간 내에 충분한 양의 데이터를 수집하기 어렵다는 한계가 있다. 반면 가속도, 자기장, 자이로스코프 등의 물리 센서의 경우 사생활 침해 가능성이 낮으며 단시간 내에 충분한 양의 데이터를 수집할 수 있다. 본 연구에서는 이러한 점에 주목하여, 스마트폰 상의 다종 물리 센서 데이터만을 활용, 딥러닝 모델에 기반을 둔 사용자의 동행 상태 인식 방법론을 제안한다. 사용자의 동행 여부 및 대화 여부를 분류하는 동행 상태 분류 모델은 컨볼루션 신경망과 장단기 기억 순환 신경망이 혼합된 구조를 지닌다. 먼저 스마트폰의 다종 물리 센서에서 수집한 데이터에 존재하는 타임 스태프의 차이를 상쇄하고, 정규화를 수행하여 시간에 따른 시퀀스 데이터 형태로 변환함으로써 동행 상태분류 모델의 입력 데이터를 생성한다. 이는 컨볼루션 신경망에 입력되며, 데이터의 시간적 국부 의존성이 반영된 요인 지도를 출력한다. 장단기 기억 순환 신경망은 요인 지도를 입력받아 시간에 따른 순차적 연관 관계를 학습하며, 동행 상태 분류를 위한 요인을 추출하고 소프트맥스 분류기에서 이에 기반한 최종적인 분류를 수행한다. 자체 제작한 스마트폰 애플리케이션을 배포하여 실험 데이터를 수집하였으며, 이를 활용하여 제안한 방법론을 평가하였다. 최적의 파라미터를 설정하여 동행 상태 분류 모델을 학습하고 평가한 결과, 동행 여부와 대화 여부를 각각 98.74%, 98.83%의 높은 정확도로 분류하였다.