• 제목/요약/키워드: 손실함수

검색결과 716건 처리시간 0.029초

심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 최적화 (Optimization of Multi-time Scale Loss Function Suitable for DNN-based Audio Coder)

  • 신승민;변준;박영철;백승권;성종모
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1315-1317
    • /
    • 2022
  • 최근, 심층신경망 기반 오디오 부호화기가 활발히 연구되고 있다. 심층신경망 기반 오디오 부호화기는 기존의 전통적인 오디오 부호화기보다 구조적으로 간단하지만, 네트워크의 복잡도를 증가시키지 않고 인지적 성능향상을 기대하는 것은 어렵다. 이 문제를 해결하기 위하여 인간의 청각적 특성을 활용한 심리음향모델 기반 손실함수를 사용한 기법들이 소개되었다. 심리음향 모델 기반 손실함수를 사용한 오디오 부호화기는 양자화 잡음을 잘 제어하였지만, 여전히 지각적인 향상이 필요하다. 본 논문에서는 심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 지역 손실함수 윈도우 크기의 최적화 제안한다. Multi-time Scale 손실함수의 지역 손실함수 계산을 위한 윈도우 크기를 조절하며, 이를 통하여 오디오 부호화에 적합한 윈도우 사이즈를 결정한다. 실험을 통해 얻은 최적의 Multi-time Scale 손실함수를 사용하여 네트워크를 훈련하였고, 주관적 평가를 통해 기존의 심리음향모델 기반 손실함수보다 좋은 음성 품질을 보여주는 것을 확인하였다.

  • PDF

효과적인 복소 스펙트럼 기반 음성 향상을 위한 시간과 주파수 영역 손실함수 조합에 관한 연구 (A study on loss combination in time and frequency for effective speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.38-44
    • /
    • 2022
  • 잡음에 오염된 음성의 명료도와 음질을 향상시키고자 음성 향상을 수행한다. 본 연구에서는 복소값 스펙트럼을 이용한 마스크기반 음성 향상에서 시간 영역 손실함수와 주파수 영역 손실함수에 따른 학습 결과를 비교하였다. 시간 영역의 음성 파형과 주파수 영역의 스펙트럼의 세부정보를 고려해 두 영역의 장점을 활용할 수 있도록 손실함수 조합에 관해 연구를 진행하였다. 시간 영역 손실함수는 Scale Invariant-Source to Noise Ratio(SI-SNR)을 이용해 계산하고, 주파수 영역 손실함수는 복소값 스펙트럼과 크기 스펙트럼을 Mean Squared Error(MSE)로 계산하여 사용하였고, sin 함수를 이용해 위상에 대한 손실함수를 계산하였다. 손실함수 조합은 시간 영역 손실함수인 SI-SNR과 각 주파수 영역 손실함수를 조합하였다. 또한 크기 값과 위상 값을 모두 고려할 수 있도록 SI-SNR과 크기 스펙트럼, 위상에 관련된 손실함수들도 조합하여 실험을 진행하였다. 음성 향상 결과는 Source-to-Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를이용해 성능 비교 평가를 진행하였다. 음성 향상 결과를 확인해보기 위해 스펙트럼 상에서 비교를 진행하였다. TIMIT 데이터베이스를 이용한 실험 결과, 시간 영역 또는 주파수 영역 손실함수보다 SI-SNR과 크기 스펙트럼을 조합한 손실함수를 사용하여 음성 향상을 학습했을 때 가장 높은 성능을 보였다.

주요 공공시설물의 홍수피해액 추정을 위한 손실함수 개발 - 도로 및 상·하수도시설물 - (Development of Loss Function for Estimation of Flood Damage Cost in Main Public Facilities - Road·Water and Sewerage Facilities -)

  • 황신범;김상호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.49-49
    • /
    • 2021
  • 홍수 발생 시 제내지에 존재하는 도로 및 상·하수도시설물은 저지대를 중심으로 생성되는 침수지역이 아닌 대부분 집중호우, 태풍으로 인해 발생한 유출량이 지표면 유출로 이어져 지면 경사를 따라 유하하면서 흐름을 방해하거나 노후된 시설물 등에서 피해가 발생한다. 이러한 피해발생 특성을 고려하여 홍수피해액을 추정하기에는 침수면적과 시설물 현황 등을 활용하는 기존의 손실 함수 개발 방법으로는 부족한 부분이 존재하며, 유수 흐름의 주요 인자인 침수심, 유속 등과 같은 수리특성을 고려하여 시설물에 대한 홍수피해액을 추정하는 방안이 필요하다. 본 연구에서는 수리특성을 고려한 시설물의 홍수피해액을 추정하기 위한 손실함수를 개발하고자 국가재난정보관리시스템(NDMS) DB에서 해당 시설물의 상세주소를 이용하여 피해 발생위치와 피해액을 파악하였으며, 2차원 수리해석 모형인 FLO-2D를 활용하여 시설물의 피해위치에서 발생된 수리특성 인자인 침수심과 유속을 분석하였다. 시설물의 단위면적 당 피해액을 종속변수로, 분석된 평균 침수심과 평균 유속을 독립변수로 선정한 후 변수 자료들의 신뢰성과 함수의 설명력을 향상시키기 위하여 이상자료들을 제거한 후 손실함수를 개발하였다. 본 연구에서 개발된 손실함수는 수리특성 인자인 침수심과 유속에 의하여 홍수피해액을 직접적으로 추정하는 방법으로 향후 홍수재해에 대한 사전 재산피해 추정을 통하여 합리적인 선제적 예방조치 등의 홍수재해 예방 활동 등에 활용될 수 있을 것으로 기대한다.

  • PDF

의존 구문 분석에 손실 함수가 미치는 영향: 한국어 Left-To-Right Parser를 중심으로 (Effects of the Loss Function for Korean Left-To-Right Dependency Parser)

  • 이진우;최맹식;이충희;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.93-97
    • /
    • 2020
  • 본 연구는 딥 러닝 기반 의존 구문 분석에서, 학습에 적용하는 손실 함수에 따른 성능을 평가하였다. Pointer Network를 이용한 Left-To-Right 모델을 총 세 가지의 손실 함수(Maximize Golden Probability, Cross Entropy, Local Hinge)를 이용하여 학습시켰다. 그 결과 LH 손실 함수로 학습한 모델이 선행 연구와 같이 MGP 손실 함수로 학습한 것에 비해 UAS/LAS가 각각 0.86%p/0.87%p 상승하였으며, 특히 의존 거리가 먼 경우에 대하여 분석 성능이 크게 향상됨을 확인하였다. 딥러닝 의존 구문 분석기를 구현할 때 학습모델과 입력 표상뿐만 아니라 손실 함수 역시 중요하게 고려되어야 함을 보였다.

  • PDF

하천시설물에 대한 손실함수의 개발 (Development of Loss Functions for River Facilities)

  • 김상호;황신범;김연수;이창희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.122-122
    • /
    • 2017
  • 재해로부터 국민의 인명과 재산을 보호하기 위해서는 재해 발생의 빈도 증가와 대형화 추세에 따라 예상되어지는 피해규모의 분석과 예측을 통한 대책 마련이 필요하다. 한국의 경우 피해지역 조사를 통하여 획득한 피해일시, 피해시설물, 피해내역, 피해액과 같은 피해액 정보를 관리하는 국가재난관리시스템(National Disaster Management System, NDMS)이 운영되고 있다. 그러나 공공시설물 중 가장 많은 피해액을 나타내고 있는 하천시설물에 대한 피해규모의 예측에 대한 연구는 전무한 실정이다. 본 연구에서는 국가재난관리시스템의 과거 하천 피해정보를 이용하여 하천의 구간별 평균유속과 피해연장으로부터 하천의 피해액을 추정할 수 있는 하천 손실함수를 개발하였으며, 시범 대상지역에 적용하여 검증하였다. 하천 손실함수는 향후 피해액 추정에 따른 피해규모 분석을 통하여 재해저감대책을 마련하는데 필요한 유용한 정보로 활용될 수 있을 것이다.

  • PDF

GAN 모델에서 손실함수 분석 (A Study on the Loss Functions of GAN Models)

  • 이초연;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.942-945
    • /
    • 2019
  • 현재 딥러닝은 컴퓨터 분야에서 이미지 처리 방법으로 활용도가 높아지면서 딥러닝 모델 개발 연구가 활발히 진행되고 있다. 딥러닝 모델 중에서 이미지 생성모델은 대표적으로 GAN(Generative Adversarial Network, 생성적 적대 신경망) 모델을 활용하고 있다. GAN은 생성기 네트워크와 판별기 네트워크를 이용하여 진짜 같은 이미지를 생성한다. 생성된 이미지는 실제 이미지와의 오차를 최소화해야 하며 이때 사용하는 함수를 손실함수라고 한다. GAN에서 손실함수는 이미지를 생성하는 학습이 불안정하여 이미지 품질이 떨어지는 문제가 있다. 개선된 GAN 관련 연구가 진행되고 있지만 완전한 문제 해결에는 부족하다. 본 논문은 7개의 GAN 모델에서 사용하는 손실함수를 분류하고 특징을 분석한다.

호우·태풍 피해에 따른 공공시설물 손실함수 개발에 관한 연구 - 도로 및 상·하수도 시설물 - (Development of Loss Functions for Public Facilities Damage - by Heavy Rain and Typhoon -)

  • 황신범;김상호;이창희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.25-25
    • /
    • 2019
  • 자연재해에 따른 피해로부터 국민의 재산과 인명 등을 보호하기 위해서는 예상되는 재해로부터 발생하는 피해규모에 대한 분석과 예측을 통한 대책 마련이 필요하다. 본 연구에서는 최근 10년간 발생되어진 자연재해 원인과 시설물별 분류 결과를 통하여 가장 많은 피해가 발생되어진 호우 태풍에 따른 공공시설물 피해에 대한 피해규모를 예측할 수 있는 손상 손실함수를 개발하고자 하였다. 공공시설물 중에서도 제외지에서 대부분의 피해가 발생하는 하천시설물 외에 국민의 생활영역인 제내지에서 피해규모가 크게 발생하였으며, 국가재난관리시스템(NDMS)의 피해내역 시설물 분류가 명확한 도로 시설물과 상 하수도 시설물을 함수 개발 대상물로 선정하였다. 도로와 상 하수도 시설물에 대한 국가재난관리시스템(NDMS)의 과거 피해내역과 호우 태풍에 의한 피해발생 규모로서 일반적으로 활용되고 있는 침수예상도 범람도 등을 활용하기 위하여 피해액을 종속변수로 침수면적을 독립변수로 이용하여 도로와 상 하수도 시설물의 피해액을 추정할 수 있는 손실함수를 개발하였다. 개발되어진 도로 시설물 및 상 하수도 시설물에 대한 손실함수는 향후 재해에 따라 발생 가능한 추정 피해액 규모 분석 등을 통하여 재해저감 대책을 위한 기초자료로 활용될 것으로 기대한다.

  • PDF

의료 영상 바이오마커 추출을 위한 딥러닝 손실함수 성능 비교 (Comparison of Deep Learning Loss Function Performance for Medical Video Biomarker Extraction)

  • 서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.72-74
    • /
    • 2021
  • 다양한 분야에서 현재 활용되고 있는 딥러닝 과정은 데이터 준비, 데이터 전처리, 모델 생성, 모델 학습, 모델 평가로 구성 된다. 이중 모델 학습 과정에서 손실함수는 모델이 학습하면서 출력한 값을 실제 값과 비교하여 그 차이를 출력하게 되고, 출력된 손실값을 기반으로 모델은 역전파 알고리즘을 통해 손실값이 감소하는 방향으로 가중치를 수정해가며 학습을 진행한다. 본 논문에서는 바이오마커 추출을 위한 딥러닝 모델에서 사용될 신경망 출력 값의 손실도를 측정하여 출력해주는 다양한 손실함수를 분석하고 실험을 통해 최적의 손실함수를 찾아내고자 한다.

  • PDF

다양한 손실 함수를 이용한 음성 향상 성능 비교 평가 (Performance comparison evaluation of speech enhancement using various loss functions)

  • 황서림;변준;박영철
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.176-182
    • /
    • 2021
  • 본 논문은 다양한 손실 함수에 따른 Deep Nerual Network(DNN) 기반 음성 향상 모델의 성능을 비교 평가한다. 베이스라인 모델로는 음성의 위상 정보를 고려할 수 있는 복소 네트워크를 사용하였다. 손실 함수는 두 가지 유형의 기본 손실 함수, Mean Squared Error(MSE)와 Scale-Invariant Source-to-Noise Ratio(SI-SNR)를 사용하였으며 두 가지 유형의 지각 기반 손실 함수 Perceptual Metric for Speech Quality Evaluation(PMSQE)과 Log Mel Spectra(LMS)를 사용한다. 성능은 각 손실 함수의 다양한 조합을 사용하여 얻은 출력을 객관적인 평가와 청취 테스트를 통해 측정하였다. 실험 결과, 지각기반 손실 함수를 MSE 또는 SI-SNR과 결합하였을 때 전반적으로 성능이 향상되며, 지각기반 손실함수를 사용하면 객관적 지표에서 약세를 보이는 경우라도 청취 테스트에서 우수한 성능을 보임을 확인하였다.

파라메트릭 활성함수를 이용한 심층신경망의 성능향상 방법 (Performance Improvement Method of Deep Neural Network Using Parametric Activation Functions)

  • 공나영;고선우
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.616-625
    • /
    • 2021
  • 심층신경망은 임의의 함수를 근사화하는 방법으로 선형모델로 근사화한 후에 비선형 활성함수를 이용하여 추가적 근사화를 반복하는 근사화 방법이다. 이 과정에서 근사화의 성능 평가 방법은 손실함수를 이용한다. 기존 심층학습방법에서는 선형근사화 과정에서 손실함수를 고려한 근사화를 실행하고 있지만 활성함수를 사용하는 비선형 근사화 단계에서는 손실함수의 감소와 관계가 없는 비선형변환을 사용하고 있다. 본 연구에서는 기존의 활성함수에 활성함수의 크기를 변화시킬 수 있는 크기 파라메터와 활성함수의 위치를 변화시킬 수 있는 위치 파라미터를 도입한 파라메트릭 활성함수를 제안한다. 파라메트릭 활성함수를 도입함으로써 활성함수를 이용한 비선형 근사화의 성능을 개선시킬 수 있다. 각 은닉층에서 크기와 위치 파라미터들은 역전파 과정에서 파라미터들에 대한 손실함수의 1차 미분계수를 이용한 학습과정을 통해 손실함수 값을 최소화시키는 파라미터를 결정함으로써 심층신경망의 성능을 향상시킬 수 있다. MNIST 분류 문제와 XOR 문제를 통하여 파라메트릭 활성함수가 기존의 활성함수에 비해 우월한 성능을 가짐을 확인하였다.