통합 검색 | Korea Science

심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 최적화 (Optimization of Multi-time Scale Loss Function Suitable for DNN-based Audio Coder)

신승민;변준;박영철;백승권;성종모
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.1315-1317
- /
- 2022
최근, 심층신경망 기반 오디오 부호화기가 활발히 연구되고 있다. 심층신경망 기반 오디오 부호화기는 기존의 전통적인 오디오 부호화기보다 구조적으로 간단하지만, 네트워크의 복잡도를 증가시키지 않고 인지적 성능향상을 기대하는 것은 어렵다. 이 문제를 해결하기 위하여 인간의 청각적 특성을 활용한 심리음향모델 기반 손실함수를 사용한 기법들이 소개되었다. 심리음향 모델 기반 손실함수를 사용한 오디오 부호화기는 양자화 잡음을 잘 제어하였지만, 여전히 지각적인 향상이 필요하다. 본 논문에서는 심층신경망 기반 오디오 부호화기를 위한 Multi-time Scale 손실함수의 지역 손실함수 윈도우 크기의 최적화 제안한다. Multi-time Scale 손실함수의 지역 손실함수 계산을 위한 윈도우 크기를 조절하며, 이를 통하여 오디오 부호화에 적합한 윈도우 사이즈를 결정한다. 실험을 통해 얻은 최적의 Multi-time Scale 손실함수를 사용하여 네트워크를 훈련하였고, 주관적 평가를 통해 기존의 심리음향모델 기반 손실함수보다 좋은 음성 품질을 보여주는 것을 확인하였다.
PDF

의존 구문 분석에 손실 함수가 미치는 영향: 한국어 Left-To-Right Parser를 중심으로 (Effects of the Loss Function for Korean Left-To-Right Dependency Parser)

이진우;최맹식;이충희;이연수
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
- /
- pp.93-97
- /
- 2020
본 연구는 딥 러닝 기반 의존 구문 분석에서, 학습에 적용하는 손실 함수에 따른 성능을 평가하였다. Pointer Network를 이용한 Left-To-Right 모델을 총 세 가지의 손실 함수(Maximize Golden Probability, Cross Entropy, Local Hinge)를 이용하여 학습시켰다. 그 결과 LH 손실 함수로 학습한 모델이 선행 연구와 같이 MGP 손실 함수로 학습한 것에 비해 UAS/LAS가 각각 0.86%p/0.87%p 상승하였으며, 특히 의존 거리가 먼 경우에 대하여 분석 성능이 크게 향상됨을 확인하였다. 딥러닝 의존 구문 분석기를 구현할 때 학습모델과 입력 표상뿐만 아니라 손실 함수 역시 중요하게 고려되어야 함을 보였다.
PDF

효과적인 복소 스펙트럼 기반 음성 향상을 위한 시간과 주파수 영역 손실함수 조합에 관한 연구 (A study on loss combination in time and frequency for effective speech enhancement based on complex-valued spectrum)

정재희;김우일
- 한국음향학회지
- /
- 제41권1호
- /
- pp.38-44
- /
- 2022
잡음에 오염된 음성의 명료도와 음질을 향상시키고자 음성 향상을 수행한다. 본 연구에서는 복소값 스펙트럼을 이용한 마스크기반 음성 향상에서 시간 영역 손실함수와 주파수 영역 손실함수에 따른 학습 결과를 비교하였다. 시간 영역의 음성 파형과 주파수 영역의 스펙트럼의 세부정보를 고려해 두 영역의 장점을 활용할 수 있도록 손실함수 조합에 관해 연구를 진행하였다. 시간 영역 손실함수는 Scale Invariant-Source to Noise Ratio(SI-SNR)을 이용해 계산하고, 주파수 영역 손실함수는 복소값 스펙트럼과 크기 스펙트럼을 Mean Squared Error(MSE)로 계산하여 사용하였고, sin 함수를 이용해 위상에 대한 손실함수를 계산하였다. 손실함수 조합은 시간 영역 손실함수인 SI-SNR과 각 주파수 영역 손실함수를 조합하였다. 또한 크기 값과 위상 값을 모두 고려할 수 있도록 SI-SNR과 크기 스펙트럼, 위상에 관련된 손실함수들도 조합하여 실험을 진행하였다. 음성 향상 결과는 Source-to-Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를이용해 성능 비교 평가를 진행하였다. 음성 향상 결과를 확인해보기 위해 스펙트럼 상에서 비교를 진행하였다. TIMIT 데이터베이스를 이용한 실험 결과, 시간 영역 또는 주파수 영역 손실함수보다 SI-SNR과 크기 스펙트럼을 조합한 손실함수를 사용하여 음성 향상을 학습했을 때 가장 높은 성능을 보였다.
https://doi.org/10.7776/ASK.2022.41.1.038 인용 PDF KSCI

벼의 압력손실 및 호흡 모델과 자동통풍에 관한 연구 (PRESSURE DROP, RESPIRATION MODELS AND AUTOMATIC AERATION OF ROUGH RICE)

정종훈;라리 알 버어마
- Journal of Biosystems Engineering
- /
- 제16권3호
- /
- pp.298-311
- /
- 1991
빈 시스템에서 적정 팬을 선정하기 위해서, 빈에서 벼를 건조 혹은 통풍시킬 때 벼의 저항에 의해 발생되는 공기의 압력손실을 예측하는 모델을 개발하였다. 또한 벼의 건물 손실을 예측하기 위하여 벼의 호흡 모델을 개발하였다. 그리고 온도 및 습도 센서들을 이용한 자동계측 시스템을 사용하여 저장된 벼의 상태를 연속적으로 측정, 분석함으로써 벼의 통풍기준을 결정하고 이를 근거로 빈의 자동통풍 시스템을 개발하여 평가하였다. 공기의 정압 손실은 공기의 속도 및 벼의 함수율의 함수로서 나타내어졌으며, 일정 곡물 깊이에서 벼의 함수율이 낮을수록 그 정압손실은 증가하였다. 벼의 호흡에 의해 발생되는 이산화탄소의 양은 저장온도, 벼의 함수율, 저장 기간의 함수로서 나타낼 수 있었다. 벼의 안전 저장을 위해 곡물의 온도 및 함수율, 평형상대습도, 벼의 품질저하지수(deterioration index)에 대한 자동통풍 기준을 결정하였으며 이들을 이용해서 퍼스널 컴퓨터로 팬, 제습기 등의 통풍 장치들을 자동제어하는 자동통풍 시스템을 개발하였다. 이 시스템은 곡물의 상태를 예측, 제어함으로써 14% 이하의 함수율과 4이하의 품질저하지수, 그리고 어떤 균류도 생성시키지 않음으로써 벼를 안전하게 저장할 수 있었다.
PDF

다양한 손실 함수를 이용한 음성 향상 성능 비교 평가 (Performance comparison evaluation of speech enhancement using various loss functions)

황서림;변준;박영철
- 한국음향학회지
- /
- 제40권2호
- /
- pp.176-182
- /
- 2021
본 논문은 다양한 손실 함수에 따른 Deep Nerual Network(DNN) 기반 음성 향상 모델의 성능을 비교 평가한다. 베이스라인 모델로는 음성의 위상 정보를 고려할 수 있는 복소 네트워크를 사용하였다. 손실 함수는 두 가지 유형의 기본 손실 함수, Mean Squared Error(MSE)와 Scale-Invariant Source-to-Noise Ratio(SI-SNR)를 사용하였으며 두 가지 유형의 지각 기반 손실 함수 Perceptual Metric for Speech Quality Evaluation(PMSQE)과 Log Mel Spectra(LMS)를 사용한다. 성능은 각 손실 함수의 다양한 조합을 사용하여 얻은 출력을 객관적인 평가와 청취 테스트를 통해 측정하였다. 실험 결과, 지각기반 손실 함수를 MSE 또는 SI-SNR과 결합하였을 때 전반적으로 성능이 향상되며, 지각기반 손실함수를 사용하면 객관적 지표에서 약세를 보이는 경우라도 청취 테스트에서 우수한 성능을 보임을 확인하였다.
https://doi.org/10.7776/ASK.2021.40.2.176 인용 PDF KSCI

주요 공공시설물의 홍수피해액 추정을 위한 손실함수 개발 - 도로 및 상·하수도시설물 - (Development of Loss Function for Estimation of Flood Damage Cost in Main Public Facilities - Road·Water and Sewerage Facilities -)

황신범;김상호
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2021년도 학술발표회
- /
- pp.49-49
- /
- 2021
홍수 발생 시 제내지에 존재하는 도로 및 상·하수도시설물은 저지대를 중심으로 생성되는 침수지역이 아닌 대부분 집중호우, 태풍으로 인해 발생한 유출량이 지표면 유출로 이어져 지면 경사를 따라 유하하면서 흐름을 방해하거나 노후된 시설물 등에서 피해가 발생한다. 이러한 피해발생 특성을 고려하여 홍수피해액을 추정하기에는 침수면적과 시설물 현황 등을 활용하는 기존의 손실 함수 개발 방법으로는 부족한 부분이 존재하며, 유수 흐름의 주요 인자인 침수심, 유속 등과 같은 수리특성을 고려하여 시설물에 대한 홍수피해액을 추정하는 방안이 필요하다. 본 연구에서는 수리특성을 고려한 시설물의 홍수피해액을 추정하기 위한 손실함수를 개발하고자 국가재난정보관리시스템(NDMS) DB에서 해당 시설물의 상세주소를 이용하여 피해 발생위치와 피해액을 파악하였으며, 2차원 수리해석 모형인 FLO-2D를 활용하여 시설물의 피해위치에서 발생된 수리특성 인자인 침수심과 유속을 분석하였다. 시설물의 단위면적 당 피해액을 종속변수로, 분석된 평균 침수심과 평균 유속을 독립변수로 선정한 후 변수 자료들의 신뢰성과 함수의 설명력을 향상시키기 위하여 이상자료들을 제거한 후 손실함수를 개발하였다. 본 연구에서 개발된 손실함수는 수리특성 인자인 침수심과 유속에 의하여 홍수피해액을 직접적으로 추정하는 방법으로 향후 홍수재해에 대한 사전 재산피해 추정을 통하여 합리적인 선제적 예방조치 등의 홍수재해 예방 활동 등에 활용될 수 있을 것으로 기대한다.
PDF

의료 영상 바이오마커 추출을 위한 딥러닝 손실함수 성능 비교 (Comparison of Deep Learning Loss Function Performance for Medical Video Biomarker Extraction)

서진범;조영복
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2021년도 춘계학술대회
- /
- pp.72-74
- /
- 2021
다양한 분야에서 현재 활용되고 있는 딥러닝 과정은 데이터 준비, 데이터 전처리, 모델 생성, 모델 학습, 모델 평가로 구성 된다. 이중 모델 학습 과정에서 손실함수는 모델이 학습하면서 출력한 값을 실제 값과 비교하여 그 차이를 출력하게 되고, 출력된 손실값을 기반으로 모델은 역전파 알고리즘을 통해 손실값이 감소하는 방향으로 가중치를 수정해가며 학습을 진행한다. 본 논문에서는 바이오마커 추출을 위한 딥러닝 모델에서 사용될 신경망 출력 값의 손실도를 측정하여 출력해주는 다양한 손실함수를 분석하고 실험을 통해 최적의 손실함수를 찾아내고자 한다.
PDF

경첩 손실 함수 최소화를 통한 오디오 핑거프린트 이진화 (Audio Fingerprint Binarization by Minimizing Hinge-Loss Function)

서진수
- 한국음향학회지
- /
- 제32권5호
- /
- pp.415-422
- /
- 2013
본 논문에서는 경첩 손실 함수를 최소화를 통해서 강인한 이진 오디오 핑거프린팅 방법을 제안하였다. 특히 제안된 방법에서 오디오 핑거프린트는 이진값을 가지므로 핑거프린트 DB 크기를 줄여줄 수 있는 장점이 있다. 일반적으로 특징을 이진화하는 과정에서 핑거프린트의 강인성, 식별성 등 성능의 손실이 불가피하므로 손실을 최소화하는 것이 필요하다. 본 논문에서는 핑거프린팅에서 두 오디오 클립 간의 유사도가 경첩 함수 형태로 주어지는 것에 착안하여 경첩 손실을 최소화하는 방법으로 특징을 이진화하여 핑거프린트를 구하는 방법을 제안한다. 유도된 경첩 손실 함수는 최소 손실 해싱 기법을 통해서 최소화 하였다. 수 천곡 규모의 오디오에 대해서 다양한 변환들에 대한 인식 성능을 실험하였으며, 제안된 경첩 손실 함수 최소화를 통해서 핑거프린트의 식별성과 강인성이 개선됨을 확인하였다.
https://doi.org/10.7776/ASK.2013.32.5.415 인용 PDF KSCI

하천시설물에 대한 손실함수의 개발 (Development of Loss Functions for River Facilities)

김상호;황신범;김연수;이창희
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2017년도 학술발표회
- /
- pp.122-122
- /
- 2017
재해로부터 국민의 인명과 재산을 보호하기 위해서는 재해 발생의 빈도 증가와 대형화 추세에 따라 예상되어지는 피해규모의 분석과 예측을 통한 대책 마련이 필요하다. 한국의 경우 피해지역 조사를 통하여 획득한 피해일시, 피해시설물, 피해내역, 피해액과 같은 피해액 정보를 관리하는 국가재난관리시스템(National Disaster Management System, NDMS)이 운영되고 있다. 그러나 공공시설물 중 가장 많은 피해액을 나타내고 있는 하천시설물에 대한 피해규모의 예측에 대한 연구는 전무한 실정이다. 본 연구에서는 국가재난관리시스템의 과거 하천 피해정보를 이용하여 하천의 구간별 평균유속과 피해연장으로부터 하천의 피해액을 추정할 수 있는 하천 손실함수를 개발하였으며, 시범 대상지역에 적용하여 검증하였다. 하천 손실함수는 향후 피해액 추정에 따른 피해규모 분석을 통하여 재해저감대책을 마련하는데 필요한 유용한 정보로 활용될 수 있을 것이다.
PDF

시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수 (A Multi-band Loss Function for Improving Time-Domain Autoencoder)

임유진;유정찬;서은미;박호종
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 추계학술대회
- /
- pp.78-79
- /
- 2021
본 논문에서는 시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수를 제안한다. 기존의 시간 영역 오토인코더를 사용하는 압축 및 복원 모델은 저 대역 손실에 치중되어 고 대역 신호를 생성하지 못하고 다운 샘플링된 신호를 결과로 출력하는 문제점을 가진다. 이를 해결하기 위해 대역별로 손실을 분리하여 가중치를 조절할 수 있는 다중 대역 손실 함수를 제안한다. 제안하는 손실 함수가 적용된 오토인코더에 음성 신호를 입력하여 학습을 진행한 결과, 다운 샘플링이 발생하지 않으며 고 대역 신호가 복원되는 것을 스펙트로그램을 통해 확인하였다.
PDF

검색결과 708건 처리시간 0.028초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)