통합 검색 | Korea Science

Design of Model to Recognize Emotional States in a Speech

Kim Yi-Gon;Bae Young-Chul
- International Journal of Fuzzy Logic and Intelligent Systems
- /
- 제6권1호
- /
- pp.27-32
- /
- 2006
Verbal communication is the most commonly used mean of communication. A spoken word carries a lot of informations about speakers and their emotional states. In this paper we designed a model to recognize emotional states in a speech, a first phase of two phases in developing a toy machine that recognizes emotional states in a speech. We conducted an experiment to extract and analyse the emotional state of a speaker in relation with speech. To analyse the signal output we referred to three characteristics of sound as vector inputs and they are the followings: frequency, intensity, and period of tones. Also we made use of eight basic emotional parameters: surprise, anger, sadness, expectancy, acceptance, joy, hate, and fear which were portrayed by five selected students. In order to facilitate the differentiation of each spectrum features, we used the wavelet transform analysis. We applied ANFIS (Adaptive Neuro Fuzzy Inference System) in designing an emotion recognition model from a speech. In our findings, inference error was about 10%. The result of our experiment reveals that about 85% of the model applied is effective and reliable.
https://doi.org/10.5391/IJFIS.2006.6.1.027 인용 PDF KSCI

CMIP5 GCM을 활용한 사헬 지대의 사막면적 모의 평가 및 분석 (Evaluation of CMIP5 GCMs for simulating desert area over Sahel region)

서호철;최연우;;김연주
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2020년도 학술발표회
- /
- pp.255-255
- /
- 2020
아프리카 대륙에서 존재하는 가장 큰 사하라 사막(Sahara desert)의 면적은 지난 1세기 동안 기후변화로 인하여 10% 정도 증가하였고, 미래에도 기온상승으로 인하여 증가할 것으로 판단된다. 사하라 사막 면적의 증가로 인하여 아프리카의 자연식생과 수자원뿐만 아니라 아프리카에 거주하는 사람들의 삶에 많은 영향을 미치기에 사막의 면적 또는 경계선의 위치를 예측함은 매우 중요하다. 본 연구에서는 Coupled Model Intercomparison Project Phase 5 (CMIP5)의 36개 Global Climate Models (GCMs)과 ERA-interim 재분석 자료의 1979~2000년 강수 자료들을 이용하여 사헬(Sahel) 지대 서쪽(15W~15E, 10N~20N)과 동쪽(15E~35E, 10N~20N)의 강수량과 사막경계선을 비교하였다. 또한, 각 모델의 과거 모의 성능을 평가하여 미래 기후 예측성을 판단하고자 한다. 본 연구에서는 22년 평균 강수량이 200mm 이하인 지역을 사막이라 정의하고, 모델별로 연평균 강수량과 사막경계선에 대한 root mean square error(RMSE)를 산정하여 평가하였다. 또한, 습윤 정적 에너지(Moist. Static Energy; MSE), 바람(풍속 및 풍향) 자료를 이용하여 각 모델의 사막경계선의 오차에 대한 이유를 분석하였다. 이 연구를 바탕으로 하여 사헬 지대의 강수량 및 사막면적 모의의 불확실성 요소를 이해하고, 미래 상세 지역 수문기후 변화 예측에 활용 가능한 GCMs을 선별할 수 있을 것으로 판단한다.
PDF

시변 페이딩 채널에 대한 결정 지향 방식의 SC-FDE 시스템 (SC-FDE System Using Decision-Directed Method Over Time-Variant Fading Channels)

김지헌;양진모;김환우
- 한국음향학회지
- /
- 제26권6호
- /
- pp.227-234
- /
- 2007
본 논문은 CP(Cyclic Prefix)를 사용한 SC-FDE(Single Carrier with Frequency Domain Equalization) 기반의 전송 방식에 대해 기술하였다. SC-FBE 방식은 OFDM(Orthogonal Frequency Division Multiplexing)과 기능 구성이 유사하며, OFDM과 유사하게 주파수 영역에서 블록 단위로 효율적인 등화 수행이 가능하다. 특별히 단일 반송파 방식은 OFDM에 비해 비선형 왜곡에 상대적으로 덜 민감한 장점을 가지고 있다. 본 논문에서는 결정 지향 방식의 SC-FDE 수신부를 설계하고, 시뮬레이션을 통해 성능 결과를 제시하였다.
https://doi.org/10.7776/ASK.2007.26.6.227 인용 PDF KSCI

인공 신경망의 한국어 운율 발생에 관한 연구 (The Study on Korean Prosody Generation using Artificial Neural Networks)

민경중;임운천
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
- /
- pp.337-340
- /
- 2004
한국어 문-음성 합성 시스템(TTS: Text-To-Speech)은 합성음의 자연스러움을 증가시키기 위해 운율 발생 알고리듬을 만들어 시스템에 적용하고 있다. 운율 법칙은 각국의 언어에 대한 언어학적 정보나 자연음에서 구한 운율에 대한 지식을 기반으로 음성 합성 시스템에 적용하고 있다. 그러나 이렇게 구한 운율 법칙이 자연음에 존재하는 모든 운율 법칙을 포함할 수도 없고, 또 추출한 운율 법칙이 틀린 법칙이라면, 합성음의 자연감이나 이해도는 떨어질 것이므로, TTS의 실용화에 장애가 될 수 있다. 이러한 점을 감안하여 본 논문에서는 자연음에 내재하는 운율을 학습할 수 있는 인공 신경망을 이용한 운율발생 신경망을 제안하였다. 훈련단계에서 인공 신경망의 입력 단에 한국어 문장의 음소 열을 차례로 이동시켜 인가하면 입력 단의 중앙에 해당하는 음소의 운율 정보가 출력되도록 훈련시킬 때, 목표 패턴을 이용한 감독학습을 통해, 자연음에 내재하는 운율을 학습하도록 하였다. 평가 단계에서 문장의 음소 열을 입력하고, 추정율을 측정하여 인공 신경망이 한국어 문장에 내재하는 운율을 학습하여 발생시킬 수 있음을 살펴보았다.
PDF

병렬 마이크로 채널에서 FC-72의 2상 유동 마찰 압력 강하 예측 (Prediction methods for two-phase flow frictional pressure drop of FC-72 in parallel micro-channels)

최용석;임태우;유삼상
- Journal of Advanced Marine Engineering and Technology
- /
- 제38권7호
- /
- pp.821-827
- /
- 2014
본 연구에서는 FC-72를 작동유체로 사용하여 병렬 마이크로 채널에서의 2상 유동 마찰 압력 강하를 예측하기 위한 실험적 연구를 수행하였다. 병렬 마이크로 채널은 깊이 0.2 mm, 폭 0.45 mm, 길이 60 mm의 15개의 마이크로 채널로 구성되었으며, 실험은 질량유속 $152.2{\sim}584.2kg/m^2s$, 열유속 $7.5{\sim}28.3kW/m^2$ 범위에서 이루어졌다. 실험에서 얻어진 자료는 기존의 마찰 압력 강하를 예측하기 위한 상관식들과 비교 분석하였다. 기존의 상관식은 일반적으로 균질 모델과 분리류 모델을 사용한다. 본 연구에서는 분리류 모델을 사용한 기존의 상관식을 수정하여 새로운 상관식을 제안하였으며, 그 결과 Mean Absolute Error 9.6%내에서 실험 결과를 잘 예측하였다.
https://doi.org/10.5916/jkosme.2014.38.7.821 인용 PDF KSCI

모바일 환경에서 MPEG-4 비디오 스트림 전송을 위한 실시간 적응형 스케쥴링 프로토콜 (A Real-time Adaptive Scheduling Protocol for MPEG-4 Video Stream Transmission in Mobile Environment)

김진환
- 한국멀티미디어학회논문지
- /
- 제13권3호
- /
- pp.349-358
- /
- 2010
모바일 환경의 비디오 스트리밍에서 클라이언트들은 작업 부하의 차이가 큰 비디오를 요청할 수 있기 때문에 적응성은 중요한 문제이다. 본 논문에서는 모바일 또는 무선 통신망에서 MPEG-4 비디오 스트림을 효율적으로 전송하기 위해 제한된 대역폭을 스케쥴링하는 기법이 제시된다. 수락 제어 단계에서는 요청된 각 비디오 대역폭이 평균 대역폭 요건에 따라 할당된다. 실제 스케쥴링 단계에서는 클라이언트들의 재생 상황에 더욱 적합한 스케쥴링이 수행될 수 있도록 하기 위해 클라이언트의 버퍼 수준에 따라 대역폭이 동적으로 할당된다. 제시된 RTA(Real-Time Adaptive) 스케쥴링 프로토콜에서는 버퍼 수준이 낮은 클라이언트에게 일시적으로 더 많은 대역폭이 할당될 수 있다. 버퍼 수준에 기반한 스케쥴링 정책을 사용하는 RTA 프로토콜은 일시적인 과부하 영향을 최소화하는 한편 재생시 실시간적 성능을 최대화할 수 있다. RTA 프로토콜의 성능은 다양한 실험을 통하여 측정되었으며 BSBA(Buffer Sensitive Bandwidth Allocation) 프로토콜과 비교한 결과 RTA 프로토콜이 더 많은 수의 프레임들을 전송함으로써 우수한 성능을 가지는 것으로 분석되었다.
PDF KSCI

폐기물로부터 메탄발생량 예측을 위한 Sigmoidal 식과 1차 반응식의 통계학적 평가 (Statistical Evaluation of Sigmoidal and First-Order Kinetic Equations for Simulating Methane Production from Solid Wastes)

이남훈;박진규;정새롬;강정희;김경
- 유기물자원화
- /
- 제21권2호
- /
- pp.88-96
- /
- 2013
본 연구의 목적은 고형폐기물의 메탄발생 특성을 나타내기 위한 1차 반응식과 S형태 식들의 적합성을 평가하는 것이다. S형태 식은 수정 Gompertz와 Logistic 식을 사용하였다. 모델의 적합성을 평가하기 위해 잔차제곱합, 표준제곱근 오차, Akaike's information criterion 등의 통계분석을 실시하였다. AIC (Akaike's information criterion)는 모델의 변수 개수 차이에 따른 모델 적합성을 비교하기 위하여 적용하였다. 1차 반응식의 경우 지체기를 고려하지 않을 때보다 고려하였을 경우 잔차제곱합과 표준제곱근 오차는 감소하는 것으로 나타났다. 그러나 1차 반응식의 경우 S형태 식보다 AIC가 상대적으로 높게 나타났다. 이는 S형태 식이 1차 반응식보다 메탄발생특성을 나타낼 때에 더욱 적합한 것으로 사료된다.
https://doi.org/10.17137/Korrae.2013.21.2.88 인용 KSCI

백색광 간섭기에서 간섭 무늬의 상호 상관관계 함수를 이용한 절대 위상 측정 알고리즘 (Absolute phase identification algorithm in a white light interferometer using a cross-correlation of fringe scans)

김정곤
- 센서학회지
- /
- 제9권4호
- /
- pp.316-326
- /
- 2000
본 논문에서는 백색광 간섭현상 (white light interferometry)을 위한 신호처리 알고리즘을 제안한다. 제안하는 알고리즘으로 간섭기의 광경로 절대길이 (absolute optical path length)를 정확하게 측정할 수 있다. 그리고 제안하는 알고리즘은 간섭 무늬 (fringe scan)의 상호 상관관계 함수 (cross-correlation function)와 가설 검증을 사용한다. 가설 검증은 간섭 무늬의 상호 상관관계 함수가 대칭이 되는 봉우리를 영차 간섭 봉우리 (zero order fringe peak) 후보자로 선정함으로써 영차 간섭 봉우리를 오판할 확률을 줄인다. 산탄잡음(shot noise)이 제안된 알고리즘의 성능에 미치는 영향을 컴퓨터 모의 실험을 통하여 조사하였다. 모의 실험결과와 보외법 (extrapolation)을 사용하여 신호대산탄잡음비 (signal-to-shot noise ratio)가 31 dB 보다 클 때의 알고리즘의 성능을 예측하였다. 간섭 봉우리의 세 가지 매개변수 변화 (신호대산탄잡음비, 간섭 스캔 샘플링율 광원의 가간섭성 길이)에 따른 영차 간섭 봉우리 추정 오차를 계산하였다. 모의 실험 결과를 통하여 제안한 알고리즘이 영차 간섭 무늬 봉우리를 정확하게 판별할 수 있음을 보여주었다. 제안하는 신호처리 알고리즘은 소프트웨어적인 기법으로서 경제적이고 속도가 빠르며 간단한 알고리즘이다.
PDF

반도체 센서의 확장칼만필터를 이용한 자세추정 (Extended Kalman Filtering for I.M.U. using MEMs Sensors)

전용호
- 한국전자통신학회논문지
- /
- 제10권4호
- /
- pp.469-475
- /
- 2015
본 논문은 반도체 센서를 이용하여 공간상 시스템의 자세를 정확히 측정할 수 있도록 확장 칼만 필터를 설계하는 방법에 관한 연구이다. 공간상 자세는 관성좌표계(고정 좌표계)로부터 몸체에 부착된 회전좌표계의 상호 관계로 표현한다. 자세를 표현하는데 있어서 간결한 방법인 쿼터니언을 상태변수로 이용하며, 속도 센서로부터 계측된 값을 입력으로 가정하고, 상태 변화를 추정하였다. 그리고 가속도 센서로부터 획득된 값을 관측 데이터로 하여 추정한 값과의 정합과정을 통해 최적의 추정치를 얻어낸다. 이때 추정의 정밀도를 높이기 위해 추정 주기를 센서특성에 맞춰 조절하도록 확장 칼만 필터를 설계하였다. 그 결과, 3축 속도 센서와 3축 가속도 센서를 이용하여 설계된 추정기의 RMS(: Root Mean Square) 추정오차가 시뮬레이션에서 약 1.7 [$^{\circ}$] 이하로 유지되었고, 실험에서 100 [ms] 의 주기로 상태추정을 함으로 추정기가 유용함을 입증하였다.
https://doi.org/10.13067/JKIECS.2015.10.4.469 인용 PDF KSCI

효과적인 복소 스펙트럼 기반 음성 향상을 위한 시간과 주파수 영역 손실함수 조합에 관한 연구 (A study on loss combination in time and frequency for effective speech enhancement based on complex-valued spectrum)

정재희;김우일
- 한국음향학회지
- /
- 제41권1호
- /
- pp.38-44
- /
- 2022
잡음에 오염된 음성의 명료도와 음질을 향상시키고자 음성 향상을 수행한다. 본 연구에서는 복소값 스펙트럼을 이용한 마스크기반 음성 향상에서 시간 영역 손실함수와 주파수 영역 손실함수에 따른 학습 결과를 비교하였다. 시간 영역의 음성 파형과 주파수 영역의 스펙트럼의 세부정보를 고려해 두 영역의 장점을 활용할 수 있도록 손실함수 조합에 관해 연구를 진행하였다. 시간 영역 손실함수는 Scale Invariant-Source to Noise Ratio(SI-SNR)을 이용해 계산하고, 주파수 영역 손실함수는 복소값 스펙트럼과 크기 스펙트럼을 Mean Squared Error(MSE)로 계산하여 사용하였고, sin 함수를 이용해 위상에 대한 손실함수를 계산하였다. 손실함수 조합은 시간 영역 손실함수인 SI-SNR과 각 주파수 영역 손실함수를 조합하였다. 또한 크기 값과 위상 값을 모두 고려할 수 있도록 SI-SNR과 크기 스펙트럼, 위상에 관련된 손실함수들도 조합하여 실험을 진행하였다. 음성 향상 결과는 Source-to-Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를이용해 성능 비교 평가를 진행하였다. 음성 향상 결과를 확인해보기 위해 스펙트럼 상에서 비교를 진행하였다. TIMIT 데이터베이스를 이용한 실험 결과, 시간 영역 또는 주파수 영역 손실함수보다 SI-SNR과 크기 스펙트럼을 조합한 손실함수를 사용하여 음성 향상을 학습했을 때 가장 높은 성능을 보였다.
https://doi.org/10.7776/ASK.2022.41.1.038 인용 PDF KSCI

검색결과 181건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)