• 제목/요약/키워드: Acoustic Features

검색결과 328건 처리시간 0.027초

Simulation Techniques for Mid-Frequency Vibro-Acoustics Virtual Tools For Real Problems

  • Desmet, Wim;Pluymers, Bert;Atak, Onur;Bergen, Bart;Deckers, Elke;Huijssen, Koos;Van Genechten, Bert;Vergote, Karel;Vandepitte, Dirk
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2010년도 춘계학술대회 논문집
    • /
    • pp.49-49
    • /
    • 2010
  • The most commonly used numerical modelling techniques for acoustics and vibration are based on element based techniques, such as the nite element and boundary element method. Due to the huge computational eorts involved, the use of these deterministic techniques is practically restricted to low-frequency applications. For high-frequency modelling, probabilistic techniques such as SEA are well established. However, there is still a wide mid-frequency range, for which no adequate and mature prediction techniques are available. In this frequency range, the computational eorts of conventional element based techniques become prohibitively large, while the basic assumptions of the probabilistic techniques are not yet valid. In recent years, a vast amount of research has been initiated in a quest for an adequate solution for the current midfrequency problem. One family of research methods focuses on novel deterministic approaches with an enhanced convergence rate and computational eciency compared to the conventional element based methods in order to shift the practical frequency limitation towards the mid-frequency range. Amongst those techniques, a wave based prediction technique using an indirect Tretz approach is being developed at the K.U.Leuven - Noise and Vibration Research group. This paper starts with an outline of the major features of the mid-frequency modelling challenge and provides a short overview of the current research activities in response to this challenge. Next, the basic concepts of the wave based technique and its hybrid coupling with nite element schemes are described. Various validations on two- and threedimensional acoustic, elastic, poro-elastic and vibro-acoustic examples are given to illustrate the potential of the method and its benecial performance as compared to conventional element based methods. A closing part shares some views on the open issues and future research directions.

  • PDF

초음파 도플러를 이용한 음성 인식 (Automatic speech recognition using acoustic doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.74-82
    • /
    • 2016
  • 본 논문에서는 음성 신호 대신 초음파 도플러 신호를 이용하여 음성을 인식하는 새로운 음성 인식 방법을 제안하였다. 제안된 방법은 주변 잡음에 대한 강인성과 무 접촉식 센서 사용에 따른 사용자의 불편함 감소를 포함하는 기존의 음성/무음성 인식 방법에 비해 몇 가지 장점을 갖는다. 제안된 방법에서는 40 kHz의 주파수를 갖는 초음파 신호를 입 주변에 방사하여, 반사된 신호를 취득하고, 취득된 신호의 도플러 주파수 변화를 이용하여 음성 인식을 구현하였다. 단일 채널 초음파 신호를 사용하는 기존의 연구와 달리, 다양한 위치에서의 취득된 초음파 신호를 음성 인식에 사용하기 위해 다채널 취득 장치를 고안하였다. PCA(Principal Component Analysis)특징 변수를 사용한 음성 인식에는 좌-우 모델을 갖는 은닉 마코프 모델을 사용하였다. 제안된 방법의 검증을 위해 60개의 한국어 고립어에 대해 6명의 화자로부터 취득된 초음파 도플러 신호를 인식에 사용하였으며, 기존 음성기반 음성인식 기법과 비교할 만한 수준의 인식율을 얻을 수 있었다. 또한 실험 결과 제안된 방법은 기존의 단일 채널 음성 인식 방법과 비교하여 우수한 성능을 나타내었으며, 특히 잡음 환경에서도 90 % 이상의 인식율을 얻을 수 있었다.

성대낭종과 성대폴립 간의 고음발성 양상의 차이 (Differentiation of Vocal Cyst and Polyp by High-Piched Phonation Characteristics)

  • 이종익;정고은;김성태;김상연;남순열;김상윤;노종렬;최승호
    • 대한후두음성언어의학회지
    • /
    • 제23권1호
    • /
    • pp.48-51
    • /
    • 2012
  • Background and Objectives : Vocal fold cyst is generally treated by surgical resection, it has a difference with vocal fold polyp, treated by conservative management first. Decrease in mucosal waves is known as main diagnostic criteria of vocal fold cyst. Sometimes there is a difficulty for diffrential diagnosis between cyst and polyp only by endoscopic examination. The purpose of the study is to identify the objective features of vocal cyst and polyp on the basis of voice analysis for the proper differential diagnosis, especially at high pitched phonation. Materials and Method : The voice analysis was done in 15 focal fold cyst patients and 42 vocal fold polyp. Parameters of perceptual assessment, acoustic and aerodynamic measure, and voice range profile were compared between two groups. Results : Vocal fold cyst patients showed significantly reduced MPT by acoustic and aerodynamic analysis, narrowed frequency-range and low maximun frequency by voice range profile analysis compared with vocal fold polyp patient. Maximun frequency 381 Hz is established for cut off value, differential diagnosis between cyst and polyp (ROC analysis, sensitivity 60%, specificity 68%). Conclusion : Voice analysis is helpful for differential diagnosis between vocal fold cyst and polyp, especially there is a difficulty for distinguish cyst from polyp at clinical situation by endoscopic examination. The result of decreased maximum frequncy at vocal fold cyst supports incomplete high-pitched phonation and falsetto regester at vocal fold cyst patients due to decreased mucosal wave, compared with vocal fold polyp patients.

  • PDF

제주도 하수처리장 해양방류구 인근해역의 늦은 봄철 조류 특성과 조석잔차류에 의한 오염물질의 분포 특성 (Characteristics of Tide-induced Flow and its Effect on Pollutant Patterns Near the Ocean Outfall of Wastewater Treatment Plants in Jeju Island in Late Spring)

  • 김준택;홍지석;문재홍;김상현;김태훈;김수강
    • 한국해양학회지:바다
    • /
    • 제26권2호
    • /
    • pp.63-81
    • /
    • 2021
  • 이 연구에서는 2018년 늦은 봄철을 대상으로, 제주도내 위치한 제주와 보목 하수처리장의 해양방류구 주변 해역의 하수처리 방류수의 이동 특성을 파악하기 위하여 다층 유향·유속계 (Acoustic Doppler Current Meter; ADCP)와 지역규모 해양 수치모델의 가상 추적자 실험을 활용한 분석을 수행하였다. ADCP관측 결과에 의하면 두 하수처리장 모두 방류구 인근 해역의 해수 유동은 비조석 성분 보다 조석 성분이 컸고, 조류는 등수심선과 평행한 방향의 왕복성 운동이 지배적이었다. 조화 분석결과는 제주와 보목 하수처리장 해역 모두 반일주기 유속 성분이 우세한 혼합형 조석특성이 지배적이지만, 보목 하수처리장 주변의 유속 세기가 제주 하수처리장 유속의 50% 정도로 느리고, 조류의 회전성이 제주는 시계 방향, 보목의 경우 반시계 방향으로 지역적으로 차이를 보인다. 특히, 보목 하수처리장 방류구 주변해역은 상대적으로 느린 유속과 더불어 잔차류가 등수심선을 가로질러 연안으로 향하기 때문에 해안을 따라 오염물질이 집적되는데 유리한 환경이다. 고해상도 수치실험은 유속·유향 현장 관측 결과와 유사한 해수 유동 특성을 잘 모의하였으며, 오염물질의 이동확산을 파악하기 위한 추적자 실험을 통하여 잔차성분이 연안을 향하는 보목 하수처리장 연안에서 오염물질 잔류량이 상대적으로 높아질 수 있음을 제시하였다. 이러한 결과는 늦은 봄철에 보목 하수처리장 인근 해역이 상대적으로 약한 조류와 연안을 향하는 잔차성분의 영향으로 하수처리 방류수에 의한 연안 오염 가능성이 높은 환경임을 제시하는 결과이다. 퇴적유기물 조사에서도 보목하수처리장 인근 연안은 중간오염 단계를 보임으로써 조석 잔자류에 의한 연안 오염물질 축적과 그에 따른 연안환경오염의 가능성을 뒷받침하고 있다.

RawNet3를 통해 추출한 화자 특성 기반 원샷 다화자 음성합성 시스템 (One-shot multi-speaker text-to-speech using RawNet3 speaker representation)

  • 한소희;엄지섭;김회린
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.67-76
    • /
    • 2024
  • 최근 음성합성(text-to-speech, TTS) 기술의 발전은 합성음의 음질을 크게 향상하였으며, 사람의 음성에 가까운 합성음을 생성할 수 있는 수준에 이르렀다. 특히, 다양한 음성 특성과 개인화된 음성을 제공하는 TTS 모델은 AI(artificial intelligence) 튜터, 광고, 비디오 더빙과 같은 분야에서 널리 활용되고 있다. 따라서 본 논문은 훈련 중 보지 않은 화자의 발화를 사용하여 음성을 합성함으로써 음향적 다양성을 보장하고 개인화된 음성을 제공하는 원샷 다화자 음성합성 시스템을 제안했다. 이 제안 모델은 FastSpeech2 음향 모델과 HiFi-GAN 보코더로 구성된 TTS 모델에 RawNet3 기반 화자 인코더를 결합한 구조이다. 화자 인코더는 목표 음성에서 화자의 음색이 담긴 임베딩을 추출하는 역할을 한다. 본 논문에서는 영어 원샷 다화자 음성합성 모델뿐만 아니라 한국어 원샷 다화자 음성합성 모델도 구현하였다. 제안한 모델로 합성한 음성의 자연성과 화자 유사도를 평가하기 위해 객관적인 평가 지표와 주관적인 평가 지표를 사용하였다. 주관적 평가에서, 제안한 한국어 원샷 다화자 음성합성 모델의 NMOS(naturalness mean opinion score)는 3.36점이고 SMOS(similarity MOS)는 3.16점이었다. 객관적 평가에서, 제안한 영어 원샷 다화자 음성합성 모델과 한국어 원샷 다화자 음성합성 모델의 P-MOS(prediction MOS)는 각각 2.54점과 3.74점이었다. 이러한 결과는 제안 모델이 화자 유사도와 자연성 두 측면 모두에서 비교 모델들보다 성능이 향상되었음을 의미한다.

시계열 신호 통계량 기반 캐비테이션 신호 탐지 (Cavitation signal detection based on time-series signal statistics)

  • 양해상;최하민;이석규;성우제
    • 한국음향학회지
    • /
    • 제43권4호
    • /
    • pp.400-405
    • /
    • 2024
  • 선박 프로펠러 캐비테이션 소음이 발생하면 수중 방사 소음의 수준이 급격히 상승하는데, 특히 함정의 경우에 피탐지 확률이 증가해 치명적인 위협 요인이 될 수 있다. 따라서 함정의 생존성 향상을 위하여 캐비테이션 신호를 정확하고 신속하게 판단하는 것이 매우 중요한데, 종래에는 센서로 계측한 음압/진동 준위가 기준값 이상이면 캐비테이션 발생으로 판단하는 기술과 데몬 기법을 통해 캐비테이션 발생 여부를 판별하는 방법이 주로 수행되었다. 그러나 이와 관련된 기술은 캐비테이션의 발생 현상에 대한 물리적 이해와 사용자의 주관적 기준을 기반으로 수행되며 여러 절차를 거치기 때문에 캐비테이션 신호를 조기에 자동으로 인식하는 기법의 개발이 필요하다. 본 논문에서는 선체에 부착된 음향 센서를 이용하여 계측된 음향 신호로부터 캐비테이션 신호의 특징을 반영한 간단한 통계량 기반 특징을 추출하고 이로부터 캐비테이션 발생 여부를 자동으로 판단하는 알고리즘을 제안한다. 제안된 기법의 성능은 센서 수와 모형 시험 조건에 따라 평가하는데, 단일 센서로 계측된 신호에 캐비테이션의 특징을 충분히 반영하여 훈련하면 캐비테이션 신호의 발생 여부를 판단 가능함을 확인했다.

음성특징의 거리에 기반한 한국어 발음의 시각화 (Visualization of Korean Speech Based on the Distance of Acoustic Features)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.197-205
    • /
    • 2020
  • 한국어는 자음과 모음과 같은 음소 단위의 발음은 고정되어 있고 표기에 대응하는 발음은 변하지 않기 때문에 외국인 학습자가 쉽게 접근할 수 있다. 그러나 단어와 어구, 문장을 말할 때는 음절과 음절의 경계에서 소리의 변동이 다양하고 복잡하며 표기와 발음이 일치하지 않기 때문에 외국어로서의 한국어 표준 발음 학습은 어려운 면이 있다. 그러나 영어 같은 다른 언어와 달리 한국어의 표기와 발음의 관계는 논리적인 원리에 따라 예외 없이 규칙화 할 수 있는 장점이 있으므로 발음오류에 대해 체계적인 분석이 가능한 것으로 여겨진다. 본 연구에서는 오류 발음과 표준 발음의 차이를 컴퓨터 화면상의 상대적 거리로 표현하여 시각화하는 모델을 제시한다. 기존 연구에서는 발음의 특징을 단지 컬러 또는 3차원 그래픽으로 표현하거나 입과 구강의 변화하는 형태를 애니메이션으로 보여 주는 방식에 머물러 있으며 추출하는 음성의 특징도 구간의 평균과 같은 점 데이터를 이용하는데 그치고 있다. 본 연구에서는 시계열로 표현되는 음성데이터의 특성 및 구조를 요약하거나 변형하지 않고 직접 이용하는 방법을 제시한다. 이를 위해서 딥러닝 기법을 토대로 자기조직화 알고리즘과 variational autoencoder(VAE) 모델 및 마코브 확률모델을 결합한 확률적 SOM-VAE 기법을 사용하여 클러스터링 성능을 향상시켰다.

머신러닝 분류기를 사용한 만성콩팥병 자동 진단 및 중증도 예측 연구 (Automatic detection and severity prediction of chronic kidney disease using machine learning classifiers)

  • 문지현;김선희;김명주;류지원;김세중;정민화
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.45-56
    • /
    • 2022
  • 본 논문은 만성콩팥병 환자의 음성을 사용하여 질병을 자동으로 진단하고 중증도를 예측하는 최적의 방법론을 제안한다. 만성콩팥병 환자는 호흡계 근력의 약화와 성대 부종 등으로 인해 음성이 변화하게 된다. 만성콩팥병 환자의 음성을 음성학적으로 분석한 선행 연구는 존재했으나, 환자의 음성을 분류하는 연구는 진행된 바가 없다. 본 논문에서는 모음연장발화, 유성음 문장 발화, 일반 문장 발화의 발화 목록과, 수제 특징 집합, eGeMAPS, CNN 추출 특징의 특징 집합, SVM, XGBoost의 머신러닝 분류기를 사용하여 만성콩팥병 환자의 음성을 분류하였다. 총 3시간 26분 25초 분량의 1,523개 발화가 실험에 사용되었다. 그 결과, 질병을 자동으로 진단하는 데에는 0.93, 중증도를 예측하는 3분류 문제에서는 0.89, 5분류 문제에서는 0.84의 F1-score가 나타났고, 모든 과제에서 일반 문장 발화, 수제 특징 집합, XGBoost의 조합을 사용했을 때 가장 높은 성능이 나타났다. 이는 만성콩팥병 음성 자동 분류에는 화자의 발화 특성을 모두 반영할 수 있는 일반 문장 발화와 거기로부터 추출한 적절한 특징 집합이 효과적임을 시사한다.

수동소나를 위한 LOFAR/DEMON 그램 압축 기법 (LOFAR/DEMON grams compression method for passive sonars)

  • 안재균;조현덕;신동훈;권택익;김광태
    • 한국음향학회지
    • /
    • 제39권1호
    • /
    • pp.38-46
    • /
    • 2020
  • 로파/데몬 그램은 수동소나의 특성을 확인하기 위해 수중 음향 신호에 대한 방위, 시간, 주파수를 시각적으로 표현한 결과이다. 이러한 그램들은 기존의 압축 기법들을 적용하기 힘든 토널 성분과 같은 특징들을 포함하고 있다. 본 논문에서는 이진맵과 예측 기법으로 구성된 새로운 로파 및 데몬 그램 압축 기법을 제안한다. 먼저 각 주파수 빈에 대한 예측을 결정하는 이진맵을 생성하고, 프레임을 몇 개의 매크로 블록으로 구분한다. 각 매크로 블록에 대해 인트라 예측과 인터 예측을 적용하여 나머지를 계산한다. 그리고 이진맵에서 유효한 빈들에 대해 예측을 수행하고 엔트로피 부호화를 위해 나머지를 양자화 한다. 이진맵과 예측모드를 전송함으로써 복호기는 동일한 절차로 그램을 복원한다. 시뮬레이션을 통해 제안하는 알고리즘의 로파와 데몬 그램 압축 결과가 기존의 데이터 압축 기법에 비해 우수함을 확인한다.

영어강세음절의 외국인어투에 관한 연구 (A Study on the Foreign Accent of English Stressed Syllables)

  • 박희석
    • 중소기업융합학회논문지
    • /
    • 제6권4호
    • /
    • pp.51-57
    • /
    • 2016
  • 본 연구는 강세음절이 있는 8개의 단어를 선정하여 원어민과 한국 대학생들 사이의 모음발음 길이를 스펙트로그램을 이용하여 측정한 후에 비교분석한 실험적 연구이다. 이 실험을 위하여 20명의 한국인 피 실험자들이 8개의 단어들이 들어있는 문장들을 발화하고 녹음하였으며, 음향적 특질들은 Praat 소프트웨어 프로그램을 이용하여 측정하였으며 그 결과를 통계분석 하였다. 분석결과, 8개의 강세모음에서 두 집단 간 차이가 있었으며, 7개의 강세모음에서는 그 차이가 유의미하였다. 두 실험집단 간 실험결과를 보면, 제1음절에 강세가 있는 모음들은 모두 집단 간 유의미한 차이를 보여주었다. 그 중에서 wonderful과 glasses의 강세음절에서는 유의미성이 크게 나타나고 있었는데, 특히 영어저모음 /${\ae}$/의 발음에서는 원어민이 한국인집단보다 훨씬 큰 길이로 발음하는 것을 알 수 있었다. 이러한 실험결과는 영어교육현장에서 외국인어투의 개선을 위한 수업자료로 활용할 수 있으리라 판단된다.