• 제목/요약/키워드: 음향성능

검색결과 2,165건 처리시간 0.025초

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

  • 이강규;윤원중;박규식
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.29-37
    • /
    • 2005
  • 본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.

$OakDSPCore^{\circledR}$를 이용한 적응형 다중 비트 (AMR) 음성 부호화기의 실시간 구현 (Real-time Implementation of the AMR Speech Coder Using $OakDSPCore^{\circledR}$)

  • 이남일;손창용;이동원;강상원
    • 한국음향학회지
    • /
    • 제20권6호
    • /
    • pp.34-39
    • /
    • 2001
  • 적응형 다중 비트 (AMR: adaptive multi-rate)은 ETSI (European Telecommunications Standards Institute)에서 채택한 광대역 코드분할 다중화(W-CDMA: wideband cadedivision multiple access)용 음성 부호화표준방식으로서 채널 상태의 변화에 따라 가변적인 전송률을 가진다. 본 논문에서는 적응형 다중 비트 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친 후OakDSPCore/sup R/를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현하였다. 구현된 코덱은 최대의 계산량을 요구하는6.7 kbps 모드일때 인코더부분이 최대 20.6MIPS이며 디코더부분은 약2.7MIPS의 복잡도를 나타낸다. 사용된 메모리는 약 21.33 kwords, 데이터 RAM메모리는 약 4.25 kwords를 가지며 데이터 ROM메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약 23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 성능을 가지는 CSD17C00A를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 ETSI에서 제공하는 21개의 테스트 (test) 벡터를 통하여 bit-exact함을 확인하였다. 그리고 마이크와 스피커를 이용한 실시간 음성 입출력이 음질의 왜곡이나 지연없이 실시간으로 동작함을 확인하였다.

  • PDF

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

초음파 도플러를 이용한 음성 인식 (Automatic speech recognition using acoustic doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.74-82
    • /
    • 2016
  • 본 논문에서는 음성 신호 대신 초음파 도플러 신호를 이용하여 음성을 인식하는 새로운 음성 인식 방법을 제안하였다. 제안된 방법은 주변 잡음에 대한 강인성과 무 접촉식 센서 사용에 따른 사용자의 불편함 감소를 포함하는 기존의 음성/무음성 인식 방법에 비해 몇 가지 장점을 갖는다. 제안된 방법에서는 40 kHz의 주파수를 갖는 초음파 신호를 입 주변에 방사하여, 반사된 신호를 취득하고, 취득된 신호의 도플러 주파수 변화를 이용하여 음성 인식을 구현하였다. 단일 채널 초음파 신호를 사용하는 기존의 연구와 달리, 다양한 위치에서의 취득된 초음파 신호를 음성 인식에 사용하기 위해 다채널 취득 장치를 고안하였다. PCA(Principal Component Analysis)특징 변수를 사용한 음성 인식에는 좌-우 모델을 갖는 은닉 마코프 모델을 사용하였다. 제안된 방법의 검증을 위해 60개의 한국어 고립어에 대해 6명의 화자로부터 취득된 초음파 도플러 신호를 인식에 사용하였으며, 기존 음성기반 음성인식 기법과 비교할 만한 수준의 인식율을 얻을 수 있었다. 또한 실험 결과 제안된 방법은 기존의 단일 채널 음성 인식 방법과 비교하여 우수한 성능을 나타내었으며, 특히 잡음 환경에서도 90 % 이상의 인식율을 얻을 수 있었다.

현악기의 물리적 모델링을 위한 최적의 멀티코어 프로세서 아키텍처 탐색 (Exploration of Optimal Multi-Core Processor Architecture for Physical Modeling of Plucked-String Instruments)

  • 강명수;최지원;김용민;김종면
    • 한국음향학회지
    • /
    • 제30권5호
    • /
    • pp.281-294
    • /
    • 2011
  • 물리적 모델링 기반 음 합성 알고리즘은 음 합성 시 많은 연산량을 요구하며 이는 실시간 음 합성을 저해한다. 이러한 문제를 해결하기 위해 본 논문에서는 물리적 모델링 기반 현악기 사운드 엔진을 멀티코어 프로세서에 구현하고, 사운드 엔진을 위한 최적의 멀티코어 프로세서 구조를 제안한다. 대상 현악기의 단위음을 합성하기 위해 각 프로세싱 엘리먼트 (processing element, PE)당 합성하는 샘플 (sample-per-processing element, SPE) 수를 변화시키는 실험을 통해 시스템의 성능 (system performance), 시스템 면적 효율 (area efficiency), 에너지 효율 (energy efficiency)을 각각 측정하고, 측정된 결과를 바탕으로 최적의 멀티코어 프로세서 구조를 선택하였다. 모의실험 결과, 어쿠스틱 기타는 SPE가 5,513과 2,756일 때 가장 높은 시스템 면적 효율과 에너지 효율을 보였으며, 클래식 기타는 SPE가 22,050과 5,513일 때 시스템 면적 효율과 에너지 효율이 가장 높았다. 또한 이를 이용하여 44.1 kHz의 샘플링율을 갖도록 대상 악기의 단위음을 합성한 결과 원음과 스펙트럼에서 매우 유사함을 확인할 수 있었고, 울산대학교 대학원생 및 교수 10명을 대상으로 실시한 MUSHRA 주관 청취 테스트에서도 좋은 결과를 얻었다.

제주 서남부해역에서 내부파에 의한 소나 탐지확률 변화 (Variation of probability of sonar detection by internal waves in the South Western Sea of Jeju Island)

  • 안상겸;박중용;추영민;성우제
    • 한국음향학회지
    • /
    • 제37권1호
    • /
    • pp.31-38
    • /
    • 2018
  • 2015년 5월 제주 서남부 해역에서 실시된 SAVEX15(Shallow Water Acoustic Variability EXperiment 2015) 데이터를 기반으로 내부파가 소나의 예상탐지확률(Predictive Probability of Detection, PPD)에 미치는 영향에 대하여 분석하였다. 제주 서남부 해역은 내부파, 수중음파채널 등으로 인하여 복잡한 해수 유동이 존재하는 해역이다. 본 논문에서는 확률적인 접근 방법을 통하여 소나의 성능을 예측하였다. SAVEX15 데이터 중 11 kHz ~ 31 kHz 대역대의 LFM(Linear Frequency Modulation), MLS(Maximum Length Sequence) 신호를 데이터 처리 하여 음원과 수신기가 약 2.8 km 떨어진 지점에서의 전달손실(Transmission Loss, TL)과 소음준위(Noise Level, NL) 값을 산출하였다. TL과 NL의 확률밀도함수(Probability Density Function, PDF)를 합성곱하여 신호이득에 대한 확률밀도 함수를 구하고 음원과 수신기의 수심에 따른 예상탐지확률을 산출하였다. 솔리톤 패킷과 내부조석 등의 내부파가 존재할 때 시간에 따른 예상탐지확률의 변화를 분석한 결과 각각 다른 양상으로 예상탐지확률 값에 영향을 주는 것을 확인하였다.

반응면 기법을 이용한 A필라/와이퍼 풍절음 예측 연구 (A study on A-pillar & wiper wind noise estimation using response surface methodology at design stage)

  • 임성남;신성룡;신현수
    • 한국음향학회지
    • /
    • 제37권5호
    • /
    • pp.292-299
    • /
    • 2018
  • 자동차 외장 디자인은 차량의 첫인상을 만들지만, 엔지니어링 입장에서는 공력 및 바람소리 성능에 중요한 요소이다. 외장 디자인은 차량의 프로토 타입 시점에 변경하기는 불가능하기 때문에 차량 초기 디자인 단계에서 외장 디자인을 점검하고, 바람소리 수준을 예측하는 것이 중요하게 된다. 외장 디자인 요소 중 차량 바람소리에 중요한 A필라와 와이퍼에 대한 바람소리 해석 기법은 개발되어 적용되고 있으나, 해석 및 모델링 과정이 복잡하고 시간이 많이 소모되기 때문에 엔지니어입장에서 디자이너 및 설계자와 함께 A필라 및 와이퍼 형상별 기여도를 검토하기엔 시간적인 여유가 부족하게 된다. 본 논문에서는 최적화를 위하여 A필라 형상 및 와이퍼 형상에 따라 바람소리 해석 S/W인 PowerFLOW(PowerClay 모델링 S/W, SEA-Baced(Statistical Energy Analysis-Based) 실내소음 해석툴, Turbulent Acoustic Power 해석툴)를 이용하여 실내소음을 해석적으로 예측하고, 예측한 결과를 이용하여 반응 표면법을 이용하는 최적화 S/W인 modeFRONTIER를 이용하여 디자인 요소에 대한 반응면을 구축하여, 디자인 요소와 실내 소음간의 상관성을 구성하여, 디자인 단계에서 A필라와 와이퍼에 의한 바람소리 수준을 예측하였다. 최적화 결과 및 반응면 구축 예측 결과에 대하여 실제 시험을 통하여 예측 경향성을 판단하고, 해석 및 예측에 대한 신뢰성을 확인하였다. 최종적으로 해석 및 반응면 구축 과정을 통하여 A필라 및 와이퍼에 대한 차종별 CAT(Computer Aided Test) 분석툴을 개발하고, 실제 차량 개발 과정에 적용하여 효용성을 확인하였다.

인공기저막 기반 인공와우의 주파수 분리 성능향상을 위한 인공기저막 전산모사 (A Simulation Study of Artificial Cochlea Based on Artificial Basilar Membrane for Improving the Performance of Frequency Separation)

  • 김태인;장성민;송원준;배성재;김완두;조맹효
    • 대한기계학회논문집A
    • /
    • 제36권4호
    • /
    • pp.457-463
    • /
    • 2012
  • 기저막은 달팽이관의 한 기관으로서 주파수 대역에 따라 기저막의 최대 진폭 발생 위치가 변화하여 소리를 인지할 수 있게 되며 이는 기저막의 형상에 기인한다. 본 연구에서는 인공기저막 기반의 완전 삽입형 인공와우 개발을 위한 연구의 일환으로써 주파수 분리 대역폭을 보다 확장시킬 수 있는 기저막의 형상을 제안하기 위해 설계 인자 연구를 수행하였다. 상용 유한요소소프트웨어 Abaqus 를 이용한 유한요소 해석을 통해 인공기저막의 음향 진동 특성을 예측하였으며 해석결과는 실험결과와 비교하여 검증하였다. 기저막 모델의 다양한 형상 변화와 기저막 모델에 존재하는 잔류응력에 따른 주파수 분리 대역의 변화 추이를 설계 인자 연구를 통하여 제시하였다.

음성처리에서 온라인 오류역전파 알고리즘의 학습속도 향상방법 (A Method on the Learning Speed Improvement of the Online Error Backpropagation Algorithm in Speech Processing)

  • 이태승;이백영;황병원
    • 한국음향학회지
    • /
    • 제21권5호
    • /
    • pp.430-437
    • /
    • 2002
  • 다층신경망 (MLP: multilayer perceptron)은 다른 패턴인식 방법에 비해 여러 가지 훌륭한 특성을 가지고 있어 음성인식 및 화자인식 영역에서 폭넓게 사용되고 있다. 그러나 다층신경망의 학습에 일반적으로 사용되는 오류역전파 (EBP: error backpropagation) 알고리즘은 학습시간이 비교적 오래 걸린다는 단점이 있으며, 이는 화자인식이나 화자적응과 같이 실시간 처리를 요구하는 응용에서 상당한 제약으로 작용한다. 패턴인식에 사용되는 학습데이터는 풍부한 중복특성을 내포하고 있으므로 패턴마다 다층신경망의 내부변수를 갱신하는 온라인 계열의 학습방식이 속도의 향상에 상당한 효과가 있다. 일반적인 온라인 오류역전파 알고리즘에서는 가중치 갱신 시 고정된 학습률을 적용한다. 고정 학습률을 적절히 선택함으로써 패턴인식 응용에서 상당한 속도개선을 얻을 수 있지만, 학습률이 고정된 상태에서는 학습이 진행됨에 따라 학습에 기여하는 패턴영역이 달라지는 현상에 효과적으로 대응하지 못하는 문제가 있다. 이 문제에 대해 본 논문에서는 패턴의 기여도에 따라 가변 하는 학습률과 학습에 기여하는 패턴만을 학습에 반영하는 패턴별 가변 학습률 및 학습생략 (COIL: Changing rate and Omitting patterns in Instant Learning)방법을 제안한다. 제안한 COIL의 성능을 입증하기 위해 화자증명과 음성인식을 실험하고 그 결과를 제시한다.

국부적 불연속을 갖는 도파관을 따라 전파되는 파동에 대한 파수 영역 유한 요소 해석 (Propagation of Structural Waves along Waveguides with Non-Uniformities Using Wavenumber Domain Finite Elements)

  • 유정수
    • 한국음향학회지
    • /
    • 제33권3호
    • /
    • pp.191-199
    • /
    • 2014
  • 파이프, 평판과 같이 단면의 형상이 길이 방향으로 일정한 도파관 구조물을 따라 전파되는 진동의 반사 및 투과 특성은 여러 공학 분야에서 응용되는 중요한 주제이다. 도파관에 조인트 또는 균열 등의 국부적 불연속이 있는 경우, 스펙트럴 요소(spectral element)와 유한 요소(finite elment)를 결합한 SE/FE 방법이 주로 사용되고 있다. 그러나 이 방법은 보 이론에 기반한 스펙트럴 요소가 사용되므로 저주파수 대역 해석에 국한되는 단점이 있다. 고주파수 대역 해석에는 스펙트럴 수퍼 요소(spectral super element)와 유한 요소를 결합한 SSE/FE 방법이 제안되었으나 유한요소와 스펙트럼 요소의 연성으로 인해 많은 연산 시간이 요구된다. 이러한 문제점을 개선하고자, 본 연구에서는 국부적 불연속 구간의 단면이 일정한 경우에 대해 국부적 불연속 구간을 스펙트럴 수퍼 요소로 대체한 SSE/SSE 연성 해석을 시도하였다. 적용 모델로는 국부적 결함을 가진 레일의 파동 반사 및 투과, 그리고 주기적 보강재를 가진 평판의 진동전파에 대해 적용하였다. 결함을 가진 레일의 해석 예를 통해, 본 논문에서 사용한 SSE/SSE 방법과 기존의 SSE/FE 방법의 성능을 비교하였다. 보강재를 가진 평판의 예를 통해서는 반복 구조를 가진 도파관의 파동 전파 특성 해석에 SSE/SSE 방법이 유용함을 확인하였다.