통합 검색 | Korea Science

중증 장애우용 음성구동 휠체어를 위한 강인한 음성인식 알고리즘 (Robust Speech Recognition Algorithm of Voice Activated Powered Wheelchair for Severely Disabled Person)

석수영;정현열
- 한국음향학회지
- /
- 제26권6호
- /
- pp.250-258
- /
- 2007
현재의 음성인식 기술은 하드웨어 기술의 발전과 더불어 여러 분야에 응용되고 있지만 음성구동 휠체어와 같은 고신뢰성이 요구되는 응용분야에서는 아직도 그 성능이 불충분하다. 실 환경에서 음성을 통해 안전하게 휠체어를 제어하기 위해서는 도로의 소음 등과 같은 주변잡음의 영향에 의한 음성인식 성능의 저하, 사용자의 기침소리나 숨소리 등과 같은 비음성 입력시의 오동작, 명령어의 불명확한 발성과 일반인과는 다른 발성 속도 및 발성 주파수 등을 고려한 인식시스템이 필요하다. 이를 위하여 본 논문에서는 비음성 입력시의 오동작을 방지하기 위해 인식기의 전처리 단에서 YIN 기본주파수 추출방법을 적용한 후 프레임 별 신뢰도에 기반한 고정도로 음성/비음성을 판별할 수 있는 방법을 제안하고, 불명확한발성에 대한 인식 성능 향상을 위해 화자 적응화 방법 및 개인적인 발성 변이를 표현할 수 있는 다중 후보 단어사전을 구성하여 인식성능 제고를 도모하였다. 잡음이 포함된 실 환경하에서 수집한 데이터를 대상으로 인식실험을 수행한 결과 기존의 켑스트럼 방법에서는 오류 없이 비음성을 찾아내는 재현율은 62%로 나타났으나 본 논문에서 제안한 YIN방법에 기반을 둔 신뢰도 측정방법에서는 95.1%를 나타나 우수한 성능을 나타내었다. 실 환경에서 수집된 2211개의 불명확한 발성을 대상으로 인식실험을 수행한 결과 2000상태 16 혼합수 HMnet 모델을 이용한 경우 인식률이 78.6%로 나타났으나 MAP적응화 방법 및 다중 후보 인식사전을 적용한 결과 99.5%의 인식 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.
https://doi.org/10.7776/ASK.2007.26.6.250 인용 PDF KSCI

기타의 음 합성을 위한 병렬 프로세서 구현 (Implementation of Parallel Processor for Sound Synthesis of Guitar)

최지원;김용민;조상진;김종면;정의필
- 한국음향학회지
- /
- 제29권3호
- /
- pp.191-199
- /
- 2010
물리적 모델링은 실제 악기음과 유사한 고음질의 음을 합성하는 방법이다. 그러나 물리적 모델링은 악기의 소리를 합성할 때 필요한 수많은 파라미터들을 동시에 계산해야 하기 때문에 동시 발음수가 높은 악기의 경우 실시간 처리에 문제가 발생할 수 있다. 이러한 문제를 해결하기 위해 본 논문에서는 기타의 음 합성 알고리즘을 실시간으로 처리 가능한 단일 명령어 다중 데이터 (Single Instruction Multiple Data, SIMD)처리 방식의 병렬 프로세서를 제안한다. 대표적인 현악기인 기타의 6개 현을 제어하기 위해 6개의 프로세싱 엘리먼트 (Processing Element, PE)로 구성된 SIMD기반 병렬 프로세서를 사용하였다. 각각의 프로세싱 엘리먼트는 해당되는 기타 현을 모델링하며, 각 현의 여기신호와 파라미터를 합성 병렬 알고리즘의 입력으로 받아 동시에 6개 현의 합성된 음을 실시간으로 생성할 수 있다. 표본화 비율을 44.1 kHz로 설정하고 16비트 양자화 데이터의 음을 합성한 모의 실험 결과, 제안한 SIMD기반 병렬 프로세서를 이용한 합성음은 원음과 매우 유사하였으며, 상용 프로세서인 TI사의 TMS320C6416보다 실행 시간에서 8.9배, 에너지 효율에서 39.8배의 성능 향상을 보였다.
https://doi.org/10.7776/ASK.2010.29.3.191 인용 PDF KSCI

CELP Type Vocoder에서 RTP 확장 헤더 데이터를 이용한 연속적인 프레임 손실에 대한 PLC 성능개선 (The Performance Improvement of PLC by Using RTP Extension Header Data for Consecutive Frame Loss Condition in CELP Type Vocoder)

홍성훈;배명진
- 한국음향학회지
- /
- 제29권1호
- /
- pp.48-55
- /
- 2010
패킷네트워크에서 사용하는 음성부호화기는 자체적으로 PLC (Packet Loss Concealment) 알고리즘을 사용하고 있지만 서비스에 적합할 만큼 좋지 않다. 더욱이 연속적인 패킷 손실에 대해서는 많이 취약하다. PLC 알고리즘은 크게 송신단 기반의 알고리즘과 수신단 기반의 알고리즘으로 나뉜다. 송신단 기반의 알고리즘은 추가정보를 전송하기 때문에 음질개선에 큰 성능을 갖는 반면 데이터 전송율이 높아지고 추가 지연이 발생하며 상호간의 호환이 불가능하다. 수신단 기반의 알고리즘은 수신된 데이터에 기반하기 때문에 추가지연이나 정보가 필요 없으나 음질개선에 한계가 있다. 본 논문에서는 RTP 헤더 정보 중 사용하지 않는 확장 헤더 데이터 (Extension Header Data: 32 bit)부분에 PLC를 위한 추가정보를 전송하는 방법을 제안한다. 이렇게 함으로써 송신단 기반의 알고리즘이 갖는 호환성 문제를 해결하고 음질 개선 성능을 향상 시킬 수 있다. 추가적으로 발생하는 지연 (delay)는 이미 수신단에서 네트워크상의 지연을 조정하기 위해 지터 버퍼 (jitter buffer)를 갖고 있기 때문에 제안하는 알고리즘으로 인해 발생하는 추가 지연은 없다. G.729 PLC를 위한 추가 정보는 LP 파라미터 합성용 MA필터 인덱스, 여기신호, 여기신호 이득 및 잔여신호 이득 파라미터로 프레임당 16 bit를 할당한다. 이는 RTP payload 전송 시 음성 데이터를 두 프레임인 20 ms 단위로 전송하기 때문이다. 성능 평가 결과 기존 대비 13.5%의 성능 향상을 보였다.
https://doi.org/10.7776/ASK.2010.29.1.048 인용 PDF KSCI

음선 기반 중주파수 대역 잔향음 모델 개발 및 실측 데이터 비교 (Mid Frequency Band Reverberation Model Development Using Ray Theory and Comparison with Experimental Data)

추영민;성우제;양인식;오원천
- 한국음향학회지
- /
- 제28권8호
- /
- pp.740-754
- /
- 2009
실제 해양에서 음파는 해수면/해저면의 거친 경계면이나 기포층/어군과 같이 불규칙적으로 분포된 체적에 의해 산란 되며, 잔향음 신호는 이러한 산란 신호의 합으로 형성된다. 실측된 잔향음 신호를 정확하게 모의하기 위해서는 각 산란 메커니즘에 적합한 산란 모델을 음파 전달 손실 모델과 결합시켜야 한다. 본 논문에서는 기존의 산란 모델과 결합이 용이한 음선 이론을 기반으로 잔향음 모델을 개발하였다. 개발된 잔향음 모델은 (1) 해수면에 대한 산란 신호로 실험 기반의 Chapman-Harris 식과 이론 기반의 APL-UW/SSA 모델, (2) 해저면에 대해서는 실험 기반의 Lambert 법칙과 이론 기반의 APL-UW/SSA 모델을 선택적으로 사용하도록 한다. 개발된 잔향음 모델의 타당성을 검증하기 위해서 정상 모드법 기반으로 개발된 Ellis 모델 결과와 2006 잔향음 공동웍크�乍【� 발표된 여러 잔향음 모델 결과와 비교하였다. 모델간의 비교를 통해 검증된 잔향음 모델을 이용하여 한국 근해의 중주파수 대역 잔향음 신호를 모의하고, 이를 실측 데이터와 시간 영역에서 직접 비교하였다. 이러한 비교를 통해 각 해역의 해양 환경의 특성에 따라 상호 다른 잔향음 신호 경향을 고찰 할 수 있으며, 나아가 각 해역 특성을 반영하는 산란 강도 함수를 본 잔향음 모델을 통해 선정할 수 있다.
https://doi.org/10.7776/ASK.2009.28.8.740 인용 PDF KSCI

입술움직임 영상신호를 고려한 음성존재 검출 (Speech Activity Decision with Lip Movement Image Signals)

박준;이영직;김응규;이수종
- 한국음향학회지
- /
- 제26권1호
- /
- pp.25-31
- /
- 2007
본 논문은 음성인식을 위한 음성구간 검출과정에서, 음향에너지 이외에도 화자의 입술움직임 영상신호까지 확인하도록 함으로써, 외부의 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위하여 시도한 것이다. 먼저, PC용 화상카메라를 통하여 영상을 획득하고, 입술움직임 여부가 식별된다. 그리고 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세스와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서는 공유메모리에 저장되어 있는 데이터를 확인함으로써 사람의 발성에 의한 음향에너지인지의 여부를 확인하게 된다. 음성인식기와 영상처리기를 연동시켜 실험한 결과, 화상카메라에 대면해서 발성하면 음성인식 결과의 출력까지 정상적으로 진행됨을 확인하였고, 화상카메라에 대면하지 않고 발성하면 음성인식 결과를 출력하지 않는 것을 확인하였다. 이는 음향에너지가 입력되더라도 입술움직임 영상이 확인되지 않으면 음향잡음으로 간주하도록 한 것에 따른 것이다.
https://doi.org/10.7776/ASK.2007.26.1.025 인용 PDF KSCI

항적 산란신호의 모델링과 실험적 검증 (Modeling of Scattered Signal from Ship Wake and Experimental Verification)

지윤희;이재훈;김재수;김정해;김우식;최상문
- 한국음향학회지
- /
- 제28권1호
- /
- pp.10-18
- /
- 2009
이동하는 수상 운동체는 반경 $8{\sim}200{\mu}m$ 크기의 미세기포군을 포함하는 기포항적을 발생시킨다. 경우에 따라 10여분 이상 지속되는 수중 미세기포는 음향산란을 일으키는 요인이 되며, 기포가 존재하는 동안 능동소나에 의한 지속적인 탐지가 가능하다. 본 논문에서는 기포항적에 존재하는 미세기포의 사공간적인 분포변화에 따라 산란되는 음파를 모의하는 잔향음 모델을 제시하였다. 기포항적 산란신호의 모델은 음향학적 모델과 운동학적 모델로 이루어져 있으며 음향학적 모델에서는 미세기포의 공간분포를 체적산란강도로 변환하여 공간에 대한 적분을 수행하고, 운동학적 모델은 해양공간의 고정좌표계와 능동소나에 고정된 국부좌표계 사이의 좌표변환을 위한 오일러변환을 기반으로 구현되었다. 구현된 모델의 점증을 위해 2007년 9월 한국해양대학교 앞 해상에서 실제 선박을 운항하여 기포항적을 발생시킨 후 일정간격으로 신호를 획득하여 분석하였고, 이를 모델에 적용하여 타당성을 검증하였다.
https://doi.org/10.7776/ASK.2009.28.1.010 인용 PDF KSCI

근거리 신호 모델링을 기반으로 한 어레이 형상 추정 기법들의 성능 분석 (Performance Analysis of the Array Shape Estimation Methods Based on the Nearfield Signal Modeling)

박희영;이충용
- 한국음향학회지
- /
- 제27권5호
- /
- pp.221-228
- /
- 2008
소나 시스템에서 참조 신호를 이용하여 어레이 형상을 추정하는 경우, 참조 신호는 어레이와 충분히 떨어져 있지 않기 때문에 근거리 신호 모델링이 필요하다. 근거리 신호 모델링을 기반으로 하는 어레이 형상 추정 기법은 일반적으로 수신된 참조 신호의 공간 공분산 행렬을 이용한다. 이러한 기법 중 1개의 참조 신호만을 이용하여 공간 공분산 행렬의 고유치 분해 후 최대 고유치에 해당하는 고유 벡터를 참조 신호의 조향 벡터로 구성하여 어레이 형상을 추정하는 근거리 고유벡터 기법이 있다. 본 논문에서는 1개 이상의 참조 신호를 이용하여 공간 공분산 행렬로부터 구한 잡음 부공간과 신호 부공간이 서로 직교한다는 특성을 이용하여 Newton-type 반복 기법으로 센서 위치를 추정해 나가는 간략화된 부공간 근사 기법을 제안한다. 또한 근거리 고유 벡터 기법과 간략화된 부공간 근사 기법의 성능을 다양한 환경에서 분석해 본다. 모의 실험 결과 한 개의 참조 신호를 이용하는 경우에 근거리 고유 벡터 기법과 간략화된 부공간 근사 기법이 거의 동일한 성능을 보임을 확인할 수 있었다. 또한 근거리 고유 벡터 기법이 참조 신호를 2개 이상 사용할 수 없는데 반해 간략화된 부공간 근사 기법은 두 개의 참조 신호를 이용함으로써 참조 신호의 입사 방향에 관계없이 안정적인 형상 추정 결과를 얻을 수 있음을 확인하였다.
https://doi.org/10.7776/ASK.2008.27.5.221 인용 PDF KSCI

중량 바닥충격음 측정의 신뢰성 향상을 위한 측정방법 검토 (A Study on the Measurement Method for Improvement of Reliability for Heavy-Weight Floor Impact Sound Measurement)

주문기;박종영;양관섭;오양기
- 한국음향학회지
- /
- 제27권4호
- /
- pp.163-170
- /
- 2008
대부분의 바닥충격음측정은 반사성 재질로 마감된, 가구도 커튼도 없는 수 미터 치수의 장방형 공실에서 이루어진다. 이러한 공간에서 저주파 모드의 발생을 피하는 일은 쉽지 않다. 현재의 측정표준에 따른 중량 바닥충격음 측정의 재현성과 신뢰성을 저해하는 가장 큰 요인은 이러한 저주파 모드 중첩 현상이며, 그 측정의 편차는 63Hz 대역에서 때론 10dB에 이르는 경우도 있다. 이 연구에서는 중량바닥충격음 측정의 편차원인인 저주파 대역 모드중첩의 영향을 줄일 수 있는 보다 신뢰성 있는 측정방법을 찾고자 하였다. 그 방법으로 수음실의 모드 중첩 현상 자체를 제어하는 방법과 어느 정도 모드가 존재하는 상황에서도 수음실 공간 전체의 음압레벨 평균에 가깝게 측정할 수 있는 방법의 두 가지에 대하여 실험하였다. 실험의 결과 저음흡음재 보다 베이스 트랩을 이용하여 수음실의 울림을 줄이는 방식은 수음실의 모드중첩을 제어하는 데는 효과가 있지만 현실적으로 다양한 측정 현장에서 저음 잔향시간을 $1{\sim}2$ 초 사이로 구현하는 일이 쉽지 않음이 단점으로 드러났다. 마이크로폰을 회전시키면서 공간적 평균을 구하는 방식은 측정이 복잡하지도 않으며 쉽게 많은 수음점을 확보하여 수음실 전체 공간을 통한 측정값과 근소한 오차를 보이는 것으로 밝혀졌다.
https://doi.org/10.7776/ASK.2008.27.4.163 인용 PDF KSCI

압축성 대와류모사를 이용한 고속열차의 공력 및 공력소음의 수치적/실험적 분석 (Numerical and experimental analysis of aerodynamics and aeroacoustics of high-speed train using compressible Large Eddy Simulation)

이권기;정철웅;김재환;정민승
- 한국음향학회지
- /
- 제43권1호
- /
- pp.95-102
- /
- 2024
기술 발전에 힘입어 고속열차의 운항속도는 증가하고 있으며, 고속열차 외부 유동장으로부터 발생하는 공력소음은 설계 단계에서 매우 중요한 고려 대상이 되어왔다. 이러한 고속열차의 유동기인소음을 정확하게 예측하기 위해서는 근거리 음향장에서 고해상도의 음원 발생과 원거리 음향장에서 수치적 소산이 적은 소음 전파가 요구된다. 이는 실제 고속열차의 구성요소 별로 시공간 스케일을 모두 적절하게 고려할 수 있는 수치격자 및 시간해상도가 동반되어야 한다. 이러한 도전점을 극복하기 위해, 본 연구는 실제 크기 및 실제 운행속도의 고속열차 5차량의 외부 유동장 및 음향장을 3차원 압축성 대와류모사(Large Eddy Simulation, LES) 기법을 이용하여 동시 계산하였다. 수치해석의 검증을 위해 벽면압력섭동 측정 결과와 수치해석 결과를 비교하였다. Ffowcs Williams and Hawkings 방정식을 이용하여 고속열차로부터 방사되는 음향파워를 예측하고 주행속도간 결과를 비교분석하였다. 본 연구는 고속열차의 공력소음 발생 메커니즘 분석을 바탕으로 한 소음 저감에 기여할 것으로 사료된다.
https://doi.org/10.7776/ASK.2024.43.1.095 인용 PDF

축류팬 날개 끝 윙렛 형상의 적용 유무에 따른 공기역학적 성능 및 유동 소음에 관한 수치적/실험적 연구 (Numerical and experimental investigations on the aerodynamic and aeroacoustic performance of the blade winglet tip shape of the axial-flow fan)

유서윤;정철웅;김종욱;박병일
- 한국음향학회지
- /
- 제43권1호
- /
- pp.103-111
- /
- 2024
축류팬은 상대적으로 저압의 유동 영역에서 유동을 수송하기 위해 사용되며, 다양한 설계 변수에 대해 설계된다. 축류팬의 날개 끝 형상은 유동 및 소음 성능에 지배적인 역할을 수행하며 이에 대한 대표적인 유동 현상으로 날개 끝에서 발생하는 날개 끝 와류와 누설 와류가 있다. 이러한 3차원 유동 구조를 제어하기 위해 다양한 연구가 수행되어 왔으며, 항공기 분야에서 날개 끝 와류를 억제하고 효율을 증가시키기 위해 윙렛 형상이 개발되었다. 본 연구에서는 에어컨 실외기용 축류팬 날개에 적용된 윙렛 형상의 영향을 분석하기 위한 수치적, 실험적 연구를 수행하였다. 3차원 유동 구조 및 유동 소음을 수치적으로 분석하기 위해 unsteady Reynolds-Averaged Navier-Stokes(RANS) 방정식과 Ffocws-Williams and Hawkings(FW-H) 방정식을 전산유체역학 기법에 기초하여 수치 해석하였으며, 실험 결과와의 비교를 통해 수치 기법의 유효성을 검증하였다. 윙렛 형상에 따른 날개 끝 와류와 누설 와류의 형성의 차이를 3차원 유동장을 통해 비교하고, 그에 따른 공기역학적 성능을 정량적으로 비교하였다. 또한, 예측 유동장을 바탕으로 소음을 수치적으로 모사하여 윙렛 형상이 유동 소음 측면에 미치는 영향을 분석하였다. 대상 팬 모델의 시제품을 제작하여 유동 및 소음 실험을 실시하여 실제 성능을 정량적으로 평가하였다.
https://doi.org/10.7776/ASK.2024.43.1.103 인용 PDF

검색결과 765건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)