• 제목/요약/키워드: Speech signal processing

검색결과 331건 처리시간 0.023초

프로그램 가능한 SC Filter의 설계 (Design of Programmable SC Filter)

  • 이병수;이종악
    • 한국통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.172-178
    • /
    • 1986
  • 스위치드 커패시터 필터(Switched-capacitor filter)의 유리한 점은 IC화 할 때 능동 RC회로의 RC적(RC Product)에 해다아는 것이 커패시턴스의 비로 되어 정확하게 그 값을 유지하는 것이 쉽고 클럭주파수에 의하여 중심주파수를 선형적으로 변화시킬 수 있다는 것이다. 본 논문에서는 프로그램 가능한 2차 SC필터를 구성한 후 디지털 신호에 의하여 중심주파수, 선택도 및 최대이득이 제어가능함을 실험을 통하여 입증하였다. 실험결과 필터의 ${omega}_0$는 모든 수동소자에 대해 저감도를 유지할 수 있었으나 스위치의 기생용량이 커패시터의 비에 미치는 영향은 피할 수 없었다. SC 필터는 클럭주파수, 저항 어레이등에 의하여 전달특성을 가변시킬 수 있으므로 디지탈 신호의 처리나 음성의 분석 및 합성에도 이용될 수 있을 것이다.

  • PDF

실데이터 기반 능동 소나 신호 합성 방법론 (Real data-based active sonar signal synthesis method)

  • 김윤수;김주호;석종원;홍정표
    • 한국음향학회지
    • /
    • 제43권1호
    • /
    • pp.9-18
    • /
    • 2024
  • 최근 수중표적의 저소음화와 해상교통량의 증가로 인한 주변 소음의 증가로 능동 소나 시스템의 중요성이 증대되고 있다. 하지만 신호의 다중 경로를 통한 전파, 다양한 클러터와 주변 소음 및 잔향 등으로 인한 반향신호의 낮은 신호대잡음비는 능동 소나를 통한 수중 표적 식별을 어렵게 만든다. 최근 수중 표적 식별 시스템의 성능을 향상 시키기 위해 머신러닝 혹은 딥러닝과 같은 데이터 기반의 방법을 적용시키려는 시도가 있지만, 소나 데이터셋의 특성 상 훈련에 충분한 데이터를 모으는 것이 어렵다. 부족한 능동 소나 데이터를 보완하기 위해 수학적 모델링에 기반한 방법이 주로 활용되어오고 있다. 그러나 수학적 모델링에 기반한 방법론은 복잡한 수중 현상을 정확하게 모의하는 데에는 한계가 있다. 따라서 본 논문에서는 심층 신경망 기반의 소나 신호 합성 기법을 제안한다. 제안하는 방법은 인공지능 모델을 소나 신호 합성 분야에 적용하기 위해, 음성 합성 분야에서 주로 사용되는 타코트론 모델의 주요 모듈인 주의도 기반의 인코더 및 디코더를 소나 신호에 적절하게 수정하였다. 실제 해상 환경에 모의 표적기를 배치해 수집한 데이터셋을 사용하여 제안하는 모델을 훈련시킴으로써 보다 실제 신호와 유사한 신호를 합성해낼 수 있게 된다. 제안된 방법의 성능을 검증하기 위해, 합성된 음파 신호의 스펙트럼을 직접 분석을 진행하여 비교하였으며, 이를 바탕으로 오디오 품질 인지적 평가(Perceptual Quality of Audio Quality, PEAQ)인지적 성능 검사를 실시하여 총 4개의 서로 다른 환경에서 생성된 반사 신호들에 대해 원본과 비교해 그 차이가 최소 -2.3이내의 높은 성적을 보여주었다. 이는 본 논문에서 제안한 방법으로 생성한 능동 소나 신호가 보다 실제 신호에 근사한다는 것을 입증한다.

Modulated Lapped Transform 영역에서 적응 필터링을 이용한 음향 반향 제거기의 구현 (An Implementation of Acoustic Echo Canceller Using Adaptive Filtering in Modulated Lapped Transform Domain)

  • 백수진;박규식
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.425-433
    • /
    • 2003
  • 음향 반향 제거기 (Acoustic Echo Canceller: AEC)는 원거리 회의 시스템이나 차량 내 핸즈프리 통화 등에서 필연적으로 발생하는 반향을 제거하기 위해 이용된다. 이러한 반향을 제거하기 위해 다양한 적응 필터링 알고리즘이 제안되었으며 LMS(Least Mean Square) 알고리즘은 다른 알고리즘에 비해 매우 단순하고, 비교적 강인하여 많은 응용 분야에 사용되고 있다. 그러나 LMS 알고리즘은 음성과 같은 상관도가 높은 유색 신호에 대해 음향반향 제거기의 수렴 속도를 저하시켜 전체적인 음향 반향 제거 성능을 떨어뜨리게 한다. 이를 보완하기 위하여 DCT나 DFT 등의 직교 변환 행렬을 이용하여 입력신호의 상관성을 저하시킨 후 LMS 적응 필터링 알고리즘을 적용하는 변환 영역 음향 반향 제거 알고리즘 등이 제안되었다. 본 논문에서는 MLT (Modulated Lapped Transform) 직교 변환행렬을 이용한 MLT영역의 적응음향반향 제거 알고리즘을 제안한다. 제안된 알고리즘은 기존의 NXN DCT, DFT, Hadamad등의 정방 행렬 대신에 2NXN 크기의 MLT 변환 행렬을 사용함으로서 유색 입력 신호에 대해 효과적인 상관성 저하와 빠른 수렴 속도를 달성할 수 있었으며 실제 음향 반향 제거 시스템에 적용하여 그 성능을 비교 입증하도록 하였다. 합성 음성신호와 실제 음성 신호를 이용한 모의 실험 결과 제안된 MLT 영역 음향 반향 제거 시스템은 기존의 DCT 변환 영역 음향 반향 시스템에 비해 약 2배 이상의 빠른 수렴속도와 약 20∼30 ㏈ 정도의 ERLE (Echo Return Loss Enhacement) 향상을 얻을 수 있었다

혼합 가우시안 군집화를 이용한 상태공유 음향모델 최적화 (A Study on the Optimization of State Tying Acoustic Models using Mixture Gaussian Clustering)

  • 안태옥
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.167-176
    • /
    • 2005
  • 본 논문은 음성인식에 쓰이는 음향모델의 모델링 방법 중 결정트리 상태공유 모델링(DTST)을 기반으로 출력 확률 분포의 혼합 가우시안 수를 줄여 모델을 최적화하는 방법을 제안한다. DTST는 음성학적 지식을 포함할 수 있는 질의어 집합과 유사도를 기반으로 한 결정 방법을 이용하는 것이다. 이때 상태들의 출력 확률 분포의 혼합 가우시안 수를 늘려 인식률을 증가시킬 수 있게 된다. 본 논문에서는 인식률이 최대가 되는 지점에서 혼합 가우시안들을 군집화 하여 그 수를 줄이고자 한다. 군집화 시에 필요한 거리 측정 방법은 유클리드(Euclidean)와 바타챠랴(Bhattacharyya) 방법을 이용하였고, 새로운 가우시안은 거리가 최소가 되는 두 가우시안으로부터 평균과 분산을 다시 계산하여 생성하였다. 증권상장 회사명(STOCKNAME) 1,680개의 단어 데이터베이스를 구성하여 실험한 결과 바타챠랴 방법은 $97.2\%$의 인식률을 유지하면서 전체 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켰고, 유클리드 방법은 $96.9\%$의 인식률을 유지하면서 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켜 모델을 최적화할 수 있었다.

다채널 디지털 보청기에 적용 가능한 Adaptive Feedback Cancellation 알고리즘 구현 (Implementation of Adaptive Feedback Cancellation Algorithm for Multichannel Digital Hearing Aid)

  • 전신혁;지유나;박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.102-110
    • /
    • 2017
  • 본 논문에서는 다채널 디지털 보청기에 적용 가능한 적응 음향 궤환 제거(Adaptive Feedback Cancellation : AFC) 알고리즘을 실시간으로 구현한다. 다채널 디지털 보청기는 일반적으로 난청 보상을 위해 FFT 필터뱅크 기반 광역 동범위압축(Wide Dynamic Range Compression) 알고리즘을 사용한다. 구현한 실시간 음향 궤환 제거 알고리즘은 다채널 디지털 보청기와 동일한 FFT 필터뱅크를 사용하여 WDRC와 함께 하나의 통합된 구조를 가짐으로써 보청기 배터리 수명에 영향을 미치는 연산량 측면에서 이득을 볼 수 있었다. 구현된 음향 궤환 제거 알고리즘은 고정 및 변화하는 음향 궤환 경로를 실시간으로 추정하여 보청기 출력 신호의 품질을 향상시킴을 확인하였다. 또한 비선형적인 입, 출력에 의해 음향 궤환 제거기가 정상적으로 작동하지 못해 출력 신호의 포화가 일어날 경우 감소 이득을 적용하여 시스템의 안정성을 높이고자 하였다. 결과적으로 다양한 실제 사용 환경에서 강건하게 동작하는 알고리즘을 구현할 수 있었다. 본 알고리즘은 추후 음질 개선 알고리즘 등 다양한 기능의 추가 구현이 용이하다.

선형 보간법을 이용한 시간과 주파수 조합영역에서의 피치 추정 방법 (Pitch Estimation Method in an Integrated Time and Frequency Domain by Applying Linear Interpolation)

  • 김기출;박성주;이석필;김무영
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.100-108
    • /
    • 2010
  • 본 논문은 피치를 추출하는 방법으로 자기상관을 이용하였다. 시간과 주파수 영역의 자기상관은 서로 다른 특성을 가지고 있으며, 각각 피치주기와 기본주파수에 대응된다. 본 논문에서는 시간과 주파수 영역에서의 자기상관을 결합하는 방법을 이용하였다. 이 방법은 자기상관에서 발생하는 피치 doubling과 having 에러를 크게 개선시킬 수 있었다. 하지만, 시간과 주파수 영역에서 유성음의 주기적 특성인 피치주기와 기본주파수는 서로 역수 관계이며, 특히 기본주파수의 에러는 FFT의 분해능에 의하여 발생된다. 이러한 영향을 줄이기 위하여 시간 영역과 주파수 영역에서의 자기상관 결합에 보간법을 적용함으로써 피치 검출율을 향상 시킬 수 있었다. 자기상관을 결합할 때 시간영역에서 찾은 피치후보들에 대해서만 주파수영역의 자기상관을 구함으로써 계산량은 감축될 수 있었다. 또한, 선형보간을 이용하여 기존방법 보다 FFT 계수를 8배 줄일 수 있었다. 그 결과, FFT 연산량과 주파수영역의 자기상관 계산량을 크게 감축하여 기존 방법 대비 알고리즘 처리시간을 약 9.5배 줄일 수 있었다.

장애 음성 판별을 위한 의료/전자 융복합 소프트웨어 개발 (Development of medical/electrical convergence software for classification between normal and pathological voices)

  • 문지혜;이지연
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.187-192
    • /
    • 2015
  • 장애음성을 판별할 수 있는 소프트웨어가 개발 될 경우, 원격의료와 언어치료 등 여러 융복합 분야에서의 활용도가 매우 높다. 본 논문은 성대 진동에 대한 변화율을 나타내는 의료정보인 음향학적 파라미터와 신호처리 기반 고차 통계량에 기반을 둔 파라미터를 융합하여, CART(Classification And Regression Trees) 분석을 통해서 정상/장애음성 판별 프로그램을 구현하였다. 사용된 음향학적 파라미터는 Jitter(%)와 shimmer(%)이다. 그리고 본 연구에서 제안된 고차통계량 기반 파라미터는 왜도(Skewness)와 첨도(Kurtosis)의 평균과 분산이다. Kay Elemetrics의 데이터베이스에서 무작위로 발췌된 정상음성 53명, 장애 음성 173명의 /아/ 발화를 이용하여 결정트리(Decision tree) 기반장애음성 판별을 위해 평균적으로 83.15%의 성능을 보이는 알고리즘을 구현하였다. 그 결과를 바탕으로 추후 상용화를 고려하여 사용자 친화적인 프레임 워크에 의해 컨텐츠를 생성하는 융복합형 기능이 포함된 장애음성 판별 프로그램을 개발하였다.

음소에 의한 한국어 음성의 분석과 인식 (The Analysis and Recognition of Korean Speech Signal using the Phoneme)

  • 김영일;이건기;이문수
    • 한국음향학회지
    • /
    • 제6권2호
    • /
    • pp.38-47
    • /
    • 1987
  • 한국어는 발음상의 특징과 구조에 의해서 음소철로 분리가 가능하므로, 한국어를 자음 음소, 모음 음소, 받침 음소로 나눌 수 있다. 분리된 각각의 음소들을 편자기 상관계수를 이용하여 분석하였는데, 이 때 예측 차수는 15차이다. 분석 실험에서 동일한 음소들은 그 특성이 거의 유사하였다. 한국어 단음 675개를 자음 음소. 모음 음소, 받침 음소로 각각 분리하여 인식한 결과 각각 $85.0(\%)$, $90.7(\%)$, $85.5(\%)$의 인식률을 얻었고, 이 음소들을 결합시킨 단음에서는 $72.1(\%)$의 인식률을 얻었다. 따라서, 이와 같은 방법을 이용하여 한국어 단음을 작은 데이터 양으로 처리 시간을 단축시킬 수 있고, 더 나아가 한국어의 모든 단음, 단어, 문장 둥을 인식할 수 있다.

  • PDF

음성신호 처리 기술을 적용한 탄산음료와 유칼립투스 발향이 발음에 미치는 영향 분석 (Pronunciation Influence Analysis of Carbonate Drink and Eucalyptus Fragrance by Applying Speech Signal Processing Techniques)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제37권5C호
    • /
    • pp.420-428
    • /
    • 2012
  • 현대와 같은 스마트사회에서 NQ라 불리우는 대인관계의 효율을 극대화 시키는 것은 대단히 중요한 요소가 되고 있다. 특히 대인 관계 시 목소리가 미치는 영향이 38%나 차지하고 있는 실정이므로 발음을 좋게 하기 위한 다각적 방법 마련이 사회적 요구사항이 되고 있는 실정이다. 이를 위해 본 논문에서는 일상생활에서 대화 중 흔히 섭취하는 탄산음료와 유칼립투스 발향이 발음에 미치는 영향을 음성신호 처리 기술을 적용하여 규명해 내는 방법을 제안하고자 한다. 특히 탄산음료의 경우 섭취량에 따라 그것이 발음에 어떤 영향을 미치는지를 분석해 보고자하며 기관지에 효과적인 유칼립투스의 경우도 그 발향이 발음에 미치는 영향을 새롭게 규명해 보고자 한다. 이를 위해 성대 진동의 변화율과 진폭의 규칙성을 분석하고 피치와 음성 에너지의 크기를 분석하여 탄산음료 섭취량과 유칼립투스 발향이 발음에 미치는 영향을 정량화, 객관화, 수치화를 행하고자 한다.

디지털 보청기 알고리즘 평가를 위한 감음신경성 난청의 모델링 (Modeling of Sensorineural Hearing Loss for the Evaluation of Digital Hearing Aid Algorithms)

  • 김동욱;박영철
    • 대한의용생체공학회:의공학회지
    • /
    • 제19권1호
    • /
    • pp.59-68
    • /
    • 1998
  • 디지털 보청기는 기존의 아날로그 보청기에 비하여 많은 장점이 있다. 디지털 신호처리 프로세서의 발달과 더불어 최근에 다양한 디지털 보청 알고리즘과 완전한 디지털 보청기가 선보였다. 디지털 보청기의 알고리즘을 개발하거나 디지털 보청기를 새로이 평가하려는 사람들에게 난청자를 대상으로 하는 임상연구는 필수적으로 거쳐야 하는 과정이다. 그러나 이러한 임상연구는 실제 난청자를 대상으로 하여야 하기 때문에 난청자와 검사자 간에 통상적으로 많은 시간과 노력이 필요하며 원활한 의사 소통이 때로는 어려울 수 있다. 왜냐하면 난청자들의 연령이 너무 어리거나 많아서 의사소통에 지장을 주거나 검사자가 필요로 하는 시간에 비슷한 난청 유형을 가진 대상자를 모으기 어렵다. 본고에서는 임상연구를 보조하여 디지털 보청기 또는 알고리즘이 개발되기까지 수행되어야 할 많은 임상연구의 결과를 예측하고 평가할 수 있는 디지털 난청 시뮬레이션 방법을 제안하고, 실제 환자의 데이터를 사용한 시뮬레이션과 그에 대한 임상 실험을 통하여 시스템의 성능을 평가하였다. 실험 결과, 정상인으로부터 모델링된 환자 데이터와 매우 유사한 측정 결과를 얻어냄으로써, 제안된 시스템이 목적하고자 하는 바를 이룰 수 있음을 검증하였다. 또한 난청 시뮬레이터의 목적인 디지털 보청기 알고리즘을 개발하기 위한 평가 툴로서, 개발 초기에 다양한 디지털 보청기용 알고리즘을 구현하여 실제 난청 시뮬레이터와 연계하여 실험함으로써 보청기 알고리즘의 평가 및 새로운 보청기 알고리즘을 개발하고 평가하거나 향후 난청자를 대상으로 하는 임상연구에서 사용할 수 있는 유용성을 입증하였다.로 우유 교육 프로그램이 향후보다 체계적이고 확대되어 지속적으로 실시된다면, 우유에 대한 의미는 물론 인식 그리고 지식 정도에 있어 효과적인 결과를 유도할 수 있을 것이다.니하였다. 6) Dibutyryl cyclic AMP 및 8-bromo cyclic GMP 모두 혈소판응집률(血小板凝集率)을 감소시켰고, 후자(後者)는 전자(前者)에 비(比)하여 월등(越等)히 현저(顯著)하였다. sodium nitroprusside에 의한 항응집률(抗凝集率)은 methylene blue 전처치(前處置)에 의하여 길항(拮抗)되었으나, bovine hemoglobin전처치에 의하여는 영향(影響)을 받지 아니하였다. 이상(以上)의 성적(成績)을 종합(綜合)하면, 뇌졸중증(腦卒中症)때, 특히 뇌혈전증(腦血栓症)의 응급치료시(應急治療時) sodium nitroprusside의 응용(應用)이 가능(可能)하다고 사료(思料)되며, 이에 대(對)하여 임상적(臨床的) 치료(治療)가 기대되는 바이다.다시 상승(上昇)하는 경향(傾向)이었다. 중성지질(中性脂質) 중(中) climacteric rise 및 숙도(熟度)와 관련하여 변화(變化)한 것은 diglyceride 및 sterol ester의 2종(種)이었으며 glyceride가 중성지질(中性脂質) 전량(全量)의 변화(變化)와 동일(同一)한 경향(傾向)인데 반(反)하여 sterol ester은 climactric onset까지 증가(增加)하다가 기후(其後) 감소(減少)하였다. 인지질(燐脂質)도 저장기간(貯藏期間) 중(中) 처리구(處理區)에 관계(關係)없이 다같이 감소(減少)되었는데, 그 정도(程度)

  • PDF