• 제목/요약/키워드: 청각신호

검색결과 211건 처리시간 0.028초

음성인식을 위한 알고리즘에 관한 연구 (A study on the algorithm for speech recognition)

  • 김선철;이정우;조규옥;박재균;오용택
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.2255-2256
    • /
    • 2008
  • 음성인식 시스템을 설계함에 있어서는 대표적으로 사람의 성도 특성을 모방한 LPC(Linear Predict Cording)방식과 청각 특성을 고려한 MFCC(Mel-Frequency Cepstral Coefficients)방식이 있다. 본 논문에서는 MFCC를 통해 특징파라미터를 추출하고 해당 영역에서의 수행된 작업을 매틀랩 알고리즘을 이용하여 그래프로 시현하였다. MFCC 방식의 추출과정은 최초의 음성신호로부터 전처리과정을 통해 아날로그 신호를 디지털 신호로 변환하고, 잡음부분을 최소화하며, 음성 부분을 강조한다. 이 신호는 다시 Windowing을 통해 음성의 불연속을 제거해 주고, FFT를 통해 시간의 영역을 주파수의 영역으로 변환한다. 이 변환된 신호는 Filter Bank를 거쳐 다수의 복잡한 신호를 몇 개의 간단한 신호로 간소화 할 수 있으며, 마지막으로 Mel-cepstrum을 통해 최종적으로 특징 파라미터를 얻고자 하였다.

  • PDF

소형 DC 모터의 자동검사를 위한 음향신호 분석 (An Sound Signal Analysis for Automatic Test of Small DC Motor)

  • 장수영;이종찬;김성진;김천덕
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.115-118
    • /
    • 2000
  • 본 연구에서는 소형 DC 모터 완성품의 제품검사에서 객관성이 결여된 판정기준인 작업자의 청각에 의한 관능검사에 대신하여 자동 진단 시스템의 적용으로 고신뢰성을 확보하기 위하여 음향신호를 취득하여 분석하는 방법을 제안하였다. 소형 모터가 회전할 때 발생하는 음향신호를 마이크로폰으로 취득하여, 취득한 신호에 단구간 Hanning Window를 걸어 시간에 따라 이동하면서 신호의 주파수 성분을 시간에 따라 전개하는 STFT(Short-Time Fourier Transform) 기법으로 정상적인 모터와 이상인 모터에서 발생하는 음향신호를 분석하였다.

  • PDF

감마톤 특징 추출 음향 모델을 이용한 음성 인식 성능 향상 (Speech Recognition Performance Improvement using Gamma-tone Feature Extraction Acoustic Model)

  • 안찬식;최기호
    • 디지털융복합연구
    • /
    • 제11권7호
    • /
    • pp.209-214
    • /
    • 2013
  • 음성 인식 시스템에서는 인식 성능 향상을 위한 방법으로 인간의 청취 능력을 인식 시스템에 접목하였으며 잡음 환경에서 음성 신호와 잡음을 분리하여 원하는 음성 신호만을 선택할 수 있도록 구성되었다. 하지만 실용적 측면에서 음성 인식 시스템의 성능 저하 요인으로 인식 환경 변화에 따른 잡음으로 인한 음성 검출이 정확하지 못하여 일어나는 것과 학습 모델이 일치하지 않는 것을 들 수 있다. 따라서 본 논문에서는 음성 인식 향상을 위해 감마톤을 이용하여 특징을 추출하고 음향 모델을 이용한 학습 모델을 제안하였다. 제안한 방법은 청각 장면 분석을 이용한 특징을 추출을 통해 인간의 청각 인지 능력을 반영하였으며 인식을 위한 학습 모델 과정에서 음향 모델을 이용하여 인식 성능을 향상시켰다. 성능 평가를 위해 잡음 환경의 -10dB, -5dB 신호에서 잡음 제거를 수행하여 SNR을 측정한 결과 3.12dB, 2.04dB의 성능이 향상됨을 확인하였다.

심음 분석을 위한 주파수 특성에 기반한 매칭퍼슈잇 방법 (Matching Pursuit based on Frequency Characteristics of Heart Sounds for Phonocardiogram Analysis)

  • 김일동;정규혁;임종하;이인성
    • 전자공학회논문지SC
    • /
    • 제47권1호
    • /
    • pp.47-55
    • /
    • 2010
  • 심음은 심질환을 진단하는 1차적인 수단이지만 비정상 심음인 S2에서 A2와 P2의 분열 신호와 S2에 S3의 분마음 간섭 신호는 전문 의사들조차 청각적으로 구분하기 쉽지 않아 초기 진단에 어려움이 있다. 본 논문에서는 청각적으로 구분이 어려운 심음들을 분류하기 위해 PCG 신호의 주파수 특성에 적합한 분석 및 합성 방법을 제안한다. 제안한 방법은 심음을 매칭 퍼슈잇으로 분해한 후 주파수 특성에 맞게 대역별로 합성하여 분석함으로써 청진으로 구분이 어려운 신호를 다른 상태의 심음과 구별한다. 실험 결과 분석을 통해 초기 진단 시 불명확한 S2의 분열 유무, S2의 분열 상태, 그리고 S3의 분마음 간섭 신호를 구별할 수 있었으며 분열의 정확한 시간 간격을 확인할 수 있었다.

40채널 뇌자도 신호의 잡음제거 및 분석을 위한 신호처리 시스템 개발 (The Development of Signal Processing System for the Noise Reduction and An in 40 Channel SQUID Signal)

  • 이동훈;신원창;이용호;권혁찬;홍종배;안창범
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.2846-2848
    • /
    • 1999
  • 본 논문의 목적은 측정된 뇌자도 신호의 잡음제거 및 분석을 목적으로 하는 뇌자도 신호처리 시스템의 개발이다. 뇌자도 신호의 크기는 매우 작고 외부 노이즈 환경에 민감하게 반응하기 때문에 다양한 신호처리 기법을 이용하여 뇌자도 신호의 신뢰성을 높이는 것이 중요하다. 본 논문에서는 40채널 SQUID 시스템을 이용하여 뇌에서 발생하는 자기 신호를 측정하고, 측정된 데이터에 존재하는 노이즈 성분을 선형필터와SQUID 시스템의 레퍼런스 채널을 이용하여 제거하며, 이를 분석하는 뇌자도 신호처리 시스템을 개발하였다. 실제로 청각자극을 이용하여 뇌자도 신호를 측정, 분석 함으로써 개발된 뇌자도 신호처리 시스템의 신뢰성을 확인하였다. 또한 측정한 뇌자도 신호에서 주파수 대역에 따른 뇌자도 신호의 분포를 Map으로 구성하였으며, dipole source의 위치를 표시하였다.

  • PDF

적응 필터뱅크를 이용한 오디오 부호화 (Audio Coding Using Adaptive Filter Bank)

  • 신유철;강현철;변윤식
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.98-106
    • /
    • 1998
  • 본 논문은 두 부류의 오디오 원에 대해 각각 다른 구조를 가지는 필터뱅크를 설계 하고 스위칭 기준을 제안한다. 균일한 필터뱅크로는 MDCT 필터뱅크를 사용하고 필터 뱅크 로는 웨이브렛 패킷 필터뱅크를 사용하였으며 오디오 신호의 시변 특성에 기초하여 두 필터 뱅크를 스위칭한다. MDCT 필터뱅크는 정상신호 표현에 적절하지만 급격한 변화를 포함하 는 오디오 신호를 표현하는데는 적절하지 못한다. 따라서, 본 연구에서 사용한 웨이브렛 패 킷 필터뱅크는 인간의 청각 특성을 고려한 임계대역(critical band)과 유사하게 설계하였으며 스위칭 기준엣는 에너지-엔트로피(energy-entropy), 영교차(zero-crossing)법 그리고 차분 (difference)기준을 사용하였다. 입력되는 오디오 신호의 통계적 특성에 기안하여 두 필터뱅 크를 스위칭하는 방식의 오디오 부호화기에 대해서 새로운 스위칭 기준을 제안하였다. 여러 가지 오디오 신호에 대한 주관적 평가(MOS)를 수행한 결과, 기존의 부호화기보다 좋은 성 능을 보였다.

  • PDF

신호 에너지의 지각적인 간섭현상에 의한 컨벌루션 노이즈의 해석에 관한 연구 (The Study for Perceptual Convolutional Noise by the Masking Effect of Signal)

  • 김헌중;한헌수;홍민철;차형태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.187-190
    • /
    • 2002
  • 본 논문에서는 잡음 환경에서의 사람의 청각 시스템에서의 신호 에너지에 대한 지각(perception) 패턴을 나타내는 임계 대역에서의 여기(excitation)에너지와 이러한 신호 에너지 사이의 지각적인 간섭 효과를 나타내는 마스킹 특성을 이용하여 지각적인 컨벌루션 잡음(covolutional noise)해석을 통한 잡음 제어 기법을 연구하였다. 이러한 지각적 컨벌루션 잡음은 지각 영역에서 잡음 에너지에 의한 간섭 현상의 영향을 나타내며, 신호의 지각 적인 특성 변화 및 부가 잡음(additional noise) 제어 후에 신호 내에 잔존하는 잔여 노이즈를 반영하는 것이다. 실험 결과 부가 잡음 제어 필터와 컨벌루션 잡음 제어 필터가 대등한 노이즈 제어 성능을 나타내었으며, 다양한 잡음 환경에서 이러한 지각 영역에서의 부가 잡음 제어와 컨벌루션 잡음 제어를 통해 높은 SNR비 개선과 더불어 MOS 측정을 통해서도 높은 음질을 보장할 수 있음을 확인 할 수 있었다.

  • PDF

청각 피드백이 적용된 좌우 불균형 개선을 위한 밸런스 인솔 개발 및 검증 (The Development and Verification of Balance Insole for Improving the Muscle Imbalance of Left and Right Leg Using based Sound Feedback)

  • 강승록;윤영환;유창호;나재욱;홍철운;권대규
    • 재활복지공학회논문지
    • /
    • 제11권2호
    • /
    • pp.115-124
    • /
    • 2017
  • 본 연구에서는 하지의 좌우 불균형 검출을 위한 밸런스 측정 인솔을 개발하고 불균형을 개선하기 위한 청각 피드백 기술에 대한 검증을 하고자 하였다. 밸런스 인솔은 실시간 압력 감지 범위가 64 단계이며 발바닥 압력분포를 고려해 8개 부위에 FSR 센서를 탑재한 FPCB로 구성되었다. 피험자는 하지의 좌우 근력차이가 20% 이상 차이가 나는 피험자 20명을 선출하였다. 피험자들은 경사 0, 5, 10%와 속도 3, 4, 5km/h 로 15분 간 트레드밀 위에서 보행을 하였다. 또한 보행 시 나타나는 좌우 불균형을 평가 및 청각 피드백에 따른 개선효과를 검증하기 위해 측정된 족압 센서 데이터와 실시간 근육생리신호 데이터를 비교분석하였다. 실험 결과, 보행경사와 속도가 증가할수록 하지 좌우의 근력 불균형을 보유한 피험자들은 75.7%~140.9%까지 증가하는 반면 청각 피드백을 제공 시 10% 이내로 감소하는 결과를 보였다. 본 연구에서 개발 인솔 시스템을 이용한 보행환경에 따른 인체 좌우 불균형 발생시 FSR 신호 감도 결과와 인체생리신호 간 유효한 결과를 보였다. 향후 밸런스 피드백 보행 시 하지 좌우 불균형 개선 효과 경향을 보여 향후 족부 영역별 FSR 센서 민감도, 불균형 검출 및 개선을 위한 역치점 처리 알고리즘 개발에 대한 연구가 필요하다고 사료된다.

조피볼락의 청각 임계비 (The Auditory Critical Ratio of the Black Rock Fish Sebastes Schlegeli)

  • 박용석;이창헌;김고환;서두옥
    • 수산해양교육연구
    • /
    • 제12권1호
    • /
    • pp.1-10
    • /
    • 2000
  • 해양목장에서 음향순치 대상 어종으로 사용할 수 있는 조피볼락의 청각능력을 파악하여 해양목장화의 기초자료를 제공할 목적으로 조피볼락의 백색잡음에 대한 청각 임계비와 학습 및 유집을 위한 방성음압 강도를 조사한 결과는 다음과 같다. 음압 74, 78, 83의 3단계 백색잡음을 방성하였을 때 조피볼락의 청각문턱치는 백색잡음이 없을 때보다 높게 나타나 마스킹 효과가 나타났고, 주파수 300Hz에서 보다 높게 나타났다. 조피볼락의 청각임계비는 측정주파수 80, 100, 200, 300, 500, 800Hz에서 음압이 대략 21, 19, 22, 30, 54, 46dB이고 마스킹 현상은 주파수 300Hz에서 음압 65dB의 잡음레벨에서 나타나기 시작하였고 그외의 주파수에서는 음압 70dB이상에서 나타났으며 주파수 100 - 200Hz에서 신호음을 인식하기위해서는 음압 90dB이상, 잡음레벨보다 약 20dB이상의 높은 음압이 요구되었다.

  • PDF

확장된 음향적 시차 모델을 이용한 음상 거리정위의 모델화 (Modeling of Distance Localization by Using an Extended Auditory Parallax Model)

  • 김해영
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.30-39
    • /
    • 2004
  • 본 연구는 3차원 공간상에 있어서의 음상정위를 제어하기 위한 디지털 신호처리 기술, 특히, 음상의 거리정위에 있어서의 머리전달함수 (HRTF)의 역할에 착안한 신호처리 기술을 확립하기 위한 것을 목적으로 한다. 이러한 목적을 달성하기 위하여 본 논문에서는 청각에 있어서의 거리 지각을 제어하기 위한 중요한 요소를 밝혀내기 위해 기존의 Hirsch-Tahara 모델과 음향적 시차 모델에 대해서 청각 실험을 행했다. 그 결과 이 두 모델에 있어서는 음상의 거리지각을 설명하기에는 한계와 전 방향에 있어서는 적용할 수 없는 문제점이 있었다. 이러한 문제점들을 고려해 본 논문에서는 음향적 시차 모델을 전 방향에 있어서 적용 가능하도록 확장된 음향적 시차 모델을 제안해 그 유효성에 대해 청취 실험을 통해 고찰했다. 그 결과, 본 논문에서 제안한 확장된 음향적 시차 모델을 이용하면 수평면 상의 전 방향에 있어서 약 2m 까지의 범위 내에서는 실제 음원에서 지각할수 있는 거리와 거의 같은 수준으로 음상의 거리를 제어함으로써 본 모델의 유효성을 인간을 대상으로한 청취실험을 통해 증명했다.