• 제목/요약/키워드: auditory filter band

검색결과 8건 처리시간 0.029초

난청인의 난청 정도에 따른 비대칭 청각 필터 구현의 객관적 평가 (An Objective Estimation for Simulating of Asymmetrical Auditory Filter of the Hearing Impaired According to Hearing Loss Degree)

  • 주상익;전유용;송영록;이상민
    • 재활복지공학회논문지
    • /
    • 제3권1호
    • /
    • pp.27-34
    • /
    • 2009
  • 난청인의 청력 손실은 개인별로 다양하므로 기존의 대칭적으로 주파수 밴드별 청각 필터를 구현하는 방법은 다양한 형태의 난청인의 청력 손실을 적절하게 모사해주지 못한다. 각 중심주파수와 음성의 입력크기에 따라 청각 필터의 형태가 비대칭적으로 바뀌고 청력손실이 있는 난청인은 청력 손실에 따라 청각필터의 형태가 정상인들과는 다른 형태로 바뀌게 되며 음질에도 차이가 있다. 본 연구에서는 난청인의 난청 정도에 따라 변하는 비대칭 청각 특성을 잘 반영한 청각필터를 구현하여 몇 가지 실험을 통해 각 구현된 청각 필터의 성능을 객관적으로 평가하였다. 실험은 구현된 청각 필터를 통한 음성의 perceptual evaluation of speech quality (PESQ) 와 log likelihood ratio (LLR)를 사용하였으며 그 값을 통해 처리된 음성의 객관적인 음질과 왜곡정도를 평가 하였다. 청력 손실을 주었을 때 대칭과 비대칭 청각 필터사이의 PESQ 와 LLR 값을 실험해 본 결과 청각 필터 간의 큰 차이를 보였다. 위 실험 결과들로 대칭과 비대칭 청각 필터의 형태에 따라서 음성의 음질에 영향을 받는다는 것을 알 수 있었다. 특히, 난청이 있을 때 중심 주파수별 청각 필터의 비대칭적 형태 변화가 난청인이 받아들이는 음질에 영향이 있었다.

  • PDF

청각 주파수 응답에 기반한 자동 모음 개시 지점 탐지 (Automatic Vowel Onset Point Detection Based on Auditory Frequency Response)

  • 장한;김학태;정길도
    • 한국산학기술학회논문지
    • /
    • 제13권1호
    • /
    • pp.333-342
    • /
    • 2012
  • 이 논문에서는 인간 청각 시스템에 기반한 모음 개시 지점 (VOP) 탐지 방법을 제시하였다. 이 방법을 통해 '지각의' 주파수 범위, 즉 선형 음향 주파수에서의 Mel Scale을 보여준 후 일련의 삼각 Mel-weighted Filter Bank를 만들어 인간의 청각 시스템에서 대역 필터링 기능을 시뮬레이션하였다. 이러한 비선형 임계 대역 Filter Bank는 데이터 차원수를 크게 감소시키고 비선형적으로 간격을 둔 Mel 스펙트럼에서 더욱 효과적으로 포먼트를 생성하기 위해 조파들의 영향을 제거해준다. Mel 스펙트럼의 첨두 에너지 합은 각 프레임의 특징으로 추출하고 에너지 진폭이 급격히 상승하기 시작할 때의 특성은 Gabor 윈도우를 사용하여 VOP로 탐지한다. 실험 결과를 통해서 다른 종류의 자음들과 연결된 12개의 모음들을 포함하는 한 단어 데이터베이스에 대한 제안된 방법의 평균 정확도는 단시간 에너지와 zero-crossing 비율에 기반을 둔 다른 모음 탐지 방법들보다 높은 72.73% 이상임을 확인하였다.

디지털 필터를 이용한 오디오 워터마킹 기술 (Audio Watermarking Technique Based on Digital Filter)

  • 신승원;김종원;최종욱
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2001년도 종합학술발표회논문집
    • /
    • pp.464-468
    • /
    • 2001
  • In this paper, we propose a robust watermarking technique that accepts time scaling, pitch shift, add noise and a lot of lossy compression such as MP3, AAC, WMA. The technique is developed based on digital filtering. Being designed according to critical band of HAS (human auditory system), the digital filters nearly affect audio quality. Furthermore, before implementing digital filtering, wavelet transform decomposes the audio signal into several signals that is composed of specific frequencies. Designed digital filters scan the decomposed signal. The designed digital filter, band-stop filter, distorts and eliminates specific frequencies of audio signals. Watermarking detection can be accomplished by FFT (Fast Fourier Transform). Firstly, segments of audio signal are transformed by FFT. Then, the obtained amplitude spectrum by FFT is summed repeatedly. Finally the watermark detector can find filters used to watermark encoding based on eliminating frequencies. The suggested technique can embed 4bits/s in a robust manner.

  • PDF

청각 구조를 이용한 잡음 음성의 인식 성능 향상 (Performance Improvement of Speech Recognizer in Noisy Environments Based on Auditory Modeling)

  • 정호영;김도영;은종관;이수영
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.51-57
    • /
    • 1995
  • 본 논문에서는 청각 모델을 기초로 잡음에 강한 음성 특징 추출을 연구하였다. 청각모델은 basilar membrane 모델, 섬모세포(hair cell) 모델과 스펙트럼 출력단으로 구성하였다. Basilar membrane 모델은 음파의 진동에 따른 전달 특성을 묘사한 것으로 대역 통과 필터의 열로 나타난다. 섬모 세포 모델은 basilar membrane의 진동에 의한 신경 물질로의 변환을 나타낸다. 이것은 입력의 상대적인 값에 크게 반응하는 adaptation 기능을 이용하게 되며, 잡음 제거에 중요한 역할을 하게 된다. 스펙트럼 출력 단은 각 채널의 평균 firing rate를 이용하여 mean rate spectrum을 형성한다. 그리고 mean rate spectrum을 이용하여 특징 벡터를 추출하였다. 실험 결과는 청각 구조에 기초한 특징 추출이 다른 특징 추출 방법에 비해 잡음에서 더 향상된 성능을 가짐을 보였다.

  • PDF

중간 전송율에서 적응 포스트 필터링을 이용한 음성용 SBC의 성능 향상 (Performance Enhancement of SBC for Voice Signal Using Adaptive Postfiltering at the Medium Bit Rate)

  • 김원구;이남걸;윤대희;차일환
    • 한국통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.121-131
    • /
    • 1992
  • 포스트 필터링(adaptive postfiltering)을 수신단의 마지막에세 수행 하였다. 첫째는, SBC 시스템의 대역 필터를 QMF(Quadrature Mirror Filter) 대신 GQMF(Generalized QMF)를 사용하여 성능을 향상시켰고, 둘째는, 각 대역에 적응 비트 할당을 함으로써 음질의 향상뿐 아니라 variable rate 부호화할 수도 있었다. 세번째로는 APCM(Adaptive Plulse Code Modulation)과 ADPCM(Adaptive Differential Pulse Code Modulation)을 부호화기로 사용하여 각각의 성능을 평가 한 결과, SB-APCM 의 성능이 우수하였다.또한, 수신단의 마지막에서 적응 포스트 필터링을 수행하여 부호화된 음성의 음질을 개선할 수 있었다. 본 논문에서는 두가지의 적응 포스트 필터링 기법을 제안하였는데 낮은 복잡성을 가지고도 부호화된 음성에서 상당량의 잡음 감쇄를 이룰 수 있었다.

  • PDF

디지털 오디오 주관적 음향레벨 계측기 구현을 위한 ITU-R BS. 1387-1의 알고리즘 특성 분석 (Performance analysis of subjective Loudness meter with ITU-R BS. 1387-1 algorithm for digital audio)

  • 뉴엔 보 바오 느안;박성균;노승환;한찬규
    • 전기전자학회논문지
    • /
    • 제16권4호
    • /
    • pp.395-404
    • /
    • 2012
  • 본 논문에서는 객관적 오디오 품질 분석에 대한 권고안인 ITU-R BS.1387-1의 귀의 모델을 토대로 라우드니스를 객관적으로 측정할 수 있는 알고리즘을 구현하며, 그 성능을 23개의 순음과 9개의 샘플 디지털 사운드에 적용하여 평가하였다. 순음의 경우 ISO226:2003에서 제공하는 실험 데이터와 비교한 결과 5%이하의 오차를 보이며, 디지털 사운드 실험 결과도 Moore 모델의 측정결과와 비교할 때 4.7%이하의 편차와 0.96이상의 코릴레이션을 나타내어 좋은 성능을 보였다. 한편 구현 알고리즘에 적용한 청각필터 수에 따른 성능 변화를 분석하기 위해 21개의 별도의 샘플 디지털 사운드에 적용하였다. 그 결과를 분석하여 보면, 37개의 청각필터를 갖는 구현 알고리즘에 바이어스 보상값을 적용함으로써 109개 필터를 사용하는 경우에 대해 2%미만의 오차를 갖는 양호한 성능을 갖도록 할 수 있었다.

1/3-옥타브 대역통과필터를 이용한 음상정위기법 성능 향상 (Improving a Sound Localization Using 1/3-octave Band Pass Filter)

  • 황신;양진우;정완섭;김순협
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.98-103
    • /
    • 2001
  • 인간의 청각기관은 소리의 방향과 거리인지에 있어서 여러 가지의 정보들을 복합적으로 이용한다. 이러한 양 귀에 들어오는 소리세기의 차이, 위상의 차이, 그리고 주파수 스펙트럼의 차이 등의 정보들을 종합적으로 포함하고 있는 것이 머리전달함수이다. 본 논문에서는 이 머리전달함수를 이용한 3차원 음상정위를 위해 사람의 청각기관에 알맞은 1/3-옥타브 대역통과필터를 이용한 알고리즘을 제안한다. 먼저 측정된 머리전달함수의 음색왜곡 및 음질저하를 최소화하기 위해 1/3-옥타브 대역통과필터를 이용해 간략화시켰으며, 간략화된 데이터베이스를 크기와 시간의 부분으로 나누어 모듈을 구성하였다. 이의 성능평가를 위해 객관평가와 주관평가를 실시하였으며, 실험결과 85.7%정도의 음상정위의 성능 개선을 가져왔다.

  • PDF

ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기 (A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E)

  • 김경태;이민기;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제45권2호
    • /
    • pp.81-89
    • /
    • 2008
  • 광대역 신호는 16 kHz로 표본화되어 50-7000 Hz로 밴드 제한된 신호를 말하며, 전화대역 음성 신호에 비해서 높은 자연성(naturalness)과 명료성(intelligibility)을 가진다. 이런 특징으로 광대역 부호화기는 화상회의, 디지털 AM 방송 및 고음질 음성통신 등에 사용될 수 있다. 본 논문에서는 가변대역 특징을 갖는 광대역 음성 오디오 부호화기를 제안하였다. 제안된 부호화기는 대역분한 구조를 가진다. 저주파 대역은 전화대역 음성 부호화기로 많이 사용되고 있는 8 kbit/s ITU-T G.729나 보다 높은 전송률로 오디오 신호까지 처리할 수 있는 11.8 kbit/s ITU-T G.729 Annex E로 부호화한다. 고주파 대역은 청각 모델을 기반으로 한 파라미터 부호화 방법으로 부호화한다. 제안된 고주파 대역 부호화는 감마톤 필터뱅크(gammatone filterbank)를 이용하여 입력신호를 임계대역으로 분할한 후, 각각의 임계대역 신호를 양자화한다. 저주파 대역 부호화기와 고주파 대역 부호화기는 서로 독립되어 있으므로, 복호화기에서는 채널 조건에 따라 전화대역 합성신호와 광대역 합성신호를 선택할 수 있는 특징이 있다. 성능 평가 결과, 제안된 부호화기는 낮은 전송률과 짧은 지연 시간으로 음성과 오디오 신호 모두에 대해 ITU-T G.722.1 24 kbit/s와 동등한 음질을 제공한다는 것을 확인하였다.