DOI QR코드

DOI QR Code

A Variable Step-Size Adaptive Feedback Cancellation Algorithm based on GSAP in Digital Hearing Aids

가변 스텝 크기 적응 필터와 음성 검출기를 이용한 보청기용 피드백 제거 알고리즘

  • An, Hongsub (Dept. of Electronic Engineering, Inha University) ;
  • Park, Gyuseok (Dept. of Electronic Engineering, Inha University) ;
  • Song, Jihyun (Dept. of Electronic Engineering, Inha University) ;
  • Lee, Sangmin (Dept. of Electronic Engineering and Institute for Information and Electronic Research Inha University)
  • Received : 2013.05.23
  • Accepted : 2013.11.27
  • Published : 2013.12.01

Abstract

Acoustic feedback is perceived as whistling or howling, which is a major complaint of hearing-aids users. Acoustic feedback cancellation is important in hearing-aids because acoustic feedback degrades performance of the hearing aid device by reducing maximum insertion gain. Adaptive systems for estimate acoustic feedback path and feedback suppression algorithms have been proposed in order to solve this problem. A typical feedback cancellation algorithm is LMS(least mean squares) because of its computational efficiency. However it has problem of convergence performance in high correlated input signal. In this paper, we propose a new variable step-size normalized LMS(least mean squares) algorithm using VAD(voice activity detection) to overcome the limitation of the LMS algorithm. The VAD algorithm is GSAP(global speech absence probability) and the feedback cancellation algorithm is normalized LMS. The proposed algorithm applies different step-size between voice and non-voice using VAD, for high stability, fast convergence speed and low misalignment when correlated inputs, such as speech. The result of simulation with white noise mixed speech signal, the proposed algorithm shows high performance then traditional algorithm in terms of stability, convergence speed and misalignment.

Keywords

1. 서 론

난청은 청각 기관의 기능장애로 인해 청각 능력이 저하되거나 상실된 상태를 말한다. 이러한 난청은 크게 두 가지로 분류되는데, 하나는 외이, 고막, 중이 등 소리를 전달해주는 기관의 장애로 인하여 음파의 전달이 정상적으로 이루어지지 않는 상태로 발생하는 전음성 난청이고, 다른 하나는 달팽이관의 소리를 감지하는 기능에 이상이 생기거나 소리에 의한 자극을 뇌로 전달하는 청신경 또는 중추신경계의 이상으로 발생하는 감각신경성 난청이다. 이러한 난청의 치료 또는 보상에 있어서 대부분의 전음성 난청은 수술적 처치에 의해 극복이 가능한 상태이나 감각신경성 난청의 극복은 아직까지 많은 과제들이 남아 있다[2].

일반적으로 달팽이관의 유모세포가 손상되어 감각신경성 난청이 발생하면, 소리에 대한 청취능력과 역동범위가 감소하며, 어음이해도 또한 저하된다[3]. 이러한 감각신경성 난청의 극복 방안으로 제안되는 것 중 하나가 보청기의 착용이다. 보청기는 난청인의 청력 손실을 보상해주도록 고안된 의료기기로서 산업기술의 발달에 따라 디지털 기술이 도입되어 눈부신 발전을 하였고, 대표적인 의료기기의 한 분야로 자리매김 하고 있다.

하지만 이러한 보청기에도 여러 가지 문제가 있는데, 그 중 하나가 음향 피드백 현상이다. 음향 피드백 현상이란, 보청기의 수화기에서 외이도 밖으로 새어나온 소리가 송화기로 되돌아가서 재증폭되는 소리로 ‘삐’ 또는 ‘윙’ 소리, 잡음 등으로 표현되며 단순히 ‘피드백’ 이라고도 한다.[4].

음향 피드백의 주요 발생 요인은 크게 증폭기의 전자적 특성과 송화기, 수화기, 외이도의 음향적 특성으로 나눌 수 있다. 송화기와 수화기의 거리가 가까울 경우에 음향 피드백이 발생할 확률이 높은데, 주로 2-5KHz에서 일어난다. 그러나 이론상으로는 모든 주파수에서 일어날 가능성이 있고, 보청기 주변의 음향 조건에도 영향을 받는다. 수화기에서 새어나온 소리가 송화기로 되돌아가서 재증폭하는 과정에서 전기회로를 통과할 때의 위상이 특정 주파수에서 새로 입력되는 소리와 동일하면 음향 피드백이 발생하기 쉽고, 위상이 다르면 음향 피드백을 억제 할 수 있다[3].

음향 피드백 경로의 특성이 일정하다면 피드백 경로의 임펄스 응답을 이용하여 피드백 신호를 제거 할 수 있다. 그러나 보청기에서 음향 피드백 경로는 항상 바뀌므로 효과적인 피드백 제거기는 적응 필터를 이용하여 변화하는 피드백 경로를 지속적으로 추정할 수 있어야 한다.

변화하는 피드백 경로를 추정하기 위해서 많은 피드백 제거 알고리즘이 개발되어 왔다. 적응 필터를 사용하는 대표적인 피드백 제거 알고리즘은 LMS(least mean squares) 계열의 알고리즘이다[5]. LMS 계열의 알고리즘은 간단한 구조와 적은 계산량을 가지고 있지만 입력 신호의 상관성이 높은 유색 신호에서는 수렴 성능이 매우 떨어지는 단점을 가지고 있다.

본 논문에서는 이러한 LMS 계열의 알고리즘의 단점을 극복하기 위하여 음성 검출기를 사용한 가변 스텝 사이즈 적응 알고리즘을 제안 한다. 음성 검출기를 사용하여 음성 구간과 비음성 구간을 분리하여 상황에 맞는 스텝 사이즈를 적용하여 상관관계가 높은 유색 신호에서도 빠른 수렴 성능과 높은 적응성을 갖도록 하였다. 사용된 피드백 제거 알고리즘은 정규화된 LMS 알고리즘이며, 음성 검출기로는 GSAP(global speech absence probability)를 사용하였다. 제안된 알고리즘은 컴퓨터 모의실험을 통하여 그 성능을 검증하였다.

 

2. 제안한 음향 피드백 제거기

2.1 제안한 음향 피드백 제거기의 구조

제안한 음향 피드백 제거기는 정규화된 LMS 적응 필터를 사용하여 구한 오차 신호를 이용한다. 그림 1은 제안한 음향 피드백 제거기의 블록선도를 나타낸다. 연속 적응시 스템의 구조에 정규화된 LMS 적응 필터를 사용하고 GSAP 알고리즘을 이용하여 적응 필터의 스텝 사이즈를 가변적으로 적용하였다.

그림 1음향 피드백 제거기의 블럭선도 Fig. 1 Block diagram of proposed acoustic feedback canceller

그림 1에서 x(n)은 입력 신호, y(n)은 피드백 신호이다. 입력 신호와 피드백 신호가 더해져서 d(n)이 되고, forward path를 지나 지연된 출력 신호는 적응 필터를 거쳐 (n)이 된다. 에러 신호 e(n)은 d(n)과 (n)의 차로 만들어진다. Forward Path는 G(z)=G0Z−1 로 표현 될 수 있는데 여기 서 G0는 증폭 이득을 나타내고 Z- Δ 는 시간 지연을 나타낸 다. 적응 필터에서는 feedback path의 필터 계수를 추정하여 y(n)에 가까운 (n)을 만든다. 최종 출력인 s(n)은 다음 식 (1)에 의해서 계산된다.

최종 출력 s(n)은 에러신호 e(n)에 증폭 이득인 G0를 곱한 신호를 시간 지연을 통해 얻어진다. 적응 필터는 얻어진 최종 출력 s(n)을 필터의 입력으로 받아 계수를 조절하게 되는데 계수를 조절할 때 스텝 사이즈는 GSAP 알고리즘을 통해 결정된다.

2.2 기반 알고리즘

2.2.1 LMS 알고리즘

LMS 계열의 알고리즘에는 LMS 알고리즘과 NLMS 알고 리즘이 있다. NLMS 알고리즘은 LMS 알고리즘의 정규화한 알고리즘이다. LMS 계열의 알고리즘은 구조가 간단하고 계산량이 적으며 빠른 수렴 속도를 장점으로 널리 이용되는 알고리즘이다.

조절 가능한 계수들 {h(k),0 ≤ k ≤ N-1}을 갖는 FIR 필터가 있다고 가정하였을 때,

여기서 {x(n)}은 입력 신호이고, {y(n)}은 그에 해당하는 출력 신호이다. 또한 FIR 필터와 출력을 비교할 원하는 신호 {d(n)}이 있다고 가정하면, d(n)과 y(n)의 차를 구함으로써 오차신호 {e(n)}을 만들 수 있다. 즉,

필터의 계수들은 오차 제곱들의 합을 최소화하도록 선택 한다. 그러므로

여기서 rdx(k)와 rxx(k)의 정의는 다음과 같다.

여기서 {rdx(k)}는 원하는 출력 신호 {d(n)}과 입력 신호 {x(n)}의 상호상관(cross-correlation) 신호이고, {rxx(k)}는 {x(n)}의 자기상관(auto correlation) 신호이다.

오차 제곱의 합 ɛ은 FIR 필터 계수들의 2차 함수이다. 따라서 필터의 계수들 {h(k)}에 대하여 ɛ을 최소화할 때, 일련의 선형 방정식들이 만들어진다. ɛ을 필터의 각 계수에 대하여 미분하면 다음과 같은 식을 얻을 수 있다.

그러므로

이것은 최적의 필터 계수들을 만들어내는 선형 방정식들의 집합이다. 식 (8)을 직접 풀기 위해서는 입력 신호의 자기상관 신호 {rxx(k)}, 원하는 출력 신호 {d(n)}과 입력 신호 {x(n)}의 상호상관 신호 {rdx(k)}를 계산해야 한다. 하지만 LMS 알고리즘은 상관 신호 {rxx(k)}와 {rdx(k)}를 명시적으로 계산하지 않고, 재귀적 경사법을 사용하여 ɛ의 최소값과 최적 필터 계수들을 찾아준다.

먼저, {h(k)}의 임의의 초기값을 {h0(k)}라 할 때, 각각의 새로운 출력 표본 {x(n)}을 적응 FIR필터에 인가하여 그에 해당하는 출력 {y(n)}을 계산한 후에, 오차신호 e(n)=d(n)-y(n)을 만들고, 다음 방정식에 따라 필터의 계수들을 새로 업데이트한다.

여기서 Δ는 스텝 사이즈 매개변수이고, x(n-k)는 시간이 n일 때 필터의 k번째 탭에 위치한 입력 신호의 표본이다 [6].

LMS 계열의 알고리즘은 구조가 간단하면서도 빠르고 안정적인 수렴 성능을 가지고 피드백 경로를 정확하게 추정할 수 있는 장점을 가지나, 입력 신호의 상관관계가 높은 유색 신호에서는 고유치 분포율이 증가하여 수렴 성능이 낮아지는 문제점이 있다.

2.2.2 GSAP 알고리즘

음성신호를 x, 음성 신호에 더해지는 잡음 신호를 n이라 하고 그들의 합을 y로 가정한 후 푸리에 변환을 취하면,

여기서 k는 변환 축에서 계수의 위치를 나타내고, t는 시간 축에서 프레임 인덱스를 나타낸다. (10)번 식을 이용하여 음성 부재와 음성 존재의 두 가지 상태를 가정 할 수 있다.

여기서 Y=[Y1,Y2,...,YM] N=[N1,N2,...,NM] X=[X1,X2,...,XM]를 나타내며 다음의 식(12)을 이용하여 global SAP를 계산 할 수 있다.

여기서 p(H0)는 음성부재의 선행 확률을 나타낸다. 각 주파수 bin에서 스펙트럼 구성 요소는 통계적으로 독립이라 가정하면 식(12)은 식(13)로 변환된다[7].

여기서 을 나타내며, Λ(Yk(t))는 k번째 주파수 bin의 우도비를 나타낸다. 잡음과 깨끗한 음성의 스펙트럼이 complex Gaussian 분포를 따른다는 가정에서 H0와 H1의 확률밀도함수는 다음과 같다[8].

여기서 λs,k와 λn,k 깨끗한 음성과 잡음의 분산을 나타낸다. 따라서 Λ(Yk(t))는 다음 식(16)와 같이 나타낼 수 있다 [9].

여기서 이고 이다.

 

3. 모의 실험

3.1 모의 실험의 환경

모의 실험에서 forward path의 증폭 이득으로는 20dB의 이득을 얻기 위해서 G0=10의 값을 사용하였으며 128샘플 의 시간 지연을 사용하였다. 그리고 피드백 제거기의 성능 평가를 위한 지표로는 misalignment를 사용 하였다. misalignment는 모의 실험에서 사용된 실제 피드백 경로의 필터 계수와 적응 알고리즘이 추정한 필터 계수를 비교하여 나타내는 수치로써 필터 계수간의 불일치 정도 즉, 적응 알고리즘이 얼마나 가깝게 실제 피드백 경로의 필터 계수를 추정하였는지를 나타내는 척도이다.

여기서 ωopt는 실험에 사용된 실제 피드백 경로의 필터 계수이고 ω는 적응 필터가 추정한 필터 계수이다.

그림 2와 3은 모의 실험에 사용된 피드백 경로의 임펄스 응답을 나타낸다. 피드백 경로는 64 탭을 갖는 FIR 필터를 사용하였다.

그림 2모의 실험에 사용된 피드백 경로의 임펄스 응답 Fig. 2 Impulse response of feedback path using in simulation

그림 3피드백 경로가 바뀌는 경우에 사용된 임펄스 응답 Fig. 3 Impulse response of feedback path using in feedback path change simulation

그림 4에서는 모의 실험에 사용할 스텝 사이즈를 결정하기 위하여 백색 잡음을 입력 신호로 사용하고, 80 샘플의 시간지연, G0=10 이득을 사용하여 각각의 misalignment를 측정하여 스텝 사이즈에 따른 성능을 비교하였다. 결과를 살펴보면 스텝 사이즈가 크면 수렴 속도는 빠르나 불일치 정도가 높고 작을수록 수렴 속도는 느리지만 불일치 정도가 낮은 것을 알 수 있다. 수렴 속도와 불일치 정도는 상충 (trade-off) 관계로서 상황에 맞게 적절하게 조절되어야 한다.

그림 4스텝 사이즈 선택을 위한 모의 실험 Fig. 4 Simulation result to select step-size

그림 5에서는 모의실험에 사용된 실제 음성 신호의 파형을 나타내고 있다. 음성신호는 한국어 2개의 문장으로 이루어져있으며 약 4.7초의 길이를 가지고 16KHz의 샘플링율을 가지고 있다. 이 음성 신호에 0dB의 백색잡음을 더하여 최종 입력 신호로 사용하였다.

그림 5모의 실험에 사용된 실제 음성 신호의 파형 Fig. 5 Speech waveform using in simulation

3.2 모의 실험 결과

그림 6과 그림 7 그리고 그림 8에 제안된 피드백 제거기의 성능 평가를 위하여 실제 음성에 잡음을 더한 입력 신호를 적용하였을 때의 결과를 나타내었다. 수렴 성능과 수렴 속도의 명확한 확인을 위하여 dB를 기준으로 삼았으며 그림 5에는 제안된 알고리즘과 고정된 스텝 사이즈를 사용하는 NLMS 알고리즘과 비교하였고 그림 7에는 VSS-AP[10] 알고리즘과 비교하였으며 그림 8에는 피드백 경로가 변경 될 때의 알고리즘의 성능을 비교하였다.

그림 6에 나타낸 고정된 스텝 사이즈를 사용하는 알고리즘과 제안된 알고리즘의 성능을 비교해 보면 먼저 고정된 스텝 사이즈를 사용하는 알고리즘에서 스텝 사이즈가 큰 경우 빠른 수렴 속도를 가지나 불일치성이 높고, 스텝 사이즈가 작은 경우 불일치성은 낮으나 느린 수렴 속도를 가지고 있음을 볼 수 있다. 하지만 제안된 알고리즘은 GSAP 알고리즘을 이용해 음성 구간과 비음성 구간을 나누어 스텝사이즈를 가변적으로 적용함으로써 빠른 수렴 속도와 낮은 불일치성을 가짐을 볼 수 있다. 스텝 사이즈가 큰 기존 알고리즘과 거의 동일한 수렴 속도를 갖으면서 낮은 불일치성을 보이고, 스텝 사이즈가 작은 기존 알고리즘 보다 빠른 수렴 속도를 가지면서 더 낮은 불일치성을 보임으로써 제안된 알고리즘은 기존 알고리즘보다 우수한 성능을 가지고 있음을 볼 수 있다.

그림 6고정 스텝 사이즈 알고리즘과 제안된 알고리즘의 성능 비교 Fig. 6 Performance comparison result between fixed step-size and proposed algorithm

그림 7VSS-AP 알고리즘과 제안된 알고리즘의 성능 비교 Fig. 7 Performance comparison result between VSS-AP and proposed algorithm

그림 8피드백 경로 변경 후 알고리즘의 성능 비교 Fig. 8 Performance comparison result when feedback path change

그림 7과 8에는 VSS(variable step-size) APA(affine projection algorithm)와 제안된 알고리즘의 성능을 비교하였 다. 여기서 k는 투사 차수로써 k가 1인 경우는 NLMS를 나 타낸다. 제안된 알고리즘은 VSS-AP 알고리즘과 비슷한 수렴 속도를 가지면서 더 낮은 불일치성을 보임을 알 수 있다. 특히 음성 구간에서는 그 차이가 극명하게 나타남을 알 수 있다.

 

4. 결 론

음향 피드백은 보청기 사용자들의 가장 큰 불만 중에 하나이다. 이러한 음향 피드백을 제거하기 위하여 지금까지 여러 알고리즘들이 제안되어왔고 그 중 대표적인 것이 LMS계열의 알고리즘이다. LMS계열의 알고리즘은 구조가 간단하면서 빠르고 안정적인 수렴 성능을 가지며 피드백 경로를 정확하게 추정하면서도 계산량이 적어 보청기의 소비전력 측면에서 큰 장점을 가지고 있으나 입력 신호의 상관 관계가 높은 유색 신호에서 고유치 분포율이 증가하여 수렴 성능이 낮아지는 문제점이 있다. 본 논문에서는 이러한 LMS계열의 알고리즘의 문제점을 해결하기 위하여 음성 검출기를 이용한 가변 스텝 사이즈를 갖는 새로운 알고리즘을 제안하였다. 그리고 제안된 알고리즘을 사용하여 음향 피드백이 일어나는 상황에서 실제 음성 신호를 이용한 모의실험을 실시하였다. 그 결과 제안된 알고리즘은 고정된 스텝 사이즈 알고리즘과 비교 하였을 때는 높은 적응성을 갖는 상황에서 빠른 수렴 속도를 가짐을 알 수 있었고, VSS-APA 알고리즘과 비교 하였을 때는 비슷한 수렴 속도에서 더 높은 적응성을 가짐을 알 수 있었다.

결과적으로 본 논문은 보청기의 음향 피드백 제거 알고리 즘으로써 여러 가지 장점을 가지고 있으나 유색신호에서의 수렴 성능이 낮아지는 문제점을 가진 LMS계열의 알고리즘의 단점을 해결하는 알고리즘을 제안함으로써 보청기에서 음향 피드백을 해결하는 좋은 솔루션이 될 수 있다.

References

  1. Maxwell, J. and Zurek, P., "Reducing acoustic feedback in hearing aids," IEEE Trans. Speech Audio Processing, vol. 4, pp. 304-313, July 1995
  2. H. S. An, G. S. Park, Y. Y. Jeon, Y. R. Song, S. M. Lee, "The Assessment on the Sound Quality of Reduced Frequency Selectivity of Hearing Impaired People," Trans. KIEE., vol. 60, no.6, KIEE, pp. 1196-1203, 2011 https://doi.org/10.5370/KIEE.2011.60.6.1196
  3. J. H. Lee, K. W. Lee, "Hearing aid evaluation," Hackjisa, ISBN 978-89-5891-106-7, 2009
  4. M. G. Siqueira, A. Alwan, R. Speece, "Steady-state analysis of continuous adaptation in acoustic feedback reduction systems for hearing-aids," IEEE Trans. Speech and Audio Processing, vol. 8, no. 4, pp. 443-453, Jul. 2000 https://doi.org/10.1109/89.848225
  5. Widrow, B., McCool, J. M., Larimore M., and Johnson, C. R., "Stationary and nonstationary learning characteristics of the LMS adaptive filter," Proc. IEEE, vol. 64, no. 8, pp. 1151-1162, Aug. 1976 https://doi.org/10.1109/PROC.1976.10286
  6. Vinay K. Ingle, John G. Proakis, "Digital Signal Processing using Matlab," THOMSON, ISBN 978-89-92675-46-8, 2007
  7. Y. S. Park, H. S. An, S. M. Lee, "Speech enhancement algorithm based on teager energy and speech absence probability in noisy environments," Trans. IEEK., vol. 49, no. 3, IEEK., pp. 81-88, 2012 https://doi.org/10.5573/ieek.2012.49.12.081
  8. S. Y. Lee and N.S. Kim, "A statistical model based residual echo suppression," IEEE Signal Processing Letters, vol. 14, no. 10, pp. 758-761, Oct. 2007. https://doi.org/10.1109/LSP.2007.896452
  9. N. S. Kim and J. H. Chang, "Spectral enhancement based on global soft decision," IEEE Signal Processing Letters, vol. 7, no. 5, pp.108-110, May 2000 https://doi.org/10.1109/97.841154
  10. H. C. Shin, A. H. Sayed, and W. J. Song, "Variable step-size NLMS and affine projection algorithms," IEEE Signal Processing, vol. 11, no. 2, pp. 132-135, Feb. 2004 https://doi.org/10.1109/LSP.2003.821722