1. 서 론
의료기술의 발전과 함께 재활복지에 대한 관심이 증가하며 다양한 재활의료기기가 연구 및 개발되고 있다[1-5]. 그 중에서도 언어치료기기는 청각장애, 구개열, 마비말장애와 같은 의사소통장애인들에 대한 재활과 복지의 지원으로 그 관심도가 함께 증가하고 있는 추세이다. 근긴장저하(hypotonia), 약증(weakness) 등의 임상적 특성을 갖는 이완형 마비말장애(flacciddysarthrias), 입술 또는 입천장이 완전하게 융합되지 못한 구순구개열 환자들은 정상인에 비해 비강음 수치가 높게 나타난다. 특히 연인두매커니즘이 정상적으로 작동하지 않는 연인두기능부전(velopharyngeal incompetence, VPI) 환자의 경우 성대진동에 의해 만들어진 후두음원이 기질적·기능적 결함으로 인해 비정상적으로 증폭되어 공명장애의 하위유형인 과다비성을 초래할 수 있다[6-11]. 이와 같이 구어산출매커니즘의 한 요소인 공명에 장애가 발생할 경우, 일상적인 의사소통에 어려움을 갖게 된다. 이를 중재하기 위해 언어치료사들은 시각, 청각, 촉각 등의 감각을 이용하지만, 이 방법은 정확한 수치를 나타낼 수 없어 치료사의 주관적인 판단에 의존하는 경우가 대다수이다. 일부 언어치료사의 경우 나조미터(Nasometer)와 같은 측정 장비를 사용하여 환자의 비강음 수치를 정량적으로 평가하고 있다[12-14]. 그러나 기존의 나조미터의 경우 관련 분야의 연구 및 대중화가 이루어지지 못해 많은 문제점을 동반하고 있다.
공명장애치료를 위해서는 구강 및 비강음에 해당하는 정확한 크기의 음향신호를 포집하여야 하며, 특히, 구강 및 비강음 사이의 간섭영향이 없어야 한다. 하지만, 기존의 나조미터의 경우 구강음이 비강음을 포집하는 마이크로폰에 영향을 미치는 음향 피드백에 대한 영향 및 신호처리기법이 미비한 실정이며, 대부분 음향피드백을 간과하고 측정된 데이터 및 치료사들의 주관적인 판단에 의존하고 있다. 이러한 음향 피드백의 영향은 구강에서 발생된 음향신호가 비강 마이크로폰에 영향을 미침으로서 비음치(nasa-lance) 연산에 낮은 신뢰도를 야기시킨다[12]. 최근에는 구강 및 비강음간의 간섭영향을 최소화 하기 위해 차폐된 마스크형태의 나조미터가 출시된 바 있으나 여전히 사용에 제한적이다.
본 논문에서는 범용적으로 사용되는 분리판 형태나조미터가 가지는 구조적 문제점과 구강 및 비강음사이에서 발생하는 음향피드백의 영향을 고찰하였으며, 나조미터내 마이크로폰의 감도 및 THD(total harmonic distortion) 특성을 분석하였다. 또한, 성인 남녀 각각 3명의 피시험자를 통해 표준 단어를 발화하였을 때 나조미터내 비강 및 구강 마이크로폰을 통해 포집되는 음성신호의 주파수특성, 상관계수 및비음치를 분석하였으며, 최근 주목받고 있는 차폐된마스크 형태의 나조미터와 특성을 비교하였다. 실험 및 비교를 통해 범용의 분리판 형태를 가지는 나조미터보다 마스크 형태의 나조미터에서 약 3∼15% 높게 측정된 것을 확인하였으며, 향후 음향피드백 경감및 비음치 산출 최적화를 위한 나조미터용 신호처리기법의 필요성을 고찰하였다.
2. 나조미터의 구조 및 특성
공명장애 환자의 비음치 측정을 위한 나조미터 개념도는 Fig.1과 같다. 나조미터의 모듈내에는 분리판 아래 구강 음을 포집하기 위한 구강 마이크로폰,분리판 위쪽에는 비강음을 포집하기 위한 비강 마이크로폰이 위치하고 있으며, 이들 마이크로폰은 음성발화시에 동시에 음향신호를 수집하여 아래의 식 (1)에 기반하여 비음치를 연산하게 된다[12-14].
\(\text {Nasalance}[\%]=\frac{\text {Nasal sound} \text {density}}{\text {Oral sound density}+\text {Nasal sound} \text {density}} \times 100\) (1)
본 논문에서는 분리판 형태의 Glottal社 나조미터를 이용하여 마이크로폰 특성을 분석하였다. 나조미터의 구성요소중 가장 중요한 부품은 외부의 소리신호를 포집하여 신호처리 장치로 전달하는 마이크로폰이며, 마이크로폰은 입력장치로서 우수한 감도(Sensitivity) 및 넓은 주파수 대역이 요구된다. Fig. 2는 Glottal社 나조미터의 마이크로폰 특성 분석을 위한 실험 개념도이며, 실험환경 사진 및 결과는 Fig. 3과 같다.
Fig. 1. Schematic of the conventional nasometer for a patient.
Fig. 2. Experimental schematic of the conventional nasometer.
Fig. 3. Experimental environment (a) picture and (b) results of the microphone sensitivity at the nasometer.
표준 스피커(FR16WP,Visaton)를 통해 0.1~10kHz 대역,94dBSPL의 puretone 음을 1 m 거리에 있는 나조미터의 마이크로폰 및 기준 마이크로폰(ER10B, Etymotic.)에 인가하였으며, 신호발생 및 수집장치(NI DAQ-9137, National Instruments)를 통해 각각의 마이크로폰 감도를 측정하였다. 구강 및비강 마이크로폰은 각각 약 1kHz구간에서 공진이 발생하였으며, 구강 마이크로폰은 평균 -45dB, 비강마이크로폰은 평균 -42dB(0dB=1V/Pa)의 감도 특성을 보였다. 나조미터내 두 개의 마이크로폰 주파수특성은 유사하며 7kHz대역 이후에서 6dB 이상의 차이를 보였다. 또한, 나조미터 마이크로폰 포집신호의 왜곡도를 평가하기 위해 0.5,1,2,4kHz 대역에서의 THD를 측정하였다. 일반적으로 마이크로폰의 THD는 인가된 기준신호 이외에 주파수 대역에서 분산된 불필요한 고조파 성분으로 인한 왜곡도를 평가하는 지표로 사용되며, 식 (2)와 같이 표현 된다. THD는 fundamental 주파수 I1와 harmonicsIn 성분을 이용하여 도출된다[15,16]. 또한, 최대 입력 음압 레벨은 1kHz 기준 1∼3%의 왜율에서 받아 들일 수 있는크기로 정의될 수 있다. 순음 인가에 따른 주파수 특성은 Fig. 4와 같으며, 식 (2)를 기반하여 도출된 THD 결과는 Table1과 같다.
\(T H D=\frac{\sqrt{I_{2}^{2}+I_{3}^{2}+I_{4}^{2}+\cdots}}{I_{1}}\) (2)
나조미터내 비강 및 구강 마이크로폰은 94 d BSPL입력 신호에 대하여 0.5,1,2,4kHz 대역 각각 0.098∼ 0.447의 왜율을 보였으며 특히,1kHz 공진 대역에서 높은 왜율을 보였다. 또한, 왜율 1%로 기준하였을 때 최대 입력 레벨은 100.99∼ 114.12dBSPL의 특성을 보였다. 이는 일반적인 마이크로폰의 최대입력 레벨인 110∼120dBSPL보다 약 6∼8dB 낮은 수준이지만 환자에 최근접되어 약 40∼ 60dBSPL의 평상시 발화음을 측정하는 나조미터의 특성을 고려하였을 때 문제가 되지 않는다.
Fig. 4. FFT results (a) nasal microphone at the separation type nasometer, and (b) oral microphone.
Table 1. The distortion and maximum input level of nasal and oral microphone.
3. Separation type nasometer의 음향피드백영향
분리판 형태를 포함하는 기존의 나조미터의 경우 구강에서 발생된 음향신호가 비강 마이크로폰에 포집될 수 있다. 이는 식 (1)의 비음치 산출에 있어 신뢰도에 영향을 미칠 수 있으며, 본 논문에서는 분리판형태의 나조미터에 음향피드백이 미치는 영향을 분석하였으며, 실험구성도 및 실험결과는 Fig.5와 같다.
Fig. 5. Experimental results (a) blockdiagram and (b) the acoustic feedback effect.
음향 피드백의 영향분석을 위해 표준스피커를 통해 0.1∼10kHz 대역,94dBSPL의 puretone 음을 구강 마이크로폰으로 인가하였으며, 이때 음향 피드백을 통해 비강 마이크로폰으로 포집되는 신호의 크기를 측정하여 구강 마이크로폰신호와의 차이를 산출하였다. 실험대역인 0.1∼10kHz 대역에서 평균 약8dB의 간섭영향을 확인하였으며,2kHz 대역 이상에서 다소 높아지는 특성을 보였다. 실험결과를 통해 구강에서 발화된 음향신호는 나조미터의 분리판을회절하여 비강 마이크로폰에 약 6∼12dB 가량 신호의 간섭을 일으킬 수 있으며, 이러한 영향은 실제 환자의 비음치 계산에 있어 원치 않는 높은 수치를 산출하게 된다.
4. 나조미터 구조에 따른 비음치 산출 특성
최근 주목받고 있는 차폐된 마스크 형태의 나조미터는 앞서 제기된 음향피드백의 영향을 최소화 하기 위한 목적으로 구현되었으나, 실제 임상에서는 활용도가 낮은편이다. 여전히 현장에서의 언어치료사들은 간단한 기구를 이용하여 주관적인 판단에 의존하고 있으며, 병의원에서도 범용의 분리판 형태 나조미터를 간헐적으로 사용하고 있다. 특히, 나조미터의 분리판 구조가 가져오는 음향피드백에 대한 이론적인 고찰과 영향에 대해서는 많은 견해가 존재한다.
본 논문에서는 범용의 분리판 형태 나조미터와 차폐된 마스크 형태의 나조미터를 이용하여 발화에 따른 음성신호의 주파수 특성, 상관계수 및 비음치를 산출하여 분석하였으며, 두 가지 모듈이 가지는 유의미한 차이점을 고찰하였다. 음성발화를 위한 실험대상자는 남녀 각각 3명으로 대상자 정보는 Table 2와 같다.
Table 2. The imformation of subject for nasalance analysis
시험대상자 중 여자 1번의 경우 미약한 축농증을 동반하고 있으며, 그 외 성인 남녀들은 정상이다. 시험대상자는 모음연장발성 검사어 /α/, 비음단어 /mama/ 및 /mimi/를 발화하였으며, 나조미터의 구강 및 비강 마이크로폰을 통해 발화된 음성신호를 포집하였다. 포집된 음성신호는 오디오 모듈(M-track, M-Audio)을 통해 레코딩되고 신호발생 및 수집장치로 전달되었다. 나조미터 구조에 따른 비음치 특성 분석을 위한 실험 블록도 및 사진은 Fig.6과 같다.
Fig. 6. (a) Experimental schematic and (b) environment using the separation type nasometer, and (c) closed field mask type nasometer.
분리판 및 마스크형태의 나조미터내 구강 및 비강 마이크로폰으로부터 각각 측정된 음성신호는 MATLAB 프로그램을 이용하여 주파수 분석되었으며, 분석결과는 Fig.7, 8과 같다.
Fig. 7. Measured spectrum about vocal signal of male using the separation type nasometer (a) /α/, (b) /mama/, (c) /mimi/, and measured spectrum about vocal signal of male using the mask type nasometer (d) /α/, (e) /mama/, (f) /mimi/.
Fig. 8. Measured spectrum about vocal signal of female using the separation type nasometer (a) /α/, (b) /mama/, (c) /mimi/, and measured spectrum about vocal signal of female using the mask type nasometer (d) /α/, (e) /mama/, (f) /mimi/.
Fig.7은 남자 피시험자의 /α/, /mama/, /mimi/단어에 대한 주파수 변환 결과이며, Fig.8은 여자 피시험자의 /α/,/mama/,/mimi/단어에 대한 주파수 변환 결과이다. 마스크 형태의 나조미터를 통해 측정된 음성신호(Fig. 7, 8의 (d),(e),(f))들은 분리판 형태의 나조미터를 통해 측정된 음성신호(Fig.7,8의 (a), (b), (c))들 보다 상대적으로 200Hz 기준 이상의 고주파 대역에서 성분이 억제되었으며,200Hz 이하 대역의 성분은 증가하였다. 이는 나조미터의 마스크 구조가 가지는 주파수 필터 특성을 반영한 결과이며, 상대적으로 분리판 형태보다 음향피드백의 영향에 둔감한 특성을 보인 것으로 볼 수 있다.
분리판 및 마스크 형태의 나조미터를 통해 포집된 음성신호간의 관계도를 확인하기 위해 식 (3)을 기반한 상관계수를 분석하였다. 일반적으로 상관계수는두 신호 \(x \), \(y\)의 표본 평균 \(\bar x\), \(\bar y\), 그리고 표준 편차를 이용하여 상관계수를 구할 수 있다[16]. 상관계수의 비교는 동일 단어 발화시에 구강 및 비강 마이크로폰을 통해 측정된 두 음성신호를 이용하여 분석하였다.
\(Correlationcoefficient =\frac{\sum_\limits{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum_\limits{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sum_\limits{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}}\) (3)
또한, 두 가지 형태의 나조미터를 이용하여 시험한 피시험자들의 비음치를 식 (4)를 기반하여 도출하였으며, 여기서 t1, t2는 각각 구강 및 비강 마이크로폰을 통해 측정된 음성신호의 길이이다.
\(Nasalance[\%]=\frac{\sum_\limits{n=1}^{t 1} N a s a l}{\sum_\limits{n=1}^{t 1} N a s a l+\sum_\limits{n=1}^{t 2} { Oral }} \times 100\) (4)
식 (3)과 (4)를 통해 도출된 상관계수 및 비음치결과는 Table3과 같다.
Table 3. The imformation of subject for nasalance analysis
전반적으로 모음연장발성단어 /α/의 경우 비음치가 20%미만으로 산출되었으며, /mama/, /mimi/의 경우 각각 약 40%,60∼80%로 산출되었다./α/의 경우 비음에 영향을 미치는 자음성분이 없어 낮게 나왔으며, /mama/, /mimi/는 표준 비음 단어로써 다소 높게 산출되었다. /mama/와 /mimi/의 비음수치가 상이한 이유는 /mama/의 /α/성분은 후방형 저모음특성으로써 상대적으로 설단이 아래쪽에 위치하고 /mimi/의 /i/성분은 전방형 고모음 특성으로써 설단이 위쪽에 위치하여 비강과 구강의 분리를 강화하는 기전의 결과로 예상된다[17]. 분리판 및 마스크 형태의 나조미터를 통해 산출도니 지표들의 차이는 Fig.9와 같다.
Fig. 9. Nasalance results comparison (a) males and (b) females, correlation coefficient results comparison (c) males and (d) females.
/α/,/mama/,/mimi/ 단어에 대한 남자 평균 비음치의 경우 분리판보다 마스크 형태의 나조미터에서 약 5∼10% 낮게 측정되었으며, 여자 평균 비음치의 경우도 3∼15%로 낮게 측정되었다. 구강 및 비강 음성신호간의 남자 평균 상관계수의 경우 분리판보다 마스크 형태의 나조미터에서 약 0.20∼0.45(/α/, /mama/) 높게 산출되었으며,/mimi/단어의 경우 약 0.01 미약하게 높은 결과를 보였다. 여자 평균 상관계수 역시 약 0.2∼0.38(/α/,/mama/) 높게 산출되었으며, /mimi/단어의 경우 약 0.02 높은 결과를 보였다. Fig.9를 통해 남녀모두 상관계수가 높아질수록 비음치는 낮아지는 경향을 보이며, 이는 구강과 비강의 음성신호가 유사할수록 비음치는 낮아짐을 의미한다. 음향피드백의 영향을 최소화하기 위해 고안된 마스크 형태의 나조미터는 분리판 형태의 나조미터보다 간섭영향을 덜 받게되고 상대적으로 구강 및 비강음성신호간의 상관도가 높아지는 특성을 보인다. 그리고 상관도가 높아짐으로써 피시험자의 비음치는 분리판 형태의 나조미터 결과보다 약 5∼15% 정도 낮게 나오는 결과를 보인다. 이는 나조미터내 마스크 형태의 구조가 발화된 음성의 약 200Hz 대역을 기준으로 이상의 영역에서는 주파수 성분을 억제하고 이하의 영역에서는 증폭함으로써 200Hz 미만의 대역에 분포하고 있는 비음성분과 상대적으로 유사해지는 결과를 갖는다. 이를 통해, 구강 및 비강 음성신호간의 상관도가 높아지게 되고 비음치 수치가 낮아지게 된다.
5. 결론 및 고찰
본 논문에서는 공명장애환자를 위해 일부 사용되는 범용의 나조미터 특성을 분석하였으며, 분리판 형태의 기존 나조미터가 가지는 구조적 문제점에 대해 고찰하였다. 특히, 분리판 구조가 가져오는 음향 피드백의 영향을 확인하였으며, 실험결과 약 6∼ 12dB의 크기로 비강 마이크로폰에 간섭영향을 미치는 것을 확인하였다. 이러한 음향피드백 영향은 나조미터의 정확한 비음치 산출에 문제를 야기 시킬 수 있다. 최근 음향피드백의 영향을 최소화 하기위해 고안된 마스크 형태의 나조미터가 있으나 실제 치료에 활용은 미흡한 수준이다. 또한, 구강과 비강 음을 측정하기 위한 나조미터의 음향포집구조 형태에 따른 비음치산출 연구 결과는 보고된 바 없다. 따라서, 본 논문에서는 기존 분리판 형태의 나조미터와 마스크 형태의 나조미터의 음향포집특성을 비교하였으며, 측정된 음성신호의 상관계수 및 비음치 산출을 통해 유의미한 결과를 확인하였다.
특히, 모음연장발성단어 /α/, 표준 비음 단어 /mama/, /mimi/를 피시험자 남녀 각각 3명을 통해 발화하여 임상적 유용성을 가지는 음성데이터를 취득하였으며, 주파수변환분석을 통해 음향포집구조에 따른 주파수 억제 특성을 확인하였다. 마스크 형태가 가지는 차폐구조는 약 200Hz 대역을 기준으로 저역통과필터 특성을 보이며, 이를 통해 분리판 형태의 나조미터보다 구강 및 비강 음 간의 상관도를 높이고 비음치가 상대적으로 낮게 측정되는 결과를 보인다.
또한, 본 연구를 통해서 피시험자의 단어 발화시설단의 위치에 따라 비음치가 달라지는 것을 확인하였다. 연구에 사용된 /mama/와 /mimi/ 두 단어의 경우, 후방형 저모음의 /α/, 전방형 고모음의 /i/성분이 가지는 구조적인 차이에 의해 비음치가 달라지게 된다. 따라서,/α/,/e/,/i/,/o/,/u/ 등의 모음에 따른 설단 위치를 분석하고 나조미터의 비음치 산출에 미치는 영향에 대한 연구가 추가적으로 필요하다. 이러한 기전을 바탕으로 표준화된 비음치 산출을 위한 나조미터 신호처리 알고리즘이 반영 되어야 할 것이다.
나조미터는 고가의 제품으로써 여전히 해외 선진사로부터 전량 수입해오는 실정이다. 해외 제품들은 알파벳을 기반으로하여 비음치 산출 알고리즘이 적용되어 있으며 이러한 기기들은 국내에 공명장애를 가지는 아동 및 성인 환자에겐 적합하지 않다. 최근 들어 관련 연구의 필요성과 사회적 분위기에 힘입어 다양한 한국어기반의 표준 비음치 평가 연구들이 활발히 진행되고 있으며, 이에 상응하여 관련 신호처리 알고리즘에 대한 연구가 필수적이다. 한국어는 영어와 다르게 설단의 위치와 강직도에 따라 평음, 경음, 격음 등의 다양한 음성이 발화된다. 설단의 위치는 해부학적으로 비강과 구강 사이 개폐 또는 차폐를 결정짓게 되며, 이러한 기전은 자연스럽게 비음치 산출에 영향을 미치게 된다. 본 연구결과는 나조미터의 음향포집구조에 따른 비음치 산출 영향에 대해 고찰하였으며, 향후 다양한 임상 유용성을 가지는 실험과 신호처리 알고리즘의 구현을 통해 한국형 나조미터 연구에 적용될 수 있을 것이다.
References
- A.E. Aronson, Clinical Voice Disorder , Thieme Station, New York, 1985.
- D.R. Borden and S.C. Macfarlane, The Voice and Voice Theraphy, Allyn and Bacon, Boston, 2000.
- J.E. Kang, “The Relationship between Speaker Factors and Speech Intelligibility of Children with Cleft Palate,” Communication Sciences and Disorders, Vol. 14, No. 3, pp. 338-348, 2009.
- J.N. Lee, G.H. Lee, S.D. Na, K.W. Seong, J.H. Cho, and M.N. Kim, "Noise Cancellation Algorithm of Bone Conduction Speech Signal Using Feature of Noise in Separated Band," Journal of Korea Multimedia Society, Vol. 19, No. 2, pp. 128-137, 2016. https://doi.org/10.9717/kmms.2016.19.2.128
- H.G. Shin, “Assessment and Treatment of the Cleft Palate Speech Disorder by Use of the Nasometer,” Korean Cleft Lip and Association, Vol. 11, No. 1, pp. 1-11, 2008.
- S.E. Lim, "Nasalance Scores of 5 to 7-Year-Old Korean Children," Journal of the Korean Academy of Speech-language Pathology and Audiology, Vol. 10. No. 3, pp. 71-88, 2005.
- S.G. Kang, "Study on Nasalance of in Five-age Children," Journal of the Korean Society of Special Education, Vol. 1. No. 2, pp. 12-22, 2000.
- S.J. Jang and H.J. Choi, "Effect of Percentage of Correct Consonants and Nasalance Score on the Speech Intelligibility and Acceptability in Adults with Dysarthria," Journal of Rehabilitation International Korea, Vol. 20. No. 3, pp. 67-82, 2016.
- G. Ziade, M. Kasti, and D. Sarieddine, "Clinical Application of Nasometry in Patients with Nasal Obstruction," Ear, Nose, and Throat Journal, Vol. 96. No. 10, pp. 1-4, 2017. https://doi.org/10.1177/014556131509404508
- H.S. Shim, Treatment Device for Voice Disorders, 10-1114920, Korea, 2012.
- National Rehabilitation Center, The Language Rehabilitation Treatment Method and the Language Rehabilitation Treatment Apparatus, 10-1703253, Korea, 2017.
- S.T. Woo, Nasometer to Relieve Acoustic Feedback and Method Thereof, 10-0161983, Korea, 2018.
- T. Watterson, K. Lewis, and T. Brancamp, "Comparison of Nasalance Scores Obtained with the Nasometer 6200 and the Nasometer II 6400," The Cleft Palate-Craniofacial Journal, Vol. 42. No. 5, pp. 574-579, 2005. https://doi.org/10.1597/04-017.1
- H.C. Tou, Smart Nasometer, 15/686,207, USA, 2018.
- S.T. Woo, J.H. Han, J.H. Lee, S. Cho, K.W. Seong, M. Chol, et al., "Realization of a High Sensitivity Microphone for a Hearing Aid Using a Graphene-PMMA Laminated Diaphragm," American Chemical Society Applied Materials and Interfaces, Vol. 9. No. 2, pp. 1237-1246, 2017. https://doi.org/10.1021/acsami.6b12184
- J. Eargle, The Microphone Book, Butterworth-Heinemann, Oxfordshire, 2005.
- L.J. Raphael, Speech Science Primer, Lippincott Williams and Wilkins, Baltimore, 2013.