• 제목/요약/키워드: Voice Diagnosis System

검색결과 28건 처리시간 0.019초

성대진동검사의 최신 지견 (Recent Advances in Examination of Vocal Fold Vibration)

  • 이진춘;배인호
    • 대한후두음성언어의학회지
    • /
    • 제32권1호
    • /
    • pp.1-8
    • /
    • 2021
  • Human vocal cords vibrate as quickly as 100-250 times per second, so it is impossible to observe them with normal endoscopic diagnostic equipment. High-speed videolaryngoscopy (HSV) allows the visualization of non-periodic vibratory motion of vocal fold beyond the limitation of videostroboscopy. New developed post-processing methods that converts HSV to two-dimensional videokymography (2D VKG) using U-medical image-processing software can provide quantitative information on vocal fold mucosa vibration. Multifunctional laryngeal examination system is composed of 3 kinds of examinations such as HSV, 2D scanning digital kymography (2D DKG) and line scanning digital kymography (DKG). Evaluation of entire vocal cord vibratory pattern in each cord is possible using 2D DKG and a faster and more reliable quantitative information can be obtained. As this system is used in clinical and research, it is expected to bring much advances to the diagnosis of voice disorders. In this review, I will introduce the principles and advantages on examination of the vocal fold vibration, which is in the spotlight recently, and proceed with the literature review.

사상체질음성분석기(四象體質音聲分析機)(PSSC)를 통한 한국인 성인남성(成人男性)의 체질별(體質別) 음향특성연구(音響特性硏究) - 단문(短文)을 중심으로 - (A Study on the Characteristics of the Korean Adult Male Sound According to Sasang Constitution Using PSCC with a Sentence)

  • 최재완;송학수;한동윤;조성언;왕향란;전종원;김달래;유준상
    • 사상체질의학회지
    • /
    • 제18권3호
    • /
    • pp.64-74
    • /
    • 2006
  • 1. Objectives and Methods A Study on the Characteristics of the Korean Adult Male Sound according to Sasang Constitution using PSSC with a Sentence. Sasang Constitutional Medicine(SCM) is the one of the traditional Korean Medicine. It classifies people into four categories like Taeyangin, Soyangin, Taeumin and Soeumin. The rule to classify is Appearance and Body Shape, Facial Appearance and Speech, Character and Talents and Diseases and Medications. This study was done to investigate the relationships between Voice and Sound parameters using PSSC(Phonetic System of Sasang Constitution) in a sentence. Experimental Participants were 195 Korean adult males including 1 Taeyangin, 37 Soyangin, 105 Taeumin and 52 Soeumin. Sasang Constitutional specialist used PSSC and Korean Medical Diagnosis to classify participants into four constitution. 2. Results In Pitch segment, Soyangin's Center freq.(4) was significantly high compared with Taeyangin and Taeumin groups. Soyangin's and Soeumin's Center freq.(6) was significantly high compared with Taeyangin and Taeumin groups. In APQ segment and Octave segment, there were no significant differences among four groups. In Shimmer segment, Taeumin's F Shimmer(1) and F Shimmer(2) were significantly high compared with Taeyangin and Soyangin groups. In Energy segment, Taeyangin's 2k-4k total sum, 2k-4k dev., C dev., C# dev. and D S.D. were significantly high compared with other groups. In Recording time segment, there was no significant difference among four groups. More Taeyangin cases and the other parameters are needed to determine constitution using PSSC and to make PSSC effective. 3. Conclusions From above result, there is the possibility of efficiency standard guide for constitution diagnosis by analyzation og voice.

  • PDF

모바일 핸드셋을 이용한 자동차 진단 (Vehicle Diagnostic System using Mobile Handset)

  • 박동규;어윤;김성엽;송업조;김수규;이도훈
    • 한국멀티미디어학회논문지
    • /
    • 제10권10호
    • /
    • pp.1338-1346
    • /
    • 2007
  • 모바일 단말기의 성능과 해상도가 발전함에 따라 모바일 단말기는 단순히 음성통신 장치가 아닌 다양한 서비스를 제공하는 도구로 인식되기에 이르게 되었다. 또한 인간과 기계간의 사용자 인터페이스의 진보로 인하여 전자장치와 임베디드 시스템 기술에 기반한 차량의 진단과 관리 기술이 출현하고 있다. 본 논문에서는 모바일 단말기에서 OBD-II(On Board Diagnostics version II) 프로토콜을 이용하여 자동차를 진단하는 기능에 대하여 설명하고자 한다. 2005년 이후 국내에 출시되는 모든 자동차에는 진단 시스템 표준인 OBD-II 시스템 장착이 의무화되었다. 본 연구에서는 이러한 배경을 바탕으로 OBD-II표준을 기반으로 한 프로토콜 변환기와 개인소지 휴대폰만으로 자동차의 진단이 가능한 자동차 자기진단시스템을 개발하게 되었으며, 여기에 필요한 사용자 인터페이스는 모바일 표준 플랫폼인 WIPI에서 구현하였다.

  • PDF

디지털 선박 내 다차원 센서 스트림 데이터의 효율적인 처리 (Efficient Processing of Multidimensional Sensor stream Data in Digital Marine Vessel)

  • 송병호;박경우;이진석;이경효;정민아;이성로
    • 한국통신학회논문지
    • /
    • 제35권5B호
    • /
    • pp.794-800
    • /
    • 2010
  • 디지털 선박에서는 선박 내의 각종 센서로부터 측정된 디지털 데이터에 대한 정확하고 에너지 효율적인 관리가 필요하다. 센서 네트워크에서 대용량의 입력 스트림 데이터 전체를 데이터베이스에 모두 저장하여 한꺼번에 처리하는 것은 효율적이지 못하다. 본 논문에서는 디지털 선박 내 센서 네트워크의 에너지 효율성과 정확성을 고려하여 여러 센서에서 지속적으로 들어오는 다차원 스트림 데이터의 처리 성능을 높이고자 한다. 디지털 선박 내에 다수 개의 센서(온도, 습도, 조도, 음성 센서)를 배치하고 효율적인 입력 스트림 처리를 위해서 슬라이딩 윈도우 기반으로 질의를 처리하고 Mjoin 방법으로 다중 질의 계획을 수립한 후 SVM 알고리즘을 통해 저장 데이터를 축소하는 효율적인 처리 기법을 제안한다. 분류된 데이터들 중 필요하지 않는 데이터는 자동으로 데이터베이스에서 삭제되고 유효한 데이터는 디지털 선박 모니터링 시스템에 이용하였다. 35,912개의 데이터 집합을 사용하여 실험한 결과 실제 입력되는 데이터보다 저장 공간의 18.3%를 축소함으로써 효과적임을 보였다.

ATM/B-ISDN 통신망 기반의 멀티미디어 원격의료 정보시스템을 위한 PC용 GUI 구현 (The Implementation of a PC GUI for a Multimedia Tele-Medical System based on ATM / B-ISDN)

  • 정연기;김영탁
    • 한국멀티미디어학회논문지
    • /
    • 제1권1호
    • /
    • pp.45-55
    • /
    • 1998
  • 원격의료정보 시스템에서는 멀티미디어 정보의 전송을 위한 광대역 통신망과 멀티미디어 원격 의료 정보를 쉽게 사용할 수 있게 하는 단말장치가 기본적으로 구성되어야 한다. 특히 멀티미디어 원격 의료정보 시스템의 단말기에는 의료진이 쉽게 사용할 수 있도록 병원의 기존 진료 절차와 거의 동일한 형태의 진료업무가 실행될 수 있는 멀티미디어 GUI 환경이 제공되어야 한다. 본 논문에서는 ATM/B-ISDN을 기반으로 한 멀티미디어 원격의료정보 시스템에서의 PC용 멀티미디어 원격진료 GUI(TeleMe야_GUI)를 구현하였다. ATM/B-ISDN 통신망 환경에서 워크스테이션을 멀티미디어 데이터베이스 서버로 두고, 각 의료진이 사용하는 PC의 TeleMe야_GUI에서 멀티미디어 진료 자료들을 원격 검색 할 수 있도록 하기 위한 클라이언트/서버간의 통신 프로토콜을 제안하였다. 이러한 ATM 통신망과 통신 프로토콜을 기반으로 하여 PC용 GUI를 구현하였다. 본 논문에서 제시하는 TeleMedi_GUI를 이용하면 의사는 X-ray/CT와 같은 영상정보나 X-ray 판독소견과 같은 음성정보를 이용하여 환자를 효율적으로 진료할 수 있다. 이 연구결과는 1차 진료기관과 2차 종합 진료기관간의 의료정보 서비스망으로 활용될 수 있으며, 병원 내부에서도 멀티미디어 진료시스템 개발에 활용될 수있다.

  • PDF

한국성인(韓國成人)의 사상체질음성분석기(絲狀體質音聲分析機)를 이용한 체질별(體質別) 음향특성(音響特性) 연구(硏究) (A Study on the Acoustic Characteristics of the American Adults Using Phonetic System for Sasang Constitution)

  • 신미란;김달래;유준상
    • 사상체질의학회지
    • /
    • 제19권3호
    • /
    • pp.75-88
    • /
    • 2007
  • 1. Objectives The purpose of this study was to objectively diagnose American male and female's production of two vowels /a, i/ by Sasang Constitution. 2. Methods It was analyzed the constitutional characteristics of the American adults voices with PSSC-2004. of 134 cases of vowels /a, i/ with a duration of $2.5{\sim}3$ seconds were inputted in PSSC-2004 and analyzed into 40 factors. 3. Results and Conclusions 1) APQ In the male group's production of vowel /a/, the Soyangin's APQ(l), APQ(3) and APQ(4) were significantly high compared with those of Taeumin and Soeumin. 2) Shimmer In the male group's production of vowel /a/, Soeumin's Octave1 Shimmer was significantly low compared with that of Taeumin and Soeumin. In the male group's production of vowel /i/, Soeumin's D-Shimmer was significantly low compared with that of Taeumin and Soeumin. In the female group's production of vowel /a/, the Soyangin's C-Shimmer was significantly high compared with that of Taeumin and Soeumin. 3) Octave In the male group's production of vowel /a/, the Soyangin's Octave3, Octave4, Octave5, Octave6 and Octave1 Ratio were significantly high compared with those of Taeumin and Soeumin. In the male group's production of vowels /a, i/, the Soyangin's Octave4 was significantly high compared with that of Taeumin and Soeumin. 4) Energy In the male group's production of vowel /a/, the Soyangin's Time Domain Total Sum /Time Domain Count, Freq Domain Total Sum /cnt(0), 0k-4k Total Sum, Dev., A(A#, C, E, D#, E, F#) tot E, and A(C,, D#, F#) Dev. were significantly high compared with those of Taeumin and Soeumin. In the male group's production of vowel /i/, the Soyangin's Time Domain Total Sum /Time Domain Count, Freq Domain Total Sum /cnt(0) and 0k-4k Total Sum, Dev. were significantly high compared with those of Taeumin and Soeumin. 5) Peak In the male group's production of vowels /a/ and /i/,, the Soyangin's Peak1 Ratio was significantly low compared with that of Taeumin and Soeumin. In the male group's production of vowels /a/ and /i/,, the Soyangin's Peak10 Ratio, Time Domain Peak Total/Total Energy Sum, Time Domain Peak Dev. and Total/Total Dev. Sum were significantly high compared with those of Taeumin and Soeumin. 6) It is necessary to expand the research of the acoustic analysis of American and Korean to other countries in the diagnosis of the Sasang Constitution by using the voice characteristics.

  • PDF

다단계 신경회로망을 이용한 후두질환 감별진단 시스템의 개발 (A Basic Study on the Differential Diagnostic System of Laryngeal Diseases using Hierarchical Neural Networks)

  • 전계록;김기련;권순복;예수영;이승진;왕수건
    • 대한의용생체공학회:의공학회지
    • /
    • 제23권3호
    • /
    • pp.197-205
    • /
    • 2002
  • 본 연구에서는 잡음이 존재하는 공간에서 획득한 음성신호로부터 후두질환을 감별진단 할 수 있는 분류기를 구현하였다. 이를 위해 후두질환 환자로부터 수집한 /아/ 모음에 잡음을 혼입하여 음성 신호를 획득하였고, 여러 가지 후두질환을 감별진단 할 수 있는 파라미터를 추출하였으며. 이를 입력으로 하는 계층적 신경회로망을 구성하여 후두질환을 감별진단 하도록 하였다. 감별진단용 분류기는 다섯 단계의 계층적 신경회로망으로 구성하였다 첫 번째 신경회로망은 정상 양성 후두질환과 악성 후두질환을. 두 번째 신경회로망은 정상과 양성 후두질환을 감별진단 하도록 하였다 그리고 세 번째 신경회로망은 양성 후두질환 중 후두용. 성대결절 후두마비를 감별진단 하도록 하였으며. 네 번째와 다섯 번째 신경회로망은 성문암 1-4기를 감별진단 하도록 구성하였다. 분류기에 적용된 신경회로망은 다층퍼셉트론 구조로써 역전파 알고리듬으로 학습시켰으며, 선형변환 표준점수변환 등 전처리과정을 적용하여 분류기의 성능을 개선하였다. 후두질환의 감별진단 결과 후두용 88.23%. 정상. 성대결절. 후두마비 100%. 성문암 1기 90%, 성문암 2-4기 100%의 감별진단율을 관찰할 수 있었다.

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.