• 제목/요약/키워드: 음성 분석

검색결과 3,062건 처리시간 0.026초

발화속도 및 강도 분석에 기반한 폐질환의 음성적 특징 추출 (Voice Features Extraction of Lung Diseases Based on the Analysis of Speech Rates and Intensity)

  • 김봉현;조동욱
    • 정보처리학회논문지B
    • /
    • 제16B권6호
    • /
    • pp.471-478
    • /
    • 2009
  • 현대인의 6대 난치병으로 분류되고 있는 폐질환은 대부분 흡연과 대기 오염으로 발병한다. 이와 같은 이유로 폐기능이 손상되어 폐포내에서 이산화탄소와 산소의 교환이 정상적으로 이루어지지 않아 생명 연장의 위험 질환으로 관심이 증대되고 있다. 이를 위해 본 논문에서는 폐질환 에 대한 음성적 특징 추출을 목적으로 음성 분석 요소를 적용한 폐질환 진단 방법을 제안하였다. 우선 폐질환을 앓고 있는 환자들과 동일한 연령, 성별대의 정상인들로 피실험자 집단을 구성하고 이들의 음성을 수집하였다. 또한 수집된 음성을 통해 다양한 음성 분석 요소를 적용하여 분석을 수행하였으며 발화속도 및 강도 분석 요소 부분에서 폐질환자 집단과 정상인 집단간의 유의성이 있음을 알아 낼 수 있었다. 결론적으로 폐질환자 집단이 정상인 집단보다 발화속도가 느리며 강도가 크게 나타나는 결과를 도출해 내었으며 이를 통해 폐질환의 음성적 특징 추출 방법을 제시하였다.

심장 질환 진단을 위한 음성분석학적 요소의 시각 특징 및 형태 추출 (Visual Features and Shape Extraction of Voice Analysis Elements for Heart Diseases Diagnosis)

  • 김봉현;이세환;박선애;가민경;오원근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.405-408
    • /
    • 2007
  • 건강관리 및 유지에 대한 현대인들의 관심이 증대되면서 삶의 질 향상을 추구하는 고령화 사회에서 성인병 및 만성질환은 매우 위험한 요인이 되고 있는 실정이다. 특히 심장 질환은 3대 사망률 중 한 부분을 차지하고 있을 정도로 위협적이며 비전염성 만성질환 중 하나이다. 그러나 모든 질환에 대한 대처 방법이 동일하듯이 조기 진단에 의한 질환 예방이 무엇보다 중요하다. 따라서 본 논문에서는 심장 질환자의 음성 신호를 획득하여 다양한 음성분석학적 요소 추출 및 분석을 통해 심장 질환과의 연관성을 파악하고자 한다. 이를 위해 본 논문에서는 기존의 음성 분석 요소에 대한 1차 실험을 검증하고 추가 음성 분석 요소들에 대한 2차 실험을 행하여 각각의 분석 요소들과 음성에 대한 형태학적 특징을 시각화하여 편리하게 심장 질환을 진단하는 기법들을 제시하고자 한다.

  • PDF

단어추출을 기반으로 한 음성 대화처리 시스템 (Spoken Dialogue Management System based on Word Spotting)

  • 송창환;유하진;오영환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.313-317
    • /
    • 1994
  • 본 연구에서는 인간과 컴퓨터 사이의 음성을 이용한 대화 시스템을 구현하였다. 특별히 음성을 인식하는데 있어서 단어추출(word apotting) 방법을 사용하는 경우에 알맞은 의미 분석 방법과 도표 형태의 규칙을 기반으로 하여 시스템의 응답을 생성하는 방법에 대하여 연구하였다. 단어추출 방법을 사용하여 음성을 인식하는 경우에는 형태소분석 및 구문분석의 과정을 이용하여 사용자의 발화 의도를 분석하기 어려우므로 새로운 의미분석 방법을 필요로 한다. 본 연구에서는 퍼지 관계를 사용하여 사용자의 발화 의도를 파악하는 새로운 의미분석 방법을 제안하였다. 그리고, 사용자의 발화 의도에 적절한 시스템의 응답을 만들고 응답의 내용을 효율적으로 관리하기 위한 방범으로 현재의 상태와 사용자의 의도에 따른 응답 규칙을 만들었다. 이 규칙은 도표의 형태로 구현되어 규칙의 갱신 및 확장을 편리하게 만들었다. 대화의 영역은 열차 예매에 관련된 예매, 취소, 문의 및 관광지 안내로 제안하였다. 음성의 오인식에 의한 오류에 적절히 대처하기 위해 시스템의 응답은 확인 및 수정 과정을 포함하고 있다. 본 시스템은 문자 입력과 음성 입력으로 각각 실험한 결과, 사용자는 시스템의 도움을 받아 자신이 의도하는 목적을 달성할 수 있었다.

  • PDF

우리나라 교사의 음성 특성과 음성장애 위험 요인에 관한 체계적 문헌고찰 (A Systematic Review on Voice Characteristics and Risk Factors of Voice Disorder of Korea Teachers)

  • 차슬기;변해원
    • 한국융합학회논문지
    • /
    • 제9권8호
    • /
    • pp.149-154
    • /
    • 2018
  • 직업적 음성 사용자들의 범위가 확대됨에 따라 음성에 대한 관심이 증가하고 있다. 특히 교사는 음성장애 위험이 높은 직업군에 포함되기 때문에 음성문제 발생과 음성장애 발병 요인에 대한 규명이 필요하다. 본 연구는 교사의 음성 특성과 음성장애 위험 요인에 대한 체계적 연구 분석을 통해 교사의 음성장애 위험 요인을 확인하고 이를 위한 기초자료를 제공하였다. 2000년부터 2018년까지 '직업', '교사', '직업적 음성 사용자', '음성', '음성장애', '위험' 키워드를 조합하여 414편의 연구가 검색되었으며 그 중 8편의 연구를 최종 분석 대상으로 선정하였다. 질적 평가는 Qualsyst: checklist for assessing the quantitative studies 항목을 수정하여 비뚤림 평가를 실시하였다. 연구 결과 교사는 음성 사용에 있어 음성의 오남용이 자주 발생하였으며 이는 환경에 영향을 받는 것으로 확인되었다. 이러한 결과를 통해 교사의 음성 오남용 환경 개선과 주기적인 음성 교육이 필요함을 제안한다.

음성모음과 신체의 상관관계 분석 (An Analysis of Correlation between Voice vowels and Human body)

  • 최인호;전종원
    • 한국항행학회논문지
    • /
    • 제14권3호
    • /
    • pp.375-383
    • /
    • 2010
  • 본 논문은 음성진단이나 음성치료를 위한 연구로서 음성과 신체의 상관관계를 분석한 것이다. 음성신호와 함께 신체의 머리와 가슴 그리고 복부에서 음성에 의한 진동파형을 측정하였으며, 이 때 사용한 음성은 모음 '아', '에', '이', '오', '우' 이다. 그 결과 모음에 따라 신체의 특징을 잘 나타내는 성분을 확인할 수 있었으며, 신체질량지수(BMI)와의 상관계수를 측정하여 음성에 의한 신체조건 진단의 활용방안을 제시하였다.

음성 인식에서 훈련 및 인식 과정에 사용되는 대상 어휘의 차이에 대한 음향 모델의 성능 평가 (Performance Evaluation of Acoustic Models According to Differences between Vocabularies in Training and Test Phases of Speech Recognition)

  • 김회린;이항섭;권오욱
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.22-27
    • /
    • 1998
  • 본 논문에서는 ETRI에서 개발한 가변 어휘 음성 인식기의 어휘 독립 음향 모델링 방법을 기술하고, 이 모델의 어휘 종속, 어휘 독립 및 어휘적응 성능을 평가하기 위하여 다 양한 고립단어 및 연속음성 DB에 대하여 실험한 결과를 분석하였다. 평가를 위하여 사용한 음성 DB로는 고립단어 음성으로 POW(Phonetically Optimized Words) 3848, PBW(Phonetically Balanced Words) 445, PBW 452, 호텔예약 244 단어, 게임 제어용 단어 등이며, 연속음성으로 일반 문장 음성 및 연속 숫자음을 이용하였다. 성능 분석 결과 40개 음소 모델만으로도 비교적 높은 인식률을 보여 주었지만, 어휘독립의 경우는 어휘종속에 비 하여 성능이 크게 낮았고, 특히 대상 어휘가 숫자음, 알파벳, 연속음 등의 경우에는 POW 데이터나 PBW 데이터만 가지고는 우수한 가변 어휘 음성 인식기를 구현하기에 한계가 있 음을 알 수 있다. 또한, 훈련 데이터의 어휘와 평가데이터의 어휘가 비슷할 경우에는 변이음 모델을 사용하면 음소 모델만을 사용할 경우에 비하여 그 성능이 우수하였지만, 일반적인 어휘독립의 상황에서는 효과가 별로 없음을 알 수 있었다.

  • PDF

음성 데이터의 지능적 분류 및 컨텍스트 분석 시스템 구현 (Intelligent Classification and Context Analysis System of Voice Data)

  • 최현석;주성환;김대천;박예찬;염상길;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.162-163
    • /
    • 2016
  • 사람은 의사소통을 위해 음성, 글자, 몸짓 등 다양한 매개체를 활용한다. 오늘날 스마트폰의 발달로 문자의 비중이 높아지고 있지만 음성 대화는 여전히 사람들 사이에서 가장 많이 사용되어지는 의사소통 수단이다. 음성 대화는 녹음해서 음성 데이터로 남길 수 있다. 음성을 녹음하는 과정은 간편하지만 녹음파일에서 원하는 데이터를 찾는 것은 많은 시간이 소모된다. 본 논문에서는 음성 데이터를 인식하여 텍스트화 시키고 문자화 된 데이터를 분석하여 사용자에게 효율적으로 분류하는 시스템을 제안한다. 이 시스템으로 사용자는 음성 데이터의 내용을 들어보지 않고 파악할 수 있으며 원하는 내용을 찾을 수도 있다.

피춰 추출 관점에서 기준 화자 수 증가에 따른 음성 인식 성능 분석 (Performance Analysis of Speech Recognition by Increasing the Number of Reference Speaker)

  • 이철희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 학술대회
    • /
    • pp.111-114
    • /
    • 1998
  • 음성을 인식하기 위해서는 주어진 음성을 미리 정한 기준 음성과 비교하여 가장 유사한 것을 갖는 과정을 거치게 된다. 같은 단어라도 화자에 따라서 발음 속도, 음의 강약이 틀리므로 화자 독립 음성 인식을 위해서는 여러 화자가 발음한 음성을 기준 음성으로 사용하여 인식 성능을 향상시킬 수 있다. 그러나 화자 수를 증가시켜도 인식 성능의 향상에는 한계를 보이고 있다. 이러한 문제점은 현재 음성에서 추출되는 피춰가 인식에 필요한 정보를 충분히 포함하지 않는 것과 인식 알고리즘의 효율성 등에서 원인을 찾을 수 있다. 본 논문에서는 남자 10명과 여자 10명이 발음한 한국어 숫자음을 인식 대상으로 하여 멜켑스트럼을 추출하고 DTW에 의해 인식을 수행하여 피춰 추출의 관점에서 화자 수 증가에 따른 인식률의 변화와 그 한계에 대해서 분석한다.

  • PDF

담화표지의 음성언어적 특성과 음성합성 시스템에서의 활용 (Characteristics of Spoken Discourse Markers and their Application to Speech Synthesis Systems)

  • 이호준;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.254-260
    • /
    • 2007
  • 음성은 컴퓨터로 대변되는 기계와 사람 그리고 기계를 매개로 한 사람과 사람의 상호작용에서 가장 쉽고 직관적인 인터페이스로 널리 활용되고 있다. 인간에게 음성정보를 제공하는 음성합성 분야에서는 합성결과의 자연스러움과 인식성이 시스템의 주요 평가요소로 활용되고 있는데 이러한 자연스러움과 인식성은 합성결과의 정확성뿐만 아니라 발화환경이나 발화자의 발화특징 혹은 감정상태 등에 의해 많은 영향을 받게 된다. 담화표지는 문장의 명제 내용에는 직접 관여하지 않으면서 화자의 발화 의도나 심리적 태도를 전달하는 구성 요소를 말하는데 본 논문에서는 담화표지가 포함된 대화 음성 데이터를 수집하여 담화표지의 음성언어적인 특징을 분석하고 분석된 결과를 음성합성 시스템에 활용하는 표현방식에 대해 논의한다.

  • PDF

발성 검사 및 치료를 위한 통합 장치 (Integrated Analysis System for Monitoring and Therapy of Phonation)

  • 남기창;김수찬;김한수;남지인;남도현;김덕원;최홍식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 V
    • /
    • pp.2883-2886
    • /
    • 2003
  • 좋은 발성을 위하여 음성이 만들어지려면, 뇌의 언어중추의 명령에 의하여 신경망을 통하여 ‘호흡기관(폐와 흉곽. 호흡관련 근육들)’과 ‘발성기관(주로 후두 즉 성대)’ 그리고 ‘조음, 공명기관(인두, 구강 및 비강)’의 근육들이 유기적으로 작용하여야 한다. 이런 협력 체제에 문제가 생기면, 다양한 종류의 질환이 유발될 수 있다[1,2]. 현재 임상에서 음성 분석을 위해 사용되는 시스템은 대부분 성대의 진동을 측정하기 위해 stroboscopy, 전기성문파형검법 (EGG, electroglottography), 후두근전도 중의 한 방법과 음성 분석을 위한 분석 프로그램으로 구성되어 있다. 그러나, 발성은 호흡과 매우 밀접한 관계가 있어 음성, 성대의 진동, 호흡 관계를 종합적으로 관찰할 필요가 있다. 본 연구에서는 발성 시 성대 점막의 접촉 양상은 ECG 로 측정하며, 발성의 주 에너지원이 되는 호흡의 변화를 2 channel 인덕턴스 호흡감시 장치(RIP: repiratory inductive plethymography)를 이용하여 흉곽의 움직임과 상 복강의 움직임에 대하여 측정하며, 발성되는 음성은 마이크로폰을 통하여 측정하는 ‘EGG, 음성, 호흡 통합검사 장치’를 개발하였다.

  • PDF