• 제목/요약/키워드: 음성 분석

검색결과 3,062건 처리시간 0.033초

디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술 (Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems)

  • 서진호;박호종
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.416-422
    • /
    • 2005
  • 디지털 통신 시스템에서의 음성 인식은 음성 부호화기에 의한 음성 신호의 왜곡으로 인하여 성능이 크게 저하된다. 본 논문에서는 음성 부호화기에 의한 스펙트럼 왜곡을 분석하고 왜곡된 주파수 정보를 보상하는 전처리 과정을 통하여 음성 인식 성능을 향상시키는 방법을 제안한다. 현재 널리 사용되는 표준 음성 부호화기인 IS-127 EVRC, ITU G.729 CS-ACELP. IS-96 QCELP를 사용하여 부호화에 의한 왜곡을 분석하고, 모든 음성 부호화기에 공통으로 적용하여 왜곡을 보상할 수 있는 전처리 방법을 개발하였다. 본 논문에서 제안하는 왜곡 보상 방법을 세 종류의 음성부호화기에 각각 적용하였으며, 왜곡된 음성 신호에 대한 음성 인식률에 비하여 최대 $15.6\%$의 인식률 향상을 얻을 수 있었다.

스펙트럼 형태 불변 실시간 음성 변환 시스템 (Spectral Shape Invariant Real-time Voice Change System)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.48-52
    • /
    • 2005
  • 본 논문에서는 음성의 스펙트럼 형태는 유지하면서 음성을 기계적인 음성으로 변환시키기는 실시간 음성 변환 방법을 제안하였다. 이러한 목적을 위하여 LPC 분석 및 합성 방법을 사용하여 변환된 음성의 스펙트럼은 유지하였고 합성된 음성의 피치는 자유롭게 변경되도록 하였다. 제안된 방법에서는 변환된 음성이 보다 자연스럽게 들리게 하기 위하여 여기 신호 발생기에 이득 정합 방법을 적용하였다. 제안된 방법의 성능을 평가하기 위하여 음성 변환 실험을 수행하였다. 실험 결과에서 원 음성 신호는 원 화자의 신원을 알기가 어려운 기계적인 음성 신호로 바뀌는 것을 알 수 있었고 피치의 심한 변화에도 변환된 음성의 의미는 정확히 전달될 수 있었다. 제안된 시스템은 시스템의 실시간으로 구현될 수 있는지 확인하기 위하여 TI TMS320C6711DSK 보드를 사용하여 구현되었다.

GRBAS 음성평가와 음성장애지수 (GRBAS and Voice Handicap Index)

  • 손진호
    • 대한후두음성언어의학회지
    • /
    • 제19권2호
    • /
    • pp.89-95
    • /
    • 2008
  • 주관적 음성평가는 음향분석기기를 이용한 객관적 음성 평가와 함께 음성분석에 유용하고 의미있는 평가방법이며 현재 알려진 검시법정 중에서 GRBAS 음성평가, VHI, patient self-perceptual voice rating이 가장 널리 사용되고 있고 인정받는 방법이다. 주관적 음성평가는 음성의 상태를 모두 대변할 수은 없으며 객관적인 음성평가에 대한 보완적인 의미를 가진다. 현재 개발되어 있는 주관적 음성평가 방법들이 유용한 평가도구이긴 하지만 나름대로의 문제점과 제한점을 가지고 있기 때문에 이에 대한 개선과 보완을 위한 지속적인 연구와 개발이 요구된다.

  • PDF

음성신호 분석 요소의 적용으로 헬륨가스 흡입이 음성 기관의 특성 변화에 미치는 영향 (The Effect of Helium Gas Intake on the Characteristics Change of the Acoustic Organs for Voice Signal Analysis Parameter Application)

  • 김봉현;조동욱
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.397-404
    • /
    • 2011
  • 본 논문에서는 헬륨가스 흡입에 따른 조음기관의 특성이 변화되는 것을 측정하기 위해 음성분석학적 요소의 적용을 통한 실험을 수행하였다. 헬륨가스는 기존에 잠수부가 사용하던 질소가스가 인체에 치명적인 공기 색전증을 유발하게 되면서 이를 극복하기 위한 대체 호흡용 가스로 사용되고 있다. 그러나, 헬륨가스는 명료도가 낮은 squeaky voice를 유발하기 때문에 잠수부들의 비정상적인 음성에 대한 해석에 어려움이 많다. 따라서, 헬륨가스가 음성기관에 미치는 영향을 음성분석학적 특성 변화로 측정하기 위해 헬륨가스 흡입 전과 후의 음성을 기반으로 피치 및 스펙트로그램 측정, 분석에 대한 실험을 수행하였다.

음절 복원 규칙과 형태소 분석을 이용한 음성인식 후처리 (Post-Processing of Voice Recognition Using Phonologic Rules and Morphologic analysis)

  • 서상현;김재홍;김해진;김미진;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-499
    • /
    • 1997
  • 컴퓨터의 사용이 보편화됨에 따라 컴퓨터와 사용자 사이의 쉽고 자연스러운 의사 소통을 위한 자연어 인터페이스에 대한 연구가 활발히 진행되고 있다. 이 중에서 특히, 음성인식 분야는 음성명령, 받아쓰기 시스템 등 일반적인 컴퓨터 사용자의 요구를 충족시켜 줄 수 있는 분야로 주목을 받고 있다. 그러나 음성인식은 인식 자체만으로는 인식률에 한계가 있으며, 인식 결과를 향상시키기 위해서는 후처리 단계가 필요하다. 본 논문에서는 음성 인식의 성능을 향상시키기 위해 음성 인식의 결과로 들어온 연속된 한국어 음성을 올바른 음절로 복원시켜 주는 시스템을 구현하였다. 이 시스템에서는 어절단위의 연속된 한국어 음성을 입력으로 받아 한국어 발음 규칙을 역으로 적용하여 원래의 음절로 복원시키고, 형태소 분석기를 이용하여 복원된 음절이 올바른지를 확인하고 수정한다. 초등학교 교과서에 나오는 문장을 대상으로 본 시스템의 성능을 실험한 결과, 90.42%의 복원율을 나타내었다. 현재 정확하게 복원이 되지 않는 것 중에는 동음이의어가 차지하는 비중이 크며, 이 문제는 구문분석이나 의미분석을 이용하여 어느 정도 개선할 수 있을 것으로 보인다.

  • PDF

음성신호 분석 기반의 신장 부항요법 효과 분석 (Effect Analysis of Kidney Cupping Therapy based on Voice Signal Analysis)

  • 조동욱;정연호;가민경;김봉현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1474-1475
    • /
    • 2013
  • 부항은 열 또는 음압(陰壓)장치에 의하여 부항단지 안에 음압을 조성하여 피부에 붙임으로써 피를 뽑거나 울혈(鬱血)을 일으키며 물리적 자극을 주어 병을 치료한다. 부항으로 얻어지는 물리적인 자극은 혈액순환을 촉진하고, 죽은피를 빼냄으로써 혈관을 자극하고 그로인해 다양한 효과를 얻는다. 따라서 본 논문에서는 신장에 해당하는 명문혈을 자극하여 신장과 관련된 음성분석 요소의 변화를 측정하였다. 이를 위해 신장에 이상이 없는 피실험자 10명을 선정하고 신장에 해당하는 명문혈을 자극하기 전과 후의 음성을 수집하였다. 실험은 음성분석 요소 중 신장과 관련된 1 Formant Bandwidth를 적용하여 신장 명문혈 자극 전과 후의 변화를 측정, 분석하였다. 실험 결과, 90%의 피실험자가 값이 감소하는 현상을 보였으며, 이를 통해 명문혈 자극에 따른 신장과 음성신호와의 상관성을 분석할 수 있었다.

음성 분석 정보값 비교를 통한 사상체질 태음인의 분류 (Classification of Sasang Constitution Taeumin by Comparative of Speech Signals Analysis)

  • 김봉현;이세환;조동욱
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.17-24
    • /
    • 2008
  • 본 논문에서는 사상 체질 분류를 음성 분석 정보값의 비교, 분석을 통해 제안하고자 한다. 이를 위해 본 논문에서는 사상체질의 객관적 지표를 마련하기 위한 전체 시스템 구성 중 1차 단계로써 피부 진단을 통한 소음인의 분류 과정과 연계하여 음성 신호 분석에서 발생하는 정보의 출력값에 의해 태음인을 분류하는 방법을 제안하고자 한다. 우선 각 사상 체질별로 뚜렷한 특징을 보유하고 있는 집단군을 구성하고 이들의 음성 특성을 분류하여 음성학적 요소를 추출하고자 한다. 또한 출력된 결과값을 토대로 체질 집단별 차이점과 유사점을 통하여 태음인을 분류하고자 한다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증하고자 한다.

가치-태도-행동 모델에 기반한 음성 쇼핑 지속이용의도에 관한 연구 (Continuance Use Intention of Voice Commerce Using the Value-attitude-behavior Model)

  • 김효정
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.491-502
    • /
    • 2022
  • 인간과 정보기기간 대화를 통해 물품을 구매하는 음성 쇼핑에 대한 관심이 증가하고 있다. 본 연구는 가치-태도-행동 모델을 활용하여 음성 쇼핑 지속이용의도에 미치는 영향 요인들을 살펴보았다. 인공지능 비서를 이용해 음성 쇼핑을 이용하고 있는 20-40대 소비자들을 대상으로 온라인 조사를 실시하였고, 총 360명의 응답 자료가 분석에 사용되었다. 데이터 분석을 위해 SPSS 25.0과 Amos 23.0 프로그램을 이용하였고, 기술통계분석, 확인적요인분석, 그리고 구조모형분석을 실시하였다. 본 연구의 결과는 다음과 같이 요약될 수 있다. 첫째, 기능적 가치가 음성 쇼핑에 대한 만족도에 가장 많은 영향을 미치는 것으로 확인되었다. 둘째, 사회적 가치, 감성적 가치, 그리고 진귀적 가치가 음성 쇼핑에 대한 만족도에 정(+)적인 영향을 미치는 것으로 확인되었다. 셋째, 음성 쇼핑의 만족도가 지속이용의도에 정(+)적인 영향을 미치는 것으로 확인되었다. 본 연구의 결과는 음성 쇼핑 이용자들에 대한 특성을 파악하고, 음성 쇼핑에서 추구되는 다양한 가치를 이해하는데 기여할 수 있을 것이다.

어린이 행동 패턴에 기반한 개별화된 음성 합성 (Customized Speech Synthesis for Children with Characteristic Behavioral Patterns)

  • 이호준;박종철
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.571-578
    • /
    • 2006
  • 음성을 통한 사용자 간의 정보 교환 방법은 추가적인 훈련 과정이나 장비가 필요하지 않고 공간 제약이 거의 없기 때문에 노약자 등 사용자의 연령대에 관계없이 사용될 수 있다. 또한 음성 정보는 시각이나 촉각 등 다른 정보 수단과의 상호 작용으로 상승 효과를 유발할 수 있기 때문에 사람과 기계 사이의 인터페이스로 활용될 경우 정보 전달력을 높이면서 사용자 친화적인 서비스를 제공할 수 있다. 그러나 동일한 상황에서 동일한 유형의 음성 정보가 사용자에게 지속적으로 제공될 경우 표현상의 단조로움으로 인해 정보 전달력이 급감할 수 있는 문제점도 지니고 있다. 따라서 음성을 통한 정보 전달의 경우 동일 상황이라 하더라도 사용자의 행동 패턴, 심리 상태, 주변 환경 등에 따라 차별화된 문장 구조 및 어휘의 선택으로 긴장감을 유지시켜 줄 수 있어야 한다. 본 논문에서는 5 세 전후의 어린이를 대상으로 그들의 행동 패턴 분석에 기반하여 개별화된 음성 합성 결과를 제공하는 시스템을 제안한다. 이를 위해 유치원이라는 물리적 공간에서 어린이들의 주된 행동 패턴을 분석하고, 현직 유치원 교사를 대상으로 동일한 정보를 전달하는 조건을 통하여 어린이의 행동 패턴과 위치 정보, 연령 및 성격에 따른 발화 문장의 문장 구조와 어휘적 특성을 파악한다. 최종적으로, 개별화된 음성 합성 결과를 위해 유치원 공간을 시뮬레이션 하고 RFID 를 이용하여 어린이의 행동 패턴 및 위치 정보를 파악한다. 그리고 각 상황에 따라 분석된 발화문의 문장 구조와 어휘 특성을 반영하여 음성으로 합성될 문장의 문장 구조 및 어휘를 재구성하여 사용자 개별화된 음성 합성 결과를 생성한다. 이러한 결과를 통해 어린이의 행동 패턴이 발화문의 문장 구조 및 어휘에 미치는 영향에 대해서 살펴보고 재구성된 결과 발화문을 평가한다.

  • PDF

이중음성에 대한 음성파형분석 (Quasi-periodic waveform analysis for diplophonia)

  • 홍기환;김미정;정상술
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 1993년도 제27차 학술대회 초록집
    • /
    • pp.71-71
    • /
    • 1993
  • 이중음성이란 성대진동이 정상이 아닌 유사주기성에 의해 양측 성대진동의 위상차이때문에 발생되는 소리로서 대표적으로 양측성대의 긴장불균형(tension imbalance)시와 양측성대 사이의 높이차이(level difference)시에 발성직전의 성문열림의 정도에 따라 성대진동의 주기가 서로 다르기 때문에 이중음성이 발생한다고 한다. 그러나 실제 이러한 현상은 일측성대 마비환자뿐 아니라 성대의 점막부위에 증가된 질량효과에 의해 이중음성이 나타날 수 있는데 대표적으로 성대내 낭종이라 하겠다. 본 연구에서는 청각적으로 이중음성을 나타낸 일측성대마비, 성대내낭종 및 성대육아종 등 수술을 받았던 19례를 대상으로 음향학적 분석중 음성파형을 이용한 분석을 한 결과 유사주기성 음성파형에 대한 특징들중에서 파형수, peak변이도, 잡음의 정도등이 각질환에 따라 다른 양상을 보여 이중음성의 발생기전이 질환에 따라 다름을 알 수 있었다.

  • PDF