• Title/Summary/Keyword: 음성분석

Search Result 3,085, Processing Time 0.032 seconds

An Analysis on the Emotional Speech for the Speech Synthesis System with Emotion (감정표현 음성합성 시스템을 위한 감정 분석)

  • 천희진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.350-355
    • /
    • 1998
  • 감정을 표현하는 음성 합성 시스템을 구현하기 위해서는 감정음성에 대한 분석이 필요하다. 본 논문에선,s 평상, 화남, 기쁨, 슬픔의 네 가지 감정에 대한 음성 데이터에 대해 음절 세그먼트, 라벨링을 행한 감정 음성 데이터베이스를 구축하였고, 감정표현이 음성에 영향을 미치는 요인에대하여, 운율, 음운적인 요소로 나누어 분석하였다. 또한 기본 주파수, 에너지, 음절지속시간에 대한 분석과 감정 음성의기본 주파수, 에너지, 음절지속시간, 스펙트럼 포락의 인지 정도를 측정하기 위하여 평상 음성에 감정 음성의 운율 요소를 적용하는 음성을 합성하여 ABX 방법으로 평가하였다. 그 결과, 기본 주파수의변화가 73.3%, 음절지속시간은 43.3% 로 올바른 감정으로 인지되었으며, 특히 슬픈 감정에서 음절지속시간은 76.6%가 올바르게 감정을 나타내는 것으로 인지되었다.

  • PDF

Gender Analysis in Elderly Speech Signal Processing (노인음성신호처리에서의 젠더 분석)

  • Lee, JiYeoun
    • Journal of Digital Convergence
    • /
    • v.16 no.10
    • /
    • pp.351-356
    • /
    • 2018
  • Changes in vocal cords due to aging can change the frequency of speech, and the speech signals of the elderly can be automatically distinguished from normal speech signals through various analyzes. The purpose of this study is to provide a tool that can be easily accessed by the elderly and disabled people who can be excluded from the rapidly changing technological society and to improve the voice recognition performance. In the study, the gender of the subjects was reported as sex analysis, and the number of female and male voice samples was used equally. In addition, the gender analysis was applied to set the voices of the elderly without using voices of all ages. Finally, we applied a review methodology of standards and reference models to reduce gender difference. 10 Korean women and 10 men aged 70 to 80 years old are used in this study. Comparing the F0 value extracted directly with the waveform and the F0 extracted with TF32 and the Wavesufer speech analysis program, Wavesufer analyzed the F0 of the elderly voice better than TF32. However, there is a need for a voice analysis program for elderly people. In conclusions, analyzing the voice of the elderly will improve speech recognition and synthesis capabilities of existing smart medical systems.

Emotional Speech Synthesis using the Emotion Editor Program (감정 편집기를 이용한 감정 음성 합성)

  • Chun Heejin;Lee Yanghee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.79-82
    • /
    • 2000
  • 감정 표현 음성을 합성하기 위하여 본 연구에서는 감정 음성 데이터의 피치와 지속시간의 음절 유형별 및 어절 내 음절 위치에 따른 변화를 분석하였고, 스펙트럼 포락이 감정 변화에 어떤 영향을 미치는지를 분석하였다. 그 결과, 피치와 지속시간의 음절 유형별, 어절 내 음절 위치에 따른 변화와, 스펙트럼 포락 등도 감정 변화에 영향을 미치는 것으로 나타났다. 또한, 감정 음성의 음향학적 분석 결과를 적용하여 감정 음성을 합성하고 평가하기 위하여, 평상 음성의 음운 및 운율 파라미터 (피치, 에너지, 지속시간, 스펙트럼 포락)를 조절함으로써 감정 음성을 생성하는 감정 편집기를 구현하였다.

  • PDF

Detection of nonlinearities in speech signal using bicoherence and tricoherence (Bicoherence와 tricoherence를 이용한 음성신호의 비선형성 검출)

  • 김영인;임성빈
    • Proceedings of the IEEK Conference
    • /
    • 1998.06a
    • /
    • pp.595-598
    • /
    • 1998
  • 본 논문의 목적은 한국어 모음의 음성 신호에 대하여 2차 및 3차 비선형서의 존재에 대한 정량적인 분석을 수행함에 있다. 음성 신호의 비선형성을 분석하기 위하여 표본화한 음성 신호에 대하여 bicoherence 및 tricoherence를 측정하였다. 실험 결과에 의하면 한국어 모음의 음성 신호의 발생과정에 상당히 강한 2차 및 3차 비선형성이 존재함을 알수 있었다. 특히 음성신호의 3차 비선형성에 대한 연구는 처음 수행되는 것으로 음성 신호 분석에 있어서 매우 중요한 결과로 사료된다.

  • PDF

Modeling and Analysis of Delay Bound for Voice Traffic in the IEEE 802.11 Wireless LAN (IEEE 802.11 무선랜에서 음성신호의 딜레이 바운드에 관한 분석)

  • Choi, Won-Suk;Kim, Young-Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.1485-1488
    • /
    • 2003
  • IEEE 802.11 무선 랜 환경에서 멀티미디어 트래픽이 효과적으로 전송퇴기 위해서는 정해진 딜레이 바운드내에서 전송이 완료되어야 한다 대표적인 멀티미디어 트래픽인 음성신호를 전송할 때의 단방향 딜레이 바운드는 echo canceller를 쓰지 않았을 경우 $25ms{\sim}30ms$ 이다. 딜레이 바운드를 지키지 못하고 전송된다면 시간에 민감한 음성신호의 특성 때문에 음성품질이 유지되지 않을 뿐만 아니라 채널의 혼잡을 유발하게 된다. 본 논문에서는 음성의 품질이 보장되는 기준을 95%이상의 패킷이 성공적으로 전달되는 경우로 제한하여 음성의 딜레이 바운드에 관한 분석을 시도하였다. 이를 위해 음성패킷이 drop될 확률을 수학적인 분석을 통해 유도하고 시뮬레이션을 통한 검증을 시도하였다. 시뮬레이션에서는 IEEE 802.11의 두 가지 기본적인 MAC(Multiple Access Control) 프로토콜인 DCF와 PCF를 사용해서 음성신호를 전송할 때 딜레이 바운드를 지키지 못하는 음성 패킷을 사전에 drop 시킴으로써 몇 개의 음성 노드가 손실율 5% 이내 (음성의 품질이 유지되는 한계)를 만족시키는지를 음성신호를 발생시키는 STA 수와 손실율의 관계를 통해 알아보았다.

  • PDF

Effect Analysis of Kidney Cupping Therapy based on Voice Signal Analysis (음성신호 분석 기반의 신장 부항요법 효과 분석)

  • Cho, Dong-Uk;Jeong, Yeon-Ho;Ka, Min-Kyoung;Kim, Bong-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1474-1475
    • /
    • 2013
  • 부항은 열 또는 음압(陰壓)장치에 의하여 부항단지 안에 음압을 조성하여 피부에 붙임으로써 피를 뽑거나 울혈(鬱血)을 일으키며 물리적 자극을 주어 병을 치료한다. 부항으로 얻어지는 물리적인 자극은 혈액순환을 촉진하고, 죽은피를 빼냄으로써 혈관을 자극하고 그로인해 다양한 효과를 얻는다. 따라서 본 논문에서는 신장에 해당하는 명문혈을 자극하여 신장과 관련된 음성분석 요소의 변화를 측정하였다. 이를 위해 신장에 이상이 없는 피실험자 10명을 선정하고 신장에 해당하는 명문혈을 자극하기 전과 후의 음성을 수집하였다. 실험은 음성분석 요소 중 신장과 관련된 1 Formant Bandwidth를 적용하여 신장 명문혈 자극 전과 후의 변화를 측정, 분석하였다. 실험 결과, 90%의 피실험자가 값이 감소하는 현상을 보였으며, 이를 통해 명문혈 자극에 따른 신장과 음성신호와의 상관성을 분석할 수 있었다.

연축성발성장애의 음성학적 양상

  • 최홍식;이주환;김인섭;고윤우;오종석;이광현;최성희
    • Proceedings of the KSLP Conference
    • /
    • 1999.11a
    • /
    • pp.179-179
    • /
    • 1999
  • 배경 : 연축성발성장애는 특징적인 음성의 단절과 함께 짜는 듯한 특징적인 목소리를 보이는 질환으로 발생시기가 다양하지만 대개 중년의 여성과 남성에게 호발하는 만성질환이나 아직까지 그 원인과 병태생리는 규명되어 있지 않으며 이의 음성언어분석 검사에 관한 보고는 드물다. 목적 : 본 연구는 세브란스 병원 이비인후과에서 연축성발성장애로 진단받은 환자를 대상으로 음성 연어분석 검사를 시행한 후 이를 정상인군과 비교 분석하여 연축성 발성장애의 병태생리를 규명하고자 하였다. (중략)

  • PDF

Performance Analysis of Integrated Voice and Data Traffic in a Cellular Environment (셀룰러 환경에서 통합된 음성과 데이터 트랙픽의 성능분석)

  • 김기완;김두용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.265-267
    • /
    • 2000
  • 본 논문은 셀룰러 이동통신 환경하에서 음성과 데이터가 통합된 통신 시스템의 트래픽 분석 방법을 제안한다. 통합된 통신 시스템에서 음성과 데이터 트래픽은 고유의 채널 영역을 갖고 있고 음성 영역에 유휴한 채널이 있을 경우 데이터 트래픽이 음성 채널을 사용할 수 있으며 음성이 발생하여 필요시 데이터 채널은 preempt 할 수 있는 시스템 제어 방식을 갖는다. 따라서, 본 논문에서는 이와 같이 가변하는 경계를 갖는 시스템의 블록킹 확률과 핸드오프 실패확률 등을 분석한다.

  • PDF

Collection, Analysis and Classification of Pathological Voice from ARS using Neural Network (ARS와 신경회로망을 이용한 장애음성의 수집, 분석 및 식별에 관한 연구)

  • 김광인;조철우;김대현;왕수건;전계록;안시훈;김기련;김용주
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.955-958
    • /
    • 2000
  • 본 논문은 음성신호를 이용해 성대의 질환이 있는 환자를 진단하고 병명을 판별하게끔 유도하는 자동 진단 시스템을 개발하기 위한 연구의 일부로, 그중 ARS를 이용하여 환자의 음성을 수집, 분석, 식별의 실험에 대한 연구이다. 본 연구 팀에서는 이미 CSL을 이용한 장애음성 데이터의 수집과 식별에 관한 연구 결과를 발표한바 있다. 하지만 선행연구에서는 방음실에서 디지털 녹음기를 이용하여 수집한 음성을 사용했기 때문에, ARS를 통하여 녹음한 음성과는 샘플링 주파수나 대역폭, 잡음성분등의 데이터의 특성이 상당한 차이가 있다. 이러한 이유로 ARS를 통하여 녹음한 음성에 보다 적합한 파라미터 분석프로그램을 작성하여 파라미터를 구하였다. 이 파라미터들은 Kay사의 MDVP를 기초로하여 작성하였고, 대부분 80%정도의 신뢰성을 가졌다. 수집한 음성의 식별은 정상음성과 양성음성의 두가지 경우로 분리하였다. 식별기법으로는 신경망을 이용하였고, 식별파라미터는 구한 파라미터중 6개의 파라미터를 선별하여 식별한 결과 약 90%정도의 식별율을 가졌다.

  • PDF