• 제목/요약/키워드: 음성 분석

검색결과 3,068건 처리시간 0.025초

연극 배우의 음성 관리 및 음성 사용에 관한 연구

  • 조성미;정옥란
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.137-137
    • /
    • 2003
  • 본 연구는 직업적 음성 사용자인 연극 배우의 음성 관리, 극중 인물 특징을 표현하기 위한 요소 중 음성이 차지하는 비중과 적합한 발성 및 발화 방법에 대하여 살펴보았다. 본 연구에는 대구광역시 소재 K극예술연구회의 연극 배우 9명이 참여하였다. 연극 배우의 음성 관리 및 극중 인물의 특성을 표현하기 위한 발성 및 발화 방법에 대한 설문지를 작성하여 조사하였다. 여러 가지 인물에 적합한 발성법으로 '산책' 문단을 발화하도록 한 뒤, 대상자들에게 각 인물에 대한 발성 방법을 설문지에 기록하도록 하였다. 대상자들이 발화한 음성 샘플을 음향학적, 지각적 측면에서 평가하여 대상자들이 기술한 발성 및 발화 방범과의 상관을 살펴보았다. 음성 샘플은 Windows용 Praat(4.1.7)으로 수집 및 분석하였다. (중략)

  • PDF

한국어에서의 성인과 유아의 음성 인식 비교 (Comparison of Adult and Child's Speech Recognition of Korean)

  • 유재권;이경미
    • 한국콘텐츠학회논문지
    • /
    • 제11권5호
    • /
    • pp.138-147
    • /
    • 2011
  • 현재 한국의 음성 데이터베이스 구축 현황을 살펴보면 유아에 맞춰진 음성 데이터베이스는 구축이 되지 않은 실정이다. 국외 연구를 분석한 결과, 다양한 언어를 기반으로 유아 대상의 음성 데이터베이스가 구축되어 있다. 이는 성인의 음성과 유아의 음성은 언어학적으로 차이가 있기 때문에 유아는 유아에 맞는 음성 데이터베이스가 필요하다. 한국어에서 성인과 유아의 음성 차이를 알아보기 위해, HMM을 이용하여 유아와 성인의 음성인식을 비교하였다. 유아와 성인의 음성인식 비교는 성별, 나이별, 성도 길이 정규화의 적용 유무에 따라 실험한다. 본 논문에서는 한국어에서 유아의 음성을 유아의 음성인식기로 인식했을 때가 성인의 음성인식기로 인식했을 때 보다 월등히 인식률이 높았으며, 성도 길이 정규화의 적용이 인식률 향상에 도움이 되고 있음을 보여준다.

켑스트럼 분석합성형 음성합성 시스템에서의 피치변경에 따른 스펙트럼 포락 왜곡 현상에 관한 연구 (Distortion of Spectrum Envelope with Change of Pitch Period in the Cepstrum Analysis-synthesis System)

  • 김연준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.54-57
    • /
    • 1992
  • 음성합성에 있어서 음의 자연성을 합성시키는 문제는 크게 두가지로 나누어진다. 첫째는 합성음을 원음에 가깝게 구현하려는 합성방법 자체의 문제로, 언어 합성이 가지고 있는 일반적인 문제이다. 또 다른 문제는 운율에 관한 것으로 낱말 또는 문장 내에서의 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율의 조절에는 지속시간, 피치, 그리고 음의 세기 등이 이용된다. 켑스트럼을 이용하여 분석합성을 하는 경우, pole-zero 모델로 스펙트럼 포락을 근사하므로 원음에 충실하고, 필터계수와 구동정보를 분리하여 분석, 합성하므로 인위적인 운율의 조절이 용이하여 음성합성이 가지는 위의 두가지 문제를 해결하는데 적합하다고 판단된다. 본 연구에서는 켑스트럼을 이용하여 분석합성 시스템을 구성하였다. 음성 합성 과정에서, 운율 조절 파라미터중의 하나인 피치 주기의 변경에 따라 스펙트럼 포락의 왜곡에 대해 살펴보고, 왜곡을 최소화하는 방안을 제안한다.

  • PDF

음성신호의 Jitter 성분의 장시간 변화에 관한 통계적 분석 (Statistical analysis on long-term change of jitter component on continuous speech signal)

  • 조철우
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.73-80
    • /
    • 2020
  • 본 연구에서는 연속음성에서의 장시간 jitter 성분 측정 방법에 대해 고찰하였다. 기존의 jitter측정방법으로는 지속 발성한 모음을 대상으로 변동성을 측정하는 방법을 주로 사용하여왔다. 문장음성 등 연속음성의 경우는 문장에 따른 운율정보의 영향으로 기존의 측정법으로는 왜곡이 발생하게 된다. 이에 연속 발성에 대해 운율정보의 피치 변동을 상쇄시키는 방법을 제안하고자 한다. 피치 변동을 제거하는 방법으로는 분석구간내에서의 피치 변동을 다항식 보간법에 의해 변동 경향을 대표하는 곡선을 구하고 그 곡선을 기준으로 변이를 제거하였다. 이후 변이가 제거된 피치의 궤적으로부터 jitter를 측정하는 방법을 적용하여 피치 주파수의 변동성을 측정하고 기존의 지속모음에 의한 측정 방법과 비교하였다. 제안한 방법의 효용성 측정을 위해 Kay Pentax MEEI DB의 음성 표본을 사용하였다. 통계분석 결과 제안된 방법에 의해 연속음성으로부터 측정한 jitter 값은 동일 화자의 지속모음으로부터 측정한 파라미터 값과 유사한 변동성을 보여 주었다.

여성 뉴스 앵커의 발성 특성 분석 (The Characteristics of the Vocalization of the Female News Anchors)

  • 견두헌;배명진
    • 한국음향학회지
    • /
    • 제30권7호
    • /
    • pp.390-395
    • /
    • 2011
  • 본 논문은 각 방송사의 메인 뉴스인 평일 저녁뉴스의 여성 앵커 음성 분석을 통하여 공통적인 음성 요소와 각 방송국별 상대적인 음성 및 음향에는 어떠한 차이가 있는지 연구하였다. 전반적인 음성 특성을 알아보기 위해 6가지 요소를 분석한 결과, 각 방송국별 아나운서는 발화속도를 제외하면 모든 영역에서 뚜렷한 음성 및 발성 특징을 가지고 있었으며 음향시스템적인 차이도 발견 되었다. 주요 분석 요소는 기본 피치 외에 제1포만트와 피치비율에 따른 음색과 피치대역폭을 통한 정감도 요소, 피치대역폭내의 평균피치위치를 통한 문장 끝맺음 양상, 평균 발화속도, 주파수 대역별 에너지 분포를 통한 음향적인 음색 분석이다. 분석된 수치 및 결과는 국내 여성 앵커의 발성 특징의 기준으로 참고 및 활용될 수 있다.

얼굴표정과 음성을 이용한 감정인식 (An Emotion Recognition Method using Facial Expression and Speech Signal)

  • 고현주;이대종;전명근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권6호
    • /
    • pp.799-807
    • /
    • 2004
  • 본 논문에서는 사람의 얼굴표정과 음성 속에 담긴 6개의 기본감정(기쁨, 슬픔, 화남, 놀람, 혐오, 공포)에 대한 특징을 추출하고 인식하고자 한다. 이를 위해 얼굴표정을 이용한 감정인식에서는 이산 웨이블렛 기반 다해상도 분석을 이용하여 선형판별분석기법으로 특징을 추출하고 최소 거리 분류 방법을 이용하여 감정을 인식한다. 음성에서의 감정인식은 웨이블렛 필터뱅크를 이용하여 독립적인 감정을 확인한 후 다중의사 결정 기법에 외해 감정인식을 한다. 최종적으로 얼굴 표정에서의 감정인식과 음성에서의 감정인식을 융합하는 단계로 퍼지 소속함수를 이용하며, 각 감정에 대하여 소속도로 표현된 매칭 감은 얼굴에서의 감정과 음성에서의 감정별로 더하고 그중 가장 큰 값을 인식 대상의 감정으로 선정한다.

LTE 무선 네트워크에서 Voice over IP 용량 분석 (Capacity Analysis of VoIP over LTE Network)

  • 반태원;정방철
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2405-2410
    • /
    • 2012
  • 4세대 이동통신 시스템인 LTE에서는 음성 서비스를 제공하기 위한 코어 망이 존재하지 않으며, IP 기반의 패킷 코어망으로 통합되었다. 따라서, 음성 서비스를 제공하기 위해서는 VoIP 방식이 도입되어야 하지만, LTE 초기에는 서비스 커버리지의 불연속성 등으로 3세대 네트워크의 음성 서비스 코어망을 통하여 일시적으로 음성 서비스를 제공하게 된다. 그러나, 향후 LTE 네트워크가 본격적으로 확산될 경우 고품질 음성 서비스를 위하여 필연적으로 VoIP 방식으로의 전환이 불가피하다. 본 논문에서는, 향후 본격적으로 상용화가 예상되는 VoLTE 서비스의 용량을 분석한다. 분석 결과에 따르면, LTE에서는 채널 대역폭 증가 비율 대비 VoLTE 용량 증가 비율이 높음을 확인할 수 있었다. 또한, VoLTE 용량 감소 없이 제어 채널용 자원을 늘릴 수 있는 방안이 존재함을 확인하였다.

대어휘 음성인식을 위한 의사형태소 분석 시스템의 구현 (Implementation of A Morphological Analyzer Based on Pseudo-morpheme for Large Vocabulary Speech Recognizing)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.102-108
    • /
    • 1999
  • 교착어인 한국어를 대상으로 대용량의 대화체 어휘를 포함하는 연속 음성을 인식하는 데에는 인식단위를 결정하는 것이 매우 중요하다. 본 논문에서는 어절이나 형태소를 사용하는 기존의 음성인식 시스템에서의 난점을 해소하고 새로운 인식단위인 의사형태소를 제안하고, 입력되는 문장을 의사 형태소 단위로 분석하는 형태소 분석기와 태거를 구현하였다. 의사형태소를 이용한 음성인식/합성은 어절이나 형태소단위의 음성인식/합성에서 보다 개선된 결과를 얻을 수 있게 해주며, 인식의 출력을 인식의 다음 단계인 언어처리부의 처리단위와 일치시킬 수 있으므로 전체적인 음성언어 번역시스템의 성능도 높일 수 있다. 본 논문에서 구현한 시스템은 일반 형태소를 대상으로 하는 시스템과 동일한 수준의 성능을 보였다.

  • PDF

독립성분분석을 이용한 DSP 기반의 화자 독립 음성 인식 시스템의 구현 (Implementation of Speaker Independent Speech Recognition System Using Independent Component Analysis based on DSP)

  • 김창근;박진영;박정원;이광석;허강인
    • 한국정보통신학회논문지
    • /
    • 제8권2호
    • /
    • pp.359-364
    • /
    • 2004
  • 본 논문에서는 범용 디지털 신호처리기를 이용한 잡음환경에 강인한 실시간 화자 독립 음성인식 시스템을 구현하였다. 구현된 시스템은 TI사의 범용 부동소수점 디지털 신호처리기인 TMS320C32를 이용하였고, 실시간 음성 입력을 위한 음성 CODEC과 외부 인터페이스를 확장하여 인식결과를 출력하도록 구성하였다. 실시간 음성 인식기에 사용한 음성특징 파라메터는 일반적으로 사용되어 지는 MFCC(Mel Frequency Cepstral Coefficient)대신 독립성분분석을 통해 MFCC의 특징 공간을 변화시킨 파라메터를 사용하여 외부잡음 환경에 강인한 특성을 지니도록 하였다. 두 가지 특징 파라메터에 대해 잡음 환경에서의 인식실험 결과, 독립성분 분석에 의한 특징 파라메터의 인식 성능이 MFCC보다 우수함을 확인 할 수 있었다.

LPC Smoothed Log Amplitude Spectra를 이용한 자동 음성 분할 (Automatic Segmentation Using LPC Smoothed Log Amplitude Spectra)

  • 김도한;이상운;이기정;홍재근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.795-798
    • /
    • 2000
  • 연속음 인식과 음성 합성을 위해서는 정밀한 음성학적 모델과 연속 음성에 적용 가능한 언어 모델의 개발이 중요하다. 이를 위해서는 음성 데이터 베이스에 대한 인식 단위, 혹은 합성 단위의 분할이 필요한데, 수동음성 분할은 일관성의 유지가 어렵고 긴 시간이 소요되므로 최근에는 자동 분할 기술이 많이 연구되고 있다. 자동 음성 분할 기법으로는 시간 영역이나 주파수 영역특징 벡터의 천이를 분석하는 방법과 특징 벡터간의 상관도를 구하여 경계를 추출하는 방법이 있다. LPC smoothed log amplitude spectra는 음성의 주파수 영역의 특징을 잘 나타내며, 동일 음소 내의 상관도가 서로 다른 음소의 상관도보다 더 크고, 음소의 경계구간에서 급격한 상관도의 변화를 보인다. 이 특성을 이용하여 이웃 프레임에 대한 상관도의 방향성이 특정조건을 만족하는가를 검사하여 음소의 경계를 구하는 방법을 찾았다. 또한 LPC. 이득 인자만으로 묵음 구간을 검출하는 방법을 제시한다. 이렇게 하면 묵음 구간검출과 음소 경계 검출의 일관성을 향상시키고 수행 시간을 단축시킬 수 있다. 제안한 기법으로 허용 오차 20ms 이내에서 연속음성에 대한 음소 경계 검출 실험을 수행한 결과, 수작업으로 행한 경계 검출 지점의 약 88%를 정확히 검출하였다.

  • PDF