• 제목/요약/키워드: 발성 속도

검색결과 76건 처리시간 0.021초

CELP 보코더 전송률 감소를 위한 발성속도 측정 방법 (On a Study of Measurement Method of Utterance Velocity for the Reduction of Transmission Rate in CELP Vocoder.)

  • 장경아;나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.175-179
    • /
    • 2000
  • 음성의 발성속도가 빠른 경우에는 발성속도가 느린 경우보다 적은 정보만으로도 부호화가 가능하다 음성의 발성속도가 빠른 경우에는 청취시 낮은 주파수 대역의 정보가 높은 주파수대역의 정보보다 중요하게 된다. 음성 부호화 기술은 전송를과 복잡도를 줄이고 음질을 향상시키는 방향으로 진행되고 있다. 현재 상용화되고 있는 CELP형 보코더는 낮은 전송를에 비해 우수한 음질을 제공하지만, 기존 방식은 음성의 발성속도에 대해서 처리를 달리하지 않고 사용하고 있다. 음성의 발성속도를 측정하여 발성속도가 빠를 경우에, 발성속도가 느린 경우보다 낮은 대역의 정보만 전송한다면 전송율을 감소시킬 수 있다. 본 논문에서는 CELP 부호화기의 전송률 감소를 위해 발성속도를 측정하는 방법을 제안한다. LSP 파라미터가 가지고 있는 정보로 음소의 변화율을 측정하였다. 각각 다른 발성속도를 갖는 음성시료에 대하여 음소 변화율을 구한 결과 발성속도가 다른 경우, 뚜렷하게 다른 음소 변화율을 갖는 것을 알 수 있었고. 빠르게 발성한 경우가 느리게 발성한 경우보다 42.8%가 높게 나왔다.

  • PDF

발성 속도에 따른 가변전송률 CELP 부호화기 설계에 관한 연구 (A Study on a Design of the Variable Bit-Rate Vocoder by Measuring of the Speaking Rate)

  • 나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.273-276
    • /
    • 2001
  • CELP 부호화기는 선형 예측 합성에 의한 분석 부호화의 원칙에 기본을 두고 있다. 그리고 음성 신호의 스펙트럼을 LPC 분석을 통해 부호화하는데 고정 윈도우를 사용하여 부호화한다. 그러나 음성신호는 화자의 발성속도에 따라 파형의 변화가 시간적으로 빠르게 변화하기도 하고, 반대로 유사한 파형이 일정시간 유지되기도 한다. 따라서 윈도우의 크기를 발성속도에 맞추어 분석한다면 보다 효율적인 부호화를 할 수 있다. 본 논문에서는 발성속도에 따라 전송률을 달리 적용하는 방법을 제안한다. 발성속도의 측정은 스펙트럼 변화도를 이용하여 측정하였고, 발성속도가 빠를 때는 프레임 크기를 줄여 시간적으로 빠르게 변화하는 신호에 적응적으로 분석하고 대신 파라미터 표현에 비트를 줄인다. 반대로 발성속도가 느릴 때는 프레임 크기를 키우고 파라미터 표현에 비트를 더 할당한다. 제안한 방법을 실험하기 위해 G.723.1 5.3kbps ACELP 부호화기를 이용하였다 음질의 열하 없이 평균 16.34% 전송률 감소효과를 얻을 수 있었다.

  • PDF

시간축 변환을 이용한 음성 인식기의 성능 향상에 관한 연구 (Study on the Improvement of Speech Recognizer by Using Time Scale Modification)

  • 이기승
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.462-472
    • /
    • 2004
  • 본 논문에서는 자동 음성 인식기의 성능 저하를 일으키는 요인으로서 발성 속도의 변동에 따를 성능 저하를 보상하기 위한 기법을 제안하였다. 새로운 기법의 제안에 앞서서. 먼저 발성 속도의 변화에 따른 기존의 은닉 마코프 모델을 이용한 음성 인식기의 성능을 정량적으로 분석하였다. 이러한 분석을 통해 발성 속도에 따른 유의한 성능 저하를 관찰하고, 주어진 음성으로부터 발성 속도를 정량적으로 나타낼 수 있는 변수를 도입하였다. 발성 속도를 학습 시 사용한 음성과 유사하게 변화시키기 위해 본 논문에서는 음성 신호에 대한 시간축 변환을 사용하였으며, 최종적으로 발성 속도에 따라 선택적으로 시간축 변환을 적용하여 발성 속도의 변동에 따른 음성 인식의 성능 저하를 보상할 수 있는 기법을 제안하였다. 10자리의 이동통신용 전화번호를 이용한 음성 인식의 실험을 통해, 제안된 기법은 빠르게 발성하는 음성에 대해 15.5%의 오류율 감소를 가져오는 것을 확인할 수 있었다.

정치인의 발성이 유권자에 미치는 영향 -구청장 선거를 중심으로 (Effect of politician's voice on electors -Focused on ward head election)

  • 박덕춘
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.695-700
    • /
    • 2013
  • 본 연구는 정치인의 발성이 유권자에 어떤 영향을 미치는지 살펴본 실험연구이다. 이 연구에서는 지방선거 TV연설 영상물을 대상으로 음성의 고저, 발성의 속도 등을 달리하여 조작된 4가지 영상물을 제작하여 대학생들을 대상으로 실험, 분석하였다. 연구결과 정치인 음성의 고저는 유권자의 신뢰도와 지지도에 영향을 미치는 중요한 요인이며, 저음일수록 신뢰도가 높고 이러한 신뢰도는 지지도와 연결됨을 알 수 있었다. 또한 정치인의 발성 속도도 유권자의 신뢰도에 영향을 미치는 요인임을 발견하였다. 정치인의 발성 속도가 느릴수록 유권자의 신뢰도가 높게 나타났으며, 그러나 발성속도에 의한 신뢰도는 후보 지지도와 연결되지 않았다.

기초연기 교육과정에서 발성 이전 단계의 호흡훈련 방법 연구 (A Study on the Breathing Training Method at the Pre-phonation Stage in Beginning Acting Class)

  • 최영환
    • 한국콘텐츠학회논문지
    • /
    • 제15권5호
    • /
    • pp.78-87
    • /
    • 2015
  • 배우로서 좋은 화술을 구사하기 위해 자연스런 호흡과 발성이 전제되어야 하는데 이 논문에서는 발성 이전 단계인 호흡 훈련 방법에 초점을 맞추어 논구하고 있다. 기존의 호흡과 발성훈련에 대한 연구는 성악, 요가, 단전호흡, 의학적 관점에서 접근한 것이 주류를 이룬 반면에, 배우의 연기훈련의 일환으로 되어진 연구는 그 중요성에 비해 상대적으로 많지 않다. 더구나 그러한 연구도 대체적으로 호흡과 발성, 화술을 전반적으로 다루는 연구가 대부분이다. 따라서 본 연구자는 이 논문에서 연구 법위를 좁혀 발성 이전 단계의 호흡훈련, 특히 배우의 상상력과 이미지를 통해 극 속에서 존재할 법한 다양한 상황 속에서 자연스럽게 호흡하는 훈련법을 집중적으로 연구하였다.

연속숫자 음성인식에서 화자 적응에 관한 연구 (A Study on Speaker Adaptation in Continuous Digits Speech Recognition)

  • 최광표
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.319.2-322
    • /
    • 1998
  • 본 논문에서는 반음절 단위 HMM을 이용한 연속 숫자 음성인식 시스템의 2단계로 이루어지는 화자 적응 알고리즘을 수행하였다. 음성인식 시스템에서 사용되는 훈련데이터의 양이 많더라도 발성속도, 발성크기 등의 화자 발성 습관에 따라 화자독립 음성인식 시스템에서는 많은 문제점들이 발생하게 된다. 불특정 화자를 대상으로 한 음성 인식에 있어서 개인차에 의한 변동을 대처하는 방법으로 유효한 음향적 특성을 추출하기 위해 스펙트럼의 동적인(Dynamic) 특성을 주로 이용하고 있다. 따라서 본 논문에서는 화자 적을 기법의 하나인 frequency warped spectral matching 방법을 연속숫자 음성 인식시스템에 적용하였으며, 이때 인식에 의한 적절한 화자별 스케일링 계수 선정 방법을 수행하여 오인식률이 감소함을 확인하였다.

  • PDF

과기능적 음성장애 환자의 물저항발성: 튜브 직경과 물 깊이가 물거품 높이 및 최대발성지속시간에 미치는 영향 (Tube phonation in water for patients with hyperfunctional voice disorders: The effect of tube diameter and water immersion depth on bubble height and maximum phonation time)

  • 김민경;최성희;윤종인
    • 말소리와 음성과학
    • /
    • 제15권2호
    • /
    • pp.31-40
    • /
    • 2023
  • 목적: 물 속에서 튜브 발성은 semi-occluded vocal tract(SOVT) 연습 중 하나로 환자가 튜브를 물 속에 잠기게 하여 거품을 내면서 발성을 하는 것으로 음성 훈련에 널리 사용되어 왔다. 본 연구는 과기능성 음성장애 환자를 대상으로 물저항발성 동안 튜브 직경과 튜브를 담그는 물 깊이가 물거품 높이와 최대발성지속시간(maximum phonation time, MPT)에 미치는 영향을 조사하는 것을 목적으로 한다. 방법: 과기능성 음성장애 환자 17명에게 튜브 직경(5, 7, 10 mm), 튜브를 담그는 물 깊이(4, 7, 10 cm)에 따라 지속적인 /u/발성을 하면서 거품을 내도록 하였다. 물거품 높이 및 MPT 기록을 위해 수위 센서를 이용한 물저항발성 바이오피드백 시스템을 사용하였다. 결과: 물거품 높이는 튜브 직경에 의해 유의하게 변화한 반면 MPT는 튜브 직경과 깊이에 따라 유의하게 변화하였다. 직경이 더 넓을수록 주어진 깊이에 대해 유의하게 낮은 물거품 높이를 나타냈지만, 상대적으로 일관된 버블 높이가 유지되었다. 물의 깊이에 따라 주어진 튜브 직경에서 물거품 높이는 유의한 차이가 없었으나, 물의 깊이에 따라 MPT는 유의하게 감소하였고 튜브가 넓을수록 MPT가 유의하게 감소하였다. 결론: 수위 센서 방식의 물저항 바이오피드백 시스템은 튜브 직경 및 수심에 따른 기포 특성 및 성대 진동에 대해 유용한 정보를 제공하였다. 또한, 수위센서를 이용한 물저항발성 바이오시스템은 과기능적 음성장애가 있는 환자의 물저항 발성 중 호흡 지지를 모니터링하는 데 유용하게 사용될 수 있다.

원발성폐지방육종(Primary Pulmonary Liposarcoma)에 관한 수술치험 1예 (Surgery for Primary Pulmonary Liposarcoma)

  • 김수완;김진국;김관민;최용수;안긍환;심영목
    • Journal of Chest Surgery
    • /
    • 제37권11호
    • /
    • pp.942-945
    • /
    • 2004
  • 원발성폐지방육종은 극히 드문 질환일 뿐만 아니라, 국소재발이 빈번하고 발병 초기에 원격전이가 발생하여 예후가 불량한 질환이다. 지방육종의 치료를 위해서는 수술적인 절제가 우선적이나, 완전히 절제를 못하였을 경우 지방육종이 국소적으로 재발하게 되고 상당히 빠른 속도로 자라게 된다. 저자들은 원발성폐지방육종을 완전 절제하여 10개월 간 재발 및 전이가 없는 예를 경험하였기에 보고하는 바이다.

고속 발화음에 대한 음성 인식 향상 (Improvements on Speech Recognition for Fast Speech)

  • 이기승
    • 한국음향학회지
    • /
    • 제25권2호
    • /
    • pp.88-95
    • /
    • 2006
  • 본 논문에서는 대화체 음성에 대한 음성 인식의 성능을 향상시키기 위한 방법으로, 고속 발화음에 대해 강인한 음성 인식 방법을 제안하고 성능을 평가하였다. 제안된 기법은 입력된 음성의 속도를 정량화하여 나타내기 위한 부가적인 음성 인식 과정이 필요치 않으며, 특정 대역내의 에너지 분포를 이용하여 모음 구간을 판정하고, 단위 시간당 모음의 개수를 구하여 음성의 속도를 측정하였다. 빠른 발성음에 대한 음성 인식의 성능을 향상시키기 위해, 기존의 방법은 표준 음소 길이와 측정된 음소 길이간의 비율을 이용하여 특징 벡터를 시간축으로 확장하였다. 제안된 방법에서는 발성 속도에 따라 음성을 분류하고, 분류된 음성에 대해 서로 다른 시간축 확장 비율을 정하도록 하였다. 여기서 분류에 필요한 문턱치들과 시간축 확장 비율들은 최대 우도 방법을 이용하여 구하였다. 10자리 이동 전화 번호에 대한 음성 인식의 실험 결과, 제안된 기법에 의해 전체적으로 $17.8\%$ 오류율이 감소되는 것을 확인할 수 있었다.

노무안전판례

  • 대한산업보건협회
    • 안전기술
    • /
    • 75호
    • /
    • pp.30-31
    • /
    • 2004
  • B형 간염에 감염된 근로자가 과중한 업무에 종사하다가 원발성 간종양 진단을 받고 사망한 경우, B형 간염에 감염된 것은 업무와 관련이 없다 하더라도 계속되는 근무로 인하여 육체적 과로와 정신적 스트레스가 지속되어 자연적인 속도 이상으로 악화되어 사망하였다면 업무상 재해에 해당한다

  • PDF