• Title/Summary/Keyword: 발성특성

검색결과 217건 처리시간 0.032초

한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상 (Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles)

  • 송명규;김형순
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.401-406
    • /
    • 2002
  • 한국어 숫자는 모두 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 이러한 문제점들과 더불어 배경잡음이나 채널에 의한 왜곡에 따른 문제점들로 인해 한국어 연결숫자의 인식 성능은 만족스럽지 못한 것이 현실이다. 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운변화를 고려하여 유사음소 (phonelike units: PLUs)군을 정의하고, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수할 수 있도록 인식 시스템을 구성하는 방식을 검토하였다. 전화망 4연숫자를 이용한 화자독립 인식 실험을 수행한 결과 제안된 방법의 숫자열 인식률은 상태당 믹스쳐 (mixture) 개수가 1인 경우 83.2%로, 기준 시스템 (baseline)에 대한 오류감소률이 7.2%였고 가장 높은 성능을 나타낸 믹스쳐 개수가 11인 경우 숫자열 인식률은 91.8% 오류감소율은 4.7%였다.

케이지 내 사육 공간의 차이에 따른 산란계의 음성 특성 (Characteristics of Vocalizations of Laying Hen Related with Space in Battery Cage)

  • 손승훈;신지혜;김민진;강정훈;임신재;백인기
    • Journal of Animal Science and Technology
    • /
    • 제51권5호
    • /
    • pp.421-426
    • /
    • 2009
  • 본 연구는 산란계의 사육공간의 크기별 발성음의 특성을 파악하기 위해 하이라인브라운(Hy-Line Brown) 80주령의 산란계를 대상으로 2008년 10월부터 2009년 2월까지의 기간 동안 발성음을 수집 및 녹음하였다. 산란계의 사육 케이지는 무항생제 축산물 사육밀도조건을 만족하는 0.0231 $m^3$ (0.3m ${\times}$ 0.14m ${\times}$ 0.55m)을 개체당 사육공간의 기준(control)으로 하고, 좁은 공간(small, 0.21m ${\times}$ 0.14m ${\times}$ 0.55m)과 넓은 공간(large, 0.3m ${\times}$ 0.3m ${\times}$ 0.55m) 등의 3가지 유형으로 구분하였다. 하루 3회, 각각 1시간씩 디지털 녹음기(PMD-650, Marantz)와 마이크(MKH 416P48, RF Condenser Mic.)를 이용하여 발성음을 녹음하여 분석을 실시하였다. 발성음의 스펙트로그램을 비교한 결과 케이지의 크기별로 차이가 있는 것으로 나타났으며, 스펙트럼을 비교한 결과 역시 차이가 있었다. 또한 발성음의 주파수, 강도 및 길이 역시 통계적으로 유의한 차이를 나타내었다. 본 연구를 통해 산란계의 사육공간과 발성음 사이에는 깊은 관련이 있었으며, 사육공간에 의한 스트레스의 정도를 파악하기 위해 발성음은 매우 유용할 것으로 판단된다.

전기 Glottographyy(EGG)에 의한 후두구 음력학적 특성 (The Role of the Electroglottography on Laryngeal Articulatory Dynamics)

  • 홍기환;김현기
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1996년도 제6회 학술대회 심포지움
    • /
    • pp.93-93
    • /
    • 1996
  • 최근 많은 음성검사기들의 개발에 의해 발성의 원리에 대한 많은 연구가 진행되었고 실제 임상에 이용되므로써 각종 음성질환의 기전을 연구하는데 많은 도움이 되어왔다. 그중 전기 glottogra-phy(EGG)는 값싸고 완전히 noninvasive한 음성검사기로서 각종 음성질환에 대해 진단, 치료 및 예후판정 등에 이용되어왔으며, 또한 정상 발성시의 성대진동 기전에 대해 연구되어왔다. 그러나 판독하는데 있어 실제 많은 논란이 있는데 이러한 논란은 복잡한 성 대진동 양상에 의해 생기는 것으로 EGG에 의한 양측 성대 사이의 전기 저항도는 실제 성문의 열림의 정도를 의미하는 것이 아니라 성문접촉율을 의미하기 때문이다. (중략)

  • PDF

피치 검색에 의한 Phrase 단위의 Template 추출에 관한 연구 (On a Template Extraction of phrase unit by Pitch Searching)

  • 김종국;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.77-80
    • /
    • 2004
  • 원화자로부터 목표 화자의 음성으로 변환을 위해서는 음운 및 피치변환이 이루어져야 한다. 원 음성과 목표 음성 신호 사이에 따른 발성길이, 크기 및 피치 등의 운율 특성은 화자의 개인성 및 발성문장의 의도를 나타내는 주요 역할을 한다. 본 논문에서는 음성 변환을 수행하기 위하여 발성된 음성의 강세구(phrase)단위의 피치 검출을 통하여 템플릿을 추출하는 방법을 제안한다. 우선 한국어의 운율구에 대한 정보가 필요한 것인지, 한국어는 어떤 운율 구조를 갖는지에 대하여 알아본다. 마지막으로 어떻게 연속음성으로부터 한국어에 적당한 운율구 단위를 나눌 것인지, 즉 자동 세그멘테이션 및 레이블링에 대하여 분석한다. 또한 논문에서는 한국어 문장음성의 운율구를 강세구와 억양구로 나누고 육안으로 표시한 운율구 단위를 기준으로 이 운율구 단위에 적합한 특징을 추출하여 패턴을 작성한다.

  • PDF

부산 지역 청소년 음성의 연령별 특징 변화 분석 (Acoustics of Young People's In Busan : Developmental Changes of Spectral Parameters)

  • 백승관;노용주;윤종락
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.49-52
    • /
    • 2001
  • 부산지역 청소년 음성의 지속시간, 피치주파수 포만트 주파수 특성을 연령별, 성별로 분석하였다. 실제 발음 환경에서의 음성 패턴은 발성화자 개인 및 화자별로 다양하게 변화한다. 이를 모델 화하기 위해서는 다량의 음성 데이터로부터 통계적 방법에 의한 변화 요인별 파라미터 분석이 선행되어야 할 것이다. 실험에 사용된 데이터는 부산지역에 거주하는 청소년(초등학생, 중학생, 고등학생)들이 연령별로 3회 발성한 우화의 일부와 단모음(/아/,/이/,/우/,/에/,/오/)이다 실험 결과로부터 얻어진 지속시간, 주파수 특성 변화 패턴을 연령별, 성별로 구분하여 통계적으로 분석한 뒤 이를 정량화 하였다. 실험 결과로부터 부산 지역 청소년 음성의 지속시간, 주파수 특성은 예측된 바와 같이 기 연구된 성인 음성과 많은 차이를 보였으며 이는 부산 지역 방언의 DB 구축 시 설계자가 고려해야 할 기초자료로 활용 될 수 있을 것이다.

  • PDF

여성 뉴스 앵커의 발성 특성 분석 (The Characteristics of the Vocalization of the Female News Anchors)

  • 견두헌;배명진
    • 한국음향학회지
    • /
    • 제30권7호
    • /
    • pp.390-395
    • /
    • 2011
  • 본 논문은 각 방송사의 메인 뉴스인 평일 저녁뉴스의 여성 앵커 음성 분석을 통하여 공통적인 음성 요소와 각 방송국별 상대적인 음성 및 음향에는 어떠한 차이가 있는지 연구하였다. 전반적인 음성 특성을 알아보기 위해 6가지 요소를 분석한 결과, 각 방송국별 아나운서는 발화속도를 제외하면 모든 영역에서 뚜렷한 음성 및 발성 특징을 가지고 있었으며 음향시스템적인 차이도 발견 되었다. 주요 분석 요소는 기본 피치 외에 제1포만트와 피치비율에 따른 음색과 피치대역폭을 통한 정감도 요소, 피치대역폭내의 평균피치위치를 통한 문장 끝맺음 양상, 평균 발화속도, 주파수 대역별 에너지 분포를 통한 음향적인 음색 분석이다. 분석된 수치 및 결과는 국내 여성 앵커의 발성 특징의 기준으로 참고 및 활용될 수 있다.

급성 후두기관손상 환자의 수술적 치료

  • 태경;정연기;정진석;조석현;이승환;이형석
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 2003년도 제3차 추계학술대회
    • /
    • pp.110-110
    • /
    • 2003
  • 후두기관외상은 두경부 부위의 다른 외상에 비해 흔하지 않은데, 이는 연골의 유연성과 후두의 가동성, 후두가 하악과 흉골사이에 위치하여 외상시 보호 받게 되는 해부학적 특성에 기인한다. 그러나, 후두는 호흡과 발성에 중요한 기관으로 조기 진단과 정확한 평가, 적절한 치료를 못할 경우 생명을 위협 할 수 있고 삶의 질에 지대한 영향을 줄 수 있다. 이에 저자들은 급성 후두기관손상으로 수술적 치료를 받은 환자를 대상으로 손상 기전 및 임상 양상, 손상부위, 손상 정도 치료 등을 알아보고 향후 치료에 도움을 얻고자 하였다. 1996년부터 2003년까지 급성 후두기관 손상으로 수술적 치료를 받은 10명을 대상으로 후향적으로 조사를 하였다. 손상정도는 Schaefer의 분류를 따랐으며 술후 결과는 발성과 기도유지로 평가하였다. 발성의 경우 수상전과 동일하거나 유사할 경우 성공(good)으로, 수상전과는 다르지만 기능을 하는 경우는 양호(fair)로, 거의 음성이 나지 않거나 알아들을 수 없는 경우 불량(poor)로 분류하였고, 기도유지는 수상전과 동일하거나 유사할 경우 성공(good)으로, 경한 흡인이나 운동 유발성 호흡곤란이 있는 경우(fair)로 발관이 되지 않는 경우를 불량(poor)으로 분류하였다. 남녀 성비는 8대 2였고 30~40대가 4명으로 가장 많았다. 손상의 원인은 둔상인 경우(4예) 교통사고가 2례, cloth line 손상 2례, 관통상(6례)는 모두 칼에 의한 좌상이었다 증상은 피하기종이 9례, 애성이 7례, 호흡 곤란이 6례로 많았으며 손상부위는 갑상연골 골절이 5례(50%), 기도손상과 갑상선 손상이 각각 4례에서 관찰되었다. 그 외에도 윤상 연골 골절과 윤상갑상막 손상 등이 관찰되었다. 또한 점막 손상이 7례에서 관찰되었다. 성대마비는 내원시 4례에서 관찰되었다 치료는 수상 후 조기수술을 시행하였고 수상 부위를 개방하여 손상된 연조직을 일차 봉합하거나, 골절을 정복 고정하였고 3례에서 스텐트를 삽입하였다. 술후 기도유지는 모두 성공적이었고 발성기능은 6례에서 성공(good)적이었고 4례에서 양호(fair)의 결과를 보였다. 양호의 결과를 보인 모든 예가 내원시 성대 움직임의 마비나 저하를 보인 예였다. 급성 후두기관손상환자에서 조기 진단과 적절한 수술적 치료는 환자의 생명을 유지시키고 술후 발성 지능의 보존에 양호한 결과를 보였다.

  • PDF

선형다변회귀모델과 LP-PSOLA 합성방식을 이용한 음성변환 (Voice Conversion Using Linear Multivariate Regression Model and LP-PSOLA Synthesis Method)

  • 권홍석;배건성
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.15-23
    • /
    • 2001
  • 본 논문에서는 임의의 사람이 발성한 음성을 마치 다른 사람이 발성한 것처럼 들리도록 하는 음성변환 기술에 대하여 설명하고, 화자간의 성도 특성과 여기신호 특성 파라미터 변환을 독립적으로 수행하기 위한 변환방법을 실험한다. 성도 특성 파라미터 변환은 입력되는 음성신호에서 LPC (Linear Predictive Cofficient)켑스트럼을 추출하여 선형다변회귀모델에 적용하여 수행하고, 여기신호 특성 파라미터 변환은 잔차신호를 추출하여 LP-PSOLA (Linear Predictive-Pitch Synchronous Overlap and Add) 합성방식을 이용한 화자간의 평균 피치주기 변환으로 수행된다. 실험결과는 선형다변회귀모델과 LP-PSOLA 합성방식을 이용하여 변환된 음성이 대상화자의 음성에 유사함을 보여준다

  • PDF