• 제목/요약/키워드: Voice function

검색결과 436건 처리시간 0.024초

연축성 발성장애(Spasmodic Dysphonia)에 대한 보톡스 주입치료 (Botox Injection for the Management of Spasmodic Dysphonia)

  • 최홍식
    • 대한후두음성언어의학회지
    • /
    • 제23권2호
    • /
    • pp.99-103
    • /
    • 2012
  • Spasmodic dysphonia is a chronic, focal, movement-induced, action-specific dystonia of the laryngeal musculature during speech. It can have a profound effect on quality of life, severely limiting people's communication, especially via telephone and in noisy backgrounds. Spasmodic dysphonia (SD) is usually of the adductor type characterized by glottic contractions causing tightness and voice breaks with forced-strangled voice, but it may also be abductor type or, much less commonly, mixed. Treatment options for adductor spasmodic dysphonia (ADSD) include voice therapy, surgical procedures, and botulinum toxin injections (Botox). The use of Botox injected into the laryngeal muscles remains the "gold standard" treatment for reducing the vocal symptoms of ADSD and Botox induces a temporary paresis of the laryngeal muscles and provides short-term relief of symptoms. Repeated injections of the laryngeal muscles, generally every 3-4 months, are required for continuous relief of symptoms. Improvement in vocal function has been reported after use of Botox injections, though a completely normal voice is rarely achieved. In this hospital, 1,030 patients have been enrolled for Botox injection therapy so far (May, 2012). In this review article, I'd like to present my personal experience of management of spasmodic dysphonia mainly by Botox injection.

  • PDF

다중 응답 분류회귀트리를 이용한 음성 개성 변환 (Voice Personality Transformation Using a Multiple Response Classification and Regression Tree)

  • 이기승
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.253-261
    • /
    • 2004
  • 본 논문에서는 음성 신호가 지니고 있는 화자 의존적 특징 변수를 변환 시키는 음성 개성 변환 기법이 새롭게 제안되었다. 제안된 방법은 성도 전달 함수의 특성을 반영하는 켑스트럼 벡터와 여기 신호의 특성을 반영하는 피치 값을 변환 대상 변수로 삼았으며, 이들에 대한 변환 기법으로 다중 응답 분류 회귀 트리를 사용하였다. 다중 응답 분류 회귀 트리는 기존의 분류 회귀 트리를 다차원 확장시킨 형태로서, 반응값이 벡터 형태로 존재하는 분류 회귀 트리를 의미한다. 본 논문에서는 기존의 코드북 메핑 방법과 비교하여 제안된 기법의 성능을 평가하였으며, 분류 회귀 트리에 입력되는 관찰값을 다양하게 변화시켜 트리의 복잡도와 변환 성능을 정량적으로 분석하였다. 네 명의 화자를 이용한 음성 개성 변환 실험에서, 기존의 코드북 메핑과 비교하여 객관적으로 우수한 성능을 나타내었으며, 청취 테스트에서도 변환음이 목표로 하는 화자의 음성과 유사함을 관찰할 수 있었다.

연축성 발성장애 환자의 음향학적 및 공기역학적 양상 (The Acoustic and Aerodynamic Aspects of Patients with Spasmodic Dysphonia)

  • 이주환;김인섭;고윤우;오종석;배정호;윤현철;최성희;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제11권1호
    • /
    • pp.98-103
    • /
    • 2000
  • Background and Objectives : The etiology and pathophysiology of spasmodic dysphonia is yet unknown. This study was performed to determine if any laryngeal aerodynamic parameter distinguish the voice of patient diagnosed as having adductor spasmodic dysphonia from individuals with normal voice production and to investigate the pathophysiology of spasmodic dysphonia. Materials and Methods : fifteen women diagnosed as having adductor spasmodic dysphonia and fifteen normal control women participitated in this study Maximum phonation time, mean air flow rate, subglottic pressure, vocal efficiency, Vfo, NHR, VTI, FTRI, ATRI, Jitter percent, Shimmer percent were obtained from the participants using 'MDVP(multi-dimensional voice program)' of CSL(Computerized Speech lab, Kay Elemetrics, Co., Model No. 4300), and 'maximum sustained phonation' and 'IPIPI test' of AP II(Aerophone II, Kay Elemetrics, Co., Model 6800). Results : T-test statistical analysis revealed statistically different values for vocal efficiency, Vfo, NHR, MPT, litter percent, Shimmer percent between the spasmodic dysphonia group and the control group. Conclusions : Spasmodic dysphonia affects the ability of the laryngeal mechanism to function effectively. Results from our study demonstrate that certain aerodynamic and acoustic parameters distinguish adductor spasmodic dysphonia from normal voice.

  • PDF

Human Voice, This Mystery

  • Horiuchi, Terumichi
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.378-378
    • /
    • 1996
  • Human beings and chimpanzees are very much alike. and scientists say there is only 1% difference between them. Contrary to our expectations, the difference lies not in brains but in tracheas ( windpipes ). Those of human beings are bigger and longer than those of chimpanzees. Thu means more air is inspired and expired as breath. About breath there are interesting descriptions in the Bible. In the Genesis it says God made a man out of soil and breathed life-giving breath into his nostrils and the man began to live. In other part it says life exists between incoming breath and outgoing breath. Thus breath plays key role is our life. In Hebrew and Greek, breath and spirit are the same words. In Hebrew it is ‘Luahf’ and in Greek, ‘Pneuma’ With breath and mouth organs human beings produced voice, and with haritage and through leaning we train our voice to reach the level of language which convey our culture. My contention is to realize the gift of voice and train it so that it can perform proper function as a tool of conveying our thought and culture. This is a kind of practice of speech and it may be called speechology. It includes the following practical methods: 1. Try to read aloud. 2. Encourage recitation, 3. Make public speaking as possible. 4. Learn theories of phonetics; such as about pronunciation, accent, intonation, prominence, assimilation and so on.

  • PDF

(보이스)피싱의 국가경제손실과 보안효과 연구 (A Study on National Economic Loss and Economic Effects of Security Measures against (Voice)Phishing)

  • 신진;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.157-160
    • /
    • 2012
  • (보이스)피싱은 해독능력이 약한 노인과 약자를 대상으로 사회공학적인 방법을 이용하여 경제적 피해를 유발시킨다. 최근까지도 중국으로부터 (보이스)피싱이 국민의 경제적 파탄을 야기하였고 대한민국 전체로 보더라도 (보이스)피싱으로 인한 국가경제손실은 매우 크다. 최근 (보이스)피싱을 막기위한 보안시스템과 금융보안장치를 강화하고 있으나 보안효과가 얼마나 큰가는 검증하기 쉽지 않다. 본 논문에서는 (보이스)피싱으로 인한 대한민국의 경제적손실과 보안장치강화에 따른 보안효과의 경제성에 관하여 연구하고자 한다.

  • PDF

음성 명령을 이용한 개인용 컴퓨터 조작 시스템의 구현 (The Development of Personal Computer Control System Using Voice Command)

  • 이태준;김동현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.101-102
    • /
    • 2018
  • 개인용 컴퓨터 사용자들은 키보드와 마우스를 장시간 사용 시 손목에 피로를 느끼거나 질환이 생길 수 있다. 그리고 손이 불편한 지체 장애우는 키보드와 마우스를 사용해 컴퓨터를 조작하기 힘들다. 이를 해결하기 위한 키보드와 마우스 대체품은 기능이 제한되거나 가격이 비싼 문제가 있다. 이 논문에서는 아마존 에코와 아마존 웹 서비스의 람다 함수를 이용하여 음성명령으로 개인용 컴퓨터를 조작하기 위한 시스템을 구현한다. 구현한 시스템은 사용자의 음성 명령을 아마존 웹 서버에서 처리하여 개인용 컴퓨터로 전송한다. 개인용 컴퓨터는 전송 받은 명령을 처리하고 이를 이용하여 응용 프로그램을 조작한다.

  • PDF

음성 패킷을 이용한 채널의 에러 정보 전달 (Transmission of Channel Error Information over Voice Packet)

  • 박호종;차성호
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.394-400
    • /
    • 2002
  • 디지털 음성 통신에서 송신하는 음성 패킷의 전송 에러율을 알면 송신 채널 상황에 적합한 압축 동작을 통하여 전체 통신의 품질을 향상시킬 수 있다. 그러나 현재의 이동통신과 인터넷 통신에서는 음성 패킷의 전송 에러정보를 알려주는 프로토콜이 지원되지 않는다. 본 논문에서는 이를 해결하기 위하여 채널의 전송 에러 정보를 음성 패킷에 삽입하여 실시간으로 전달하는 방법을 제안한다. 제안하는 채널 에러 정보 삽입 방법은 ACELP (algebraic code-excited linear predictin) 코드벡터의 펄스 위치의 상관 관계를 이용하며, 이를 통하여 추가정보 삽입에 의한 음질 저하를 막고 오인식율을 줄일 수 있다. 다양한 음성 데이터를 이용하여 제안한 방법의 성능을 측정하였으며 음질의 저하가 거의 발생하지 않고 정보의 검출 능력과 오인식율에서 만족할 만한 성능을 가지는 것을 확인하였다.

외부 자극에 따른 부비동과 포먼트주파수와의 상관성 분석 (Correlation Analysis of Between Paranasal Sinuses and Formant Frequency According to External Stimulation)

  • 김봉현
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1955-1961
    • /
    • 2013
  • 부비동은 얼굴에서 뼈 속에 존재하는 공기로 가득 찬 빈 공간이다. 그러나 부비동에 지속적으로 염증이 생기고 고름이 차면 축농증으로 발병하여 두통과 무기력증을 호소하고 음성의 변화를 가져온다. 따라서 본 논문에서는 외부 자극을 통해 부비동의 변화를 음성분석 요소로 측정하여 부비동 관련 질환을 예측하는 연구와 전두동, 사골동, 상악동, 접형동으로 구성된 부비동의 영역별 기능을 분석하는 연구를 수행하였다. 이를 위해 부비동 영역에 냉찜질 자극을 시행하고 자극 전과 후의 음성에 대한 포먼트주파수를 측정하여 상호간의 상관성 분석을 통해 외부 자극이 부비동에 미치는 영향을 분석하였다.

딥러닝 기반 가창 음성합성(Singing Voice Synthesis) 모델링 (Deep Learning based Singing Voice Synthesis Modeling)

  • 김민애;김소민;박지현;허가빈;최윤정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.127-130
    • /
    • 2022
  • 본 논문은 생성자 손실함수를 이용한 가창 음성합성 모델링에 대한 연구로서 기존 이미지 생성에 최적화된 딥러닝 알고리즘 중 BEGAN모델을 오디오 생성모델(SVS모델)에 적용시킬 때 발생할 수 있는 여러 요인에 대해 분석하고 최적의 품질을 도출하기 위한 실험을 수행하였다. 특히 BEGAN 기반 모델에서 제안된 L1 loss가 어느 시점에서 감마(𝛾)파라미터의 역할을 상실하게 한다는 점을 개선하고자 알파(𝛼)파라미터를 추가한 후 각 파라미터 값들의 구간별 실험을 통해 최적의 값을 찾아냄으로써 가창합성 생성물의 품질향상에 기여할 수 있음을 확인하였다.

  • PDF

음성 게이트웨이 응용을 위한 AAL2 프로세서 구현 (Implementation of an AAL2 processor for voice gateway application)

  • 이상길;최명렬
    • 한국통신학회논문지
    • /
    • 제27권11C호
    • /
    • pp.1152-1157
    • /
    • 2002
  • 본 논문에서는 voice gateway응용에서 널리 사용되어지는 AAL2 프로세서의 구현과정에 대해 기술하였다. 본 프로세서는 음성과 프레임 모드 데이터를 서비스하기 위한 CPS와 SSCS를 지원한다. 또한 4개의 ATM 가상연결을 지원하며, 그 연결은 총 1020개의 AAL2채널을 포함한다. ATM 셀 인터페이스로 UTOPIA Level 1을 사용하고, 음성 채널 인터페이스로 4개의 TDM포트를 갖고 있다. TDM포트에는 PCM과 ADPCM데이터가 존재한다. 대부분의 AAL2프로세서들은 소프트웨어로 구현되어 있거나 또는 소프트웨어와 하드웨어의 혼합으로 되어 있다. 그러므로 데이터를 처리하는데 어느 정도의 지연이 있게 된다. 그러나 본 논문의 프로세서는 하드웨어로 구현되어 있기 때문에 CPS와 SSCS에 대해 매우 적은 처리지연을 보이고 있다. 또한, CPS 패킷들의 루프백과 스위칭이 가능하게 구현되었고, TDM채널에 대해서도 역시 스위칭과 루프백이 가능하도록 구현되었다. 구현된 프로세서의 특징은 CPS와 SSCS의 so부 구조가 소프트웨어의 함수를 보는 듯하다는 것이다. 또한 그 블록을 포함하는 다른 블록들을 설계 시 재사용되어 질 수 있으며, 대용량의 채널을 수용할 때에도 응용 가치가 높다고 사료된다.