• Title/Summary/Keyword: 발성

Search Result 1,738, Processing Time 0.035 seconds

Design & Implementation of Voice-Interface for Web-Browsing (웹 브라우징을 위한 음성 인터페이스 설계 및 구현)

  • Lee, Seung-Ho;Youk, Sang-Cho;Kwon, Young-Mi;Lee, Geuk
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.04a
    • /
    • pp.106-109
    • /
    • 1998
  • WWW은 무한한 확장 가능성을 지닌 HTTP(Hyper-Text Transfer Protocol)와 편리한 웹 브라우져를 통해 질적, 양적 성장 계속해 왔으며 특히 GUI(Graphic User Interface) 환경에서 동작하는 웹 브라우져는 WWW이 수많은 이용자를 확보하는데 일익을 담당했다. 본 논문에서는 이 웹 브라우져에 음성인식 기술을 접목하여 WWW의 이용자가 자신의 음성으로 편리하게 웹 브라우징을 할 수 있도록 하는 음성 인터페이스를 설계, 구현 한다. 본 음성 인터페이스는 계속적으로 입력되는 음성 정보 중 화자의 발성음을 추출하여 음성 인식기에 전달하는 음성 입력기와 화자의 발성을 인식하는 음성 인식기 그리고 인식결과를 웹 브라우져에게 처리 하도록 하는 결과 처리기로 구성되어 있다.

  • PDF

Primary Malignant Melanoma of the Cervical Spinal Cord -Case Report- (경추 척수의 원발성 흑색종양)

  • Kim, Chul-Yong;Choi, Myung-Sun
    • Radiation Oncology Journal
    • /
    • v.5 no.1
    • /
    • pp.43-47
    • /
    • 1987
  • Primary malignant melanom of the spinal cord is extremely rare. The best treatment appears to be total surgical excision, when possible and postoperative irradiation, but the value of radiotherapy is unknown because the number of cases that have been irradiated postoperatively is small. The 2-year survival rate for primary malignant melanoma of the spinal cord is usually less than $16\%$ and most patients died within 1 year. The prognosis of this tumor is poor.

  • PDF

Automatic Speaker Identification by Sustained Vowel Phonation (지속적으로 발성한 모음에 의한 화자인식)

  • Bae, Geon-Seong
    • The Journal of the Acoustical Society of Korea
    • /
    • v.11 no.1
    • /
    • pp.35-41
    • /
    • 1992
  • A speaker identification scheme using the speaker-based VQ codecook of a sustained vowel is proposed and tested. With the pitch synchronous LPC vector of the sustained vowel /i/ as a feature vector, a VQ codebook size of 4 was found to be suitable to characterize each speaker's feature space. For 40 normal speakers (20 males, 20 females), we achieved the correct identification rate of 99.4% with a training data set, and 89.4% with a test data set with speech samples of only 50 pitch periods.

  • PDF

A Comparison of Aerodynamic Characteristics in Muscle Tension Dysphonia and Adductor Spasmodic Dysphonia (근긴장성 발성장애와 내전형 연축성 발성장애의 공기역학적 특성 비교)

  • Heo, Jeonghwa;Song, Kibum;Choi, Yanggyu
    • Phonetics and Speech Sciences
    • /
    • v.5 no.4
    • /
    • pp.63-70
    • /
    • 2013
  • The purpose of this study is to show the aerodynamic characteristics and differences in muscle tension dysphonia and adductor spasmodic dysphonia to predict factors which will provide additional information while preparing for the objective examination standard to distinguish the two dysphonias. Forty-eight individuals diagnosed with muscle tension dysphonia and adductor spasmodic dysphonia participated in this study. PAS was used in order to find the aerodynamic characteristics for the two dysphonias. The outcomes of this study show that the airflow variation and glottal resistance of the two groups showed noticeable differences. This study concludes that the aerodynamic characteristics may be used as additional information on diverse evaluations to classify muscle tension dysphonia and adductor spasmodic dysphonia.

Improvement of Bit Rate applying the Speaking Rate and PSOLA Technique of Speech in CELP Vocoder (음성신호의 발성율과 PSOLA기법을 적용한 음성 보코더 전송률 개선에 관한 연구)

  • 장경아;서지호;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2003.11a
    • /
    • pp.45-48
    • /
    • 2003
  • In general, speech coding methods are classified into the following three categories: the waveform coding, the source coding and the hybrid coding. Fast speaking is possible to encode with a few information compared with slow speaking rate. In case of speaking rate, low frequency band is more important than high frequency band while listening. Speech vocoding technique is developing to way with low bit rate and complexity and high sound quality. the CELP type of vocoder support very good sound quality with low bit rate but these vocoders don't consider about the speaking rate. When we consider speaking rate and encode the frame depending on the speaking rate, the bit rate is able to reduce the bit rate than the conventional vocoder. We propose the technique to estimate the speaking rate and applied PSOLA technique in case of the frame of slow speaking rate. As a result of simulation bit rate can be reduced about 300 bps.

  • PDF

A Case of Mutational Dysphonia Treated with Type III Thyroplasty (제3형 갑상연골성형술에 의한 변성발성장애의 치험 1례)

  • 최홍식;조창현;김광문
    • Proceedings of the KSLP Conference
    • /
    • 1994.06b
    • /
    • pp.90-90
    • /
    • 1994
  • 변성발성장애(Mutational dysphonia)는 원인이 확실히 밝혀져 있지는 않지만, 변성기에 성호르몬의 작용에 의한 정상적인 후두의 발육이 제대로 이루어지지 않아서 발생되는 것으로 추정되고 있다. 임상 양상은 대개 성인 남자임에도 불구하고 병적으로 음성의 기본주파수(fundamental frequency)가 높아서 여자 목소리에 가깝게 들린다는 것을 주 증상으로 하고 있으며, 이학적 검사상 성대의 움직임은 정상이나, 성대의 두께가 얇거나, 성대의 길이가 짧고 긴장도가 증가되어 있는 것 같이 보인다. 음성치료를 시도해 볼 수 있으며, Isshiki가 제 3형 갑상연골성형술로 효과적으로 치료될 수 있다고 보고한 이래, 다수의 보고자들에 의해 시도되어 왔다. (중략)

  • PDF

Treatment of a Case with Dysphonia due to Posterior Glottic Chink using Arytenoid Adduction and Type I Thyroplasty (피열연골내전술과 제1형 갑상연골성형술을 이용한 성문후부부전에 의한 발성장애의 치료 1례)

  • 최홍식;최재진;김광문
    • Proceedings of the KSLP Conference
    • /
    • 1994.06b
    • /
    • pp.87-87
    • /
    • 1994
  • 편측 성대마비에 의한 부전의 수술적 치료로는 그 동안 테플론주입에 의한성대내측전위술, 제1형 갑상연골성형술, 또는 피열연골내전술 등이 이용되었으며, 성대부전이 심하거나 성대높이에 차이가 있을 때는 제1형 갑상연골성형술 등에 비해 피열연골내전술이 좋은 결과를 보이는 것으로 보고되고 있다 그러나, 성대의 움직임은 있으면서 뒷쪽에 심한 성대부전(posterior glottic chink)을 보이는 경우에는 아직은 특별한 수술적인 방법이 없는 바, 저자들은 갑상선 부분절제술 후에 생긴 양쪽성대의 움직임은 있으면서 성문 뒷쪽에 심한 부전을 보인 발성장애 환자 1례에서 제1형 갑상연골성형술과 동시에 피열연골내전술을 시행하여 좋은 결과를 얻었기에 보고하는 바이다. (중략)

  • PDF

Effect of Radiation Therapy on Voice Parameters in Early Layngeal Cancer and Normal Larynx (방사선요법이 초기 후두암 및 정상후두의 음성지표에 미치는 영향)

  • 박한종;이인자;박영학;김민식;조승호
    • Proceedings of the KSLP Conference
    • /
    • 1994.06b
    • /
    • pp.88-88
    • /
    • 1994
  • 초기후두암에 대한 방사선요법은 수술적 치료에 비하여 정상 후두기능 즉 발성 기능을 최대 한 보존할 수 있는 장점이 있다. 그러나 방사선 치료법은 병적 혹은 정상 후두조직에 섬유화, 점막부종 혹은 점액선 간소등의 변영을 초래할 수 있기 때문에 어느 정도의 음성장애를 유발하게 된다. 방사선요법이 후두의 발성기능에 미치는 영향을 알아보기 위하여 초기후두암 환자와 두경부암으로 인하여 정상후두에 방사선 조사를 받았던 환자 및 정상대조군 각 20명에 대하여 음향 및 공기역학적 음성검사를 시행하여 음성장애의 특성을 비교, 검토하였다. 초기 후두암 환자들에게 사는 방사선 치료 후 음성지표들이 관찰되었고, 정상후두에는 큰 영향을 미치지 않았다. (중략)

  • PDF

A PZrosodic Characteristics of Korean Read Sentences in Discourse Context (한국어 낭독체 담화문의 운율적 특징)

  • 성철재
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.209-213
    • /
    • 1998
  • 50개의 담화단독 문장과 연속발성 문장을 대상으로 무장의 첫 어절과 마지막 어절에서의 첫 음절과 마지막 음절의 운율특징을 조사하였다. 이를 체계적으로 살펴 보기 위하여 각 어절에서의 마지막 음절의 음향변수에 대한 첫 음절의 음향변수의 비율을 얻은 뒤 이를 대상으로 하여 평균값과 분포를 구하였다. 지속시간의 경우 두 스타일 간에 주목할 만한 큰 차이점은 없었으나 담화 연속 문장의 문두에서 화자의 조음시간 프로그래밍이 약간 조화롭지 못함을 알 수 있었다. Fo는 마지막 어절 부분의 비율값이 두 스타일간 통계적으로 유의한 차이를 보였으며 운율자질로 기능할 수 있는 가능성을 보였다. 에너지는 Fo와 유사한 분포경향을 보인다. 문미 어절의 마지막 음절이 첫 음절의 약 85% 정도의 힘으로 발성됨을 알 수 있고, 담화 연속 발화의 마지막 어절에서 단독 발화문보다 상대적으로 강하게 조음되었음을 알 수 있었다.

  • PDF

Text-dependent Speaker Verification System in SVAPI 1.0 Environment (SVAPI 1.0 환경에서의 어구 종속 화자 확인 시스템)

  • 김유진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.401-405
    • /
    • 1998
  • SVAPI 1.0 환경에서의 어구 종속 화자 확인 시스템에 대해 기술한다. 구현된 시스템은 궁극적으로 공중 전화망 응용이 가능한 실용 시스템을 목표로 개발되었으며 이를 위해 SVAPI 위원회에 의해 제안된 SVAPI 1.0을 개발 환경으로 사용하였다. SVAPI는 객체 지향 구조, 클라이언트-서버 및 telephony 환경의 지원등이 특징이며 어플리케이션과 엔진을 독립적으로 개발할 수 있는 이점을 제공한다. 구현된 데모 시스템은 펜티엄 프로세서와 Windows95/NT 4.0 운영체제 그리고 Win16/Win32 API를 통해 제어 가능하며 음성 입력이 가능한 디바이스를 장착한 IBM 호환 PC이다. 화자의 성문 등록은 화자가 동일한 어구를 3회 발성하여 이뤄지며 등록과 확인의 응답속도는 모두 1초 이내이다. 소프트웨어의 구성은 크게 어플리케이션과 어구 종속 화자 확인 엔진으로 구분할 수 있으며 엔진은 끝점 검출 알고리즘, 음성 특징 추출 알고리즘 그리고 연속 HMM 기반의 화자 성문 모델 등록 및 유사도 계산 등을 포함한 확인 알고리즘으로 구성되어 있다. 화자의 성문은이름과 같은 약 3음절 이상의 단어로 등록되고 테스트되었다. 엔진의 객관적인 평가를 위해 전화선을 통해 남자 6명, 여자 3명의 화자로부터 자신의 이름을 각각 40회 발성하여 구축된 음성 데이터 베이스를 사용하였으며 실험 결과 남자는 2.85%, 여자는 2.44%의 EER을 각각 얻었다.

  • PDF