• 제목/요약/키워드: Speech sound

검색결과 628건 처리시간 0.028초

심장(心臟) 질환(疾患) 진단(診斷)을 위한 한의학적 청진(聽診) 기반의 설음(舌音) 분석 (A Lingual Sound Analysis based on Oriental Medicine Auscultation for Heart Diseases Diagnosis)

  • 김봉현;조동욱;허성호
    • 한국통신학회논문지
    • /
    • 제34권8B호
    • /
    • pp.830-838
    • /
    • 2009
  • 다양한 진단 기기들의 개발로 인해 발전을 거듭하고 있는 서양의학에 비해, 한의학은 임상의의 직관에 의존하여 환자들에게 시각적이며 객관적으로 질환 상태를 표현해줄 수 있는 정량화된 진단 데이터들이 부족한 실정이다. 이를 위해 본 논문에서는 한의학적 진단 방법의 시각화를 통한 객관화를 구현하기 위해 먼저, 한의학에서 몸을 다스리는 중심기관이며 생명과 정신의 근원처로 간주하고 있는 심장과 음성 신호와의 관계를 한방에 기초하여 규명하고 분석하였다. 따라서 심장은 오관 중 혀와 관련이 되어 있어 음성과 연계하여 생각하면 심장 질환자는 설음(舌音), 즉 혓소리의 발음이 불명확하다는 것에 초점을 맞추어 심장 질환의 유무를 판단하는 방법을 설계하였다. 이를 위해 심장 질환자와 정상인으로 피실험자 집단을 구성하고 이들의 음성에서 헛소리에 해당하는 부분에 대한 제2포먼트 주파수의 통계적 대역폭 분석과 형태적 모델링 분석을 수행하여 상호간의 비교, 분석을 수행하였다. 최종적으로 설계한 방법에 대해 실험 결과를 통한 상관성을 분석하였다.

3축 가속도센서 및 음성인식 모듈을 이용한 마우스 포인팅 시스템의 구현 (A embodiment of mouse pointing system using 3-axis accelerometer and sound-recognition module)

  • 이승준;신동환;아피프;김주웅;박진우;엄기환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.934-937
    • /
    • 2010
  • 본 논문에서는 물리적 스위치 방식의 인터페이스를 사용하기 불편한 장애우나 전자기기 사용에 익숙하지 못한 사람들을 위한 차세대 인터페이스를 구현하기 위해 음성인식과 3축 가속도센서를 헤드셋과 연동하여 새로운 마우스 포인팅 시스템을 구현하였다. 인식률이 상대적으로 높은 화자종속방식을 지원하고 그 음성신호를 인식해서 BCD 코드로 출력을 내는 음성인식 모듈을 헤드셋의 마이크의 출력부와 연결하여 사용하였으며, TMS320F2812 프로세서를 사용한 컨트롤러를 구축하여 3축 가속도 센서와 연동한 후 헤드셋의 머리윗부분에 장착하여 비주얼 베이직을 통해 헤드셋으로 마우스 포인팅 및 클릭이 가능한 시스템을 구현하였다.

  • PDF

난청인의 통화 청취도 향상을 위한 전화기 개발 (A Development of Telephone for the Hearing Impaired to Improve Listening Ability of Telephone Speech)

  • 이상민;송철규;이영묵;김원기
    • 대한의용생체공학회:의공학회지
    • /
    • 제18권4호
    • /
    • pp.457-466
    • /
    • 1997
  • 청력장애인이 전화상의 말에 대한 청취력을 향상시킬수 있는 보청기능이 있는 전화기를 개발하였다. 최근 청력장애인이 늘어나고 있으며 생산자로서의 사회참여 욕구 또한 늘어나고 있는데 이들은 자신의 핸디캡을 메워줄 보조기기를 강력히 원하고 있다. 보청기능 전화기는 음성으로써 외부 정보를 획득할 수 있는 기본적인 통신 보조기기의 한 형태이다. 본 연구팀은 청력장애인의 청력특성을 분석하고 전화기에 청력 보상법을 적용함으로써 보청기능이 있는 새로운 모델의 전화기를 개발하였고 3가지 분야의 시험(전기적 시험, 단어 인지도 시험, 사용자 시험)을 수행하여 이 전화기의 유용성을 평가하였다. 새 전화기는 4개의 대역통과필터를 가지고 있으며 각 밴드의 중심주파수는 전화라인의 특성과 심리음향학적인 특성을 고려하여 500, 1000, 2000, 3000 Hz로 설정하였다. 청력장애인은 전화기의 증폭특성을 자신의 청력에 맞도록 피팅(fitting)할 수 있다. 즉 자신의 손실된 청력을 잘 보상하도록 4개 필터밴드에 대한 볼륨조절을 개별적으로 조정할 수 있다. 전화기의 전체 이득은 250~32000Hz 대역내에서 20㏈ 이상이다. 시험결과 새 모델의 전화기가 기존의 전화기보다 청력장애인의 전화음성 이해도를 향상 시킨다고 증명되었다. 향후 측음 및 잡음 억제, 주파수 대역분리, 청력패턴 보상과 심리음향적 라우드니스(loudness)보상에 대한 연구가 필요하며 공학과 임상 분야에서의 청력장애인의 언어 이지특성 연구를 통하여 더욱 발전된 전화기가 개발될 수 있다고 판단된다.

  • PDF

FDBM의 음원분리 성능평가 (Evaluation of a signal segregation by FDBM)

  • 이채봉
    • 한국전자통신학회논문지
    • /
    • 제8권12호
    • /
    • pp.1793-1802
    • /
    • 2013
  • 음원분리 방법으로는 여러 가지가 제안되고 있으나 그 중에서도 주파수영역 두 귀 모델(Frequency Domain Binaural Model : FDBM)은 저 연산량과 울림 제거에 효과적이다. FDBM에 의한 두 귀 보청 시스템은 SNR이나 기여도 함수(Coherence function)에 의한 평가로 하기 때문에 인간의 청취특성을 고려하지 않고 있다. 본 논문에서는 음질의 문제 해결을 위하여 FDBM의 음원분리 성능평가를 하였다. SNR, 기여도 함수, PESQ의 세 가지 수법을 이용하여 기본 특성에 대하여 시뮬레이션을 통하여 확인하였다. 모든 결과가 FDBM에 의해 좌우 채널간 평가치의 차가 작게 되었고, 좌우 채널이 거의 같은 레벨까지 개선되었음을 확인하였다. 그리고 음원방향을 바꾸고 음원 수를 증가시킨 경우에도 일정한 개선이 보였다. SNR과 기여도 함수, PESQ의 결과를 비교하면 PESQ의 평가에서는 입력 SNR를 변동시킨 경우에도 거의 모든 조건에서 분리에 의한 평가가 개선되었다.

음성 확성을 위한 하울링 신호 자동 검출기법 연구 (A Study on the Automatic Howling Signal Detection Algorithm for Speech Sound Reinforcement)

  • 김경택;김동규;노용완;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.246-249
    • /
    • 2005
  • 음향 시스템에 있어서 하울링 현상은 음성 레벨을 제한함으로써 음성의 명료도를 저하시키는 주된 요인이다. 그리고 이를 해결하기 위한 방법으로 하울링 주파수 대역의 게인을 낮추어 음향신호의 피드백을 최소화 하는 것이 일반적이기 때문에 하울링 주파수를 찾아내는 것이 하울링 제어에 있어서 가장 핵심적인 요소가 된다. 그래서 본 논문에서는 하울링 주파수를 자동으로 검출할 수 있는 기법을 제시하였다. 이는 외부로부터 입력된 오디오신호가 하울링 신호 특성을 만족하는 정도를 ‘하울링 지수’라는 파라메터로 정의한 후 이를 기준으로 하울링 발생여부를 판단하고 하울링으로 판별된 신호의 최대 진폭을 갖는 주파수를 하울링 주파수로 출력하는 기법이다. 본 하울링 신호 자동 검출기법의 내용을 검증하기 위하여 하울링 자동 검출 프로그램을 제작하여 실험을 수행한 결과 전체 하울링 신호의 95% 이상을 검출할 수 있었다.

  • PDF

연변어 탄설음화 현상의 음성, 음운론적 분석 (The phonetics and phonology of flapping in Yonbyon dialects)

  • 강현숙
    • 대한음성학회지:말소리
    • /
    • 제37호
    • /
    • pp.1-12
    • /
    • 1999
  • In this paper, we examine the allophones of an underlying segment /l/ in Korean dialects. In particular, we examine how an underlying /l/ sound surfaces in the Korean dialect spoken at Yonbyon, China. To do so, we employ the following processes: First, we perform the phonetic studies on the allophones of an underlying /l/ in the Yonbyon dialect. Secondly, we compare the phonological environments of the allophones of an underlying /l/ in the Yonbyon dialect with the South Korean dialect. Finally, we discuss the phonological implications of the allophones of the underlying /l/ in terms of Feature Geometry and Syllable Contact Law. Based on the phonetic study, we will argue that the distinctive feature [sonorant] should be placed outside the root node and that the flap, an allophone of an underlying /l/, should be understood as an obstruent, not a sonorant.

  • PDF

유성음 구간 검출을 위한 간단한 알고리즘에 관한 연구 (A Study on the Simple Algorithm for Discrimination of Voiced Sounds)

  • 장규철;우수영;박용규;유창동
    • 한국음향학회지
    • /
    • 제21권8호
    • /
    • pp.727-734
    • /
    • 2002
  • 본 논문에서는 유ㆍ무성음 구간을 검출하기 위한 간단한 알고리즘을 제안한다. 제안된 방법은 음성의 유ㆍ무성음의 주기성에 대한 특성을 보완할 수 있는 저대역 에너지와 영교차율, 그리고 주기성의 안정성을 판단하기 위한 피치 변화량을 파라미터로 사용하였다. 유ㆍ무성음의 구간검출을 음소단위의 검출이라는 측면에서 접근하여 음소군의 검출율과 음소군내의 음소의 검출율을 얻었다. TIMIT코퍼스 (corpus)를 데이터베이스로 사용하여 실험했을 때 유성음 음소 검출율이 약 13% 향상되었다.

Applying the Bi-level HMM for Robust Voice-activity Detection

  • Hwang, Yongwon;Jeong, Mun-Ho;Oh, Sang-Rok;Kim, Il-Hwan
    • Journal of Electrical Engineering and Technology
    • /
    • 제12권1호
    • /
    • pp.373-377
    • /
    • 2017
  • This paper presents a voice-activity detection (VAD) method for sound sequences with various SNRs. For real-time VAD applications, it is inadequate to employ a post-processing for the removal of burst clippings from the VAD output decision. To tackle this problem, building on the bi-level hidden Markov model, for which a state layer is inserted into a typical hidden Markov model (HMM), we formulated a robust method for VAD not requiring any additional post-processing. In the method, a forward-inference-ratio test was devised to detect the speech endpoints and Mel-frequency cepstral coefficients (MFCC) were used as the features. Our experiment results show that, regarding different SNRs, the performance of the proposed approach is more outstanding than those of the conventional methods.

한글문자의 인식에 관한 연구(IV) (Mathematical Analysis of the Structure of Korean Characters)

  • 최주근
    • 대한전자공학회논문지
    • /
    • 제9권4호
    • /
    • pp.25-32
    • /
    • 1972
  • 이 논문은 한글문자의 조직을 수학적인 관점에서 분석 겸토하였다. 1) 자모문자와 조합문자외 조직개념을 통일된 관점에서 겸토하였고. 2) 문자는 24개의 기본자음과 모음이 음에 따라 조합될뿐만 않이라 그것은 또한 음(또는 문자)의 집단을 한음으로서 일거에 결정짖고 또 계단적으로 발전하는 특의한 성질을 가지고 있다는 것을 지적하였다. 3) 또 24개의 자모가 matrix 조직에 의한 수학적 방법에 의하여 14,364자가 조직배열 된다는 것을 기술하였다.

  • PDF

섹시한 음성의 음향학적 특징 연구 (A Study on the Acoustic Characteristics of Sexy Voice)

  • 정옥란;조성미
    • 대한음성학회지:말소리
    • /
    • 제57호
    • /
    • pp.73-84
    • /
    • 2006
  • The purpose of this study was to explore the acoustic characteristics of sexy voice. In this study, we measured acoustic parameters (fundamental frequency, jitter, shimmer, and nasalance) of a sustained vowel sound produced by 40 actors (20 males and 20 females) and 40 non-actors (20 males and 20 females). Digital audio recordings were made in the sustained vowel |a| for acoustic analyses using Praat (version 4.1.9) and Nasal View (version 4.5). Twenty voice pathologists participated in the listening experiment and judged the degree of sexiness on a 7-point scale. The results showed that fundamental frequency, shimmer and nasalance had significant differences between actors and non-actors. The acoustic parameters of sexy voice matched perceptual aspects of a previous study: Low fundamental frequency-low pitch and high shimmer-husky voice. On the other hand, the nasalance score did not match that of the previous study: Decreased nasalance had a higher score on sexiness scale judged by the listeners. It would be desirable to study the voice quality by analyzing and controlling more acoustic and auditory parameters for practical applications in the future.

  • PDF