• 제목/요약/키워드: Running Speech

검색결과 36건 처리시간 0.022초

정상성인 여성 화자와 음성장애 성인 여성 화자의 문단 낭독 시 휴지 및 호흡단락 특성의 비교 (A comparison study of the characteristics of pauses and breath groups during paragraph reading for normal female adults with and without voice disorders)

  • 표화영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.109-116
    • /
    • 2019
  • 본 연구는 정상군과 음성장애 환자군의 문단낭독 시 휴지 및 호흡단락 특성을 파악해보고자 시행되었다. 정상군 40명과 기능적 음성장애 환자군 40명을 대상으로 PAS(Phonatory Aerodynamic System) 중 Running Speech를 이용하여 '가을' 문단을 낭독하게 하였다. 이를 통해 흡기 동반 및 미동반, 어절간 및 어절내 휴지와 호흡단락을 구분하고 이에 대한 기술통계 및 집단간 통계적 유의성을 검증하였다. 그 결과 흡기를 동반한 휴지횟수는 환자군이 더 높았으나 흡기를 동반하지 않은 휴지횟수는 정상군이 더 높은 수치를 보였다. 어절경계 중 휴지가 동반된 비율은 환자군이 더 높았고 호흡단락당 음절수는 정상군이 유의하게 더 높았다. 음성장애 화자군은 성대폐쇄부전으로 인한 호흡지지가 정상군보다 부족하므로 휴지 시 흡기를 동반하는 경우나 호흡단락의 수가 더 많은 것으로 사료된다. 이는 일상대화의 자연스러움을 저해할 수 있으므로 음성장애 화자의 중재 시 휴지와 호흡단락의 빈도를 적절히 조절하는 것도 평가 및 중재에 포함해야 할 것이다.

자동차 환경내의 음성인식 자동 평가 플랫폼 연구 (A Study of Automatic Evaluation Platform for Speech Recognition Engine in the Vehicle Environment)

  • 이성재;강선미
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.538-543
    • /
    • 2012
  • 주행 중 차량내의 음성인터페이스 에서 음성인식기의 성능은 가장 중요한 부분이다. 본 논문은 차량내 음성인식기의 성능 평가를 자동화하기 위한 플랫폼의 개발에 대한 것이다. 개발된 플랫폼은 주 프로그램, 중계 프로그램 데이터베이스 관리, 통계산출 모듈로 구성된다. 성능 평가에 있어 실제 차량의 주행 조건을 고려한 시뮬레이션 환경이 구축되었고, 미리 녹음된 주행 노이즈와 발화자의 목소리를 마이크를 통해 입력하여 실험하였다. 실험 결과 제안하는 플랫폼에서 얻어진 음성인식 결과의 유효성이 입증되었다. 제안한 플랫폼으로 사용자는 음성인식의 자동화와 인식결과의 효율적인 관리 및 통계산출을 함으로서 차량 음성인식기의 평가를 효과적으로 진행할 수 있다.

A fast running FIR Filter structure reducing computational complexity

  • Lee, Jae-Kyun;Lee, Chae-Wook
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2005년도 6th 2005 International Conference on Computers, Communications and System
    • /
    • pp.45-48
    • /
    • 2005
  • In this paper, we propose a new fast running FIR filter structure that improves the convergence speed of adaptive signal processing and reduces the computational complexity. The proposed filter is applied to wavelet based adaptive algorithm. Actually we compared the performance of the proposed algorithm with other algorithm using computer simulation of adaptive noise canceler based on synthesis speech. As the result, We know the proposed algorithm is prefer than the existent algorithm.

  • PDF

고속 웨이브렛 변환 적응알고리즘을 이용한 적응잡음제거기에 관한 연구 (Adaptive Noise Canceler Using Fast Wavelet Transform Adaptive Algorithm)

  • 이채욱;박세기;오신범;강명수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.179-182
    • /
    • 2002
  • In this paper, we propose a wavelet based adaptive algorithm which improves the convergence speed and reduces computational complexity using the fast running FIR filtering efficiently We compared the performance of the proposed algorithm with time and frequence domain adaptive algorithm using computer simulation of adaptive noise canceler based on synthesis speech. As the result, the proposed algorithm is suitable for adaptive signal processing area using speech or acoustic field.

  • PDF

웨이블렛 기반 적응 알고리즘의 계산량 감소에 적합한 Fast running FIR filter에 관한 연구 (fast running FIR filter structure based on Wavelet adaptive algorithm for computational complexity)

  • 이재균;이채욱
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.250-255
    • /
    • 2005
  • 본 논문에서는 적응 신호처리의 수렴속도를 향상 시키고 복잡한 계산량을 줄이는 새로운 필터 구조를 제안한다. 그리고 제안한 알고리즘을 웨이블렛 기반 적응 알고리즘에 적용한다. 실제로 합성 음성을 사용하여 적응 잡음 제거기에 적용하여 컴퓨터 시뮬레이션을 통해 제안한 알고리즘과 기존 알고리즘과의 성능을 비교한다. 그 결과 변환 영역 알고리즘은 기존의 시간영역의 알고리즘보다 수렴속도의 향상을 보였고, 웨이블렛 알고리즘, short-length fast running FIR 알고리즘, fast-short-length fast FIR 알고리즘 그리고 제안한 알고리즘에 대한 비교 연구를 수행하였다.

  • PDF

차량환경에서 음성명령어기 사용을 위한 음성개선방법 (Speech Enhancement for Voice commander in Car environment)

  • 백승권;한민수;남승현;이봉호;함영권
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.9-16
    • /
    • 2004
  • 본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다 특히 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단일 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman 필터를 이용하여 시간상 단구간 정적 잡음을 제거한다. 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다.

자동차 환경에서의 단독 숫자음 및 명령어 인식 (Isolated Digit and Command Recognition in Car Environment)

  • 양태영;신원호;김지성;안동순;이충용;윤대희;차일환
    • 한국음향학회지
    • /
    • 제18권2호
    • /
    • pp.11-17
    • /
    • 1999
  • 본 논문에서는 DHMM(Discrete Hidden Markov Model) 기반의 음성 인식 시스템에서 소음에 강인한 인식 성능을 얻기 위하여, 관찰 확률 스무딩(observation probability smoothing) 방법을 제안하고, 자동차 소음하에서의 음성 인식에 적합한 소음처리 기법을 실험을 통해 제시한다. 제안된 관찰 확률 스무딩 방법은 입력되는 음성의 특징벡터가 소음에 오염되어 양자화(vector quantization) 과정에서 적절한 코드워드(codeword)가 아닌 다른 코드워드로 양자화됨으로써 발생하는 인식성능 저하를 막기 위하여, 각각의 코드워드와 거리가 가까운 코드워드들의 관찰 확률값을 높여주는 방법이다. 이 밖에 자동차 소음에 대한 대처 방안으로 특징 벡터의 거리 측정시의 리프터(lifter) 사용, 고역 통과 필터(high pass filter) 사용, 스펙트럴 차감법(spectral subtraction) 사용 등의 성능을 평가한다. 인식 실험은 자동차 정지 중과 주행 중의 두 가지 상황에서 녹음된 한국어 단독 숫자음과 명령어 14단어에 대해 수행하였으며, 정지 중 97.4%와 주행 중 59.1%의 인식률로부터, 제안된 관찰 확률 스무딩 방법과 리프터, 고역 통과 필터, 스팩트럴 차감법의 소음 처리 기법을 추가한 결과, 정지 중 98.3%와 주행 중 88.6%의 인식률을 얻을 수 있었다.

  • PDF

성대폴립, 성대낭종 환자들의 Laryngeal Micro Surgery 수술 전, 후 공기역학적 비교: Running Speech 중심으로 (Aerodynamic Characteristics of Voice Disorders (Polyp, Cyst) before and after Laryngeal Micro Surgery: Focus on Running Speech)

  • 문태훈;심미란;황연신;김근전;이동현;선동일
    • 대한후두음성언어의학회지
    • /
    • 제30권2호
    • /
    • pp.95-100
    • /
    • 2019
  • Background and Objectives For patients with polyps and cysts, glottal gaps resulting from their lesions have negative respiratory effects when they vocalize. Phonatory Aerodynamic System is clinically used, but is often limited in the measurement of vowels. So the researchers attempted to verify the usefulness of Phonatory Aerodynamic System by comparing differences in respiratory characteristics and patterns which can be measured by the level of connected speech. Materials and Method Among the subjects who were diagnosed through a stroboscopy, there were 33 patients with polyps and 23 patients with cysts. Then, 36 subjects who were found to have no specific findings through a stroboscopy and perceptual test were selected to the normal group. We compared respiratory characteristics and patterns. And compared vocal polyps and cysts before and after laryngeal micro surgery (LMS). Results First, difference in respiratory patterns between the normal group and the patients with polyps and cysts were examined to show that breath groups, breath group syllables, and expiratory·inspiratory volume were significantly higher in the polyp/cyst group than those in the normal group, indicating that precision was lowered during the conversation, due to reduction in speech intelligibility and interruption of communication. Second, there were significant differences in maximum phonation time, mean flow rate, and subglottal pressure among respiratory characteristics, breath groups, breath group syllables, and inspiratory volume before and after LMS, which appeared to be similar to the normal group. Conclusion The understanding of respiratory characteristics and patterns produced by patients in connected speech which is most similar to natural speech was found to be the objective and useful method for examining characteristics of the subjects.

히어 캠 임베디드 플랫폼 설계 (HearCAM Embedded Platform Design)

  • 홍선학;조경순
    • 디지털산업정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.79-87
    • /
    • 2014
  • In this paper, we implemented the HearCAM platform with Raspberry PI B+ model which is an open source platform. Raspberry PI B+ model consists of dual step-down (buck) power supply with polarity protection circuit and hot-swap protection, Broadcom SoC BCM2835 running at 700MHz, 512MB RAM solered on top of the Broadcom chip, and PI camera serial connector. In this paper, we used the Google speech recognition engine for recognizing the voice characteristics, and implemented the pattern matching with OpenCV software, and extended the functionality of speech ability with SVOX TTS(Text-to-speech) as the matching result talking to the microphone of users. And therefore we implemented the functions of the HearCAM for identifying the voice and pattern characteristics of target image scanning with PI camera with gathering the temperature sensor data under IoT environment. we implemented the speech recognition, pattern matching, and temperature sensor data logging with Wi-Fi wireless communication. And then we directly designed and made the shape of HearCAM with 3D printing technology.

후두음성 질환에 대한 인공지능 연구 (Artificial Intelligence for Clinical Research in Voice Disease)

  • 석준걸;권택균
    • 대한후두음성언어의학회지
    • /
    • 제33권3호
    • /
    • pp.142-155
    • /
    • 2022
  • Diagnosis using voice is non-invasive and can be implemented through various voice recording devices; therefore, it can be used as a screening or diagnostic assistant tool for laryngeal voice disease to help clinicians. The development of artificial intelligence algorithms, such as machine learning, led by the latest deep learning technology, began with a binary classification that distinguishes normal and pathological voices; consequently, it has contributed in improving the accuracy of multi-classification to classify various types of pathological voices. However, no conclusions that can be applied in the clinical field have yet been achieved. Most studies on pathological speech classification using speech have used the continuous short vowel /ah/, which is relatively easier than using continuous or running speech. However, continuous speech has the potential to derive more accurate results as additional information can be obtained from the change in the voice signal over time. In this review, explanations of terms related to artificial intelligence research, and the latest trends in machine learning and deep learning algorithms are reviewed; furthermore, the latest research results and limitations are introduced to provide future directions for researchers.