• 제목/요약/키워드: Speech analysis

검색결과 1,575건 처리시간 0.054초

성대용종의 중증도와 음향지수의 상관관계 (A Study of Correlation Between Severity of Vocal Polyp and Acoustic Parameters)

  • 홍기환;양윤수;김진성;이재근;이은정
    • 대한후두음성언어의학회지
    • /
    • 제17권1호
    • /
    • pp.17-27
    • /
    • 2006
  • Background and Objectives: Vocal polyp is the most common disease that causes hoarseness and its incidence is increased currently. The purposes of this study are to investigate the correlation between severity of vocal polyp and acoustic parameters and compare these data with those of the normal Korean. Materials and Methods: We analyzed the acoustic parameters of sustained vowel for 70 vocal polyp patients and 20 normal controls. A CSL(computerized speech lab) was used to carry out the analysis of the voice sample and statistical analysis was used Spearman correlation coefficient & t-test. Results: According to the conclusion of correlation analysis, 21 parameters of all the 34 parameters are significant. Conclusion: These data will be served as basic data for the evaluation of postoperative assessment of the patients with vocal polyp.

  • PDF

라인케부종환자의 음성분석 (Acoustic Analysis of Reinke Edema)

  • 김상균;최홍식;공석철;홍원표
    • 대한후두음성언어의학회지
    • /
    • 제7권1호
    • /
    • pp.11-19
    • /
    • 1996
  • Reinke's edema is used for describing varying degrees of chronic swelling of the vocal folds. The acoustic analysis of Reinke's edema has not been reported so far in this country. The purpose of this study is to clarify acoustic and aerodynamic characteristics of the Reinke's edema. Several acoustic evaluations & aerodynamic studies were done in 20 Reinke's edema patients and the data was compared with those of 20 normal controls. Videolaryngoscopy also was done to classify the severity in grading. We used C-Speech, Doctor speech science, and Phonatory function analyser. In C-Speech, we compared jitter, shimmer, and SNR(signal to noise ratio) of normal and Rrinke's edema patient. In Doctor speech science, we compared NNE(Glottal noise energy), speech fundamental frequency, voice quality between two groups. And in phonatory function analyser for aerodynamic function test, we compared speech intensity, airflow rate, and expiratory pressure between two groups. In conclusion, Reinke's edema patients showed lower voice pitches than normal, additionally jitter, shimmer, SNR(signal to noise ratio), NNE(Glottal noise energy), airflow rate, and expiratory pressure may be meaningful parameters for diagnosis and prognosis for treatment.

  • PDF

독립성분분석법을 이용한 음성인식기의 성능향상 (Performance Improvement of Speech Recognition Based on Independent Component Analysis)

  • 김창근;한학용;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.285-288
    • /
    • 2001
  • 본 논문에서는 신호간의 의존성과 관련성이 최소가 되도록 분리하는 독립성분분석 법을 이용하여 입력음성에서 변동량이 많은 방향으로 주축을 찾아 그 정보를 이용하여 데이터의 중복성을 제거한 후 음성특징벡터를 추출하는 방법을 제안한다. 학습 하고자하는 음성인식기의 음성에서 독립성분분석법을 이용하여 특징벡터를 추출하고 HMM 을 사용하여 기존의 음성특징벡터로 사용되는 mel-cepstrum과 비교하여 학습, 인식실험을 수행하였으며 제안한 방법에서 음성인식성능의 향상을 확인할 수 있었다. 또한, 인식시 주변여건에 따라 잡음에 의한 인식성능 저하에도 유연히 대처할 수 있음을 앞 수 있었다.

  • PDF

음성신호의기본주파수 검출 (On a Detection for the Fundamental Frequency of Speech Signals)

  • 배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.42-47
    • /
    • 1994
  • A pitch detector is an essential component in a variety of speech processing systems. Besides providing valuable insights into the nature of the exciation source for speech production, the pitch contour of an utterance is useful for recognizing speakers, aids-to-the handicapped, and is required in almost all speech analysis-synthesis system. Because of the importance of the pitch detection, a wide variety algorithms for pitch detection have been proposed in speech procesing literature. Thus, in this paper we discuss th evarious type of pitch detection algorithms which have been proposed until now. Then we provide th eperformance measurements for seven pitch detection algorithms.

  • PDF

감정변화에 따른 음성정보 분석에 관한 연구 (Study of Emotion in Speech)

  • 장인창;박미경;김태수;박면웅
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2004년도 추계학술대회 논문집
    • /
    • pp.1123-1126
    • /
    • 2004
  • Recognizing emotion in speech is required lots of spoken language corpus not only at the different emotional statues, but also in individual languages. In this paper, we focused on the changes speech signals in different emotions. We compared the features of speech information like formant and pitch according to the 4 emotions (normal, happiness, sadness, anger). In Korean, pitch data on monophthongs changed in each emotion. Therefore we suggested the suitable analysis techniques using these features to recognize emotions in Korean.

  • PDF

음성신호의 상위 포만트에 대한 ZCR-파라미터 검출에 관한 연구 (On a Detection of the ZCR-Parameter for Higher Formants of Speech Signals)

  • 유건수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.49-53
    • /
    • 1992
  • In many applications such as speech analysis, speech coding, speech recognition, etc., the voiced-unvoiced decision should be performed correctly for efficient processing. One of the parameters which are used for voice-unvoiced decision is zero-crossing. But the information of higher formants have not represented as the zero-crossing rate for higher formants of speech signals.

  • PDF

선천성 청각장애성인의 시각적피드백 이용 음도치료 효과 (The Effect of Visual Feedback Intervention on Voice Pitch of Adult with Hearing Impairment)

  • 어수지;윤미선
    • 음성과학
    • /
    • 제12권4호
    • /
    • pp.215-226
    • /
    • 2005
  • This study is an attempt to investigate effect of pitch treatment program using visual feedback for profound deaf adults. Dr. Speech program was applied as a training tool. The subjects of this study were 3 profound deaf adults. Speech samples for evaluation were vowel prolongations and connected speech. Analysis was performed under the principle of single subject research design. As results of this study, all subjects showed the treatment effects which were represented by lowering fundamental frequency and speaking fundamental frequency.

  • PDF

3-5세 일반아동의 말소리에 대한 융합적 분석: 단어와 자발화를 중심으로 (Convergent Analysis on the Speech Sound of Typically Developing Children Aged 3 to 5 : Focused on Word Level and Connected Speech Level)

  • 김윤주;박현주
    • 한국융합학회논문지
    • /
    • 제9권6호
    • /
    • pp.125-132
    • /
    • 2018
  • 본 연구는 단어 및 자발화 평가를 통해 학령전 아동의 말소리 산출 특성과 평가 관련 양상을 살펴보고자 하였다. 이를 위해 3-5세 일반아동 72명(연령별 각각 24명)을 대상으로 아동용발음검사(APAC)를 실시하고, 연령과 성별에 따른 자음정확도와 명료도의 차이, 자음정확도와 명료도 간 상관관계, 자음 위치 및 조음 방법에 따른 말소리 오류 패턴을 분석하였다. 연구 결과, 자음정확도와 명료도는 연령에 따라 증가하였으나 성별에 따른 차이는 없었고, 상관관계는 5세 집단에서 통계적으로 유의했으며, 말소리 오류 패턴 또한 두 평가에서 다르게 나타났다. 본 연구 결과는 아동의 말소리 산출이 언어단위에 따라 다르게 나타나기에, 이들의 말소리 능력을 적절히 파악하려면 단어뿐 아니라 자발화 평가가 병행되어야 함을 보여주었다. 이는 단어에 대한 자음정확도만으로 언어장애 등급을 판정하는 현재 기준에 대한 재검토와 추가적인 연구가 필요함을 시사한다.

구개열 환자 발음 판별을 위한 특징 추출 방법 분석 (Analysis of Feature Extraction Methods for Distinguishing the Speech of Cleft Palate Patients)

  • 김성민;김우일;권택균;성명훈;성미영
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1372-1379
    • /
    • 2015
  • 본 논문에서는 구개열 환자의 장애 발음과 정상인의 발음을 자동으로 구분하여 판별하는데 사용될 수 있는 특징 추출 방법들의 성능을 분석하는 실험에 대하여 소개한다. 이 연구는 발성 장애인의 복지 향상을 추구하며 수행하고 있는 장애 음성 자동 인식 및 복원 소프트웨어 시스템 개발의 기초과정이다. 실험에 사용된 음성 데이터는 정상인의 발음, 구개열 환자의 발음, 그리고 모의 환자의 발음의 세 그룹으로부터 수집된 한국어 단음절로서 14개의 기본 자음과 5개의 복합 자음, 7개 모음이다. 발음의 특징 추출은 LPCC, MFCC, PLP의 세 가지 방법으로 각각 수행하였고, GMM 음향 모델로 인식 훈련을 한 후, 수집된 단음절 데이터를 대상으로 하여 인식 실험을 실시하였다. 실험 결과, 정상인과 구개열 환자의 장애 발음을 구별하기 위하여 특징을 추출함에 있어서 MFCC 방법이 전반적으로 가장 우수하였다. 본 연구의 결과는 구개열 환자의 부정확한 발음을 자동으로 인식하고 복원하는 연구와 구개열 장애 발음의 정도를 측정할 수 있는 도구에 대한 연구에 도움이 될 것으로 기대된다.

추체외로 증상에 따른 항정신병 약물 복용량과 음성 특성의 상관관계 분석 (Correlation analysis of antipsychotic dose and speech characteristics according to extrapyramidal symptoms)

  • 이수빈;김서영;김혜윤;김의태;유경상;이호영;이교구
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.367-374
    • /
    • 2022
  • 본 논문은 항정신병 약물의 복용량에 따른 음성 특징의 상관관계 분석을 수행하였다. 항정신병 약물의 대표적 부작용 중 하나인 추체외로 증상(ExtraPyramidal Symptoms, EPS) 발생에 따른 음성 특징의 패턴을 알아보기 위하여, 문장 개발을 통해 한국어 기반 추체외로 증상 음성 코퍼스를 구축하였다. 수집된 자료는 추체외로 증상 군과 비 추체외로 증상 군으로 나누어 음성 특징 패턴을 조사하였으며, 특히 추체외로 증상 군의 높은 음성 특징 상관관계를 보였다. 또한, 발화 문장의 종류가 음성 특징 패턴에 영향을 미친다는 것을 확인할 수 있었으며, 이를 통해 음성 특징을 기반한 추체외로 증상의 조기 발견 가능성을 기대해볼 수 있었다.