• 제목/요약/키워드: Speech spectrum

검색결과 309건 처리시간 0.026초

승마재활 치료에 대한 자폐성 장애 아동 부모의 인식도 조사 (A Study on Recognition Degree of horse therapy for Autistic Disorder's parents)

  • 이근민;김소영;권상남
    • 재활복지공학회논문지
    • /
    • 제6권1호
    • /
    • pp.75-81
    • /
    • 2012
  • 본 연구는 자폐성 장애 아동의 승마재활 치료에 가장 영향을 미치는 학부모의 인식은 어느 정도이며 치료효과에 대한 목적의식은 어떠한지 또한 앞으로 재활승마 치료에 대해 가지는 기대에 대해 알아보고자 하였다. 자폐성 장애 아동의 부모로 100명을 연구대상으로 설문지를 연구도구로 사용하였다. 분석방법은 빈도분석(Frequency Analysis), 교차분석Chi-square Analysis)을 활용하여 각각 분석하였다. 재활승마 치료에 대한 학부모의 인지도에서 재활승마에 대한 인식이 있고, 아동이 재활승마의 경험이 없으며, 6세~10세 학부모의 응답에서 재활승마가 효과가 있을 것이라고 응답하였다. 이해도에서 재활승마는 주로 말을 타는 신체운동이고, 치료와 운동을 겸비한 전문영역으로 구체적인 도움을 주는 방법이라고 하였으며, 재활승마는 바람직하지 못한 행동을 교정 및 개선하는 방법으로 이용되고 재활기관에서 재활승마가 필요한 것으로 이해하고 있었다. 기대도에서 재활승마 치료사가 갖추어야 할 가장 중요한 요소는 치료학(작업치료, 물리치료, 언어치료) 전공자여야 한다고 나왔고, 재활승마는 개별치료, 주 2~3회가 적당하다고 하였다.

  • PDF

사상멤버쉽함수에 의한 화자적응 단어인식 (Speaker-adaptive Word Recognition Using Mapped Membership Function)

  • 이기영;최갑석
    • 한국음향학회지
    • /
    • 제11권3호
    • /
    • pp.40-52
    • /
    • 1992
  • 본논문에서는 불특정화자 음성인식의 문제점이 되는 개인차에 의한 변동을 흡수하기 위하여 사상멤버쉽함수에 의한 화자적응 단어인식 방법을 제안하였다. 이방법의 학습과정에서는 미지화자의 표준화자의 스펙트럼패턴 사이에서 작성된 사상코드북에 퍼지이론을 도입하여 사상멤버쉽함수를 작성하였으며, 인식과정에서는 미지화자의 음성패턴을 사상멤버쉽함수에 의해 표준화자의 음성패턴에 적응된 패턴으로 재구성하고 뉴럴-퍼지패턴매칭에 의해 단어를 인식하였다. 본 방법의 타당성을 평가하기 위하여, 28개의 DDD 지역명을 대상으로 실험한 결과, 종래의 사상코드북에 의한 벡터양자화 화자적응방법에서는 64.9[%], 퍼지벡터양자화 화자적응방법에서는 76.1[%]의 인식율을 얻었으나, 사상멤버쉽함수에 의한 화자적응방법에서는 95.4[%]의 향상된 인식율을 얻으므로써 인식성능의 우수함을 확인하였다. 또한 사상멤버쉽함수의 작성과정에서는 반복된 학습과정이 불피요하며, 기억용량과 계산량도 사상코드북에 의한 화자적응방법보다 각각 1/30, 1/500배 정도였다.

  • PDF

Two Korean siblings with autosomal recessive spinocerebellar ataxia 20 caused by homozygous variants in SNX14

  • Kim, Ae Ryoung;Lee, Jong-Mok;Seo, Go Hun;Lee, Sang In;Bae, Hyunwoo;Lee, Yun Jeong
    • Journal of Genetic Medicine
    • /
    • 제18권2호
    • /
    • pp.127-131
    • /
    • 2021
  • Autosomal recessive spinocerebellar ataxia 20 (SCAR20; OMIM #616354) is a recently described disorder that is characterized by ataxia, intellectual disability, cerebellar atrophy, macrocephaly, coarse face, and absent speech. It is caused by loss-of-function mutations in SNX14. To date, all cases with homozygous pathogenic variants have been identified in consanguineous families. This report describes the first Korean cases of SCAR20 family caused by homozygous variants in SNX14. Two siblings were referred to our clinic because of severe global developmental delay. They presented similar facial features, including a high forehead, long philtrum, thick lips, telecanthus, depressed nasal bridge, and broad base of the nose. Because the older sibling was unable to walk and newly developed ataxia, repeated brain magnetic resonance imaging (MRI) was performed at the age of 4 years, revealing progressive cerebellar atrophy compared with MRI performed at the age of 2 years. The younger sibling's MRI revealed a normal cerebellum at the age of 2 years. Whole-exome sequencing was performed, and homozygous variants, such as c.2746-2A>G, were identified in SNX14 from the older sibling. Sanger sequencing confirmed homozygous SNX14 variants in the two siblings as well as a heterozygous variant in both parents. This report extends our knowledge of the phenotypic and mutational spectrum of SCAR20. We also highlight the importance of deep phenotyping for the diagnosis of SCAR20 in individuals with developmental delay, ataxia, cerebellar atrophy, and distinct facial features.

MCE기반의 다중 특징 파라미터 스코어의 결합을 통한 화자인식 성능 향상 (Performance Improvement of Speaker Recognition by MCE-based Score Combination of Multiple Feature Parameters)

  • 강지훈;김보람;김규영;이상훈
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.679-686
    • /
    • 2020
  • 본 논문에서는 화자인식 성능 향상을 위해 음원에서 개선된 특징추출 방식과 최소 분류 오차 기반의 다중 특징 벡터 스코어에 대한 가중치 추정을 사용하여 스코어 결합을 제안하였다. 제안한 특징 벡터는 Glottal Flow에서 무의미한 정보구간인 평탄한 스펙트럼 구간을 제거하기 위하여 저역통과 필터를 수행한 신호에서 인지적 선형 예측 캡스트럼 계수, 왜도, 첨도를 추출하여 구성하였다. 제안한 특징 벡터는 종래의 음원에서 멜-주파수 캡스트럼 계수, 인지적 선형 예측 캡스트럼 계수를 추출하여 가우시안 혼합 모델로 모델링한 화자인식 시스템을 개선하기 위해 사용된다. 또한, 스코어 추정과정의 신뢰성을 높이기 위하여 기존의 스코어의 확률 분포를 사용하여 가중치를 추정하는 대신 제안한 특징 벡터에서 평가된 점수와 종래의 특징 벡터에서 평가된 점수에 대하여 최소 분류 오차 기법으로 가중치를 추정하여 스코어를 결합함으로써 최적의 화자를 찾는다. 실험 결과 제안한 특징 벡터가 화자를 인식하는데 유효한 정보를 포함하고 있는 것을 확인하였다. 또한, 최소 분류 오차 기반의 다중 특징 파라미터 스코어를 결합하여 화자인식을 수행하였을 때, 종래의 화자인식 성능보다 더 우수한 성능을 나타내는 것을 확인할 수 있으며, 특히 가우시안 혼합 모델이 낮을 때 더 높은 성능향상을 보였다.

성대신호 기반의 명령어인식기를 위한 특징벡터 연구 (Effective Feature Vector for Isolated-Word Recognizer using Vocal Cord Signal)

  • 정영규;한문성;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.226-234
    • /
    • 2007
  • 본 논문은 환경 노이즈를 원천적으로 차단하는 성대 마이크를 이용한 명령어 인식기를 개발한다. 성대마이크는 환경 노이즈의 효과를 최소화하는 장점이 있다. 그러나 고주파의 부재와 부분적인 포먼트 정보 손실 때문에, 성대마이크를 이용해서 개발된 ASR시스템은 표준마이크를 이용한 시스템에 비해 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로부터 입력되는 정보 보안하는데 주로 사용된다. 본 논문은 한국어의 음운적 특정과 신호 분석을 통해 성대마이크만을 사용한 높은 성능의 ASR 시스템을 개발 할 수 있음을 보인다. 주파수 대역내 에너지 합을 이용하는 MFCC 알고리즘이 갖는 성대신호 분석의 문제점을 제시하고, 성대신호를 대상으로 보다 높은 성능을 갖는 특정추출 알고리즘의 조건을 제시한다. 이러한 조건은 (1) 민감한 band-pass filter와 (2) 유/무성음 분리를 위해 사용하는 특정벡터의 사용이다 실험 결과 제안된 조건을 만족하는 ZCPA 알고리즘을 적용한 경우가 MFCC를 적용한 경우보다 약 16%정도의 높은 성능을 보인다. 그러고 CMS와 RASTA와 같은 channel normalization 알고리즘을 적용한 경우 약 2%의 성능 향상이 있다.

SAFMEDS 교수전략을 적용한 전문가 교육 사례연구 (A Case Study on the Professional Education Using SAFMEDS Teaching Strategy)

  • 정경희;최진혁;안성우;신창숙
    • 재활복지공학회논문지
    • /
    • 제10권1호
    • /
    • pp.9-18
    • /
    • 2016
  • 본 연구의 목적은 학습 유창성 향상에 유용한 SAFMEDS(Say All Fast a Minute Each Day Shuffled)전략의 교육적 유용성을 보여준 사례연구이다. 본 연구에 참여한 전문가는 일반대학원 정규과정에 개설된 자폐성 장애 연구를 수강한 3명의 대학원생들이며, 이들은 수업을 통해 자폐성장애와 언어행동분석 관련 이론 및 교육전략을 연구하였다. 연구 도구는 언어행동분석 용어목록 60 쌍이며, 이것은 앞-뒷면에 용어-정의가 각각 인쇄되어 하나의 쌍으로 구성된 플래시카드(flashcard) 형태이다. 대상자들은 용어목록 앞면에 적힌 용어의 정의를 보고 뒷면에 적힌 용어를 정확하고 빠르게 반응할 수 있도록 학습하였다. SAFMEDS 훈련으로 나타난 주요 결과에 따르면, 연구대상자 A는 시간이 지남에 따라 정반응이 증가하고 오반응이 감소하는 양상을 보여주었고, 대상자 B와 C도 정반응이 증가하고 오반응이 감소하는 결과를 보여주었다. 대상자 B의 언어목록 제시 방법이 대상자 A와 C의 제시유형과는 달랐지만 모든 대상자들의 유창성 향상에서 긍정적인 효과가 나타났다. 결국, SAFMEDS 전략이 언어목록 습득에 효과적이었으며, 유창한 언어목록을 형성할 수 있는 유용한 교육 전략임이 확인되었다. 따라서 본 연구는 일반교육뿐 아니라 특수교육 전문가들에게 SAFMEDS 전략의 유용성을 알리고 이를 다양한 영역에 적용할 수 있도록 방향을 제시하는데 의의가 있을 것이다.

장애인을 위한 하이-테크놀로지 보완·대체의사소통체계 실험 연구 동향 분석 (A Research Review of High-technology AAC Intervention for Individuals with Disabilities)

  • 송재옥;전병운
    • 재활복지
    • /
    • 제20권4호
    • /
    • pp.203-228
    • /
    • 2016
  • 본 연구의 목적은 장애인을 대상으로 이루어진 국내외 하이-테크놀로지 기반 보완 대체의사소통 중재 실험 연구의 최근 동향을 분석하여 하이-테크놀로지 기반 보완 대체의사소통체계를 활용한 중재와 연구 등에 필요한 기초 자료를 제시하는 것이다. 분석 기준에 따라 전자 데이터베이스를 활용하여 2009년부터 2016년 6월까지의 문헌을 검색하여 총 46편(국내 연구 23편, 국외 연구 23편)이 선정되었다. 선정된 문헌을 (1) 중재 대상 (2) 연구 설계 (3) 중재 환경 (4) 독립변인 (5) 종속변인 (6) 사용된 의사소통 기술 (7) 중재에 사용된 하이-테크 AAC 기기의 유형 (8) 사용된 소프트웨어의 종류 등의 기준에 따라 분석하였다. 중재 대상은 총 126명이었으며, 연령별로는 6-11세가 가장 많았고, 장애 영역별로는 자폐성 장애의 비율이 가장 높았다. 연구 설계는 국내 연구의 경우 중다 간헐 기초선 설계가 많았고, 국외 연구에서는 중재 교대 설계가 가장 많았다. 중재 환경은 특수학교나 특수학급과 같이 분리된 학교 상황의 교실 등에서 실시한 경우가 가장 많았다. 독립변인의 분석 결과, 국내 연구에서는 하이-테크 AAC 기기를 기반으로 하는 중재 프로그램(전략)의 효과를 알아보는 연구가 많았고, 국외 연구에서는 다양한 유형의 AAC 도구를 활용한 중재 비교연구의 비율이 높았다. 종속변인으로는 의사소통 기능 향상이 국내외 모두 가장 많았다. 중재에 사용된 하이-테크 AAC 도구는 태블릿 PC의 사용 비율이 가장 높았고, 소프트웨어는 국내에서는 '마이토키', 국외에서는 'Proloquo2Go'의 사용 비율이 높았다. 이러한 분석 결과를 바탕으로 장애인 대상 하이-테크놀로지 AAC 도구와 관련한 중재 연구, 현장 적용, 기기 개발 등의 방향성을 논의하였다.

기능성 음성장애의 진단을 위한 음향학적, 청지각적 평가 (Acoustic Analysis and Auditory-Perceptual Assessment for Diagnosis of Functional Dysphonia)

  • 김근효;이연우;배인호;이재석;이창윤;박희준;이병주;권순복
    • 임상이비인후과
    • /
    • 제29권2호
    • /
    • pp.212-222
    • /
    • 2018
  • Background and Objectives : The purpose of this study was to compare the measured values of acoustic and auditory perceptual assessments between normal and functional dysphonia (FD) groups. Materials and Methods : 102 subjects with FD and 59 normal voice groups were participated in this study. Mid-vowel portion of the sustained vowel /a/ and two sentences of 'Sanchaek' were edited, concatenated, and analyzed by Praat script. And then auditory-perceptual (AP) rating was completed by three listeners. Results : The FD group showed higher acoustic voice quality index version 2.02 and version 3.01 (AVQIv2 and AVQIv3), slope, Hammarberg index (HAM), grade (G) and overall severity (OS), values than normal group. Additionally, smoothed cepstral peak prominence in Praat (PraatCPPS), tilt, low-to high spectral band energies (L/H ratio), long-term average spectrum (LTAS) in FD group were lower than normal voice group. And the correlation among measured values ranged from -0.250 to 0.960. In ROC curve analysis, cutoff values of AVQIv2, AVQIv3, PraatCPPS, slope, tilt, L/H ratio, HAM, and LTAS were 3.270, 2.013, 13.838, -22.286, -9.754, 369.043, 27.912, and 34.523, respectively, and the AUC of each analysis was over .890 in AVQIv2, AVQIv3, and PraatCPPS, over 0.731 in HAM, tilt, and slope, over 0.605 in LTAS and L/H ratio. Conclusions : In conclusion, AVQI and CPPS showed the highest predictive power for distinguishing between normal and FD groups. Acoustic analyses and AP rating as noninvasive examination can reinforce the screening capability of FD and help to establish efficient diagnosis and treatment process plan for FD.

Prosodic Phrasing and Focus in Korea

  • Baek, Judy Yoo-Kyung
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.246-246
    • /
    • 1996
  • Purpose: Some of the properties of the prosodic phrasing and some acoustic and phonological effects of contrastive focus on the tonal pattern of Seoul Korean is explored based on a brief experiment of analyzing the fundamental frequency(=FO) contour of the speech of the author. Data Base and Analysis Procedures: The examples were chosen to contain mostly nasal and liquid consonants, since it is difficult to track down the formants in stops and fricatives during their corresponding consonantal intervals and stops may yield an effect of unwanted increase in the FO value due to their burst into the following vowel. All examples were recorded three times and the spectrum of the most stable repetition was generated, from which the FO contour of each sentence was obtained, the peaks with a value higher than 250Hz being interpreted as a high tone (=H). The result is then discussed within the prosodic hierarchy framework of Selkirk (1986) and compared with the tonal pattern of the Northern Kyungsang dialect of Korean reported in Kenstowicz & Sohn (1996). Prosodic Phrasing: In N.K. Korean, H never appears both on the object and on the verb in a neutral sentence, which indicates the object and the verb form a single Phonological Phrase ($={\phi}$), given that there is only one pitch peak for each $={\phi}$. However, Seoul Korean shows that both the object and the verb have H of their own, indicating that they are not contained in one $={\phi}$. This violates the Optimality constraint of Wrap-XP (=Enclose a lexical head and its arguments in one $={\phi}$), while N.K. Korean obeys the constraint by grouping a VP in a single $={\phi}$. This asymmetry can be resolved through a constraint that favors the separate grouping of each lexical category and is ranked higher than Wrap-XP in Seoul Korean but vice versa in N.K. Korean; $Align-x^{lex}$ (=Align the left edge of a lexical category with that of a $={\phi}$). (1) nuna-ka manll-ll mEk-nIn-ta ('sister-NOM garlic-ACC eat-PRES-DECL') a. (LLH) (LLH) (HLL) ----Seoul Korean b. (LLH) (LLL LHL) ----N.K. Korean Focus and Phrasing: Two major effects of contrastive focus on phonological phrasing are found in Seoul Korean: (a) the peak of an Intonatioanl Phrase (=IP) falls on the focused element; and (b) focus has the effect of deleting all the following prosodic structures. A focused element always attracts the peak of IP, showing an increase of approximately 30Hz compared with the peak of a non-focused IP. When a subject is focused, no H appears either on the object or on the verb and a focused object is never followed by a verb with H. The post-focus deletion of prosodic boundaries is forced through the interaction of StressFocus (=If F is a focus and DF is its semantic domain, the highest prominence in DF will be within F) and Rightmost-IP (=The peak of an IP projects from the rightmost $={\phi}$). First Stress-F requires the peak of IP to fall on the focused element. Then to avoid violating Rightmost-IP, all the boundaries after the focused element should delete, minimizing the number of $={\phi}$'s intervening from the right edge of IP. (2) (omitted) Conclusion: In general, there seems to be no direct alignment constraints between the syntactically focused element and the edge of $={\phi}$ determined in phonology; all the alignment effects come from a single requirement that the peak of IP projects from the rightmost $={\phi}$ as proposed in Truckenbrodt (1995).

  • PDF