• 제목/요약/키워드: 음소

검색결과 529건 처리시간 0.021초

경도인지장애와 경도 치매의 감별을 위한 대면 이름대기와 범주 이름대기의 예측 성능 비교 (Prediction Performance of Naming Tests for Differentiating Mild Cognitive Impairment and Mild Dementia)

  • 변해원
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.153-158
    • /
    • 2020
  • 본 연구는 정상 노인과 초기 단계의 노년기 인지 장애(경도인지장애(MCI), 경도 치매)의 선별검사인 대면 이름대기와 범주 이름대기의 예측력을 파악하였다. 노년기 인지장애로 진단을 받은 340명(정상 노인 203명, MCI 106명, 경도 치매 31명)을 분석하였다. 대면 이름대기는 단축형 한국판 보스턴 이름대기 검사로 측정하였고, 범주 이름대기는 통제연상단어검사의 의미검사와 음소검사를 이용하여 측정하였다. 이름대기 검사의 예측 성능을 비교하고자 다항 로지스틱 회귀분석을 수행한 결과, 대면 이름대기와 범주 이름대기 검사 모두 일반노인에서 MCI와 경도 치매를 감별하는데 유의미한 효과가 확인되었다(p<0.05). 반면, MCI에서 경도 치매를 감별할 때, 범주 이름대기의 음소검사는 교차비가 유의미하지 않았다. 본 연구의 결과는 MCI에서 경도 치매를 감별할 때, 범주 이름대기의 총점만을 측정기준으로 분석하는 것은 유의하지 않을 가능성이 높음을 시사한다.

멀티모달 인터페이스를 위한 음성 및 문자 공용 인식시스템의 구현 (An On-line Speech and Character Combined Recognition System for Multimodal Interfaces)

  • 석수영;김민정;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.216-223
    • /
    • 2003
  • 본 논문에서는 음성과 온라인 문자를 단일시스템으로 인식할 수 있는 음성 문자 공용인식 시스템을 제안한다. 일반적으로 CHMM(Continuous Hidden Markov Model)은 음성인식과 온라인 문자인식을 위해 매우 유용한 도구로 잘 알려져 있으나, 인식을 위해서는 각각을 독립 시스템으로 구현하고 있어 추가적인 메모리와 계산량을 요구한다. 제안한 공용인식 시스템은 음성인식과 문자인식을 결합하기 위하여 이들을 동일한 CHMM모델로 구성한 후 상태단위로 지속정보를 제어하는 OPDP(One Pass Dynamic Programming) 알고리즘을 통하여 음성과 문자를 인식할 수 있는 확률 통계적 시스템을 구현하였다. 음성은 MFCC(Mel Frequency Cepstrum Coefficient) 파라미터, 문자는 위치 변화량 파라미터와 비트맵 파라미터를 사용하였으며, MLE(Maximum Likelihood Estimation) 추정법을 이용하여 음소와 자소를 결합한 115개의 3상태 9천이 CHMM모델을 구성하였다. 공용인식기의 실험결과 음소 인식률 51.65%, 음성 단어 인식률 88.6%, 자소 인식률 85.3%, 필기체 단어인식률 85.6%를 나타내어 공용인식의 유효함을 확인할 수 있었다.

  • PDF

한국형 전산화 인지재활프로그램이 초기 치매노인의 생성 이름대기 수행에 미치는 효과에 관한 예비연구 (The effect of computer based cognitive rehabilitation program on the improvement of generative naming in the elderly with mild dementia: preliminary study)

  • 변해원
    • 한국융합학회논문지
    • /
    • 제10권9호
    • /
    • pp.167-172
    • /
    • 2019
  • 본 연구는 초기 치매환자를 대상으로 전산화 인지재활프로그램이 전두엽 집행기능 중 생성 이름대기에 미치는 효과를 파악하고, 치매 환자의 조기 언어중재에 관한 기초자료를 제공하였다. 분석 대상은 경증치매환자 29명으로서 전산화 인지재활프로그램(CoTras)을 중재하는 실험군 21명과 지필과 테이블활동 등 전통적인 면대면 언어재활을 중재하는 대조군 8명으로 분류되었다. 실험집단과 대조집단은 모두 12주 동안 순차적 언어 회상 기억훈련, 연합회상 기억훈련, 언어 범주화 기억훈련, 언어통합 기억훈련을 진행하였다. 의미유창성과 음소유창성의 사전검사점수를 공변량으로 통제한 Welch's robust ANCOVA분석 결과, 실험집단과 대조집단은 의미유창성과 MMSE-K의 변화에서 유의미한 차이가 있었다(p<0.05). 반면에, 음소유창성은 실험군과 대조군 모두 기초선단계에 비해서 12주간의 치료 후 유의미하게 증가하였지만 통계적으로 치료방법에 따른 유의미한 차이는 없었다. 본 연구의 결과는 전산화 인지재활프로그램이 전통적인 인지재활에 비해서 의미유창성의 향상에 효과적일 가능성을 시사한다.

알츠하이머와 혈관성 치매 환자 선별에서의 작업기억 능력 관련 구어유창성 및 이야기이해 능력의 차이 (Differences in Verbal Fluencies and Discourse Comprehension Abilities associated with Working Memory in Alzheimer's Disease and Vascular Dementia)

  • 여한결;김충명
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.383-390
    • /
    • 2020
  • 본 연구는 알츠하이머와 혈관성 치매 환자를 대상으로 구어유창성과 이야기이해 과제 수행능력의 차이 및 작업기억 처리수준과의 상관 그리고 언어능력 관련 요인선별을 위해 시행되었다. 전반적인 인지능력에서 차이를 보이지 않는 각기 15명의 환자를 대상으로 구어유창성 내 음소유창성 및 이야기이해 그리고 작업기억 하위과제인 지연회상과 재인과제에서 두 그룹 간 유의한 수행능력의 차이를 보였다. 상관 및 회귀분석에서는 알츠하이머 그룹이 작업기억 내역행 숫자기억 과제와 이야기이해 과제에서만 유의한 상관을 보인 반면, 혈관성 치매 그룹은 추가적으로 재인 점수에서도 이야기이해 능력과의 유의한 상관이 나타났다. 한편, 회귀분석에서는 혈관성 치매 그룹에서만 언어적 작업기억 능력이 이야기이해 능력의 예측 요인임을 확인하였다. 결론적으로 두 유형의 치매를 구분하는 데 있어 음소유창성 과제 외에 이야기이해 및 작업기억 과제가 유의한 도구임이 확인되었는데, 이를 통해 두 유형의 치매에 대한 분류기준을 제고함은 물론 적절한 치료계획 및 효율적인 중재에 부가적인 기여를 할 것으로 보인다.

고속 발화음에 대한 음성 인식 향상 (Improvements on Speech Recognition for Fast Speech)

  • 이기승
    • 한국음향학회지
    • /
    • 제25권2호
    • /
    • pp.88-95
    • /
    • 2006
  • 본 논문에서는 대화체 음성에 대한 음성 인식의 성능을 향상시키기 위한 방법으로, 고속 발화음에 대해 강인한 음성 인식 방법을 제안하고 성능을 평가하였다. 제안된 기법은 입력된 음성의 속도를 정량화하여 나타내기 위한 부가적인 음성 인식 과정이 필요치 않으며, 특정 대역내의 에너지 분포를 이용하여 모음 구간을 판정하고, 단위 시간당 모음의 개수를 구하여 음성의 속도를 측정하였다. 빠른 발성음에 대한 음성 인식의 성능을 향상시키기 위해, 기존의 방법은 표준 음소 길이와 측정된 음소 길이간의 비율을 이용하여 특징 벡터를 시간축으로 확장하였다. 제안된 방법에서는 발성 속도에 따라 음성을 분류하고, 분류된 음성에 대해 서로 다른 시간축 확장 비율을 정하도록 하였다. 여기서 분류에 필요한 문턱치들과 시간축 확장 비율들은 최대 우도 방법을 이용하여 구하였다. 10자리 이동 전화 번호에 대한 음성 인식의 실험 결과, 제안된 기법에 의해 전체적으로 $17.8\%$ 오류율이 감소되는 것을 확인할 수 있었다.

정규화신뢰도 기반 가변어휘 고립단어 인식기의 거절기능 성능 분석 (Rejection Performance Analysis in Vocabulary Independent Speech Recognition Based on Normalized Confidence Measure)

  • 최승호
    • 한국음향학회지
    • /
    • 제25권2호
    • /
    • pp.96-100
    • /
    • 2006
  • 고립단어 인식기의 오 인식 단어를 거절하기 위한 방법으로 정규화 신뢰도가 제안되어 논문 [1-2]에서 성공적으로 적용된 바 있다. 그러나 정규화 신뢰도의 성능 측정을 위해 고정된 단어 셌을 대상으로 실험을 하였다. 본 논문에서는 정규화 신뢰도를 가변어휘 음성인식 영역에 적용하여 신뢰도의 거절성능을 밝히고 특히, 벡터양자화기를 이용하여 미 출현 트라이 폰의 문제를 극복하는 방법을 제안한다. 이때 정규화 신뢰도는 트라이 폰 신뢰도들의 통계적 특징(평균과 표준편차)을 사용한다. 가변어휘 인식실험 결과음소 단위의 정규화방법이 트라이 폰 기반 정규화방법에 비하여 우수한 성능을 보였으며 이러한 결과는 논문 [1-2]의 결과와는 상이한 것으로 트라이 폰 기반 정규화 방법이 미 출현 트라이 폰에 대하여 강인하지 못하다는 점을 시사하고 있다. 따라서 정규화 신뢰도가 음소 또는 트라이 폰에 상관없이 기준 신뢰도인 RLTC 신뢰도 [3]에 비하여 우수한 성능을 보였으며 가변어휘 인식에서도 동작함을 확인 할 수 있었다.

PVDHMM을 이용한 음소열 기반의 SDR 응용 (Spoken Document Retrieval Based on Phone Sequence Strings Decoded by PVDHMM)

  • 최대림;김봉완;김종교;이용주
    • 대한음성학회지:말소리
    • /
    • 제62호
    • /
    • pp.133-147
    • /
    • 2007
  • In this paper, we introduce a phone vector discrete HMM(PVDHMM) that decodes a phone sequence string, and demonstrates the applicability to spoken document retrieval. The PVDHMM treats a phone recognizer or large vocabulary continuous speech recognizer (LVCSR) as a vector quantizer whose codebook size is equal to the size of its phone set. We apply the PVDHMM to decode the phone sequence strings and compare the outputs with those of a continuous speech recognizer(CSR). Also we carry out spoken document retrieval experiment through PVDHMM word spotter on the phone sequence strings which are generated by phone recognizer or LVCSR and compare its results with those of retrieval through the phone-based vector space model.

  • PDF

음성 인식을 이용한 증권 정보 검색 시스템의 개발 (Development of a Stock Information Retrieval System using Speech Recognition)

  • 박성준;구명완;전주식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권4호
    • /
    • pp.403-410
    • /
    • 2000
  • 본 논문에서는 음성 인식을 이용한 증권 정보 검색 시스템의 개발에 대하여 기술하고 시스템의 주요 특징을 설명한다. 이 시스템은 DHMM (discrete hidden Markov model)에 기반을 두고, 유사 음소를 기본 인식 단위로 사용하였다. 끝점 검출과 반향 제거 기능을 포함시켜 사용자의 음성 입력이 편리하도록 만들었으며, 한 번의 음성 입력이 하나만의 단어가 아닌 여러 개의 단어가 될 수 있도록 연속 음성 인식기를 구현하였다. 상용화 이후의 몇 개월에 걸친 데이터를 이용하여 운용 결과를 분석하였다.

  • PDF

다차원 척도 구성법을 이용한 한국어 음소의 분석 (Analysis of Korean Phonemes Using Multi-Dimentional Scaling Method)

  • 권영욱;정현열
    • 전자공학회논문지B
    • /
    • 제29B권11호
    • /
    • pp.22-30
    • /
    • 1992
  • Using Multi-Dimentional Scaling(MDS) method, this paper analyzes the differences of acoustic properties of Korean phonemes projected as distances on a plan space. The phonemes were extracted from mono-syllables frequently occurring in daily conversation. From the distances between vowels we found that the distances between vowels /∂/ and /w/, /o/ and /u/, and vowels /$\varepsilon$/ and /e/ were relatively too short separate automatically. From the analysis of consonants. we found short distances between 1) phonemes in each phoneme group, 2) nasals and liquid /r/ of work initial, 3) nasal /n,m/ and liquid /l/ of word finals. But nasals, liquids and plosives of word initials had enough distances to be separated from those of word finals in automatic recogniation.

  • PDF

가변어휘 음성인식기의 성능개선 (Performance Improvement of Variable Vocabulary Speech Recognizer)

  • 김승희;김회린
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.21-24
    • /
    • 1999
  • 본 논문에서는 가변어휘 음성인식기의 성능개선 작업에 관한 내용을 기술하고 있다. 묵음을 포함한 총 40개의 문맥독립 음소모델을 사용한다. LDA 기법을 이용하여 동일차수의 특징벡터내에 보다 유용한 정보를 포함시키고, likelihood 계산시 가우시안 분포와 mixture weight에 대한 가중치를 달리 함으로써 성능향상을 볼 수 있었다. ETRI POW 3848 DB만을 사용하여 실험한 경우, $21.7\%$의 오류율 감소를 확인할 수 있었다. 잡음환경 및 어휘독립환경을 고려하여 POW 3848 DB와 PC 168 DB 및 PBW445 DB를 사용한 실험도 행하였으며, PBW 445 DB를 사용한 어휘독립 인식실험의 경우 $56.8\%$의 오류율 감소를 얻을 수 있었다.

  • PDF