• 제목/요약/키워드: Syllable

검색결과 620건 처리시간 0.023초

한국어 음운인식에서의 조음거리와 긴장성 자질의 특성 연구: 영·유아를 중심으로 (Effects of Articulator-distance and Tense in Phonological Awareness in Korean: The case of Korean Infants and Toddlers)

  • 김충명
    • 한국콘텐츠학회논문지
    • /
    • 제15권8호
    • /
    • pp.424-433
    • /
    • 2015
  • 본 연구는 조음거리와 발성유형에 따른 영유아의 자음 음운인식 능력에서의 차이를 규명해 보기 위해 한국어 장애음을 대상으로 반복측정 실험설계를 통해 진행되었다. 집단 내 변인인으로서의 조음거리는, 연음과 경음의 자질을 갖는 1음절 초성의 조음 위치에 의해 구분된 조음점 간 거리로서 음운인식 수행도의 차이에 구조적으로 영향을 미치는지를 확인하고자 하였다. 실험결과, 음운차이 인식 수행력에서 조음거리를 변인으로 한 주효과를 확인하였는데, 그 거리가 멀어질수록 수행력이 점강하였다. 이는 동일위치나 근접거리 조음점 조건의 음운인식 수행도가 조음점 간 거리가 먼 조건에서의 수행도에 비해 민감한 반응을 보임으로써, 당해 조음점에 인접한 말소리들을 인식하는 능력이 우선 발달하는 결과를 시사함은 물론, 조음 유사성이 조기 음운습득에 영향을 끼칠 수 있음을 말해준다 하겠다. 아울러 집단 간 요인에서도 연령효과를 확인할 수 있었는데, 연령이 높을수록 조음거리에 영향을 덜 받는 경향이 있었으며 인접거리 조건에서는 남아대비, 여아의 수행력이 우수함을 알 수 있었다. 발성유형 중 긴장성을 피험자 내 변인으로 설정한 조건의 주효과는 나타나지 않았지만 연령의 주효과 및 성별과의 상호작용을 통해 연령상승에 따른 긴장음의 인식률의 유의한 상승을 관찰하였고, 긴장음 내에서는 여아의 변별력이 더 우수함을 확인할 수 있었다.

말운동장애인을 위한 시-청각 단서 제공 읽기 훈련 프로그램 개발 (Development of a Reading Training Software offering Visual-Auditory Cue for Patients with Motor Speech Disorder)

  • 방동혁;전유용;양동권;길세기;권미선;이상민
    • 대한의용생체공학회:의공학회지
    • /
    • 제29권4호
    • /
    • pp.307-315
    • /
    • 2008
  • In this paper, we developed a visual-auditory cue software for reading training of motor speech disorder patients. Motor speech disorder patients can use the visual and/or auditory cues for reading training and improving their symptom. The software provides some sentences with visual-auditory cues. Our sentences used for reading training are adequately comprised on modulation training according to a professional advice in speech therapy field. To ameliorate reading skills we developed two algorithms, first one is automatically searching the starting time of speech spoken by patients and the other one is removing auditory-cue from the recorded speech that recorded at the same time. The searching of speech starting time was experimented by 10 sentences per 6 subjects in four kinds of noisy environments thus the results is that $7.042{\pm}8.99[ms]$ error was detected. The experiment of the cancellation algorithm of auditory-cue was executed from 6 subjects with 1 syllable speech. The result takes improved the speech recognition rate $25{\pm}9.547[%]$ between before and after cancellation of auditory-cue in speech. User satisfaction index of the developed program was estimated as good.

발화속도와 한국어 분절음의 음향학적 특성 (Speech Rate and the Acoustic Features of Korean Segments)

  • 이숙향;고현주
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.162-172
    • /
    • 2004
  • 본 연구에서는 산출실험을 통해 발화속도와 한국어의 분절음의 지속시간 및 포만트 특성과의 관계와 모음의 지속시간과 포만트 간의 상관관계를 살펴보았다. 빠른 발화일수록 음절 및 자음과 모음의 지속시간은 짧게 나타났으며 대부분의 화자에서 폐쇄음의 폐쇄구간 대 기식구간의 비율이나 한 음절 내의 모음 대 자음 지속시간의 비율은 발화속도의 영향을 받지 않는 반면 일부 화자들은 발화속도의 영향을 받는 것으로 나타났다. 발화속도의 영향을 받는 화자들에서 폐쇄음의 경우 폐쇄구간이 기식구간보다 영향을 더 받으며 음절의 경우 모음이 자음보다 더 영향을 받는 것으로 나타났다. 발화속도와 모음의 포만트값과의 관계 분석 결과 발화속도가 모음약화에 영향을 미치는 정도가 화자간에 차이를 보였으며 이는 화자마다 모음의 포만트값 구현에 관하여 다른 발화기재를 이용하고 있다는 것을 간접적으로 시사해주는 것이라고 할 수 있다. 즉, 발화속도의 증가에 따라 조음기관의 움직임의 속도를 증가시키는 화자가 있는 반면 발화속도의 변화에 관계없이 일정한 속도를 유지하는 화자가 있다는 것을 의미한다.

한국어 분절음 인식을 위한 인식 단위에 대한 연구 (A Study on Recognition Units for Korean Speech Recognition)

  • 황영수;송민석
    • 한국음향학회지
    • /
    • 제19권6호
    • /
    • pp.47-52
    • /
    • 2000
  • 본 연구는 한국어 분절음 인식을 위한 인식단위 설정에 대한 연구이다. 대용량 음성 인식을 수행할 경우, 표준 패턴의 인식 단위를 단어나 음절이 아닌 분절음 단위로 사용하여야 효율적인 음성 인식을 수행할 수 있다. 본 연구는 이와 같은 분절음 인식을 수행하기 위한 연구로서, 인식 단위 설정 변화에 따른 인식 결과를 미국 OGI 연구소의 speech toolkit을 이용하여 검토한다. 인식 단위에 관해서 특히 모음의 경우 철자에 기초한 음소별 인식단위 설정과 현대어 발음에 기초한 인식단위 설정을 비교했으며, 그 결과 발음에 기초해 몇 개의 모음을 통합한 경우가 더 우수한 결과를 보였다. 또한 인식단위의 설정에 있어서 독려된 분절음으로 설정한 경우보다 앞, 뒤의 소리의 상황을 고려한 바이폰(biphone)을 이용할 경우가 5.7%-25.9%의 향상된 인식 결과를 보였다. 인식 방법에 있어서는 HMM 만을 이용한 방법보다 신경회로망과 HMM을 결합한 인식 방법이 6.1%-7.5%의 더 좋은 인식률을 나타내었다.

  • PDF

시간 영역 벌크 지표에 기반한 한국어 모음 'ㅜ'의 음성 인식 (Speech Recognition of the Korean Vowel 'ㅜ' Based on Time Domain Bulk Indicators)

  • 이재원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권11호
    • /
    • pp.591-600
    • /
    • 2016
  • 네트워크와 컴퓨팅 기술의 발달로 인해 인간이 생활하는 거의 모든 일상 환경에 컴퓨팅 기술의 접목이 증대되고 있다. 또한, 사물 인터넷에 대한 관심이 급속히 증대되면서, 음성 인식은 중요한 HCI 수단으로 자리 잡고 있다. 본 논문은 음소 기반 한국어 음성 인식 시스템의 일부로서, 한국어 모음 'ㅜ'에 대한 새로운 인식 방식을 제안한다. 제안하는 방식은 주파수 영역에서의 분석 대신, 시간 영역에서 계산한 벌크 지표를 분석하여 동작하므로, 계산 비용을 현저히 절감할 수 있다. 벌크 지표를 사용하여 모음 'ㅜ'의 전형적인 파형 패턴들을 탐지하기 위한 네 가지 요소 알고리즘을 제시하며, 이를 결합하여 최종적인 판별을 수행한다. 실험 결과를 통해, 제안하는 방식이 90.1%의 인식 정확도를 달성할 수 있음을 확인하였으며, 인식 속도는 어절 당 0.68 msec이다.

한글 문장의 자동 띄어쓰기를 위한 두 가지 통계적 모델 (Two Statistical Models for Automatic Word Spacing of Korean Sentences)

  • 이도길;이상주;임희석;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.358-371
    • /
    • 2003
  • 자동 띄어쓰기는 문장 내에서 잘못 띄어쓴 어절들을 올바르게 복원하는 과정으로서, 독자에게 글의 가독성을 높이고 문장의 뜻을 정확히 전달하기 위해 매우 중요하다. 기존의 통계 기반 자동 띄어쓰기 접근 방법들은 이전 띄어쓰기 상태를 고려하지 않기 때문에 잘못된 확률 정보에 의한 띄어쓰기를 할 수밖에 없었다. 본 논문에서는 기존의 통계 기반 접근 방법 의 문제점을 해결할 수 있는 두 가지 통계적 띄어쓰기 모델을 제안한다. 제안하는 모델은 자동 띄어쓰기를 품사 부착과 같은 분류 문제(classification problem)로 간주할 수 있다는 착안에 기반하며, 은닉 마르코프 모델을 일반화함으로써 확장된 문맥을 고려할 수 있고 보다 정확한 확률을 추정할 수 있도록 고안되었다. 제안하는 모델과 지금까지 가장 좋은 성능을 보이는 기존의 방법을 비교하기 위해 여러 가지 실험 조건에 따른 다양한 실험을 수행하였고, 오류에 대한 자세한 분석을 제시하고 있다 제안하는 모델을 복합 명사를 고려하는 평가 방식에 적응한 실험 결과, 98.33%의 음절 단위 정확도와 93.06%외 어절단위 정확률을 얻었다.

벌크 지표의 신경망 학습에 기반한 한국어 모음 'ㅡ'의 음성 인식 (Speech Recognition of the Korean Vowel 'ㅡ' based on Neural Network Learning of Bulk Indicators)

  • 이재원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권11호
    • /
    • pp.617-624
    • /
    • 2017
  • 음성 인식은 HCI 분야에서 널리 사용되는 기술 중 하나이다. 가정 자동화, 자동 통역, 차량 내비게이션 등 음성 인식 기술이 적용될 수 있는 많은 응용들이 현재 개발되고 있다. 또한, 모바일 환경에서 작동 가능한 음성 인식 시스템에 대한 수요도 급속히 증대되고 있다. 본 논문은 한국어 음성 인식 시스템의 일부로서, 한국어 모음 'ㅡ'를 빠르게 인식할 수 있는 방안을 제시한다. 제안하는 방식은 주파수 영역 대신, 시간 영역에서 계산되는 지표인 벌크 지표를 사용하므로, 인식을 위한 계산 비용을 절감할 수 있다. 모음 'ㅡ'의 전형적인 시퀀스 패턴들을 표현하는 벌크 지표들에 대한 신경망 학습을 수행하며, 최종적인 인식을 위해 학습된 신경망을 사용한다. 실험 결과를 통해, 제안하는 방식이 모음 'ㅡ'를 88.7%의 정확도로 인식할 수 있음을 확인하였고, 인식 속도는 어절 당 0.74msec이다.

사이시옷이 단어 재인에 미치는 영향 (Processing of Korean Compounds with Saisios)

  • 배성봉;이광오
    • 인지과학
    • /
    • 제23권3호
    • /
    • pp.349-366
    • /
    • 2012
  • 사이시옷 표기가 단어 의미 파악에 미치는 영향을 조사하기 위하여 두 개의 실험을 실시하였다. 실험 1에서는 사이시옷 표기의 친숙도를 조작하여 사이시옷 표기 유무의 효과를 알아보았다. 사이시옷 표기가 친숙한 단어(나뭇잎 > 나무잎)의 경우에는 사이시옷을 생략한 조건(나무잎)보다 사이시옷을 삽입한 조건(나뭇잎)에서 의미 파악이 빨랐으나, 사이시옷 표기가 친숙하지 않은 단어(북엇국 < 북어국)의 경우에는 그 반대의 결과가 나타났다. 실험 2에서는 사이시옷 표기의 친숙도가 중간 정도인 단어(조갯국 = 조개국)를 이용하여, 사이시옷의 유무가 단어 의미 이해에 미치는 영향을 조사하였다. 사이시옷을 표기한 조건(조갯국)에서 보다 사이시옷을 생략한 조건(조개국)에서 단어의 의미 이해가 더 빨랐다. 실험 1과 2의 결과를 Libben[9][10]의 APPLE 모형을 이용하여 설명하고자 하였으며, 현행 한글맞춤법의 사이시옷 규정에 대한 시사점을 논의하였다.

  • PDF

재즈 보컬 입문자를 위한 즉흥연주에 관한 연구 - 코드의 근음과 코드 톤을 이용한 연습방법 및 연출 분석 (A study on the Improvisation for Jazz vocal starter - Practice and analysis using root position in chord and chord-tones)

  • 강은미;조태선
    • 디지털융복합연구
    • /
    • 제15권6호
    • /
    • pp.377-383
    • /
    • 2017
  • 본 논문에서는 재즈 음악의 특징이라 할 수 있는 재즈 보컬의 즉흥연주 즉, 스캣의 연습 및 연출을 코드의 근음과 코드 톤을 응용한 접근 방법으로 제안하였다. 스캣은 악보에 표기 되어 있는 가사와 멜로디를 가창하지 않고 의미 없는 음절인 스캣 실러블을 이용하여 가창자의 역량에 맞추어 재창조한 음들로 솔로를 구사 한다. 이를 위해 코드의 근음을 이용하는 것은 재즈 보컬이 음악적 선율을 구성해 가는데 중요한 기준점이 된다. 가창 자는 그 기준점을 발전시켜 단순한 스캣에서 부터 점차 발전적이고 복잡한 구조의 스캣을 구사하며 다양한 음악적 표현과 교감을 표출할 수 있다. 즉흥연주로 연출하고자 하는 곡의 코트 톤 구성부터 베이스 라인의 연출과 베이스 스캣 그리고 코드 톤 아르페지오의 분석과 표현까지 스탠더드 재즈곡 '올 오브 미'를 중심으로 음악을 기능적으로 분석해 보았다. 본 논문에서는 다소 난해 하고 복잡해 보일 수 있는 재즈 보컬의 즉흥연주 또한 점진적인 접근 방법을 통해 비교적 손쉽게 구성 할 수 있음을 알 수 있었다.

음성인식 후처리에서 음소 유사율을 이용한 오류보정에 관한 연구 (A Study on Error Correction Using Phoneme Similarity in Post-Processing of Speech Recognition)

  • 한동조;최기호
    • 한국ITS학회 논문지
    • /
    • 제6권3호
    • /
    • pp.77-86
    • /
    • 2007
  • 최근 텔레매틱스 단말기 등과 같이 음성인식을 인터페이스로 하는 음성기반 검색시스템들이 많이 개발되고 있다. 그러나 음성인식에는 여전히 많은 오류가 존재하며, 이에 오류보정에 대한 여러 가지 연구가 진행되고 있다. 본 논문에서는 한국어의 음소가 갖는 특징을 기반으로 음성인식 후처리에서의 오류보정을 제안하였다. 이를 위해 한국어 음소의 특징을 고려한 음소 유사율을 사용하였다. 음소 유사율은 훈련데이터를 모노폰으로 훈련시켜 한국어 음소 각각에 대하여 MFCC와 LPC 특징추출방법을 사용하여 특징추출을 수행하고, 바타차랴 거리 측정법을 사용하여 각 음소 사이의 유사율을 구하였다. 음소 유사율과 신뢰도를 이용하여 오류보정률을 구하였으며, 이를 사용하여 음성인식 과정에서 오류로 판명된 어절에 대하여 오류보정을 수행하고, 음절 복원과 형태소 분석을 재수행하는 과정을 거쳤다. 실험 결과 MFCC와 LPC 각각 7.5%와 5.3%의 인식 향상률을 보였다.

  • PDF