• 제목/요약/키워드: reading pronunciation

검색결과 30건 처리시간 0.025초

청각 장애인을 위한 발음 교정 학습용 스마트 미러 시스템 개발 (Development of Smart Mirror System for Hearing Deaf's Pronunciation Training)

  • 정하윤;정다미;이종혁;김병규
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.267-274
    • /
    • 2017
  • 최근 패션, 뷰티 업계를 중심으로 스마트 미러를 도입한 매장을 선보이는 등 IoT기술을 적용하고자 다양한 노력이 시도되고 있다. 스마트 미러는 거울을 통해 모습을 비춰볼 수 있으면서 거울 뒤에 부착된 화면을 통해 원하는 내용을 디스플레이 할 수 있어 패션, 뷰티, 헬스 케어 등 다양한 산업 분야에 적용이 가능하다. 본 논문에서는 이러한 스마트 미러의 특성을 이용하여 구술 능력이 퇴화되어 발음이 부정확한 청각 장애인이 타인의 도움 없이 스스로 발음 교정 학습을 할 수 있도록 하는 학습 시스템을 제안하고자 한다. 제안된 시스템에서는 임베디드 시스템에서 적용 가능한 효과적인 립 리딩 기법을 제안하여 기존에 검증된 발음 교정용 데이터와 연동하여 학습 효율을 높였다.

베이지안 분류를 이용한 립 리딩 시스템 (Lip-reading System based on Bayesian Classifier)

  • 김성우;차경애;박세현
    • 한국산업정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.9-16
    • /
    • 2020
  • 음성 정보를 배제하고 영상 정보만을 이용한 발음 인식 시스템은 다양한 맞춤형 서비스에 적용될 수 있다. 본 논문에서는 베이지안 분류기를 기반으로 입술 모양을 인식하여 한글 모음을 구분하는 시스템을 개발한다. 얼굴 이미지의 입술 모양에서 특징 벡터를 추출하고 설계된 기계 학습모델을 적용하여 실험한 결과 'ㅏ' 발음의 경우 94%의 인식률을 보였으며, 평균 인식률은 약 84%를 나타내었다. 또한 비교군으로 실험한 CNN 환경에서의 인식률보다 높은 결과를 보였다. 이를 통해서 입술 영역의 랜드 마크로 설계된 특징 값을 사용하는 베이지안 분류 기법이 적은 수의 훈련 데이터에서 보다 효율적일 수 있음을 알 수 있다. 따라서 모바일 디바이스와 같은 제한적 하드웨어에서 응용 가능한 어플리케이션 개발에 활용할 수 있다.

An Experiment of Reading Aloud Meeting in English

  • Arimitsu, Yutaka;Yagi, Hidetsugu;Lee, Jae-Hoon;Wu, Zhiqiang
    • 공학교육연구
    • /
    • 제15권4호
    • /
    • pp.26-30
    • /
    • 2012
  • Nowadays, fewer Japanese university students are taking PhD degrees in the U.S.A than Koreans or Taiwanese. The language barrier is considered as one of major reasons for this. This lack of international education is one of the reasons cited, as Japan has been falling behind in industrial globalization. Reading aloud is a good practice for learning a foreign language, since many areas of our brains are simultaneously activated. Furthermore, students have a chance to overcome the psychological barrier in reading aloud in front of others, in a meeting. The authors start the voluntary meeting (which is unrelated to official classes of the curriculum) by reading English articles aloud. Topics in the meeting are selected from articles on web sites, therefore, (1) textbooks were not needed, (2) voice data could be listened to, and (3) the meaning and the pronunciation of an unknown word could be checked by web tools. Once the methodology has been mastered, volunteer students can manage the meeting. The authors introduce our experiments conducted at the Department of Mechanical Engineering, Ehime University.

A Comparative Study of Aphasics' Abilities in Reading and Writing Hangul and Hanja

  • Kim, Heui-Beom
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.289-293
    • /
    • 1996
  • In Korean, as with Kana and Kanji in Japanese, two kinds of word-writing systems--Hangul (the Korean alphabet) and Hanja (the Chinese character; Kanji in Japanese)--have been and still are being used. Hangul is phonetic while Hanja is ideographic. A phonetic alphabet represents the pronunciation of words, wheras ideographs are where a character of a writing system represents a concept. Aphasics suffer from language disorders following brain damage. The reading and writing of Hangul and Hanja by two Korean Broca's aphasics were analyzed with two goals. The first goal was to confirm the functional autonomy of reading and writing systems in the brain that has been argued by other researchers. The second goal was to reveal what difference the subjects show in reading and writing Hangul and Hanja. As experimental materials, 50 monosyllabic words were chosen in Hangul and Hanja respectively. The 50 word pairs of Hangul and Hanja have the same meaning and are also the most familiar monosyllabic words for a group of normal adults in their fifties and sixties. The errors that the aphasic subjects made in performing the experimental materials are analyzed and discussed here. This analysis has confirmed that reading and writing systems are located in different parts in the brain. Furthemore, it seems clear that the two writing systems of Hangul and Hanja have their own respective processes.

  • PDF

Vowel length difference before voiced/voiceless consonants in English and Korean

  • Moon, Seung-Jae
    • 말소리와 음성과학
    • /
    • 제9권4호
    • /
    • pp.35-41
    • /
    • 2017
  • The existence and the extent of vowel length difference before voiced/voiceless consonants in English and Korean are examined in three groups: (1) Korean-speaking Americans (group A), (2) immigrants who moved to the U.S. in their early teens (group I), and (3) Koreans who have been in the U.S. for less than 3 years (group K). 14 subjects were recorded reading 10 English and 10 Korean sentences. The results show that the three groups exhibit different patterns of the vowel length difference: Group A shows a very strong tendency of vowel lengthening before voiced consonants in both English and Korean, while Group I shows less degree of vowel lengthening, and Group K shows almost no tendency of vowel length difference in both languages. This strongly suggests that, (1) unlike English, Korean does not have the vowel length difference depending on the following consonants, and (2) the vowel lengthening effect observed in Korean (L2) speech in group A may be the result of transfer of the phonetic trait acquired in English (L1). It also implies that, in teaching pronunciation, some facts such as the vowel length difference cannot be expected to be acquired automatically for the learners of English, but have to be taught explicitly.

베이지안 분류 기반의 입 모양을 이용한 한글 모음 인식 시스템 (Recognition of Korean Vowels using Bayesian Classification with Mouth Shape)

  • 김성우;차경애;박세현
    • 한국멀티미디어학회논문지
    • /
    • 제22권8호
    • /
    • pp.852-859
    • /
    • 2019
  • With the development of IT technology and smart devices, various applications utilizing image information are being developed. In order to provide an intuitive interface for pronunciation recognition, there is a growing need for research on pronunciation recognition using mouth feature values. In this paper, we propose a system to distinguish Korean vowel pronunciations by detecting feature points of lips region in images and applying Bayesian based learning model. The proposed system implements the recognition system based on Bayes' theorem, so that it is possible to improve the accuracy of speech recognition by accumulating input data regardless of whether it is speaker independent or dependent on small amount of learning data. Experimental results show that it is possible to effectively distinguish Korean vowels as a result of applying probability based Bayesian classification using only visual information such as mouth shape features.

북한의 2013교육과정 개정 전·후 영어 교과서 구성 체제 비교 (A Comparison of Structural Organization of English Textbooks between Pre and Post North Korean 2013 Curriculum Revision)

  • 유희연;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.412-422
    • /
    • 2018
  • 본 연구는 북한 2013 개정 영어교육과정에 따라 개정된 최신의 교과서 중, 북한 자료 센터에 입수된 개정 전 대응 학년 교과서가 확보된 5종을 선정하여 개정 전과 개정 후 영어 교과서의 구성 체계를 비교하였다. 일반중학교 초급중3, 고급중2, 고급중3, 제1중학교 고급중1, 고급중 3 이렇게 5종을 선정하여 개정 전 교과서와 비교한 결과, 개정 후 교과서는 첫째, 외형과 삽입 그림에서 이전과 큰 차이를 보였는데, 이전의 흑백의 소박한 교과서 구성을 벗어나 칼라로 인쇄되었다. 둘째, 머리말에 이전까지는 없었던 김정은에 대한 충성맹세가 본격적으로 등장하였다. 셋째, 개정 전에는 읽기, 쓰기 기능에만 치중한 반면 개정 후에는 듣기, 말하기 기능을 포함한 영어의 4기능을 고루 강조하고 있다. 넷째, 개정 전 교과서는 학교급별로 통일성 없이 학년별로 서로 다른 활동 제목을 사용하던 것에서 벗어나 개정 후 교과서는 학교급별로 구성체계를 통일성 있게 따르고 있어 개정 전 보다 체계적이고 연계성 있는 교과서가 되었다. 일반중학교 고급중 교과서는 단원별로 Reading, Listening, Speaking, Writing, Grammar, Vocabulary, Pronunciation의 7가지 기능에 따라 활동이 제시되어 있고 제1중학교 고급중 교과서는 단원별로 Listening, Speaking, Reading, Writing, English in Use 5가지 기능을 제시하고 활동을 제공한다. 다섯째, 체제 유지를 위한 사상적 내용에서 벗어나 다양한 내용을 담았고 영어를 통한 과학, 지리, 컴퓨터 등 다른 교과와의 내용 통합을 지향하였다. 마지막으로, 개정 후 교과서에 참고도서의 명시는 이전에 볼 수 없었던 변화이며 개정 전 보다 확연히 달라진 구성 체계는 참고 도서에 명시된 서양 교재와 매우 비슷하다.

SOME PROSODIC FEATURES OBSERVED IN THE PASSAGE READING BY JAPANESE LEARNERS OF ENGLISH

  • Kanzaki, Kazuo
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.37-42
    • /
    • 1996
  • This study aims to see some prosodic features of English spoken by Japanese learners of English. It focuses on speech rates, pauses, and intonation when the learners read an English passage. Three Japanese learners of English, who are all male university students, were asked to read the speech material, an English passage of 110 word length, at their normal reading speed. Then a native speaker of English, a male American English teacher. was asked to read the same passage. The Japanese speakers were also asked to read a Japanese passage of 286 letters (Japanese Kana) to compare the reading of English with that of japanese. Their speech was analyzed on a computerized system (KAY Computerized Speech Lab). Wave forms, spectrograms, and F0 contours were shown on the screen to measure the duration of pauses, phrases and sentences and to observe intonation contours. One finding of the experiment was that the movement of the low speakers' speech rates showed a similar tendency in their reading of the English passage. Reading of the Japanese passage by the three learners also had a similar tendency in the movement of speech rates. Another finding was that the frequency of pauses in the learners speech was greater than that in the speech of the native speaker, but that the ration of the total pause length to the whole utterance length was about tile same in both the learners' and the native speaker's speech. A similar tendency was observed about the learners' reading of the Japanese passage except that they used shorter pauses in the mid-sentence position. As to intonation contours, we found that the learners used a narrower pitch range than the native speaker in their reading of the English passage while they used a wider pitch range as they read the Japanese passage. It was found that the learners tended to use falling intonation before pauses whereas the native speaker used different intonation patterns. These findings are applicable to the teaching of English pronunciation at the passage level in the sense that they can show the learners. Japanese here, what their problems are and how they could be solved.

  • PDF

구글 Read Along 앱 활용이 초등영어학습자의 발음과 정의적 영역에 미치는 효과 (A Study on the Effects of Read Along by Google with Primary ELLs' Pronunciation and Affective Domains)

  • 윤택남
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.437-444
    • /
    • 2022
  • 본 연구의 목적은 구글에서 개발한 어린이용 언어학습 애플리케이션인 Read Along 활용이 초등영어학습자들의 발음과 정의적 영역에 미치는 영향에 관해 살펴보는 것이다. 이를 위하여 6학년 영어학습자 24명이 4주 간의 실험 수업에 참여하였으며 주요 활동으로는 Read Along을 통한 읽기·말하기 학습이 진행되었다. 연구도구로는 사전-사후 영어발음 평가지와 정의적 영역 설문지가 활용되었으며 수집된 자료를 분석한 결과, 우선, Read Along 앱 기반 활동은 초등영어학습자들의 발음 유창성 및 정확성 향상에 있어 긍정적인 영향을 미친 것으로 나타났다. 실제 두 영역 모두 사전 대비 사후 평균값은 근소하게나마 향상되었으며 대응 표본 t-검정 결과에서도 통계적으로 유의미한 차이가 있는 것으로 나타났다. 둘째, Read Along 앱을 이용한 읽기 및 말하기 활동이 초등영어학습자들의 정의적 영역에 미치는 변화를 설문을 통해 살펴본 결과, 학습자들의 흥미도와 자신감 측면에 있어 긍정적인 변화를 보였다. 두 영역 모두, 사전 대비 사후의 평균이 각각 0.4점, 0.5점이 상승한 것으로 나타났으며 t-검정 결과 역시 유의미한 향상이 있는 것으로 드러났다. 다만 학습 태도면에 있어서는 사후에 소폭의 상승을 보이기는 하였으나 통계적으로 유의미한 차이를 드러내지는 않았다.

시간영역 필터를 이용한 립리딩 성능향상에 관한 연구 (A Study on Lip-reading Enhancement Using Time-domain Filter)

  • 신도성;김진영;최승호
    • 한국음향학회지
    • /
    • 제22권5호
    • /
    • pp.375-382
    • /
    • 2003
  • 현재 음성인식 분야에서는 잡음이 심한 환경에서 음성 인식률을 향상시킬 수 있는 바이모달의 한 형태인 립리딩 기술에 관한 연구가 활발히 진행되고 있다. 립리딩 연구에 있어서 가장 중요한 것은 정확한 입술 이미지를 찾아내는 것이다. 그러나 조명변화, 화자의 발음습관, 입술 모양의 다양성, 입술의 회전과 크기 변화 등의 환경 변화 요인 때문에 안정적인 성능을 예측하기가 힘든 실정이다. 본 논문에서는 보다 안정적 성능을 얻기 위해 시간영역에서 이미지를 임펄스 응답 필터링을 수행을 통해 향상된 인식성능을 보였다. 또한 본 연구에서는 입술 전체 영상을 대상으로 처리하는 립리딩 기법의 사용으로 인해 발생하는 데이터 용량 증가를 고려해 영상의 정보는 손실하지 않고 그 특징만을 추출하여 데이터의 양을 줄일 수 있는 주성분 분석을 전처리 과정으로 사용하였다. 본 연구에서는 영상정보만을 사용하여 음성인식 성능 관찰을 위해 자동차 내에서 서비스가 가능한 22단어를 선정하여 인식실험을 하였다. 이 단어들의 인식 성능을 비교하기 위하여 음성 인식 알고리듬으로 잘 알려진 HMM(Hidden Markov Model)을 이용하였다. 실험결과 PCA(Principal component Analysis)하였던 경우 립리딩이 64%의 인식률을 보인 반면, 시간영역필터를 립리딩에 적용시 72.7%로 인식률의 향상을 보였다.