• 제목/요약/키워드: 한글 음소인식

검색결과 22건 처리시간 0.024초

음운인식의 언어 간 전이와 한글 및 영어의 읽기 쓰기와의 관계 (Cross-language Transfer of Phonological Awareness and Its Relations with Reading and Writing in Korean and English)

  • 김상미;조증열;김지연
    • 인지과학
    • /
    • 제26권2호
    • /
    • pp.125-146
    • /
    • 2015
  • 본 연구는 초등학교 5학년 학생들을 대상으로 한국어 음운인식이 영어 음운인식에 기여하는지의 여부와, 한국어와 영어의 음운인식이 한글과 영어 읽기 및 쓰기와 관련이 되는지를 살펴보았다. 그 결과, 어휘력과 연령을 통제한 후에 한국어 음운인식은 영어 음운인식의 변량을 유의하게 설명하였다. 구체적으로 한국어 음절과 음소인식은 영어 음절인식을 예측하였고, 한국어 음소인식은 영어 음소인식을 예측하였다. 연령과 어휘력을 통제한 후에 영어 음소인식은 영어와 한글의 읽기와 받아쓰기의 변량을 유의하게 설명하였다. 또한 한국어 음절인식이 한글읽기를 설명하였으며, 영어 음절인식은 한글 받아쓰기를 설명하였다. 본 연구의 결과는 음운인식은 상위언어적 기술(metalinguistic skill)로 한국어에서 영어로 언어 간 전이되는 것을 시사한다. 또한 음소인식이 영어의 읽기와 쓰기에 중요하지만, 음소와 음절인식이 한글의 읽기와 쓰기에 중요한 것을 시사한다.

음소단위 코드북간의 확률적 전이 모델을 이용한 한국어 숫자음 인식에 관한 연구 (Isolated Korean Digits Recognition Using Stochasitc Transition Models With Phoneme-based VQ Codebooks)

  • 최환진;오영환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.149-157
    • /
    • 1993
  • 음성인식을 위해 다양한 방법들이 제안되어 있다. 본 연구에서는 음소단위 각각의 벡터 양자화된 코드북의 색인을 학습하는 HMM을 이용하여 한국어 숫자음을 대상으로 인식 실험을 수행하였다. 실험결과, 기존의 단어단위 HMM과 음소단위로 이루어진 유한상태기계(FSM)구조의 인식기에 비해 높은 인식율을 보였다.

  • PDF

간판영상에서 한글 인식 성능향상을 위한 가중치 기반 음소 단위 분할 교정 (Weighted Disassemble-based Correction Method to Improve Recognition Rates of Korean Text in Signboard Images)

  • 이명훈;양형정;김수형;이귀상;김선희
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.105-115
    • /
    • 2012
  • 본 논문에서는 휴대폰 카메라를 통해 간판영상의 한글문자를 인식한 후 오인식 된 결과를 교정하는 방법으로 인식 후보를 음소단위 분할하고 연산 가중치를 적용한 weighted Disassemble Levenshtein Distance(wDLD)를 제안한다. 제안된 방법은 인식된 문자열을 음소 단위로 분할한 후 입력 형태의 거리값을 산출하여, 가장 유사한 상호명을 데이터베이스에서 검출 한다. 제안된 방법의 효율성을 검증하기 위해, 전국의 상호명 중 중복되는 상호명을 제거한 130만개의 상호명을 이용하여 데이터베이스 사전을 구축하였다. 또한 대표적인 문자열 비교 알고리즘인 Levenshtein Distance와 음소를 분할하여 적용한 Disassemble Levenshtein Distance 방법, 그리고 본 논문에서 제안한 인식 후보의 음소 단위 분할 방법과 연산 가중치를 적용한 weighted Disassemble Levenshtein Distance의 교정율을 비교 분석 하였다. 그 결과 제안된 weighted Disassemble Levenshtein Distance(wDLD)은 Levenshtein Distance와 Disassemble Levenshtein Distance방법에 비해 각각 평균 29.85%와 6%의 인식률의 향상을 보였다.

중국 조선족 아동의 한글 자소-음소 대응능력의 발달과 글자읽기와의 관계에 관한 연구 (The Development of Grapheme-Phoneme Correspondence Rules and Kulja Reading in Korean-Chinese Children)

  • 윤혜경;박혜원
    • 아동학회지
    • /
    • 제26권4호
    • /
    • pp.145-155
    • /
    • 2005
  • This study was carried out to reveal Hangul acquisition processes in Korean-Chinese children who grow in a horizontal bilingual environment. In this experiment Grapheme substitution/deletion tasks and sensible/non-sensible Kulja reading tasks were administered to 3-, 4-, 5- and 6-year-old Korean-Chinese children growing up in a bilingual environment. Results were that Korean-Chinese children showed similar patterns of Hangul acquisition processes to Korean children but acquired grapheme-phoneme(G-P) correspondence earlier than Korean children. Hangul acquisition rates were 41.7%, 45.7%, 53% and 92.7% at age 3, 4, 5 and 6, respectively. Both Korean-Chinese and Korean children showed higher sensitivity for the final consonant than for the initial and middle consonants. Correlation between phoneme perception and reading was only significant among 6-year-olds in non-sensible Kulja reading tasks. Training in transforming ideographic Chinese to a phonetic system could effect early acquisition of G-P correspondence in Korean-Chinese children.

  • PDF

한글 지화 인식에 최적화된 데이터 글러브 시스템 (Optimize Data Glove-based System for Korean Finger Spelling Recognition)

  • 민승기;오상혁;김교령;윤태현;임준규;;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.237-241
    • /
    • 2007
  • 본 논문에서는 지화 인식에 최적화된 데이터 글러브 기반의 시스템을 제안한다. 제안된 데이터 글러브는 적은 수의 센서로 인식 속도의 향상을 기대할 수 있으며 한글의 지화 인식만을 위한 특수한 목적을 가지고 저렴하게 설계되었다. 그에 따라 한글의 지화를 사용한 많은 어플리케이션에 쉽게 적용할 수 있을 것이 기대된다. 2개의 틸트 센서는 손의 방향을 인식하고 5개의 플렉스 센서는 각 손가락의 구부러진 정도를 측정한다. 제안된 시스템에서는 k-means 알고리즘과 간단한 인덱싱 방식을 사용하여 한글의 기본적인 음소 24개를 인식하는 실험을 하였으며 인식율은 80.27% 에 이르렀다.

  • PDF

한국어 음성 데이타베이스의 저장 구조와 검색 기법 (The storage structure and retrieval mechanism for korean speech database)

  • 송군섭;박영배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.321-330
    • /
    • 1991
  • 기존의 데이타베이스에 음성 데이타를 저장하여 음성 데이타 베이스를 구축하고자 할 경우, 음성 데이타의 특성이 가변장(variable length)이며, 튜플(음소 단위)의 길이가 매우 긴 패턴 데이타이므로 기존의 데이타베이스 시스템에서는 지원할 수 없다. 또, 현재의 음성 인식 시스템에서는 패턴 데이타를 순차적인 검색 방법으로 검색하고 있어 빠른 검색 방법이 요구된다. 본 논문에서는 음성 데이타를 음소 단위로 인식하기 위해 음소 패턴 데이타를 저장하고, 유사한 특성을 갖는 부류와 음소 길이에 의한 분류를 혼합한 방법을 이용하여 빠른 시간에 검색을 할 수 있게 하기 위한 저장 구조와 검색 알고리즘을 제시한다.

  • PDF

음소단위 TDNN에 기반한 한국어 연속 음성 인식을 위한 데이타 자동분할 (Automatic segmentation for continuous spoken Korean language recognition based on phonemic TDNN)

  • 박규봉;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.30-34
    • /
    • 1995
  • 신경망을 이용하는 연속 음성 인식에서 학습이라 함은 인위적으로 분할된 음성 데이타를 토대로 진행되는 것이 지배적이었다. 그러나 분할된 음성데이타를 마련하기 위해서는 많은 시간과 노력, 숙련 등을 요구할 뿐만아니라 그 자체가 인식도메인의 변화나 확장을 어렵게 하는 하나의 요인 되기도 한다. 그래서 분할된 음성데이타의 사용을 가급적 피하고 그러면서도 성능을 떨어뜨리지 않는 신경망 학습법들이 나타나고 있다. 본 논문에서는 학습된 인식기를 이용하여 자동으로 한국어 음성데이타를 분할한 후 그 분할된 데이타를 이용하여 다시 인식기를 재학습시켜나가는 반복 과정을 소개하고자 한다. 여기에는 TDNN이 인식기로 사용되며 인식단위는 음소이다. 학습은 cross-validation 기법을 이용하여 제어된다.

  • PDF

음성공학을 위한 변이음 정보 (Allophonic Information Necessary for Speech Technology)

  • 이호영;지민제;김영송
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.131-139
    • /
    • 1993
  • 하나의 음소는 보통 음성환경에 따라 여러 변이음으로 실현된다. 음성합성기로 한국어의 문장을 자연스럽게 합성해 내려고 할 때나 음성인식기가 한국어의 문장을 정확하게 인식하도록 개발하고자 할 때 변이음에 관한 정보는 필수적이다. 따라서 이 논문의 목적은 음성공학에 필요한 변이음 정보를 제공하는 것이다. 이 논문에서는 음성공학에 필요한 한국어의 주오 변이음 규칙들을 간단히 논의하고 몇몇 중요한 변이음들의 음향적 특징을 논의한다.

  • PDF

연속분포 HMM을 이용한 한국어 연속 음성 인식 시스템 개발 (On the Development of a Continuous Speech Recognition System using Continuous Hidden Markov Model for Korean Language)

  • 김도영;박용규;권오욱;은종관
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.101-110
    • /
    • 1993
  • 본 논문에서는 연속분포 hidden Markov 모델을 이용한 화자독립 연속 음성 인식 시스템에 관해 기술한다. 연속분포 모델은 평균과 분산 벡터로 구성되며 음성신호를 직접 모델링하여 양자화 왜곡이 없어진다. 특징벡터는 filter bank 계수 및 그 1, 2차 미분계수를 사용하여 음성신호의 동적 특성을 반영하였다. Segmental K-means 알고리즘을 이용하여 학습하였으며, 연속어 인식에서 가장 문제가 되는 조음화 현상으로 인한 인식률 저하를 막기 위해 앞뒤의 음소를 고려해 주는 triphone을 인식단위로 사용하였다. Search 알고리즘으로는 시간 면에서 효율이 좋은 one-pass search 알고리즘을 사용하였다. 성능 평가를 위한 화자 독립 인식 실험에서 문법이 없을 경우 83%, finite state network율 적용한 경우에는 94%의 인식률을 나타내었다.

  • PDF

HMM에 기반한 연속음성인식에서의 형태소 그래프 생성 (Morpheme Graph Generation with HMM based Continuous Speech Recognition)

  • 최준기;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.500-504
    • /
    • 1997
  • 본 논문에서는 형태소 그래프를 정의하고 이를 한국어 연속 음성 인식의 결과로서 사용함과 동시에 한국어의 자연어 처리를 위한 지식 표현 방법으로 사용한다. 또한 형태소 그래프를 연속 음성 인식과정에서 효율적으로 생성하는 알고리즘으로서 Tree-Trellis 탐색 알고리즘을 소개한다. 한국어 연속 음성 인식기는 HMM 인식기를 사용하며 탐색 알고리즘 또한 HMM 음소 인식기의 사용을 전제로 한다. 실험 DB로는 한국과학기술원 통신연구실에서 제작한 3000 단어급의 무역상담관련 DB를 사용하였다.

  • PDF