• Title/Summary/Keyword: 자소

Search Result 184, Processing Time 0.031 seconds

Phoneme Segmentation Method of Handwrittem Hangul Based on Vowel Structure and Heuristic Rules (모음 구조와 경험적인 규칙을 이용한 필기된 한글의 자소 분리 방법)

  • Gwak, Hu-Geun;Choe, Yeong-U;Jeong, Gyu-Sik
    • The KIPS Transactions:PartB
    • /
    • v.8B no.1
    • /
    • pp.10-19
    • /
    • 2001
  • 기존의 필기된 한글의 자소 분리 방법은 일반적으로 다음과 같은 단점을 가진다 : 1) 자소 분리가 주로 세선화된 이미지에 적용되어 세선화 결과에 크게 의존하며, 2) 자소가 접촉되었을 때 명확한 자소 분리 특징점이 발생하는 단순한 접촉만을 대상으로 자소 분리 방법이 개발되어, 특징점이 없거나 특징점이 틀리게 찾아지는 경우처럼 복잡한 접촉에서는 자소 분리 오류가 쉽게 발생한다는 것이다. 본 논문에서는 이러한 단점을 보완하고자 세선화를 하지 않은 이미지에서 자소 분리를 수행하며, 자소가 접촉된 경우 명확한 분리 특징점이 발생하는 경우뿐만 아니라, 특징점이 없거나 특징점이 틀리게 찾아지는 경우에도 자소 분리를 원활하게 수행할 수 있는 방법을 제안한다. 본 논문에서는 자소의 접촉을 유형별로 나누고 각 유형에 대하여 모음의 구조와 상대적인 위치 정보, 접촉의 형태 및 경험적인 규칙들을 사용하여 자소를 분리한다. 제안된 자소 분리 방법은 다음과 같은 순서로 적용된다 : 1) 입력된 낱자 이미지에서 모음을 추적한다 ; 2) 모음의 관점에서 접촉 후 발생하는 특징점의 추출이 명확한가를 판단한다 ; 3) 각 경우에 대한 접촉 유형을 확인한다 ; 4) 접촉 유형에 따른 자소 분리 방법을 적용한다. 필기된 한글 데이터베이스 PE92를 사용한 분리 실험에서 89.5%의 높은 분리율을 얻어서 제안된 방법의 유효성을 확인할 수 있었다.

  • PDF

A Study on Character Recognition using Connected Components Grapheme (연결성분 자소를 이용한 문자 인식 연구)

  • Lee, Kyong-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.01a
    • /
    • pp.157-160
    • /
    • 2017
  • 본 연구에서는 한글 문자 인식을 수행하였다. 한글 인식을 수행하되 고딕 인쇄체 문자를 대상으로 하였고, 자소 단위 인식을 통한 인식을 수행하되 기존 한글 문자 인식 연구에서 사용하는 자음과 모음 단위의 자소가 아닌 연결성분을 이용하여 인식하는 새로운 자소를 이용하였다. 새로운 자소들은 끝점, 2선 모임점, 3선 모임점, 4선 모임점의 특징을 추출하고 특징에 의해 자소를 인식하는 데이터베이스를 구성하여 자소를 인식하게 하였다. 또한 연결 성분을 반영한 새로운 자소로 고딕 인쇄체 문자를 인식하므로 추출된 자소를 6가지로 분류하였고, 6가지 자소에 의해 구성되는 92가지 문자 구조를 제안하고 이에 따른 문자를 데이터베이스를 구축하였고, 자소의 무게 중심을 이용한 분포를 이용하여 제안된 구조를 통하여 데이터베이스를 이용한 문자인식을 수행하였다.

  • PDF

Improvement of The Printed Korean Grapheme Recognition using Meaningful Noises (규칙적인 잡음을 이용한 인쇄체 한글 자소인식 개선)

  • Lee, Jin-Soo;Kwon, Oh-Jun;Bang, Sung-Yang
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.143-147
    • /
    • 1995
  • 한글은 문자수가 많고 초성, 중성, 종성의 조합으로 이루어진 2차원적인 특성 때문에, 신경망을 이용한 한글 인식의 경우에는 자소를 분리한 후 자소별로 인식하는 방법이 많이 사용된다. 이러한 방법의 경우 분리된 자소영역에 원하는 자소 이외의 부분이 첨가되면 학습이 어려워 오인식의 주된 원인이 되기 때문에, 정확한 자소분리 알고리즘이나 전처리등을 통하여 그러한 잡음을 없애려는 시도가 많이 있었으나 아직도 원하는 자소부분 만을 정확히 분리하는 것은 어려운 문제로 남아있다. 본 논문에서는 그러한 잡음이 규칙적임을 이용하여, 필요한 자소영역만을 추출하려하기보다는 오히려 필요한 자소영역 외의 부분을 포함시킴으로써, 잡음이라고만 생각했던 부분을 하나의 정보로 역이용하여 이로 인한 여러 오인식 경우를 해결하였다. 또한 자소의 위치가 불규칙적인 부분에 있어서는, 그 위치를 고정시키는 알고리즘을 사용하여 인식률을 더욱 높였다.

  • PDF

Grapheme Segmentation Method for Low Quality Printed Hangul Text Recognition (저해상도 인쇄체 한글 영상 인식을 위한 자소 분할 방법)

  • Lee Seong-Hun;Cho Kyu-Tae;Kim Jin-Sik;Kim Jin-Hyung;Jung Cheol-Kon;Kim Sang-Kyun;Moon Young-Su;Kim Ji-Yeun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.382-384
    • /
    • 2006
  • 본 논문에서는 저해상도 한글 영상을 자소 단위로 분리하는 방법을 제안한다. 비디오 자막이나 저해상도 스캔 영상의 경우 자소간 획이 접촉되거나 잡영이 많이 포함되어 기존의 자소 분할 방법으로는 한계가 있다. 한자 문자열을 문자 단위로 분할하는데 사용된 비선형 분할 경로 알고리즘을 한글 낱자 영상에 적용하여 자소 단위로 분할한다. 기존의 분할 경로 알고리즘을 한글 자소 분할에 효과적으로 적용하기 위해서 우세점 탐지 알고리즘을 이용하여 자소간 접촉점을 찾고 이를 바탕으로 생성된 분할 경로에 따라 여러 개의 자소 후보 영상이 생성된다. 자소 영상을 자소 인식기로 인식한 결과 높은 인식률을 보이는 것을 실험을 통하여 확인하였다.

  • PDF

An English-to-Korean Transliteration Model based on Grapheme and Phoneme (자소 및 음소 정보를 이용한 영어-한국어 음차표기 모델)

  • Oh Jong-Hoon;Choi Key-Sun
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.4
    • /
    • pp.312-326
    • /
    • 2005
  • There has been increasing interest in English-to-Korean transliteration recently. Previous ,works are related to a direct method like $\rightarrow$Korean graphemes> and a pivot method like $\rightarrow$English phoneme$\rightarrow$Korean graphemes>. Though most of the previous works focus on the direct method, transliteration, however, is a phonetic process rather than an orthographic one. In this point of view, we present an English-Korean transliteration model using grapheme and phoneme information. Unlike the previous works, our method uses phonetic information such as phonemes and their context. Moreover, we also use graphemes corresponding to phonemes. Our method shows about $60\%$ word accuracy.

Online korean character recognition using letter spotting method (자소 탐색 방법에 의한 온라인 한글 필기 인식)

  • 조범준
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.21 no.6
    • /
    • pp.1379-1389
    • /
    • 1996
  • Hangul character always consists of consonants-vowel-consonants in order. Using this point, this paper proposes an approach to design a model for spotting each letter in Hangul, and then recognize characters based on the spotting results. The network model consist of a set of HMMs. The letter search is carried out by Viterbi algorithm, while character recognition is performed by searching the lattice of letter hypotheses. Experimental results show that, in spite of simple architecture of recognition, the performance is quite high reaching 87.47% for discrete regular characters. In particular the approach shows highly plausible segmentation of letters in characters.

  • PDF

Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders (한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석)

  • Lee, Daeun;Kim, Hyeji;Shin, Gayoung;Seol, Ahyoung;Pae, Soyeong;Kim, Mibae
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

계층적 신경망을 이용한 자소인식에 기초한 Off-Line 필기체 한글인식 : 자소간 섭동체거를 위한 High-Level Constraint 회로의 설계

  • 장주석;김명원;임채덕;송윤선
    • Information and Communications Magazine
    • /
    • v.9 no.11
    • /
    • pp.34-36
    • /
    • 1992
  • 여러 개의 문자(혹은 여러 개의 자소로 구성된 한개의 문자)를 인식할때에는 문자(혹은 자소) 상호간에 영향을 미쳐서 오인식이 발생할 가능성이 높다. 개개의 숫자인식에 기초한 숫자열 인식이나, 개개의 자소인식을 바탕으로한 필기체 한글인식이 그 좋은 보기일 것이다. 예를 들어 단순한 한글 '그'를 Neocognitron으로 인식한다고 생각해 보자, 조합 가능한 글자를 모두 기억시키려면 방대한 규모의 회로가 필요하므로 현실적으로 불가능하다. 따라서 기본 자소(자음 14개, 모음 10개)를 인식하도록 학습시키고 이를 바탕으로 한글을 인식하는 것이 효율적이다. 이때, 회로의 각 세포가 보는 receptive field가 유한하여 '?'의 끝 세로부분 'I'가 '?'에 영향을 미쳐서 '?'로 인식된다 즉, 자소간의 섭동에 의해 '그'가 '고'로 인식되는 것이다. 이와같은 예는 '니'가 '넉'으로, '41'이 '4H'로 인식되는 등 매우 많지만 그 해결에 대한 연구는 거의 없다. 이 논문에서는 필기체 한글 자소를 인식하는 Necognitron외에 자소간의 섭동현상을 제거하기 위한 high-level constraint 회로를 Lotka-Volterra동역학에 기초하여 설계하였다. 이로써 off-line필기체 한글인식을 보다 효과적으로 할 수 있음을 컴퓨터 시뮬레이션으로 보인다.

  • PDF

Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders (한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석)

  • Lee, Daeun;Kim, Hyeji;Shin, Gayoung;Seol, Ahyoung;Pae, Soyeong;Kim, Mibae
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

Labor-saving Cultivation of Cynanchum wilfordii using Support Crops (지주작물을 이용한 백하수오 생력재배)

  • 김민자;박부규;박재호;박성규
    • Korean Journal of Plant Resources
    • /
    • v.12 no.3
    • /
    • pp.204-208
    • /
    • 1999
  • We carried out this study to confirm the possibility of C. wilfordii cultivation using crop as a substitute for stake or net, and tested sit support crops, i.e., soybean, peanut, Perilla frutescens var. acuta Kudo, Job's tears, sorghum, and corn compared with net support. Effects of support crops on growth and root yield of C. wilfordii were as follows. Attracting efficiency of vine showed 94∼100% among crops. The number of branches per plant was 1 or 2 more in p. frutescens var. acuta Kudo, Job's tears, and sorghum support than in net support. Fresh root yield per 10a was 919kg in net support, while it was 717kg in P. frutescens var. acute Kudo, 656kg in Job' tears, and 652kg in sorghum support. However, the problem of decreased yield in these support crops could be overcome by cost saving of staking installation and by harvesting support crops. Therefore, C. wilfordii cultivation using P. frutescens var. acute Kudo, Job's tears, and sorghum as support crops showed most effective in labor and cost saving.

  • PDF