• 제목/요약/키워드: 자소

검색결과 184건 처리시간 0.018초

모음 구조와 경험적인 규칙을 이용한 필기된 한글의 자소 분리 방법 (Phoneme Segmentation Method of Handwrittem Hangul Based on Vowel Structure and Heuristic Rules)

  • 곽후근;최영우;정규식
    • 정보처리학회논문지B
    • /
    • 제8B권1호
    • /
    • pp.10-19
    • /
    • 2001
  • 기존의 필기된 한글의 자소 분리 방법은 일반적으로 다음과 같은 단점을 가진다 : 1) 자소 분리가 주로 세선화된 이미지에 적용되어 세선화 결과에 크게 의존하며, 2) 자소가 접촉되었을 때 명확한 자소 분리 특징점이 발생하는 단순한 접촉만을 대상으로 자소 분리 방법이 개발되어, 특징점이 없거나 특징점이 틀리게 찾아지는 경우처럼 복잡한 접촉에서는 자소 분리 오류가 쉽게 발생한다는 것이다. 본 논문에서는 이러한 단점을 보완하고자 세선화를 하지 않은 이미지에서 자소 분리를 수행하며, 자소가 접촉된 경우 명확한 분리 특징점이 발생하는 경우뿐만 아니라, 특징점이 없거나 특징점이 틀리게 찾아지는 경우에도 자소 분리를 원활하게 수행할 수 있는 방법을 제안한다. 본 논문에서는 자소의 접촉을 유형별로 나누고 각 유형에 대하여 모음의 구조와 상대적인 위치 정보, 접촉의 형태 및 경험적인 규칙들을 사용하여 자소를 분리한다. 제안된 자소 분리 방법은 다음과 같은 순서로 적용된다 : 1) 입력된 낱자 이미지에서 모음을 추적한다 ; 2) 모음의 관점에서 접촉 후 발생하는 특징점의 추출이 명확한가를 판단한다 ; 3) 각 경우에 대한 접촉 유형을 확인한다 ; 4) 접촉 유형에 따른 자소 분리 방법을 적용한다. 필기된 한글 데이터베이스 PE92를 사용한 분리 실험에서 89.5%의 높은 분리율을 얻어서 제안된 방법의 유효성을 확인할 수 있었다.

  • PDF

연결성분 자소를 이용한 문자 인식 연구 (A Study on Character Recognition using Connected Components Grapheme)

  • 이경호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.157-160
    • /
    • 2017
  • 본 연구에서는 한글 문자 인식을 수행하였다. 한글 인식을 수행하되 고딕 인쇄체 문자를 대상으로 하였고, 자소 단위 인식을 통한 인식을 수행하되 기존 한글 문자 인식 연구에서 사용하는 자음과 모음 단위의 자소가 아닌 연결성분을 이용하여 인식하는 새로운 자소를 이용하였다. 새로운 자소들은 끝점, 2선 모임점, 3선 모임점, 4선 모임점의 특징을 추출하고 특징에 의해 자소를 인식하는 데이터베이스를 구성하여 자소를 인식하게 하였다. 또한 연결 성분을 반영한 새로운 자소로 고딕 인쇄체 문자를 인식하므로 추출된 자소를 6가지로 분류하였고, 6가지 자소에 의해 구성되는 92가지 문자 구조를 제안하고 이에 따른 문자를 데이터베이스를 구축하였고, 자소의 무게 중심을 이용한 분포를 이용하여 제안된 구조를 통하여 데이터베이스를 이용한 문자인식을 수행하였다.

  • PDF

규칙적인 잡음을 이용한 인쇄체 한글 자소인식 개선 (Improvement of The Printed Korean Grapheme Recognition using Meaningful Noises)

  • 이진수;권오준;방승양
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-147
    • /
    • 1995
  • 한글은 문자수가 많고 초성, 중성, 종성의 조합으로 이루어진 2차원적인 특성 때문에, 신경망을 이용한 한글 인식의 경우에는 자소를 분리한 후 자소별로 인식하는 방법이 많이 사용된다. 이러한 방법의 경우 분리된 자소영역에 원하는 자소 이외의 부분이 첨가되면 학습이 어려워 오인식의 주된 원인이 되기 때문에, 정확한 자소분리 알고리즘이나 전처리등을 통하여 그러한 잡음을 없애려는 시도가 많이 있었으나 아직도 원하는 자소부분 만을 정확히 분리하는 것은 어려운 문제로 남아있다. 본 논문에서는 그러한 잡음이 규칙적임을 이용하여, 필요한 자소영역만을 추출하려하기보다는 오히려 필요한 자소영역 외의 부분을 포함시킴으로써, 잡음이라고만 생각했던 부분을 하나의 정보로 역이용하여 이로 인한 여러 오인식 경우를 해결하였다. 또한 자소의 위치가 불규칙적인 부분에 있어서는, 그 위치를 고정시키는 알고리즘을 사용하여 인식률을 더욱 높였다.

  • PDF

저해상도 인쇄체 한글 영상 인식을 위한 자소 분할 방법 (Grapheme Segmentation Method for Low Quality Printed Hangul Text Recognition)

  • 이성훈;조규태;김진식;김진형;정철곤;김상균;문영수;김지연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.382-384
    • /
    • 2006
  • 본 논문에서는 저해상도 한글 영상을 자소 단위로 분리하는 방법을 제안한다. 비디오 자막이나 저해상도 스캔 영상의 경우 자소간 획이 접촉되거나 잡영이 많이 포함되어 기존의 자소 분할 방법으로는 한계가 있다. 한자 문자열을 문자 단위로 분할하는데 사용된 비선형 분할 경로 알고리즘을 한글 낱자 영상에 적용하여 자소 단위로 분할한다. 기존의 분할 경로 알고리즘을 한글 자소 분할에 효과적으로 적용하기 위해서 우세점 탐지 알고리즘을 이용하여 자소간 접촉점을 찾고 이를 바탕으로 생성된 분할 경로에 따라 여러 개의 자소 후보 영상이 생성된다. 자소 영상을 자소 인식기로 인식한 결과 높은 인식률을 보이는 것을 실험을 통하여 확인하였다.

  • PDF

자소 및 음소 정보를 이용한 영어-한국어 음차표기 모델 (An English-to-Korean Transliteration Model based on Grapheme and Phoneme)

  • 오종훈;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.312-326
    • /
    • 2005
  • 최근 정보검색과 기계번역과 같은 자연언어응용에서 영-한 자동 음차표기에 대한 관심이 높아지고 있다. 지금까지의 영-한 자동 음차표기 연구에는 $<영어자소{\rightarrow}$한글자소>의 직접방식, <영어자소${\rightarrow$음소$\rightarrow$한글자소>의 피봇방식이 있다 기존의 영-한 음차표기 연구들은 주로 직접방식에 대한 연구가 활발히 진행되어 찼다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소 뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 $60\%$의 단어 정확도를 나타내었다.

자소 탐색 방법에 의한 온라인 한글 필기 인식 (Online korean character recognition using letter spotting method)

  • 조범준
    • 한국통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1379-1389
    • /
    • 1996
  • 한글 필기는 항상 초성, 중성, 종성의 순으로 씌어진다. 본 논문은 이점을 이용하여 자소 탐색 모델을 설계하고 그 탐색 결과에 의거하여 글자를 인식하려는 온라인 필기 인식 방법을 제시하고자 한다. 기본 자소 모델은 은닉 마르코프 모델을 이용하고 자소 탐색 모델은 HMM의 망으로 구성한다. 자소 탐색은 Viterbi 알고리즘에 의한 정합으로 이루어지며 글자 인식은 이들 자소 가설 격자의 탐색으로 이루어진다. 인식 실험 결과는 간단한 인식기 구조에도 불구하고 정자체의 경우 87.47%에 달하는 상당한 인식률을 보였으며, 특히 자연스럽게 쓴 필기에서도 매우 훌륭한 자소 분할 결과를 얻을 수 있었다.

  • PDF

한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석 (Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders)

  • 이다은;김혜지;신가영;설아영;배소영;김미배
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

계층적 신경망을 이용한 자소인식에 기초한 Off-Line 필기체 한글인식 : 자소간 섭동체거를 위한 High-Level Constraint 회로의 설계

  • 장주석;김명원;임채덕;송윤선
    • 정보와 통신
    • /
    • 제9권11호
    • /
    • pp.34-36
    • /
    • 1992
  • 여러 개의 문자(혹은 여러 개의 자소로 구성된 한개의 문자)를 인식할때에는 문자(혹은 자소) 상호간에 영향을 미쳐서 오인식이 발생할 가능성이 높다. 개개의 숫자인식에 기초한 숫자열 인식이나, 개개의 자소인식을 바탕으로한 필기체 한글인식이 그 좋은 보기일 것이다. 예를 들어 단순한 한글 '그'를 Neocognitron으로 인식한다고 생각해 보자, 조합 가능한 글자를 모두 기억시키려면 방대한 규모의 회로가 필요하므로 현실적으로 불가능하다. 따라서 기본 자소(자음 14개, 모음 10개)를 인식하도록 학습시키고 이를 바탕으로 한글을 인식하는 것이 효율적이다. 이때, 회로의 각 세포가 보는 receptive field가 유한하여 '?'의 끝 세로부분 'I'가 '?'에 영향을 미쳐서 '?'로 인식된다 즉, 자소간의 섭동에 의해 '그'가 '고'로 인식되는 것이다. 이와같은 예는 '니'가 '넉'으로, '41'이 '4H'로 인식되는 등 매우 많지만 그 해결에 대한 연구는 거의 없다. 이 논문에서는 필기체 한글 자소를 인식하는 Necognitron외에 자소간의 섭동현상을 제거하기 위한 high-level constraint 회로를 Lotka-Volterra동역학에 기초하여 설계하였다. 이로써 off-line필기체 한글인식을 보다 효과적으로 할 수 있음을 컴퓨터 시뮬레이션으로 보인다.

  • PDF

한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석 (Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders)

  • 이다은;김혜지;신가영;설아영;배소영;김미배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

지주작물을 이용한 백하수오 생력재배 (Labor-saving Cultivation of Cynanchum wilfordii using Support Crops)

  • 김민자;박부규;박재호;박성규
    • 한국자원식물학회지
    • /
    • 제12권3호
    • /
    • pp.204-208
    • /
    • 1999
  • 백하수오 재배시 지주설치 비용 절감 및 생력 재배기술 확립 목적으로 자소 등 6작물을 지주작물로 공시하여 시험을 수행한 결과를 요약하면 다음과 같다. 1. 지주작물의 주당 분지수는 율무 7개, 자소 19개로 백하수오 덩굴유인에 유리한 조건으로 작용하여 자소 97%, 율무 100%의 덩굴유인율을 보였다. 2. 백하수오의 지상부 생육은 자소, 수수재배에서 네트지주재배보다 만장이 길었고, 주당 분지수는 네트지주재배 6개에 비하여 자소, 율무, 수수 재배에서 1~2개 많았다. m$^2$당 엽중은 네트지주 재배시 1,001g으로 가장 많았고, 지주작물재배에서는 자소, 율무, 수수에서 614~636g이었다. 3. 백하수오의 지하부 생육은 땅콩, 자소재배에서 근장이 길었고, 지근수는 네트지주재배 8개에 비하여 땅콩, 자소재배 4개, 율무재배에서 6개였다. 4. 10a당 백하수오의 생근수량은 네트지주재배에서 919kg으로 가장 높았고, 지주작물재배간에는 자소 717kg, 율무 656kg, 수수 652kg으로 네트지주재배에 비하여 22~29% 감수되었다. 5. 백하수오 수량은 감수하나 지주설치 비용 절감 및 지주작물의 수확으로, 자소, 율무, 수수를 이용한 백하수오 생력재배가 가능하였다.

  • PDF