• 제목/요약/키워드: 한글 문자 인식

검색결과 325건 처리시간 0.027초

표준 문자 패턴과의 미적 평가를 통한 한글 문자 익히기 시스템 (Hanguel Character Learning System by Beauty Evaluation front Standard Character Pattern)

  • 한군희;조동욱;전병민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1653-1656
    • /
    • 2000
  • 필기체 서체 인식은 온라인 문자 인식 시스템에서 주로 사용되는 시스템이다. 또한 오프라인 문자 인식 시스템은 문자 인식에만 초점이 맞추어져 있는 상황이다. 본 논문에서는 오프라인 방식으로 기초의 문자 인식에만 머물던 시스템을 문자 익히기까지 행할 수 있는 시스템으로 확장하는 방법을 제안 하고자 한다. 이를 위해 신명조체 80포인트에 대한 표준문자패턴을 생성하고, 유사도함수를 정의하며 이를 통해 입력 문자 패턴과의 유사성을 계산하여 문자 익히기를 행하고자 한다.

  • PDF

필기 한글 문자의 모양 분해 (Shape Decomposition of Handwritten Hangul Characters)

  • 박정선;홍기천;오일석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권7호
    • /
    • pp.511-523
    • /
    • 2001
  • 필기 한글의 문자나 단어 인식에 있어 패턴을 구성하는 획 성분을 추출하는 작업은 매우 중요하다. 세선화와 직선근사에 기반한 고전적인 방법은 원래 패턴을 크게 왜곡한다는 단점을 가지고 있다. 우리는 이러한 문제점을 해결하기 위하여 한글 패턴에 적합한 모양 분해 알고리즘을 제안한다. 한글 패턴은 T-접점과 B-접점이라는 두가지 모양 특징을 중심으로 분할할 수 있다고 관찰에 근거하여 알고리즘을 설계하였다. 또한 세 개 이상의 획이 복잡한 형태로 만나는 결합 지점을 강전하게 처리하는 방법도 제시한다. 제안한 알고리즘을 PE92 데이터베이스에 적용한 결과를 제시한다.

  • PDF

임의 영상내 다수 객체에서 달력을 인식하기 위한 시스템의 구성 (The structure of the system for recognizing some calendars in an image.)

  • 이광호;이승수;최운종;박장춘
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.559-561
    • /
    • 2000
  • 본 논문은 문자 인식의 기법을 이용하여 임의 영상에서 우리의 일상 생활에서 접하는 일반적인 달력을 포함하는 영상만을 검출하기 위한 영상 인식에 관한 연구이다. 달력이라는 영상내의 객체를 인식하기 위한 과정은 다음과 같이 요약된다. 우선 1~31까지의 숫자, 월요일(MON)과 같이 한글과 영문으로 된 요일, 월, 년과 같이 달력에 존재하는 아주 기본적인 문자에 대한 참조 패턴을 형성한다. 입력된 영상에서는 문자 영역 검출 단계, 문자의 특징 추출 단계를 거쳐 영상의 문자 추출이 이루어지고, 달력을 검출하기 위한 참조패턴과 입력 패턴의 비교를 수행하는 인식 단계를 거쳐, 영상 내의 달력 유무를 판단한다. 특히 불규칙적인 배열을 이루는 문자영역을 추출하기 위하여, 본 논문에서는 Hough Transform을 이용하여 기존의 규칙적 문자 인식의 문자 검출 방법의 한계점을 해결하였다.

  • PDF

한글 문장의 자동 띄어쓰기 (Automatic Word-Segmentation for Hangul Sentences)

  • 강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.137-142
    • /
    • 1998
  • 자동 띄어쓰기는 띄어쓰기가 무시된 한글 문서의 자동색인이나 문자인식에서 줄바꿈 문자에 대한 공백 삽입 문제 등을 해결하는데 필요하다. 이러한 문서에서 공백이 삽입될 위치를 찾아 주는 띄어쓰기 알고리즘으로 어절 블록에 대한 문장 분할 기법과 양방향 최장일치법을 이용한 어절 인식 방법을 제안한다. 문장 분할은 한글의 음절 특성을 이용하여 어절 경계가 비교적 명확한 어절 블록을 추출하는 것이며, 어절 블록에 나타난 각 어절들을 인식하는 방법으로는 형태소 분석기를 이용한다. 4,500여 어절로 구성된 두 가지 유형의 문장 집합에 대하여 제안한 방법의 띄어쓰기 정확도를 평가한 결과 '공백 재현율'이 97.3%, '어절 재현율'이 93.2%로 나타났다.

  • PDF

인지 모델을 이용한 오프라인 한글 인식 (The Off-line Hangul Recognition using Congnitive Model)

  • 김용훈;황종선;조영임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.249-258
    • /
    • 1992
  • 인간이 문자를 어떻게 인식하는가에 관한 많은 연구 결과는 인지 과학자들과 심리학자들에게 의해서 주도되어 왔다. 이에 따라 본 논문은 인간의 시각 체계에 대한 인지적 연구 이론 및 원리를 요약하고 오프라인 한글 문자 인식을 위한 인지적 모델의 필요성을 설명한다. 여러 실험 결과와 주의 이론, 체제성 원리 및 맥락 효과를 도입한 새로운 모델을 개발하고 한글의 구조적 특성을 고려한 구현 모델로 제시한다.

  • PDF

온라인 한글 인식을 위한 HMM 상태 수의 최적화 (Optimization of Number of States in HMM for On-line Hangul Recognition)

  • 하진영;신봉기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.372-374
    • /
    • 1998
  • 온라인 문자 인식을 위해 시도된 여러 방법 중 은닉 마르코프 모델(HMM)이 우수한 성능을 보이고 있다. 영숫자 인식은 물론 한글 인식에 있어서도 HMM은 최근 널리 사용되고 있는데, HMM을 이용해서 모델링 할 때 해결해야 할 문제 중의 하나는 HMM의 구조를 어떻게 최적화 하느냐이다. 본 논문에서는 HMM을 이용한 온라인 한글 인식 시스템에서 HMM의 최적화를 통해 인식률을 향상시키고자 한다. 특히 HMM의 상태(state)수를 어떻게 정할 것인가에 초점을 맞춰, 실험을 통해 최적의 HMM 상태 수를 찾고자 한다.

  • PDF

자소 클래스 인식에 의한 off-line 필기체 한글 문자 분할 (Consonant-Vowel Classification Based Segmentation Technique for Handwritten Off-Line Hangul)

  • 황순자;김문현
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.1002-1013
    • /
    • 1996
  • 문자 분할은 필기체 문서 서식의 자동 인식 과정에서 중요한 부분이다. 본 연구는 off-line 필기체 한글로부터 문자를 분할하기 위한 방법을 제안한다. 제안한 방법은 한글의 구조적 특성에 기반을 두고 있다. 먼저 투영에 의하여 입력 단어로 부터 분할 을 위한 특징과 연결 화소, 획을 추출한다. 두 번째 단계에서 획의 모양과 위치, 획과 획과의 관계를 이용하여 한글의 기본 자소 클래스 영역을 찾는다. 세 번째 단계는 분할 과정으로 WRC(While Run Column)다음에 초성이나 수평 모음이 오는 경우 이 WRC에서 수직으로 분할하며, 분할된 세그먼트의 길이가 임계값 이상아면 자소 클래 스와 문자의 칼럼에 대한 특징을 이용하여 예상 분할 영역을 찾고, 이 영역에 있는 획을 따라 요철 형태로 분할한다.

  • PDF

한글 문서에서의 낱자 분리 알고리즘 (An Algorithm for Character Segmentation on the Korean Documents)

  • 이현표;양순성;황교철;이균하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.203-208
    • /
    • 1989
  • 본 논문에서는 한글 문자 인식 시스템을 이용하여 한글 문서를 자동 판독하기 위한 낱자 분리 알고리즘을 제안하였다. 제안된 알고리즘은 문자의 심미성 및 가독성을 높이기 위하여 상호 접촉되고 있는 낱자들의 유형을 조사 분석한 후 문서의 수직 및 수평 투영법에 기본을 두어 행과 열을 분리하고, 분리된 문자군을 이루고 있는 문자획의 기하학적 속성들을 분석하여 낱자를 분리하였다.

  • PDF

Substroke HMM 기반 온라인 필기체 문자인식 (On-line Handwriting Recognition Based on Substroke HMM)

  • 김춘영;석수영;정호열;정현열
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.74-77
    • /
    • 2003
  • 본 논문에서는 자연스러운 온라인 필기체 문자 인식을 위하여 획 기반 HMM(Substroke HMM)을 기반으로 한 인식 방법을 채택하고, 획 분류의 정확도 향상을 위한 전처리 과정에 대해 재샘플링 간격 조정을 통한 획 분류실험을 통해 인식률 제고에 관한 실험을 수행하였다 필기체 문자인식을 위한 방법으로 한 문자 전체를 HMM으로 구성하는 Whole-character HMM과 자소단위를 HMM으로 구성하는 character HMM을 주로 이용하였으나, 이러한 방법은 문자의 수에 비례하여 비교적 큰 메모리 용량과 계산량이 요구되는 단점이 있다. 이러한 단점을 개선하기 위한 획 기반 HMM은 문자를 획 단위로 분류한 후 이를 HMM 모델로 구성하므로 소수의 획 기반 HMM 모델만으로 문자를 모두 표현할 수 있는 장점을 가지고 있어, 인식률의 큰 저하 없이 계산량 및 메모리 용량을 크게 줄일 수 있다. PDA상에서 수집한 완성형 한글 데이터베이스를 사용하여 획 분류 실험을 수행한 결과 평활화와 7/100 길이의 재샘플링을 수행한 경우 평활화 과정을 추가하지 않은 기존의 재샘플링 5/100 길이의 경우에 비해 정확도가 평균 3.7% 향상을 나타내었으며, 특히 첨가 에러율이 감소함을 확인할 수 있다.

  • PDF

투영 프로파일의 간략화 방법을 이용한 인쇄체 한글 문서 영상에서의 문자 분할 (Character Segmentation on Printed Korean Document Images Using a Simplification of Projection Profiles)

  • 박상철;김수형
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.89-96
    • /
    • 2006
  • 본 논문에서는 한글 문서 영상에서의 문자 분할을 위한 2가지 알고리즘을 제안한다. 첫째는 투영 프로파일 기반 개선된 문자 분할 알고리즘이다. 이 알고리즘은 크게 문자수 추정, 분할 점 획득 및 문자 경계 탐색, 그리고 최적의 문자 분할 결과 선택으로 구성된다. 두 번째는 근접한 문자들이 서로 연결된 저 품질 문서 영상에 적합한 분할 알고리즘이다. 이 경우 연결요소를 제거하기 위해 투영 프로파일의 일부를 잘랐는데, 이를 ${\alpha}$-cut이라 한다. 그 후 전자의 방법을 변형하여 문자 분할을 수행한다. 다양한 폰트 속성을 갖고 품질이 낮은 43,572개의 한글 단어 영상을 대상으로 실험한 결과, 투영 프로파일 기반 개선된 문자 분할 알고리즘이 91.81%, 투영 프로파일에 ${\alpha}$-cut을 적용한 알고리즘이 99.57% 의 문자 분할 성공률을 나타내어 저 품질 한글 문서 영상에서 ${\alpha}$-cut을 이용한 문자 분할 알고리즘이 효과적임을 입증하였다.