• 제목/요약/키워드: 글자 인식

검색결과 182건 처리시간 0.021초

속성문법을 이용한 필기체 한글 문서 내의 자모인식 (The Recognition of Vowels and Consonants in a Handwritten Hangul Text with Attributed Grammars)

  • 유승필;김태균
    • 대한전자공학회논문지
    • /
    • 제26권3호
    • /
    • pp.85-94
    • /
    • 1989
  • 글자의 간격과 크기가 일정하지 않으므로 전처리 과정에서 각 글자를 분리하기 어려운 필기체 한글 문서로 부터 자모들을 인식하는 방법을 제안한다. 본 방법은 세선화된 필기체 한글문서의 영상 내에 있는 모든 글자들을 스트로크들로 변환시키고, 이들 사이의 배열관계를 나타내는 속성을 추출한 다음, 이들 스트로크와 속성들에 대해 속성문법을 적용하여 자모들을 인식한다.

  • PDF

최적선형변환에 의한 유사문자의 상세분류인식 (Detailed Recognition of Similar Characters Based on Optimum Linear Transform)

  • 김형원;김성원;양윤모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.493-495
    • /
    • 2001
  • 본 논문에서는 문자 인식에서 두 단계의 식별과정을 통하여 인식률을 향상시키는 방법에 대하여 연구하였다. 한글 문자인식에서의 어려움은 인식대상 클래스가 많고 유사문자가 많은 반면, 여러 폰트의 글자를 하나의 글자를 하나의 클래스로 할 경우에는 그 문자의 분산이 더욱 커지게 되는 점이다. 따라서 본 연구에서는 문자의 분포를 고려하여 거리를 계산하는 Bayes에 의한 식별 함수를 1단계 인식과정에서 사용하여 1위 후보문자를 인식하였다. 2단계에서는 미리 준비된 1위 후부문자의 유사문자세트의 최적선형변환 공간에서 상세분류를 행하였다. 결과적으로 1단계의 Bayes거리반에 의한 인식률(91.1%)보다도, 또한 처음부터 모든 클래스에 대하여 최적선형변환에 의한 인식률(87.9%)보다 좋은 결과(92.9%)를 얻게되었다. 이로서 1단계의 대규모 문자세트에 대한 대분류에서는 문자의 분포를 고려하는 Bayes에 의한 인식이 유효하고, 2단계의 최적선형변환에 의한 인식은 소수의 유사문자들에 대한 변별력을 높이는데 유효함을 입증하였다.

  • PDF

차량 번호판 인식률 향상을 위한 학습 예제 가중치 조정 (Using Weighted Instances for Improvement of License Plate Recognization System)

  • 박태진;김종성;류광렬;백남철;강원의;이상협
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.121-123
    • /
    • 2004
  • 차량 번호판 인식 시스템은 무인 카메라 등의 영상 장치로부터 입력된 차량 이미지로부터, 차량 번호판 정보를 읽어내는 시스템이다. 이러한 차량 번호판 인식 시스템의 응용 시스템 중 과속 차량 단속과 같은 일부 응용 시스템은 번호판의 글자나 숫자를 다른 글자나 숫자로 잘못 인식할 경우 심각한 문제를 발생시킬 수 있다. 이러한 시스템을 위해 우리는 인식 결과에 대한 신뢰도가 낮은 경우 인식을 포기 또는 위임하는 신중한 분류기(Cautious Classifier)를 이용 인식 시스템을 구성하였다. 또한 학습 예제의 가중치를 조절하는 방법을 사용 이러한 신중한 분류기의 성능을 향상 시켰다. 실제 번호판 인식 실험 결과 우리가 제안한 가중치 부여 방식이 차량 번호판 인식 문제에 좋은 결과를 보임을 확인하였다.

  • PDF

인공지능 기반 객체 인식을 위한 최적 학습모델 구축 방안에 관한 연구 (A Study on How to Build an Optimal Learning Model for Artificial Intelligence-based Object Recognition)

  • 양환석
    • 융합보안논문지
    • /
    • 제23권5호
    • /
    • pp.3-8
    • /
    • 2023
  • 4차 산업혁명으로 많은 산업 분야에 커다란 변화가 일어나고 있으며, 그중에서도 인공지능을 활용한 융합기술에 활발한 연구가 진행되고 있다. 그중에서도 인공지능을 활용한 객체 인식과 인식 결과를 활용한 디지털 전환(Digital Transformation) 분야에서 그 요구가 나날이 증가하고 있다. 본 논문에서는 이미지내에 글자, 심볼, 선을 정확하게 인식하고 인식 결과를 시뮬레이션에 활용할 수 있도록 표준화 포맷의 파일로 저장하기 위해 최적의 학습모델 구축 방법을 제안하였다. 이미지내 글자, 심볼, 선을 인식하기 위하여 인식 대상별 특성을 분석한 후 최적의 인식 기법을 선택하였다. 그다음으로 인식 대상별 인식률을 향상시키기 위하여 최적의 학습 모델 구축 방안을 제안하였다. 글자, 심볼, 선 인식의 순서와 가중치를 다르게 설정하여 인식 결과를 확인하였으며, 인식 후처리에 대한 방안도 마련하였다. 최종적인 인식 결과는 시뮬레이션 등 다양한 처리에 활용될 수 있는 표준화 포맷으로 저장하였다. 본 논문에서 제안한 최적의 학습 모델 구축에 대한 우수한 성능은 실험을 통해 확인할 수 있었다.

자소 탐색 방법에 의한 온라인 한글 필기 인식 (Online korean character recognition using letter spotting method)

  • 조범준
    • 한국통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1379-1389
    • /
    • 1996
  • 한글 필기는 항상 초성, 중성, 종성의 순으로 씌어진다. 본 논문은 이점을 이용하여 자소 탐색 모델을 설계하고 그 탐색 결과에 의거하여 글자를 인식하려는 온라인 필기 인식 방법을 제시하고자 한다. 기본 자소 모델은 은닉 마르코프 모델을 이용하고 자소 탐색 모델은 HMM의 망으로 구성한다. 자소 탐색은 Viterbi 알고리즘에 의한 정합으로 이루어지며 글자 인식은 이들 자소 가설 격자의 탐색으로 이루어진다. 인식 실험 결과는 간단한 인식기 구조에도 불구하고 정자체의 경우 87.47%에 달하는 상당한 인식률을 보였으며, 특히 자연스럽게 쓴 필기에서도 매우 훌륭한 자소 분할 결과를 얻을 수 있었다.

  • PDF

한국어 동사와 명사 관용구 인식 알고리즘 (A recognition algorithm of Korean verb and noun idiomatic phrases)

  • 이호석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.

  • PDF

계층적 신경망을 이용한 주민등록증 성명인식 (Printed Name on ID Card recognition using a Hierachical Organized Neural Network)

  • 서원택;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.325-327
    • /
    • 2003
  • 본 논문에서는 인쇄체 한글을 실용적으로 인식할 수 있는 계층적으로 구성한 신경망을 제안하고, 이를 이용해서 주민등록증의 성명을 인식하는데 적용하였다. 문자영상을 신경망을 이용하여 한글의 6가지 유형으로 먼저 분류한 후, 분류된 문자영상을 각 형식에 따라 자소단위로 분할해서 각 형식에 따른 신경망으로 인식하는 구조로 만들었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른것에 대해서 강인한 훈련을 할 수 있었다. 또한 입력단에서의 잡음을 줄이기 위해 히스토그램의 국부 평균을 적용하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

스케일에 강인한 LLAH 기반 문서 인식 알고리즘 (Scale-Invariant Document Detection Algorithm Based on LLAH)

  • 이재하;박정주;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.161-162
    • /
    • 2016
  • 비슷한 코너의 모양을 가지는 다수의 글자가 포함된 문서 영상을 인식하는 일은 쉽지 않다. 일반적으로 성능이 우수하다고 알려진 SIFT 알고리즘은 코너를 기반으로 특징을 기술하는 알고리즘이기 때문에 각 글자가 비슷한 코너의 모양을 가지는 문서 영상 인식에서는 좋은 성능을 발휘하지 못한다. 반면, LLAH 는 각 단어의 크기를 알아내어 가우시안 필터와 이진화를 통해 단어를 하나의 점으로 나타내고 각 점과 점 사이의 기하 관계를 기술자로 표현하기 때문에 문서의 단어에서 점이 일관되게 추출된다면 좋은 인식 성능을 발휘한다. 그러나, 영상에서 단어의 크기를 알아내는 작업은 계산 측면에서 많은 비용을 필요로 한다. 이에 본 논문에서는 LLAH 를 사용하기 전에 반복적인 가우시안 필터와 이진화를 적용하여 단어의 크기를 알지 못하는 상황에서도 스케일에 강인하게 문서 영상을 인식할 수 있는 알고리즘을 제안한다.

  • PDF

한글의 구조적 특징을 이용한 인쇄체 한글인식을 위한 신경망 설계 (Neural Network design for Printed Hangul recognition using structural characteristic of Hangul)

  • 서원택;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.588-591
    • /
    • 2003
  • 본 논문에서는 한글의 구조적인 특징을 이용하여 이를 효과적으로 인식할 수 있는 신경망을 설계해보았고, 이를 이용하여 주민등록증에 있는 이름을 인식하는 시스템을 구성해 보았다. 본 시스템은 한글의 6형식에 따른 구조적인 특징을 효과적으로 구분하기 위해 형식을 구분하는 신경망을 먼저 구성하여 형식별로 분류한 뒤, 형식에 따라 자모음을 분리하여 각 형식에 따라 구성된 2차 신경망으로 입력을 하여 인식하는 구조로 설계되었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른 것에 대해서 강인한 훈련을 할 수 있었다. 또한 히스토그램의 국부 평균을 적용함으로써 잡음에 효과적으로 대응하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력 받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

실세계 영상에서 적응적 에지 강화 기반의 MSER을 이용한 글자 영역 추출 기법 (An Extracting Text Area Using Adaptive Edge Enhanced MSER in Real World Image)

  • 박영목;박순화;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권4호
    • /
    • pp.219-226
    • /
    • 2016
  • 일반 생활 속에서 우리 인간의 눈으로 정보를 인식하고 그 정보를 이용하는 것에는 한계가 없을 만큼 다양하고 방대하다. 그러나 인공지능이 발달한 현재의 기술로도, 인간의 시각 처리 능력에 비하면 턱없이 능력이 부족하다. 그럼에도 불구하고 많은 연구자들은 실생활 속에서 정보를 얻고자 하고 있고, 특히 글자로 된 정보를 인식하는데 많은 노력을 기울이고 있다. 글자를 인식하는 분야에서 일반적인 문서에서 글자를 추출하는 것은 일부 정보처리 분야에서 이용되고 있지만, 실영상에서 문자를 추출하고 인식하는 부분은 아직도 많이 부족하다. 그 이유는 실영상에서는 색깔, 크기, 방향, 공통점 등에서 다양한 특징을 갖고 있기 때문이다. 본 논문에서는 이런 다양한 환경에서 문자 영역을 추출하기 위하여 적응적 에지 강화 기반의 MSER을 적용하여 장면 텍스트 추출을 시도하고, 비교적 좋은 방법임을 실험으로 보인다.