• 제목/요약/키워드: 필기 분할

검색결과 58건 처리시간 0.028초

중심점을 이용한 무제약 필기체 한글 분할 (Segmentation of Unconstrained Handwritten Korean Characters using the Center of Gravity)

  • 박성호;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.820-822
    • /
    • 2004
  • 현재까지도 대부분의 필기체 한글 인식은 완벽한 분할을 가정하여 개발되고 있으며 한글 분할 그 자체에 대한 관심은 매우 낮은 편이다. 본 논문에서는 무제약 필기체 한글을 분할하기 위하여 중심점을 이용한 분할방법을 제안한다. 제안된 방법은 기존의 분할 방법들이 갖는 직선화된 분할경로 뿐만 아니라, 문자내에 존재하는 여백의 정보를 활용하여 꺽은선 형태의 분할경로도 찾을 수 있다. 이를 위해 먼저, 한글 문자열에 대한 전처리 과정과 수직투영을 통해 분할대상을 결정한다. 그리고 문자에서 특징점을 찾고 인접한 특징점들 간의 중심점을 찾아서 가상의 분할 경로를 생성한 뒤 최적 분할 경로를 결정한다.

  • PDF

배경 세선화를 이용한 한글 필기체 글자 단위 분할 (Handwritten Korean Character Segmentation using Background thinning)

  • 서원택;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.823-825
    • /
    • 2004
  • 본 연구에서는 필기체 한글의 글자단위의 분할을 위해 배경 세선화(Background thinning)라는 방법을 제안한다. 배경 세선화 방법은 글자와 글자 사이에 존재하는 배경의 정보를 세선화 처리하여 필기체 한글에서 많이 발생할 수 있는 중첩(Overlap)글자와 연결(Touched)글자를 서로 분할하는데 효과적인 성능을 보였다. 배경 세선화를 이용하여 글자를 분할하는 방법은 인식과정의 판단을 필요하지 않은 외적분할 방법으로 빠른 속도의 분할 성능을 보였다. 이 방법은 특히, 중첩된 글자의 분할에 탁월한 성능을 보였을 뿐만 아니라, 연결된 글자에 대해서도 좋은 성능을 보였다.

  • PDF

결정값 발생기를 이용한 무제약 필기체 숫자 열의 인식 (Unconstrained Handwritten Numeral Sti-ing Recognition by Using Decision Value Generator)

  • 김계경;김진호;박희주
    • 한국산업정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.82-89
    • /
    • 2001
  • 본 논문에서는 독립문자 식별기 및 인식기를 바탕으로 한 결정값 발생기를 도입하여 무제 약 필기체 숫자 열을 효과적으로 인식하는 방안을 제안하였다. 필기체 숫자 열의 인식을 위해 사전 분할 모듈, 최종 분할 모듈 그리고 인식 모듈 등의 세 개의 모듈을 설계 구현하였다. 사전 분할 모듈에서는 결정값 발생기를 이용하여 독립 숫자, 접촉 숫자 그리고 끊어진 숫자 등을 구분하였다. 최종 분할 모듈에서도 결정값 발생기의 결과를 이용하여 접촉 숫자들을 분할하는 과정을 수행하고 인식 모듈에서 각각 분할된 숫자들을 인식하였다. 분할 기반 방식과 무 분할 방식을 혼용하여 필기체 숫자열을 인식함으로서 기존의 오 인식률을 최소화시키도록 하였다. 제안된 방식을 이용하여 NIST SD19 필기체 숫자 열 데이터베이스의 인식을 한 결과 기존의 연구결과에 비해 높은 96.7%의 인식률을 얻을 수 있었다.

  • PDF

Rum-Length code를 이용한 제약없이 쓰여진 한글 필기체 주소열 분할 (An Approach to Segmentation of Address Strings of unconstrained handwritten Hangul using Run-Length Code)

  • 김경환;윤정석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권11호
    • /
    • pp.813-821
    • /
    • 2001
  • 대부분의 문자 인식기들이 인식대상영상이 인식단위로 분할되어있다는 가정아래 개발되고 있으나, 실제 필기한글의 분할에 대한 연구는 미미한 실정이다. 본 논문은 Run-length code를 이용한 능동적인 한글 분할방법을 제시한다. 전처리와 인식단위 분할에 응용할 수 있는, 한글의 구조적 특성을 반영한, 기울기 보정 알고리즘을 제안하고, 필기자들이 일반적인 필기 습관과 한글이 갖는 2차원 구조의 특성을 반영하면서 문자의 접촉점을 적극적으로 찾아내기 위한 기초 함수들과 접촉점들의 분류 방법을 제시한다. 임의의 필기자로부터 수집한 필기 한글 주소열 데이터를 이용해 수행한 실험을 통해, 초과분할을 포함하여, 88.2%의 접촉 문자들을 분리할 수 있었다.

  • PDF

은행전표 항목의 무제약 필기 숫자열 인식 (Recognition of Unconstrained Handwritten Numerals in Bank Slip)

  • 윤성수;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.375-377
    • /
    • 1998
  • 실생활에서 사용되는 은행전표에는 많은 숫자 항목이 포함되어 있다. 이 항목들에 나타나는 숫자들은 단순히 숫자들의 배열이 아니라 콤마나 하이픈 등이 포함되어 있으며 많은 경우 숫자들끼리 서로 접촉되어 있다. 본 논문에서는 이런 시중 은행에서 사용되는 전표의 필기 숫자 항목을 처리하기 위한 시스템을 제안하고 이 효용성을 확인하기 위한 실험결과를 보였다. 실험은 크게 숫자분할 알고리즘에 대한 실험과 전체 시스템 성능에 대한 실험으로 나뉜다. 접촉된 두 숫자의 분할 알고리즘 성능 결과는 78.1%의 분할 성공률을 보였고 은행전표의 필기숫자 항목에 적용 결과는 53.5%였다.

  • PDF

숫자의 형태 이해와 분할된 FSOM을 이용한 필기 숫자 인식에 관한 연구 (A Study On Handwritten Numeral Recognition Using Numeral Shape Grasp and Divided FSOM)

  • 서석배;김대진;강대성
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1490-1499
    • /
    • 1999
  • 본 논문에서는 필기숫자의 형태와 FSOM을 이용한 새로운 필기숫자 인식 알고리즘을 제안한다. 제안한 알고리즘은 비슷한 형태를 가지는 숫자는 같은 그룹으로 분류된다는 사실에 기초한 알고리즘으로, 필기숫자의 외접선에 의한 형태결정과 템플레이트 매칭을 이용하여 필기숫자 데이터를 여러 개의 그룹으로 분할하고 분할된 각 그룹별로 인식 알고리즘을 적용한다. 본 실험에서는 필기숫자의 데이터를 16개의 그룹으로 분류하였으며, 분류된 그룹별로 각각의 특징추출과 SOM의 단점을 보완한 FSOM을 적용하였다. 분할된 16개의 FSOM은 각 그룹별로 독립적인 학습이 가능한 특징뿐만 아니라 한 그룹씩 단계적으로 학습을 할 수 있는 장점이 있다. 제안한 알고리즘의 성능을 입증하기 위해서 Concordia 대학의 필기 숫자 데이터를 사용하여 실험하였다.

  • PDF

무제약 필기체 한글분할을 위한 가상 분할경로 생성 (Virtual Segmentation Path Construction for Unconstrained Handwritten Hangul Segmentation)

  • 박성호;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.827-830
    • /
    • 2004
  • 현재까지도 대부분의 필기체 한글 인식은 완벽한 분할을 가정하여 개발되고 있으며 한글 분할 그 자체에 대한 관심은 매우 낮은 편이다. 또한 한글은 자소의 모아쓰기 형태를 갖고 있어 문자내에 여백이 존재할 뿐만 아니라 문자와 문자 사이의 접촉되는 특징이 흔히 발생되기 때문에 기존의 영문자에 사용된 방법을 그대로 직접 적용하기에는 많은 어려움이 있다. 본 논문에서는 무제약 필기체 한글을 분할하기 위하여 가상 분할경로를 이용하는 방법을 제안한다. 제안된 방법은 기존의 분할 방법들이 갖는 직선화된 분할경로 뿐만 아니라 문자내에 존재하는 여백의 정보를 활용하여 꺽은선 분할경로를 주로 이용하는데 특징이 있다. 분할과정은 크게 2단계로 구성되는데 첫 번째 단계는 입력받은 한글 문자열에 대한 전처리 과정과 수직투영을 통해 직선화된 분할경로를 찾고 이에 따라 쉽게 분할 가능한 문자와 중첩되거나 접촉된 문자를 구분하여 다음 단계의 분할대상으로 결정한다. 두 번째 단계에서는 다양한 가상의 꺽은선 분할경로를 생성하기 위하여 각 문자에서 특징점을 추출하고, 인접한 특징점들 간의 무게 중심점을 찾아서 더 세밀한 경로 생성을 함으로서 가장 최상의 분할경로를 결정한다.

  • PDF

볼록 헐을 이용한 필기 한글 패턴의 모양 분해 (A Shape Decomposition of Handwritten Hangul Patterns Using Convex Hull)

  • 박정선;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.440-442
    • /
    • 2000
  • 필기 한글 문자 인식을 위해서는 패턴을 구성하는 획 성분을 분석하는 작업이 필수적이다. 획 성분 추출을 위해 사용한 세선화 방법은 입력 영상을 왜곡하는 단점을 가지고 있다. 이를 극복하기 위하여 본 논문은 입력 영상을 왜곡하지 않고 의미 있는 부품 단위로 분할하는 방법을 제안한다. 의미 있는 부품이란 유사 볼록하게 분할된 영역을 의미한다. 분할 방법은 먼저 입력 영상에 볼록 헐 연산을 적용하여 오목 영역을 생성한다. 이 오목 영역에서 분할 기준(anchor point)점을 탐지하고 획의 반대편 외곽선 상에서 분할 끝(terminal point)점을 찾아 분할 경로를 구성하여 획을 분할한다. 모든 부품이 유사 볼록 조건을 만족할 때까지 위 과정을 반복 수행한다. 제안한 방법은 두 개의 파라미터만을 가지며 간단한 프로시져로 구성되어 있다. 또한 필기 한글 패턴뿐 아니라 여러 언어에 적용 가능하다는 장점을 갖는다.

  • PDF

무제약 필기체 한글 분할을 위한 가상 네트워크 탐색 시스템의 설계 및 구현 (Design and Implementation of Virtual Network Search System for Segmentation of Unconstrained Handwritten Hangul)

  • 박성호;조범준
    • 한국멀티미디어학회논문지
    • /
    • 제8권5호
    • /
    • pp.651-659
    • /
    • 2005
  • 본 논문에서는 무제약 필기체 한글 분할을 위하여 기존 방법들에서 제시된 적이 없는 문자간 여백에서 가상 네트워크 탐색 시스템을 이용하는 새로운 방법을 설계하고 구현하였다 제안된 방법은 다양한 필기자들이 제한 없이 쓰여진 모든 문자들에 대하여 적용이 가능하도록 설계되었고, 또한 문자간 여백에서 생성되는 가상 네트워크의 경로를 이용함으로서 꺾은선 형태의 다양한 분할경로를 얻을 수 있도록 설계되었다. 또한 탐색 시스템을 구현하는 과정에서 분할대상 블록의 길이에 따른 탐색 윈도우를 달리 적용함으로서 원하지 않는 영역에서 분할경로가 생성되는 것을 방지하였다 본 논문에서 제안하는 가상 네트워크 탐색 시스템에 대해 임의의 필기자들로 부터 자체적으로 수집한 800여개의 데이터를 대상으로 실험을 수행한 결과, 중첩되거나 접촉된 문자들을 포함하여 전체적으로 $91.4\%$ 정도의 분할 정확도를 얻을 수 있었다.

  • PDF

필기 한글 패턴을 위한 두 단계 모양 분해 알고리즘 (Two-pass Shape Decomposition Algorithm for Handwritten Hangul Patterns)

  • 박정선;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.464-466
    • /
    • 1999
  • 필기 한글 문자 인식을 위해서는 패턴을 구성하는 획 성분을 분석하는 작업이 필수적이다. 기존 인식 방법들은 세선화와 직선 근사에 기반한 방법을 사용하였다. 하지만 세선화는 필기 패턴을 크게 왜곡하는 단점을 안고 있기 때문에 새로운 방법론의 필요성이 대두되고 있다. 본 논문에서는 필기 한글 패턴의 영역-기반 모양 분해 알고리즘을 제안한다. 외곽선 분석을 이용한 기존의 한 단계 알고리즘의 한계를 지적하고, 이 한계를 극복할 수 있는 두 단계 알고리즘을 기술한다. 첫 번째 단계에서는 우세점을 찾아 B접점과 T접점을 탐지한다. 두 번째 단계에서는 볼록 헐(convex hull) 연산을 적용하여 미분할된 부분에 대해 두 번째 분할 작업을 수행한다. PE92 데이터베이스에 대해 실험 한 결과는 세선화 방법보다 우수함을 보인다.

  • PDF