• 제목/요약/키워드: 한글폰트인식

검색결과 14건 처리시간 0.02초

딥러닝을 이용한 대규모 한글 폰트 인식 (Large-Scale Hangul Font Recognition Using Deep Learning)

  • 양진혁;곽효빈;김인중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-12
    • /
    • 2017
  • 본 연구에서는 딥러닝을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 폰트는 디자인 분야에 있어서 필수적인 요소이며 문화적으로도 중요하다. 한글은 영어권 언어에 비해 훨씬 많은 문자를 포함하고 있기 때문에 한글 폰트 인식은 영어권 폰트 인식보다 어렵다. 본 연구에서는 최근 다양한 영상 인식 분야에서 좋은 성능을 보이고 있는 CNN을 이용해 한글 폰트 인식을 수행하였다. 과거에 이루어진 대부분의 폰트 인식 연구에서는 불과 수 십 종의 폰트 만을 대상으로 하였다. 최근에 이르러서야 2000종 이상의 대용량 폰트 인식에 대한 연구결과가 발표되었으나, 이들은 주로 문자의 수가 적은 영어권 문자들을 대상으로 하고 있다. 본 연구에서는 CNN을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 많은 수의 폰트를 인식하기 위해 두 가지 구조의 CNN을 이용해 폰트인식기를 구성하고, 실험을 통해 이들을 비교 평가하였다. 특히, 본 연구에서는 3300종의 한글 폰트를 효과적으로 인식하면서도 학습 시간과 파라미터의 수를 줄이고 구조를 단순화하는 방향으로 모델을 개선하였다. 제안하는 모델은 3300종의 한글 폰트에 대하여 상위 1위 인식률 94.55%, 상위 5위 인식률 99.91%의 성능을 보였다.

  • PDF

딥러닝을 이용한 대규모 한글 폰트 인식 (Large-Scale Hangul Font Recognition Using Deep Learning)

  • 양진혁;곽효빈;김인중
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.8-12
    • /
    • 2017
  • 본 연구에서는 딥러닝을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 폰트는 디자인 분야에 있어서 필수적인 요소이며 문화적으로도 중요하다. 한글은 영어권 언어에 비해 훨씬 많은 문자를 포함하고 있기 때문에 한글 폰트 인식은 영어권 폰트 인식보다 어렵다. 본 연구에서는 최근 다양한 영상 인식 분야에서 좋은 성능을 보이고 있는 CNN을 이용해 한글 폰트 인식을 수행하였다. 과거에 이루어진 대부분의 폰트 인식 연구에서는 불과 수 십 종의 폰트 만을 대상으로 하였다. 최근에 이르러서야 2000종 이상의 대용량 폰트 인식에 대한 연구결과가 발표되었으나, 이들은 주로 문자의 수가 적은 영어권 문자들을 대상으로 하고 있다. 본 연구에서는 CNN을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 많은 수의 폰트를 인식하기 위해 두 가지 구조의 CNN을 이용해 폰트인식기를 구성하고, 실험을 통해 이들을 비교 평가하였다. 특히, 본 연구에서는 3300종의 한글 폰트를 효과적으로 인식하면서도 학습 시간과 파라미터의 수를 줄이고 구조를 단순화하는 방향으로 모델을 개선하였다. 제안하는 모델은 3300종의 한글 폰트에 대하여 상위 1위 인식률 94.55%, 상위 5위 인식률 99.91%의 성능을 보였다.

  • PDF

매개변수를 가지는 한글 필기체 폰트의 자동 생성에 관한 연구 (A study on the Automatic Generation of the Freehand Style Fonts with parameters)

  • 이동렬;이도훈;박희숙;조환규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.581-590
    • /
    • 1992
  • 고품위 입출력 장치의 급속한 발달과 전자 출판 시스템의 출현은 더 다양한 서체를 요구하게 되었다. 컴퓨터에서 사용되고 있는 한글 서체는 명조, 고딕체를 제외하고는 주로 장식용 폰트를 만들어 사용하고 있다. 본 논문에서는 Cubic B-Spline 곡선을 이용하여 다양한 필기체 폰트를 구현하였고, 필기체가 가지는 특성(날림의 정도, 글자의 기울이기 정도, 각 음소의 크기, 각 글자의 크기의 균일성 등)에 따라 인자를 부여하여 개별화되고 사실적인 폰트를 생성하였다. 각 인자의 조합은 암호화되어 각 개인의 폰트로 부여된다. 즉, 개인의 고유 폰트는 폰트 암호(password)로 부여되고, 제어인자는 폰트암호의 해쉬값에 의해 선택되며, 사용자들로부터 이 제어인자들을 숨기게 되면 각 사용자들의 폰트는 유일하고, 안전하게 되므로, 일정정도의 안정성이 보장된다고 보여진다. 그리고 본 연구에서 구현된 폰트는 한글 필기체 문자인식의 정도를 측정하는 다양한 데이타를 제공하는 데에도 의미가 있다.

  • PDF

GAN 기반 폰트 생성 (GAN based Fonts Generation)

  • 이세훈;김민재;권혁정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.255-256
    • /
    • 2019
  • 한글 폰트를 만드는 데는 자음+모음 조합으로 약 11,500자 정도의 글자가 필요하다. 디자이너가 글자 하나씩 전부 디자인 하는 것도 굉장한 부담요소이고, 한글폰트를 제작하는데 있어 3개월 이상의 소요 기간과 3000만 원 이상의 비용부담 또한 무시 못 할 요소이다. 게다가 카피라이트 폰트에 대한 저작권 문제 또한 골칫거리다. 그래서 이를 최소한으로 하고자 딥 러닝의 방식중 하나인 GAN(생성적 적대 신경망)을 통해서 디자이너가 399자만 작성하고 나머지는 컴퓨터가 디자이너의 폰트 디자인을 인식하고 자동으로 만들어 주는 프로그램을 고안하였다.

  • PDF

타이포그래피 기술을 접목시킨 자막 가독성 개선 연구 - 모바일 환경에서 Noto Sans Korean 폰트를 중심으로 - (A Research on Improving Readability of subtitles combined with typography in Hangeul - Focusing on Noto Sans Korean fonts in mobile environment)

  • 박재홍
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.47-48
    • /
    • 2021
  • 본 연구는 타이포그래피 기술을 접목한 동영상과 기본 자동 자막을 사용한 동영상의 한글 자막 가독성을 비교·분석하여 모바일 동영상 시청 시 한글 자막의 가독성 개선을 위한 기초자료를 제공하는 데 목적이 있다. 연구의 목적을 위해 기본으로 설정되는 자동 자막을 사용한 동영상과 타이포그래피 기술을 적용·개선한 한글 폰트를 자막에 적용한 동영상을 비교하는 설문을 실시하였다. 시각디자인 전공자(73명)과 비전공자(52명)간의 자막 가독성 설문조사의 결과를 비교·분석하였다. 또한, 모바일을 통해 외국어 동영상 시청 시 자막 설정 기능에서 중요하게 여겨지는 요인과 현재 자막 설정 기능 중 불편하게 여기는 요인을 분석하였다. 수집된 설문의 자료는 Windows SPSS 26.0을 사용하여 분석하였다. 자막 설정 기능에서 중요하게 여겨지는 요인과 현재 자막 설정 기능의 불편 사항 등에 대한 인식의 차이를 살펴보기 위해 빈도분석, 𝑥2 검정, t 검정, 일원변량분석(one-way ANOVA) 등을 실시하였다.

  • PDF

다중 언어에서 다중 활자체 및 다중 크기의 문자 인식을 위한 2계층 분류기 (A Two-Layer Classifier for Recognition of Multi-font and Multi-size Characters in Multi-lingual Documents)

  • 지수영;문경애;오원근;김태윤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.93-97
    • /
    • 1996
  • 본 논문에서는 2 계층 분류기를 이용하여 일반적인 문서(보고서, 책, 잡지, 워드프로세서에서 출력 된 양식) 내의 다중 크기 및 다중 활자체의 인식을 위한 효과적인 방법을 제안하고 구현하였다. 다중언어 문자를 효과적으로 인식하기 위한 2 계층 분류기를 제안하였는데 이는 폰트 독립적 분류기와 폰트 의존적 분류기로 구성되어 있다. 제안된 방법의 성능 평가를 위하여 사무실에서 많이 사용하는 59 종류의 폰트와 각 폰트 당 3가지 크기의 글꼴과, 스캐너에서 지원되는 3가지 농도의 총 489개의 서로 다른 부류를 갖는 3,593,172 자를 대상으로 학습시킨 뒤에 일반 문서를 가지고 펜티엄 PC 상에서 인식 실험을 수행하였다. 실험 결과, 2계층 분류기를 갖는 시스템에서 96-98%의 인식률과 초당40자 이상의 인식 속도를 보여줌으로써 일반적인 문서에서 다중 크기 및 다중 활자체의 문자 인식에 매우 실용적인 가치가 있음을 확인했다.

  • PDF

딥러닝을 활용한 한글문장 OCR연구 (A Study on the OCR of Korean Sentence Using DeepLearning)

  • 박선우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.470-474
    • /
    • 2019
  • 한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.

  • PDF

한영 혼용문서 인식을 위한 다중 폰트 이미지로부터 한글과 영어의 구별 (Distinction of Korean and English Characters from Multi-font Images for the Recognition of Mixed Document Composed of Korean and English)

  • 전일수
    • 한국산업정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.52-58
    • /
    • 1999
  • 본 논문에서는 한\ulcorner영 혼용문서인식을 위해 다중 크기, 다중 활자체에 적용 가능한 한글과 영어를 구별하는 알고리즘을 제안한다. 제안된 방법에서는 글자의 종횡비, 연결요소의 수, 좌상단의 획이미지 존재 여부, 그리고 바(bar)를 입력 이미지에 대해 좌상우하의 순서로 진행해 가면서 바를 검출하고, 이들을 이용하여 한글과 영어를 구별한다. 제안된 방법을 문서 작성 시 널리 사용되는 ?글의 명조체, 신명조체, 고딕체, 궁서체에 대해 실험하여 그 성능의 우수성을 입증하였다.

  • PDF

한글 인식을 위한 CNN 기반의 간소화된 GoogLeNet 알고리즘 연구 (Streamlined GoogLeNet Algorithm Based on CNN for Korean Character Recognition)

  • 김연규;차의영
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1657-1665
    • /
    • 2016
  • CNN(Convolutional Neural Network)을 사용한 심화 학습이 다양한 분야에서 진행되고 있으며 관련 연구들은 이미지 인식의 많은 분야에서 높은 성능을 보이고 있다. 본 논문에서는 한글 인식을 위해 대규모 한글 데이터베이스를 학습할 수 있는 CNN 구조의 간소화된 GoogLeNet을 사용한다. 본 논문에 사용된 데이터베이스는 대규모 한글 데이터베이스인 PHD08로 총 2,350개의 한글 문자에 대해 각 2,187개의 샘플을 가져 총 5,139,450개의 데이터로 구성되어 있다. 간소화된 GoogLeNet은 학습의 결과로 학습 종료 시점에서 PHD08에 대해 99% 이상의 Top-1 테스트 정확도를 보였으며 실험의 객관성을 높이기 위해 PHD08에 존재하지 않는 한글 폰트로 이루어진 한글 데이터를 제작하여 상용 OCR 프로그램들과 분류 성능을 비교하였다. 상용 OCR 프로그램들은 66.95%에서 83.17%의 분류 성공률을 보인 반면, 제안하는 간소화된 GoogLeNet은 평균 89.14%의 분류 성공률을 보여 상용 OCR 프로그램들보다 높은 분류 성공률을 보였다.

딥러닝에 의한 한글 필기체 교정 어플 구현 (An Implementation of Hangul Handwriting Correction Application Based on Deep Learning)

  • 이재형;조민영;김진수
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.13-22
    • /
    • 2024
  • 현재 디지털 기기의 확산과 함께 일상에서 손으로 쓰는 글씨의 비중은 점점 줄어들고 있다. 키보드와 터치스크린의 활용도 증가에 따라 한글 필기체의 품질 저하는 어린 학생부터 성인까지 넓은 범위의 한글 문서에서 관찰되고 있다. 그러나 한글 필기체는 여전히 개인적인 고유한 특징을 포함하면서 가독성을 제공하는 많은 문서 작성에 필요하다. 이를 위해 본 논문에서는 손으로 쓴 한글 필기체의 품질을 개선하고, 교정하기 위한 목적의 어플 구현을 목적으로 한다. 제안된 어플은 CRAFT(Character-Region Awareness For Text Detection) 모델을 사용하여 필기체 영역을 검출하고, 딥러닝으로서 VGG-Feature-Extraction 모델을 사용하여 필기체의 특징을 학습한다. 이때 사용자가 작성한 한글 필기체의 음절 단위로 신뢰도를 인식률로 제시하고, 또한, 후보 폰트들중에서 가장 유사한 글자체를 추천하도록 구현한다. 다양한 실험을 통해 제안한 어플은 기존의 상용화된 문자 인식 소프트웨어와 비교할만한 우수한 인식률을 제공함을 확인할 수 있다.