• Title/Summary/Keyword: 글자 분류

Search Result 58, Processing Time 0.025 seconds

도메인 어댑테이션을 이용한 폰트 변화에 강인한 한글 분류기 개발

  • Park, Jaewoo;Lee, Eunji;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.50-53
    • /
    • 2019
  • 본 논문에서는 도메인 어댑테이션을 이용하여 폰트 변화에 강인한 한글 분류기를 학습하는 방법을 제안한다. 제안하는 네트워크 모델은 총 7 개로 이루어져 있으며 각각 이미지로부터 폰트에 무관한 정보를 추출하는 인코더, 추출된 정보의 유효성을 판단하기 위해 이미지 재합성에 사용되는 디코더, 재합성된 이미지의 글자 분류기, 폰트 분류기, 재합성된 글자의 정교함을 판단하는 판별기(discriminator), 그리고 인코더에서 추출된 정보에 대한 글자 분류기, 폰트 분류기이다. 본 논문에서는 적대적 생성 신경망의 학습법을 따르는 도메인 어댑테이션 기법을 이용하여 인코더의 추출 정보가 폰트 정보는 속이면서 글자 분류의 정확성은 높이도록 학습하였다. 학습 결과 인코더로부터 추출되는 정보들은 폰트에 무관한 성질을 지니면서 글자 분류에 높은 정확성을 띄었으며, 추가로 디코더에서 나오는 이미지들도 원본 폰트와 같은 이미지를 생성해 낼 수 있었다.

  • PDF

Recognition of global character type in initial phase of hangul character identification (한글 인식 초기과정의 글자유형 분류처리)

  • Kim, Mi-Hyun;Lee, Mann-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.525-532
    • /
    • 1992
  • 본 연구는 한글 글자를 지각하는데 있어서 인식의 초기 단계에 사람들이 글자의 유형을 처리하는지 알아보기 위하여 시행되었다. 글자인식의 초기 단계에서 유형 분류를 한다는 것은 이미 인공시각 연구자들에 의해 시뮬레이션을 통해 검증된 바 있으나, 그것이 심리학적으로 실재성을 가지는지에 대한 검토는 없었으므로 본 연구를 실시하게 된 것이다. 먼저 예비실험을 통해 본 실험에서 쓸 자극제시시간을 구했으며, 실험은 한글 글자 중 낱자 수가 두 개인 유형 1, 2 의 글자를 자극으로 쓰는 경우와, 낱자 수가 세개인 유형 3, 4, 5 의 글자를 자극으로 쓰는 경우를 나누어서 실시하였다. 실험 1 과 실험 2 의 결과는 모두 가설을 강력히 지지하는 것으로 나왔다. 즉 자극제시시간을 역치하로 했을 경우 글자의 정답율과 유형의 정답율을 비교해 보았을 때 유형의 정답율이 유의하게 높았으며, 이는 아직 글자의 의미처리가 일어나기 전인 인식의 초기 단계에서 이미 글자의 유형에 대한 처리가 일어났음을 시사해 주는 것이다.

  • PDF

Development of a Korean Font Classification System for Images Based on Syllable-Level Text Recognition (글자 단위 텍스트 인식 기반의 이미지 내 한글 글꼴 분류 시스템 개발)

  • Sara Yu;Kim Yoon-Ju;Song Ji-Hyo;Ki Yong Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.718-721
    • /
    • 2023
  • 이미지 내 글꼴을 파악하는 것은 디자인 자료 제작, 저작권 확인 등 다양한 곳에서 중요한 문제이다. 하지만 이미지 내 한글 글꼴을 자동으로 식별하는 시스템은 아직 존재하지 않으며, 수동으로 한글 글꼴을 파악하는 것은 시간과 정확도 측면에서 매우 비효율적이다. 따라서 본 논문에서는 이미지 내 한글 글꼴을 자동으로 인식하는 시스템을 개발한다. 본 논문에서 개발한 시스템은 크게 두 가지 기법을 사용한다: (1) 한글의 기하학적인 특성을 활용하여 글자 단위로 텍스트를 인식하며, (2) 단어가 아닌 글자 단위로 글꼴을 분류하고 각 글자에 대한 글꼴 분류 결과를 종합하여 최종적인 글꼴 분류 결과를 얻는다. 10가지 한글 글꼴이 나타나는 직접 제작한 이미지를 사용하여 시스템의 성능을 평가한 결과 제안 방법은 비교 방법에 비해 더욱 정확히 한글 글꼴을 분류함을 확인하였다.

Video character recognition improvement by support vector machines and regularized discriminant analysis (서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선)

  • Lim, Su-Yeol;Baek, Jang-Sun;Kim, Min-Soo
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.4
    • /
    • pp.689-697
    • /
    • 2010
  • In this study, we propose a new procedure for improving the character recognition of text area extracted from video images. The recognition of strings extracted from video, which are mixed with Hangul, English, numbers and special characters, etc., is more difficult than general character recognition because of various fonts and size, graphic forms of letters tilted image, disconnection, miscellaneous videos, tangency, characters of low definition, etc. We improved the recognition rate by taking commonly used letters and leaving out the barely used ones instead of recognizing all of the letters, and then using SVM and RDA character recognition methods. Our numerical results indicate that combining SVM and RDA performs better than other methods.

A Study on the Classification of Hangeul Patterns Using Hierarchical Neural Network (계층적 신경회로망을 이용한 한글 패턴 분류에 관한 연구)

  • Kim, Do-Hyeon;Lee, Byeong-Mo;Cha, Eui-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.569-572
    • /
    • 2002
  • 한글을 인식하기 위한 전처리 방법으로 흔히 모음의 종류 및 자음과의 결합 정도에 따라 6가지 유형으로 분류하는 방법을 많이 사용하고 있다. 간 논문에서는 이러한 한글 문자를 인식하기 위한 전처리 과정으로써 한글의 유형을 분류하는 방법에 대한 연구로 계층적인 신경회로망을 도입하여 빠르고 신뢰성 있는 분류 방법을 제안한다. 실험에 사용된 글자는 KS X 1001(KS C 5601) 완성형 글자 2,350개에 대한 굴림, 바탕, 돋움, 궁서 글꼴로 총 9400개의 이미지 파일을 사용하였으며. 이 중 일부는 훈련에 사용하고 나머지는 분류를 위한 테스트 데이터로 사용한 결과 약 94%의 유형 분류율과 개별 패턴을 5.67ms에 분류하는 빠른 분류 속도를 나타내었다.

  • PDF

Remote Drawing Technology Based on Motion Trajectories Analysis (움직임 궤적 분석 기반의 원거리 판서 기술)

  • Leem, Seung-min;Jeong, Hyeon-seok;Kim, Sung-young
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.9 no.2
    • /
    • pp.229-236
    • /
    • 2016
  • In this paper, we suggest new technology that can draw characters at a long distance by tracking a hand and analysing the trajectories of hand positions. It's difficult to recognize the shape of a character without discriminating effective strokes from all drawing strokes. We detect end points from input trajectories of a syllable with camera system and localize strokes by using detected end points. Then we classify the patterns of the extracted strokes into eight classes and finally into two categories of stroke that is part of syllable and not. We only draw the strokes that are parts of syllable and can display a character. We can get 88.3% in classification accuracy of stroke patterns and 91.1% in stroke type classification.

Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering (k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법)

  • Ryu, Jewoong;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

Hangul Handwriting Recognition using Recurrent Neural Networks (순환신경망을 이용한 한글 필기체 인식)

  • Kim, Byoung-Hee;Zhang, Byoung-Tak
    • KIISE Transactions on Computing Practices
    • /
    • v.23 no.5
    • /
    • pp.316-321
    • /
    • 2017
  • We analyze the online Hangul handwriting recognition problem (HHR) and present solutions based on recurrent neural networks. The solutions are organized according to the three kinds of sequence labeling problem - sequence classifications, segment classification, and temporal classification, with additional consideration of the structural constitution of Hangul characters. We present a stacked gated recurrent unit (GRU) based model as the natural HHR solution in the sequence classification level. The proposed model shows 86.2% accuracy for recognizing 2350 Hangul characters and 98.2% accuracy for recognizing the six types of Hangul characters. We show that the type recognizing model successfully follows the type change as strokes are sequentially written. These results show the potential for RNN models to learn high-level structural information from sequential data.

Vehicle License Plate Recognition System Using the Cautious Classifier and the Weighted Instance Method (신중한 분류기와 학습 예제 가중치 조정을 이용한 차량번호판인식시스템의 인식성능 향상 방안)

  • Baik, Nam Cheol;Lee, Sang Hyup;Ryu, Kwang Ryul
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.26 no.4D
    • /
    • pp.549-551
    • /
    • 2006
  • Vehicle License Plate Recognition System reads information from vehicles license plate using image detection devices. Of many applications provided by Vehicle License Plate Recognition System, some, such as speed enforcing system, can be problematic when the system incorrectly scans letters or numbers from a vehicle's license plate. Using Cautious Classifier avoids such problems by discarding the scanned information when the confidence level is doubted to be low. This study develops the License Plate Recognition System using Cautious Classifier and investigates effectiveness of applying the Weighted Instance Method to improve the performance of Cautious Classifier.

Printed Name on ID Card recognition using a Hierachical Organized Neural Network (계층적 신경망을 이용한 주민등록증 성명인식)

  • 서원택;조범준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.325-327
    • /
    • 2003
  • 본 논문에서는 인쇄체 한글을 실용적으로 인식할 수 있는 계층적으로 구성한 신경망을 제안하고, 이를 이용해서 주민등록증의 성명을 인식하는데 적용하였다. 문자영상을 신경망을 이용하여 한글의 6가지 유형으로 먼저 분류한 후, 분류된 문자영상을 각 형식에 따라 자소단위로 분할해서 각 형식에 따른 신경망으로 인식하는 구조로 만들었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른것에 대해서 강인한 훈련을 할 수 있었다. 또한 입력단에서의 잡음을 줄이기 위해 히스토그램의 국부 평균을 적용하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF