• 제목/요약/키워드: Font Classification

검색결과 31건 처리시간 0.03초

SGLDM을 이용한 문서영상의 블록 분류 (Block Classification of Document Images Using the Spatial Gray Level Dependence Matrix)

  • 김중수
    • 한국멀티미디어학회논문지
    • /
    • 제8권10호
    • /
    • pp.1347-1359
    • /
    • 2005
  • 본 논문에서는 공간 명암도 의존 행렬을 이용하여 문서영상의 다양한 블록들을 상세하게 분류해 낼 수 있는 방법을 제안하였다. 제안한 블록분류 방법에서는 먼저 명암도 문서영상을 이진화하여 평활화 기법을 적용함으로써 명암도 영상의 질감특징을 이용하여 분할하는 것보다 신속하게 블록을 분할하고 동시에 그 위치정보도 구할 수 있도록 하였다. 분할된 각 블록들의 공간 명암도 의존 행렬로부터 문서블록들의 7가지 질감특징을 구하고, 이를 정규화한 다음 역전파 신경회로망를 이용하여 문서블록들을 분류하였다. 문서블록들을 큰 문자, 중간 문자, 작은 문자, 표, 그래픽 및 사진 등 여섯 가지 유형으로 상세 분류하였다. 또한 명암도 문서영상의 2차 통계 질감특징을 얻기 위해 공간 명암도 의존 행렬을 구할 때, 기존의 사진과 같은 일반 영상분할에서와는 달리, 문서블록 고유의 특징이 잘 반영되도록 하였다. 즉, 분할된 각 블록을 하나의 마스크로 정하여 수평 한 방향의 공간 명암도 의존 행렬을 구함으로써 고속의 질감특징추출과 상세 블록분류가 가능하도록 하였다.

  • PDF

컨볼루션 뉴럴 네트워크를 이용한 한글 서체 특징 연구 (A study in Hangul font characteristics using convolutional neural networks)

  • 황인경;원중호
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.573-591
    • /
    • 2019
  • 로마자 서체에 대한 수치적 분류체계는 잘 발달되어 있지만, 한글 서체 분류를 위한 기준은 수치적으로 잘 정의되어 있지 않다. 본 연구의 목표는 한글 서체 분류를 위한 수치적 기준을 세우기 위해, 서체 스타일을 구분하는 중요한 특징들을 찾는 것이다. 컨볼루션 뉴럴 네트워크(convolutional neural network)를 사용하여 명조와 고딕 스타일을 구분하는 모형을 세우고, 학습된 필터를 분석해 두 스타일의 특징을 결정하는 피처(feature)를 찾고자 한다.

Machine Printed and Handwritten Text Discrimination in Korean Document Images

  • Trieu, Son Tung;Lee, Guee Sang
    • 스마트미디어저널
    • /
    • 제5권3호
    • /
    • pp.30-34
    • /
    • 2016
  • Nowadays, there are a lot of Korean documents, which often need to be identified in one of printed or handwritten text. Early methods for the identification use structural features, which can be simple and easy to apply to text of a specific font, but its performance depends on the font type and characteristics of the text. Recently, the bag-of-words model has been used for the identification, which can be invariant to changes in font size, distortions or modifications to the text. The method based on bag-of-words model includes three steps: word segmentation using connected component grouping, feature extraction, and finally classification using SVM(Support Vector Machine). In this paper, bag-of-words model based method is proposed using SURF(Speeded Up Robust Feature) for the identification of machine printed and handwritten text in Korean documents. The experiment shows that the proposed method outperforms methods based on structural features.

한글 외곽선 폰트의 자소 분할 (Hangul Component Decomposition in Outline Fonts)

  • 구상옥;정순기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-21
    • /
    • 2011
  • 본 논문은 한글 외곽선 폰트를 입력으로 글자의 초성, 중성, 종성 요소(컴포넌트)를 통계적-구조적 정보를 이용하여 분할하는 방법을 제안한다. 한 폰트 내에서 한글 컴포넌트는 통계적으로 일정한 위치에 나타나며, 각 컴포넌트를 이루는 획 간의 관계는 그 컴포넌트의 구조적 특징을 나타낸다. 우리는 먼저 각 컴포넌트의 위치를 저장하는 컴포넌트 히스토그램을 생성하여 컴포넌트 위치에 관한 통계 정보를 저장하였다. 그리고 글자의 구조적 정보를 반영하기 위해 픽셀의 방향성 확률을 기반으로 픽셀클러스터를 만들고, 클러스터의 위치, 방향 및 크기, 클러스터간 인접성 정보를 이용하여 후보 획을 추출하였다. 마지막으로 릴렉세이션 레이블링을 통해 후보 획 집합과 미리 정의된 글자 모델 간의 가장 적합한 구조적 매치를 구하였다. 본 논문에서 제안한 컴포넌트 분할방법은 한글 폰트의 조형적 특징에 관한 연구 및 이를 활용한 폰트분류 빛 폰트검색에 활용될 수 있다.

휴대폰 키버튼 불량 검사 시스템 (Keypad Button Defect Inspection System of Cellphone)

  • 이준재
    • 한국멀티미디어학회논문지
    • /
    • 제13권2호
    • /
    • pp.196-204
    • /
    • 2010
  • 본 논문에서는 핸드폰 조립 전의 키패드의 개별버튼에 불량 검사방법을 제안한다. 제안한 알고리즘은 키패드의 영역 분할, 폰트 영역 분할, 이동 및 회전의 처리과정을 통해, 동일 색상의 검사 및 등급 분류, 폰트 검사, 스크래치 검사로 이루어져 있다. 특히, 본 논문에서 제안한 영역분할 방법은 기존의 단순 문턱치를 기반으로 키패드의 경사나 곡면 모양에 기인한 휘도 변화에 대응하기 위해, 패드 영역만을 B-spline으로 근사화하여, 각 화소마다 다른 표면 문턱치를 적용하는 방법을 제시한다. 또한, 키패드의 회전 정보를 고유치 및 고유벡터를 사용하여 매우 빠르고 효율적으로 구하는 방법을 제시한다. 실험결과 제안한 방법은 실제 인라인 공정상에 적용하여 실험결과 우수한 성능을 보여준다.

글꼴 유사도 판단을 위한 Faster R-CNN 기반 한글 글꼴 획 요소 자동 추출 (Automatic Extraction of Hangul Stroke Element Using Faster R-CNN for Font Similarity)

  • 전자연;박동연;임서영;지영서;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제23권8호
    • /
    • pp.953-964
    • /
    • 2020
  • Ever since media contents took over the world, the importance of typography has increased, and the influence of fonts has be n recognized. Nevertheless, the current Hangul font system is very poor and is provided passively, so it is practically impossible to understand and utilize all the shape characteristics of more than six thousand Hangul fonts. In this paper, the characteristics of Hangul font shapes were selected based on the Hangul structure of similar fonts. The stroke element detection training was performed by fine tuning Faster R-CNN Inception v2, one of the deep learning object detection models. We also propose a system that automatically extracts the stroke element characteristics from characters by introducing an automatic extraction algorithm. In comparison to the previous research which showed poor accuracy while using SVM(Support Vector Machine) and Sliding Window Algorithm, the proposed system in this paper has shown the result of 10 % accuracy to properly detect and extract stroke elements from various fonts. In conclusion, if the stroke element characteristics based on the Hangul structural information extracted through the system are used for similar classification, problems such as copyright will be solved in an era when typography's competitiveness becomes stronger, and an automated process will be provided to users for more convenience.

블록의 속성과 질감특징을 이용한 문서영상의 블록분류 (Block Classification of Document Images by Block Attributes and Texture Features)

  • 장영내;김중수;이철희
    • 한국멀티미디어학회논문지
    • /
    • 제10권7호
    • /
    • pp.856-868
    • /
    • 2007
  • 본 논문에서는 블록의 속성과 질감특징을 이용하여 효과적인 블록 분류 방법을 제안하였다. 제안한 방법에서는 먼저 명암도 문서영상을 이진화한 후, 평활화 기법을 적용하여 블록의 위치정보와 본 논문에서 사용할 특징 중에 하나인 각 블록의 내부에 있는 작은 블록들의 최대 높이 값을 구하였다. 이 위치정보들을 이용하여 문서영상을 각 블록으로 분할한다. 이 블록의 명암도 블록영상에서 문서의 속성이 잘 반영된 (0,1) 방향의 공간 명암도 의존 행렬을 구하여 7가지 질감특징을 구하였다. 먼저 블록의 속성을 최소거리 규칙(Nearest Neighbor Rule)에 입력하여 문자와 비문자 영역으로, 상세분류를 위하여 7가지 질감특징을 이용하여 큰 문자, 작은 문자, 표, 그래픽 및 사진 등으로 구분함으로써 문서인식을 위한 구조 해석뿐만 아니라 다양한 응용 분야에 효과적으로 이용될 수 있도록 하였다.

  • PDF

Optical Font Recognition For Printed Korean Characters Using Serif Pattern of Strokes

  • Kim, Soo-Hyung;Kim, Sam-Soo;Kwag, Hee-Kue;Lee, Guee-Sang
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.916-919
    • /
    • 2002
  • This paper introduces the problem of typeface classification of Hangul characters and proposes features for typeface classification among Serif and Sans-serif classes. Serif classes have a small decorative stroke around the beginning of vertical strokes, while Sans-serif classes have no serif. Therefore, the serif part is first segmented from the vertical strokes, and the direction of the serif is computed as the feature for Hangul typeface identification. To evaluate the performance of the proposed system, we used 3,000 characters extracted from Korean documents - 1,500 from Serif fonts, other 1,500 from Sans-serif fonts.

  • PDF

남성의 동체부 체형 분류(제l보) - 인체의 형태에 의한 정면 체형의 분류 - (Classification of Men's Somatotype According to Body Shape and Size(Part I) -Classification of Front View According to Body Shape-)

  • 정재은;이순원
    • 한국의류학회지
    • /
    • 제26권7호
    • /
    • pp.1026-1035
    • /
    • 2002
  • The purposes of this study were to classify the front view of trunk of adult males into several kinds of shape and to provide the characteristics and silhouette of each group which has same shape. As the sample, subjects were l290 males of 20 to 54 year-old. The procedure and results were follows; l. The principal component analysis was used to obtain the shape factor of the front of the trunk 8 factors in the front which explained 86.8% of total variance were extracted. 2. As the result of the cluster analysis of factor scores, the font of body was classified in 4 types. 4 types were named X, A, Y and H type in the front considering the characteristics of each type.