• Title/Summary/Keyword: 문자 구조적 특징

Search Result 70, Processing Time 0.028 seconds

The Hangeul image's recognition and restoration based on Neural Network and Memory Theory (신경회로망과 기억이론에 기반한 한글영상 인식과 복원)

  • Jang, Jae-Hyuk;Park, Joong-Yang;Park, Jae-Heung
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.4 s.36
    • /
    • pp.17-27
    • /
    • 2005
  • In this study, it proposes the neural network system for character recognition and restoration. Proposes system composed by recognition part and restoration part. In the recognition part. it proposes model of effective pattern recognition to improve ART Neural Network's performance by restricting the unnecessary top-down frame generation and transition. Also the location feature extraction algorithm which applies with Hangeul's structural feature can apply the recognition. In the restoration part, it composes model of inputted image's restoration by Hopfield neural network. We make part experiments to check system's performance, respectively. As a result of experiment, we see improve of recognition rate and possibility of restoration.

  • PDF

Integrated Neural Networks Model for Handwritten Pattern Recognition using Segment Recombination (연속 필기 패턴 인식을 위한 세그먼트 재조합 기반 통합 신경망 모델)

  • 장경익;류정우;박성진;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.399-401
    • /
    • 1998
  • 단일 문자 인식과 달리 연속 필기 패턴의 인식은 근본적인 필기 패턴의 형태적 특성을 충분히 고려할 필요가 있으며 다양한 형태의 패턴에 대한 특징이나 정보를 사용하여 종합적으로 판단 할 수 있는 모델의 유연성이 요구된다. 신경망의 학습 기능은 패턴의 왜곡과 잡음 등에 크게 영향을 받지 않으면서 인식에 필요한 특징의 추출이나 패턴 부류에 해당하는 노드의 반응을 스스로 학습시킬 수 있고, 다양한 형태의 정보를 쉽게 통합할 수 있는 유연한 구조를 제공한다. 퍼지 이론(Fuzzy theory)은 일정한 규칙이나 수학적 모델로 표현하기 어려운 패턴의 애매한 특징을 모델링할 수 있기 때문에 인식 대상의 총체적 특징을 추출해 신경망에 효과적으로 적용할 수 있다. 본 논문에서는 연속 필기 숫자 패턴을 인식을 위한 신경망과 퍼지 이론을 이용한 통합 신경망 모델을 제안한다.

  • PDF

Korean Amount Recognizer in Bank Slips (은행 전표에서 한글 금액 인식기의 구현)

  • 지태창;김은진;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.369-371
    • /
    • 1998
  • 본 논문에서는 은행 전표의 한글 금액열을 인식하는 시스템을 제안한다. 한글의 낱자를 인식하는 연구가 활발히 진해되고 있는데 반하여, 본 연구에서는 한글의 낱자 인식 결과를 가지고 후처리를 한 후, 그 결과를 금액 숫자의 인식결과와 통합하는 시스템을 구성하였다. 한글 낱자 인식기는 MDC(Minimum Distance Classifier) 기법을 응용한 방법을 사용하였고, 그 후처리는 금액의 구조적인 특징을 사용하였다. 마지막으로 숫자 인식기의 결과와 상호 참조하여 인식기를 완성하였다. 인식 결과를 보면 한글 금액 문자열의 낱자에 대해서는 후처리를 하기 전에는 96.29%, 후처리를 한 후에는 97.72%의 인식률을 보였고, 한글 금액 문자열에 대해서는 후처리를 하기 전에는 79.96%, 후처리를 한 후에는 98.24%의 신뢰도를 보였다.

  • PDF

A Preprocessing for Efficient Classification of E-mail Messages (전자우편문서의 효율적인 분류를 위한 전처리)

  • 강영순;이용배;김태현;조숙현;맹성현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.493-495
    • /
    • 2002
  • 인터넷 사용의 증가는 의사소통 매체의 하나로 전자우편(e-mail)을 일반화되게 땠다. 전자우편은 개인적인 목적 뿐만 아니라, 광고, 판매, 서비스 흑은 제품구입 관련문의 등의 특정목적에 이용되고 있는 추세이므로 한꺼번에 많은 메일을 처리 및 관리하기 위해서는 전자우편문서의 자동분류가 필요하다. 전자우편문서는 일반문서와는 달리 반구조적(semi-structure)구성, 특수문자, 약어 및 속어 등의 특징들이 있으므로 이러한 특성들은 자동분류의 정확도에 영향을 기치는 요인이 될 수 있다. 본 논문에서는 분류 성능을 향상 시키기 위해 자동분류의 오류가 될 수 있는 특성들을 제거하고, 구조적인 특징을 활용한 분류기의 전처리기를 설계한 방법론을 제시하고자 한다

  • PDF

Hybrid Word-Character Neural Network Model for the Improvement of Document Classification (문서 분류의 개선을 위한 단어-문자 혼합 신경망 모델)

  • Hong, Daeyoung;Shim, Kyuseok
    • Journal of KIISE
    • /
    • v.44 no.12
    • /
    • pp.1290-1295
    • /
    • 2017
  • Document classification, a task of classifying the category of each document based on text, is one of the fundamental areas for natural language processing. Document classification may be used in various fields such as topic classification and sentiment classification. Neural network models for document classification can be divided into two categories: word-level models and character-level models that treat words and characters as basic units respectively. In this study, we propose a neural network model that combines character-level and word-level models to improve performance of document classification. The proposed model extracts the feature vector of each word by combining information obtained from a word embedding matrix and information encoded by a character-level neural network. Based on feature vectors of words, the model classifies documents with a hierarchical structure wherein recurrent neural networks with attention mechanisms are used for both the word and the sentence levels. Experiments on real life datasets demonstrate effectiveness of our proposed model.

Font Classification of English Printed Character using Non-negative Matrix Factorization (NMF를 이용한 영문자 활자체 폰트 분류)

  • Lee, Chang-Woo;Kang, Hyun;Jung, Kee-Chul;Kim, Hang-Joon
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.41 no.2
    • /
    • pp.65-76
    • /
    • 2004
  • Today, most documents are electronically produced and their paleography is digitalized by imaging, resulting in a tremendous number of electronic documents in the shape of images. Therefore, to process these document images, many methods of document structure analysis and recognition have already been proposed, including font classification. Accordingly, the current paper proposes a font classification method for document images that uses non-negative matrix factorization (NMF), which is able to learn part-based representations of objects. In the proposed method, spatially total features of font images are automatically extracted using NMF, then the appropriateness of the features specifying each font is investigated. The proposed method is expected to improve the performance of optical character recognition (OCR), document indexing, and retrieval systems, when such systems adopt a font classifier as a preprocessor.

Feature based Text Watermarking for Binary Document Image (이진 문서 영상을 위한 특징 기반 텍스트 워터마킹)

  • Choo Hyon-Gon;Kim Whoi-yul
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.151-156
    • /
    • 2005
  • In this paper, we propose feature based character watermarking methods based on geometical features specific to characters of text in document image. The proposed methods can satisfy both data capacity and robustness simultaneously while none of the conventional methods can. According to the characteristics of characters, watermark can be embed or detected through changes of connectivity of the characters, differences of characteristics of edge pixels or changes of area of holes. Experimental results show that our identification techniques are very robust to distortion and have high data capacity.

Development study of New Weaving Structures by Korean Traditional Patterns - Focus on Tteoksal Patterns - (한국 문양을 활용한 직물 구조 디자인 개발 - 떡살무늬를 중심으로 -)

  • Yoo, Hyun-Ah
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.12
    • /
    • pp.190-197
    • /
    • 2008
  • Weaving design which is to be designed based on the machine words threading and treading is characterized by its strong limitation of expression. The concept of design has been set based on the patterns on the wooden rice-cake mold which arechosen from many Korean traditional patterns since the expressions of patterns limited by the wooden rice-cake mold is easy to be grafted upon each other. Particularly, literal patterns and geometrical patterns contain religious desire and wishes that are generated from man's fear and wonder about Nature rather than from the pursuit of beauty which is general characteristics of patterns. Based on these images, the twill technique, especially threading of Sally Nielson's rosepath which is easy in formal expressions is used to design Korean style patterns into the weaving structure. It is hoped that this study will provide an opportunity to introduce Korean style patterns to the weavers of the world and that the weaving designs will actively be utilized in the Korean industries so that they can acquire high value-added assets and commercialize our superior culture, thus being of great help to developing our cultural industr.

New Shot Boundary Detection Method Using Normalization (정규화를 이용한 새로운 샷 경계 검출 방법)

  • Shin, Seong-Yoon;Baik, Seong-Eun;Pyo, Seong-Bae;Rhee, Yang-Won
    • KSCI Review
    • /
    • v.15 no.1
    • /
    • pp.197-201
    • /
    • 2007
  • 비디오 분할은 샷 경계 검출이라고도 하는데, 비디오를 계층적이고 구조적인 형태로 표현하기 위하여 영상, 문자, 오디오와 같은 매체 속에 포함되어 있는 내용들을 특징별로 분석하여 계층별로 분류하는 작업을 말한다. 본 논문에서는 카메라와 객체의 모션에 보다 강건하고 보다 정확한 결과를 산출하여 충분한 공간 정보를 가지는 지역적 $X^2$-히스토그램 비교 방법을 이용하여 샷 경계를 검출한다. 또한 영상처리에서 영상의 명암 값 향상을 위하여 사용되는 로그함수와 상수를 변형하여 차이 값에 적용하는 정규화 방법을 제시한다. 그리고 샷 경계 검출 알고리즘을 제시하여 일반적인 샷과 갑작스런 샷의 특징을 기반으로 검출한다.

  • PDF