• Title/Summary/Keyword: 한글 자소 결합

Search Result 8, Processing Time 0.018 seconds

A study on the combination algorithm of Korean alphabet to develope the Hangul fonts for computers (컴퓨터형 한글 서체 개발을 위한 자소 결합 알고리즘 연구)

  • Kim, Yun-Sik;Eom, Jeong-Kook;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.341-344
    • /
    • 1998
  • 컴퓨터 상에서 모든 한글 음절을 구현하고자 하면 현대한글 11,172음절의 완성형 코드나 조합형 코드를 사용해야 하는데 조합형의 경우 글자의 미려도가 떨어지는 문제성이 발생되므로 자소 벌수를 늘려 그 문제점을 보완하려는 연구가 진행되어 왔다. 이는 메모리 및 코드처리상 비효율적인 요소가 많으므로 본 논문에서는 자소는 초 중 종성 각각 6벌씩만 제작한 후 자소의 어울림에 따라 자소의 이동과 변형으로 그 미려도를 추구할 수 있는 방안을 제시하고자 한다.

  • PDF

BongNet - One Year After (봉네트 - 그후 일년)

  • Sin, Bong-Kee;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.503-518
    • /
    • 1993
  • 봉네트는 온라인 한글 필기 글씨 모델이다 [신92]. 글씨를 자소와 연결획의 결합구조로 보고, 각 자소 및 연결획 모델을 정의한 후, 이들을 제자 원리에 따라 네트워크 구조로 설계한 모델이다. 본 논문에서는 봉네트가 소개된 후 지난 일년 동안 수행되었던 실험 및 모델 검증의 결과와 앞으로도 계속될 개선책을 소개하고, 동 모델의 바탕이 된 통계적 인식 이론을 정립하고자 한다.

  • PDF

A Recognition Method of HANGEUL Pattern Using a State Space Search (상태공간탐색을 이용한 한글패턴 인식방법)

  • 김상진;이병래;박규태
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.15 no.4
    • /
    • pp.267-277
    • /
    • 1990
  • In this paper, a method of separation and recognition of phonemes from a composite Korean character pattern through a state space search strategy which is a problem solving method in artificial intelligence is proposed. To correlate the separating of phonemes with their recognizing, the problem is represented into the state space, on which a search strategy is performed. For the minimization of search area, the structural information based on the composition rules of Korean characters and the positional information of phonemes in the basic forms are used. And the effectiveness of the approach is shown by a computer simulation.

  • PDF

개선된 봉네트

  • Lee, Jay-J.;Kwon, Jae-Ook;Sin, Bong-Kee;Kim, Jin-H.
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.189-194
    • /
    • 1994
  • 봉네트는 온라인 한글 필기 글씨 모델이다. 글씨를 자소와 연결획의 결합구조로 보고, 각 자소 및 연결획 모델을 은닉 마르코프 모델을 사용하여 구성한 후, 이들을 한글의 제자 원리에 따라 네트워크 구조로 설계한 모델이다. 본 논문에서는 모델간의 분별력 부족과 입력 정보의 취약등에 기인한 약점을 해결하기 위하여 구조적 인식 방법을 결합한 봉네트의 확장과, 연속 필기 글씨의 처리를 위한 순환 구조로의 확장등, 지난 일년 동안 수행되었던 실험 및 결과를 소개하고, 앞으로의 연구 방향을 논의하고자 한다.

  • PDF

Assembling Disjoint Korean Syllables Using Two-Step Rules (2단계 규칙을 이용한 해체된 한글 음절의 결합)

  • Lee, Joo-Ho;Kim, Hark-Soo
    • Korean Journal of Cognitive Science
    • /
    • v.19 no.3
    • /
    • pp.283-295
    • /
    • 2008
  • With increasing usages of a messenger and a SMS, many young people are habitually using a new-style of sentences with intentionally disjoint Korean syllables. To develop a natural language interface system in these environments, we should first develop a technique that converts a sequence of disjoint Korean syllables to a correct sentence. Therefore, we propose a method to assemble a sequence of disjoint Korean syllables into a correct sentence by using two-step rules. In the first step, the proposed method assembles CVC (consonant-vowel-consonant) forms of simple-disjoint Korean syllables by using manual heuristic rules. In the second step, the proposed method assembles CCVCC forms of double-disjoint Korean syllables by using a mapping table and a transformation-based learning technique. In the experiment, the proposed method showed the perfect precision of 100% in assembling simple-disjoint Korean syllables and the high precision of 99.98% in assembling double-disjoint Korean syllables.

  • PDF

A Study on Documentization of Printed Hangul Image with Multi-size and Multi-style (다양한 크기 및 활자체를 갖는 인쇄체 한글 영상의 문서화에 관한 연구)

  • 김장욱;김경숙;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.295-298
    • /
    • 2001
  • 본 논문에서는 CCD카메라로 입력 받은 다중 크기 및 활자체로 구성된 한글문서의 화상 데이터를 편집기에서 수정 가능한 문자로 변환시키는 시스템을 구현하였다. 먼저 Dynamic 이 진화 처리 과정을 거친 화상을 흑백 화소의 누적분포에 따라 문자단위로 분할한 후, 다양한 크기로 분할된 문자를 표준패턴 크기로 표준화 시켰다. 한글을 자소 간 공백 위치의 특징에 따라서 6가지 유형으로 분류한 후, 퍼지 이론을 접목시킨 원형 패턴 벡터 알고리즘을 사용해서 표준벡터와 입력된 글자의 특징벡터를 비교하여 문자로 인식하게 하였다. 각 6가지 유형에서 서로 다른 자소로 결합된 문자들을 30개 선정하여 여러 가지 활자체 및 크기에 적용해 본 결과, 모두 문서화가 가능함을 알 수 있었다.

  • PDF

Korean Named Entity Recognition using Joint Learning with Language Model (언어 모델 다중 학습을 이용한 한국어 개체명 인식)

  • Kim, Byeong-Jae;Park, Chan-min;Choi, Yoon-Young;Kwon, Myeong-Joon;Seo, Jeong-Yeon
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.333-337
    • /
    • 2017
  • 본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.

  • PDF

A Study on Machine Printed Character Recognition Based on Character Type Classification (문자형식 분류 기반의 인쇄체 문자인식에 관한 연구)

  • 임길택;김호연
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.40 no.5
    • /
    • pp.266-279
    • /
    • 2003
  • In this paper, we propose machine printed character recognition methods which utilize the character type information and divide the character clusters. The characters are subdivided into a total of seven types, of which six types are for Hangul according to the grapheme combination fashions and one type for English characters, numerals, and symbols. According to the character type, we separate input character image into several recognition units and recognize them by using the direction angle feature. The recognition for each character type is completed by combining recognition units which are recognized by neural networks respectively For combining a total of seven character recognizers, we implemented seven methods such as switching method, integrating method, and their several variants. As experimental results, we obtained 98.2% recognition rate of simple switching method, 90.54% of integrating one, and between 97.35% and 98.65% of five variants.