• Title/Summary/Keyword: 한글자모

Search Result 99, Processing Time 0.029 seconds

Hangul Document Retrieval Using Character Recognition (문자 인식을 이용한 한글 문서 검색)

  • 안재철;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.544-546
    • /
    • 2001
  • 이 논문은 OCR(Optical Character Reader)로 인식된 한글 문서에서의 오인식 경향을 분석하고, 이를 이용한 한글 단어 검색 방법을 제안한다. OCR로 인식된 많은 야의 한글 문서를 기반으로 자모별 인식 빈도수를 계산하고 이를 바탕으로 초성, 중성, 중성별 인식 혼동 행렬(confusion matrix)을 구성하였다. 또한 인식 정보를 적절히 이용하기 Bayes 정리를 이용하였다. 질의어에 대한 오인식 단어의 검색 방법을 제시하고 혼동 행렬과 이 검색 방법을 바탕으로 OCR 기반 단어 검색 시스템을 구축하였다.

  • PDF

A Revising Method using Phoneme Comparison for Databases with Korean Character Set (데이터베이스상의 한글 자모단위 비교를 통한 데이터 정정기법)

  • 김대환;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.532-534
    • /
    • 2003
  • 코드로써 관리되어있지 않은 데이터베이스 내의 다양한 속성들이 시간이 흐름에 따라 정보로써 가치를 갖게 되면서. 비코드성 한글 데이터의 정형화에 대한 요구가 증가하고 있다. 정형화에 있어 한글의 특수성 중에 하나는 한글자료의 경우 KSC5601, CP949등을 사용하여 음절단위의 문자셋을 사용하여 음절단위로 저장 관리한다. 그런데 입력 시정에서는 자판기등을 이용하여 음소단위로 데이터를 입력하면서 발생하는 오류 및 비정형 데이터의 유입의 문제 등을 내포하고 있다. 이러한 문제를 해결하기 위하여 데이터의 저장단위인 음절이 아닌 음소 단위의 비교를 통하여 데이터를 정정하는 기법을 제안하고자 한다.

  • PDF

Classification of Korean Character Type using Multi Neural Network and Fuzzy Inference based on Block Partition for Each Type (형식별 블럭분할에 기초한 다중신경망과 퍼지추론에 의한 한글 형식분류)

  • Pyeon, Seok-Beom;Park, Jong-An
    • The Journal of the Acoustical Society of Korea
    • /
    • v.13 no.4
    • /
    • pp.5-11
    • /
    • 1994
  • In this paper, the ciassification of Korean character type using multi neural network and fuzzy inference based on block partition is studied. For the effective classification of a consonant and a vowel, block partition method which devide the region of a consonant and a vowel for each type in the character is proposed. And the partitioned block can be changed according to the each type adaptively. For the improvement of classification rate, the multi neural network with a whole and a part neural network is consisted, and the character type by using fuzzy inference is decided. To verify the validity of the proposed method, computer simulation is accomplished, and from the classification rate $92.6\%$, the effectivity of the method is confirmed.

  • PDF

Mathematical Analysis of the Structure of Korean Characters (한글문자의 인식에 관한 연구(IV))

  • 최주근
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.9 no.4
    • /
    • pp.25-32
    • /
    • 1972
  • This paper: a) discusses the structure of Korean charactors from a unified point of view. The forming process of vowels, consonants, and the combined characters are described in the same way. b) makes clear that vowels and consonants are unique determinants of combined characters according to speech sound. c) describes the way in which 10 vowels and 14 consonants are arranged systematically by the matrix equation, which forms 14,364 kinds of combined characters.

  • PDF

역사속 과학인물 - 최초의 한글 전신부호 고안 '김학우(1862~1894년)

  • Park, Seong-Rae
    • The Science & Technology
    • /
    • v.32 no.1 s.356
    • /
    • pp.32-34
    • /
    • 1999
  • 구한 말의 김학우는 최초의 한글 전신부호를 고안한 발명가로 고종의 총애를 받았다. 1862년 함경도에서 태어난 그는 갑오경장의 소용돌이 속에서 32세로 암살을 당했다. 러시아어, 중국어, 일어 등에 능통했던 그는 미국을 비롯한 중국, 일본 등 해외를 왕래하면서 전신기술을 배우고 돌아와 한글 자모의 모르스 전신부호를 만들어 1885년 10월 3일 최초로 서울과 인천 사이의 전신을 개통시킨 산파역이다.

  • PDF

Effective Korean POS Tagging for Typing Errors Using the Concatenation of Jamo and Syllable Embedding (자모 및 음절 임베딩 결합을 이용한 오타에 효과적인 한국어 형태소 분석)

  • Kim, Hyemin;Yang, Seon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.574-579
    • /
    • 2018
  • 본 논문에서는 한국어 형태소 분석 시스템을 제안하는데, 연구 목표는 오타 없는 문서를 대상으로 한 경우에도 높은 성능을 유지하면서, 동시에 오타가 있는 문서에서도 우수한 성능을 산출하는 것이다. 실험은 크게 두 종류로 나누어서 진행된다. 주 실험인 첫 번째 실험에서는, 자모 임베딩과 음절 임베딩을 결합(concatenate)한 벡터를 입력으로 Bidirectional LSTM CRFs을 수행함으로써, 세종말뭉치 대상으로 어절 정확도 97%, 그리고 1, 2, 5 어절마다 오타가 출현한 경우에서도 각각 80.09%, 87.53%, 92.49%의 높은 성능을 산출하였다. 추가 실험인 두 번째 실험에서는, 실생활에서 자주 발생하는 오타들을 집계하여 그 중에서 11가지 오타 유형을 선정 후, 각 유형에 대해 변환된 임베딩 벡터를 적용함으로써, 해당 오타를 포함한 문장에서 93.05%의 우수한 성능을 산출하였다.

  • PDF

Hangul Input Method for Small Electronic Networking Devices (소형 정보통신 단말기를 위한 한글 입력 방법)

  • Kang Seung-Shik;Hahn Kwang-Soo
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.2
    • /
    • pp.287-295
    • /
    • 2005
  • For a quick and easy way of writing Hangul in hand-held devices, we analyzed the combination rules of Hangul alphabets that we constructed a small set of Hangul alphabets that combines a whole set of Hangul alphabets. Hangul consonants are generated from base set of consonants with function keys and vowels are constructed from eight base set of vowels by combination rules and stroke-adding rules. Especially, we adopted an easy error-correction method to resolve the inconvenience of using a delete key for vowel harmony errors. Futhermore, we diversified the input method of diphthongs for user-friendliness by minimizing the efforts of teaming vowel combination rules. We compared our method with previous methods of 'Chon-Ji-In' and 'Na-Rat-Keul' that the proposed method is better than the previous methods in input speed and error correction functionality.

  • PDF

A Design of the Java Library for Combined Hangul Regular Expression (조합형 한글 정규식 Java 라이브러리 설계)

  • Jeong, Jae-Yong;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.31-34
    • /
    • 2015
  • 현재의 한글 정규식은 완성형 한글에 맞춰 글자단위로 사용할 수밖에 없으므로 사용이 불편하다. 따라서 이러한 불편함을 해결하기 위해 자모단위로 처리 가능한 조합형 한글 정규식 Java 라이브러리를 설계하였다. 조합형 한글 정규식 Java 라이브러리를 통해서 단순히 '가'로 시작하는 글자가 아니라 'ㄱ'으로 시작하는 글자나, 종성이 없는 단어 등을 처리할 수 있으며 기존의 정규식 문법 또한 사용할 수 있다. 이를 위해서 초성, 중성, 종성 각각에 조건을 주는 규칙을 한글 정규식 문법에 추가하였으며, 기존의 Java 정규식 라이브러리와 해당 라이브러리에서 이용하는 유니코드 표현상에서의 한글 인코딩 특징을 이용하였다.