• 제목/요약/키워드: Hangul Character Coding

검색결과 10건 처리시간 0.022초

한글의 정보처리 및 통신용 부호 최적화를 위한 한국어 분석 (Analysis of Korean Language to Optimize the Hangul Character Coding for Information Processing and Communication)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.375-380
    • /
    • 2015
  • 본 논문은 정보처리 및 전송용으로 사용되는 한글의 부호화를 최적화할 수 있도록 하기 위하여 한국어를 연구하였다. 본 논문은 한국어 구성하고 있는 한글의 구성현황과 그 한글들에 대한 각각의 사용빈도를 분석하였다. 본 논문은 본 연구결과 분석된 한글의 구성현황을 한국 KS 문자 표준과 국제 문자표준인 유니코드로 부호화되어 있는 한글 문자와 비교하였다. 연구를 위해 사용된 한국어는 국립국어원의 "현대국어사용빈도조사결과"를 대상으로 하였다. 이 보고서에 수록된 한국어는 총 58.437개이다. 분석결과 한국어 총58,437국어를 구성하고 있는 한글은 총1,540개였다. 이 총1,540개 한국어 중에서 사용빈도가 가장 높은 글자는 "다"로서 전체 사용빈도의 15%였다. 사용빈도가 가장 낮은 글자는 "휫"으로서 전체사용빈도의 0.00003%였다. 한국어를 구성하고 있는 한글 글자수는 유니코드 한글문자 부호를 구성하고 있는 한글 수 보다 약 7.2배, KS X 1001 한글문자 부호를 구성하고 있는 한글 수보다 약 1.5배 적은 것으로 나타났다.

HDB-3 데이터전송처리 효율을 고려한 7비트 한글 자모 부호체계 (7bits Hangul Jamo Coding system to consider of HDB-3 Data transmission processing efficiency)

  • 홍완표
    • 한국항행학회논문지
    • /
    • 제16권6호
    • /
    • pp.1044-1051
    • /
    • 2012
  • 본 논문은 3비트 열, 4비트 행 7비트 1바이트 부호체계를 갖는 한글정음부호체계에 대하여 데이터 전송효율 측면에서 분석하였다. 그 결과 한글정음부호체계는 원천부호화 규칙에 위배되는 부호의 총 사용빈도가 19.78%에 달하여 이 부호체계를 사용할 경우 데이터의 전송효율을 상당히 저해할 것으로 나타났다. 따라서 본 논문에서는 그에 대한 대책으로 원천부호화 규칙에 부합되는 새로운 한글정음부호체계를 제시하였다.

PARALLEL DYNAMIC CODING METHOD OF HANGUL TEXT

  • Min, Yong-Sik
    • Journal of applied mathematics & informatics
    • /
    • 제3권2호
    • /
    • pp.157-168
    • /
    • 1996
  • This paper describes an efficient coding method for Ko-rean characters (alphabet) using a three-state transition graph. Par-allel hangul Dynamic Coding Method (PHDCM) compresses about 3.5 bits per Korean character compared with other coding techinques. When we ran the method on a MasPar machine it achieved a 49.314-fold speedup with 64 processors having 10 million orean characters

JBIG2 부호화에서의 한글의 효율적 처리에 관한 연구 (A Study on Effective Processing of Hangul for JBIG2 Coding)

  • 강병택;김현민;고형화
    • 한국통신학회논문지
    • /
    • 제25권6B호
    • /
    • pp.1050-1059
    • /
    • 2000
  • In this paper, we propose a method to improve JBIG2 compression ratio which can be applied to Hangul text. Hangul character is composed of a few symbols which is called JASO, which needs inevitable increase of position information to be transmitted. To reduce this disadvantage, we have proposed an algorithm that generate aggregated symbol in combination of JASO symbols. Proposed algorithm shows better performance in Huffman coding than in arithmetic coding. In lossless coding, proposed algorithm showed 4.5∼16.7(%) improvement for Huffman coding and 2.9∼10.4(%) improvement for arithmetic coding. In lossy coding, proposed algorithm showed 3.7∼17.0(%) improvement for Huffman coding and 2.1∼10.5(%) improvement for arithmetic coding.

  • PDF

회선부호의 스크램블링을 고려한 새로운 한국표준 한글글자마디부호에 관한 연구 (Considering the scrambling code of the line Study on the New Korea joint protection Standard Hangul character)

  • 박요셉;홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.1345-1354
    • /
    • 2015
  • 본 논문은 정보통신용 표준 부호인(정보 교환용 부호계 $KS{\times}1001$ : 2004)에 정의되어 있는 한글낱자 부호집합에 대하여, Date link 계층에서 AMI/HDB-3 스크램블링 측면에서 효율적인 데이터 전송을 위한 새로운 부호집합 체계를 제시하였다. 기존 부호집합 체계와 상호비교를 위하여 ($4{\times}4$) 비트 원천부호화 규칙과 한글 빈도통계 (국립국어원)를 적용한 결과 약44 %의 데이터 전송 효율이 개선시킬 수 있음을 나타났다.

AMI/HDB-3 회선부호화 및 HDLC FLAG를 고려한 KS X 1001 정보교환용 한글낱자 부호체계 개선연구 (A Study on the Hangul Character Code System for KS X 1001 Information Interchange considering AMI/HDB-3 Line Encoding and HDLC Flag)

  • 우제택;홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.65-72
    • /
    • 2015
  • 스크램블링 기술을 적용한 AMI/HDB-3 방식은 장거리 데이터전송 회선부호화에 주로 사용된다. 본 논문은 정보통신용 부호 표준(KS X 1001 ; 2014 확인)에 규정되어 있는 한글낱자, 한글고어낱자용 부호집합에 대하여 데이터 링크 계층에서 HDLC Flag의 비트 또는 문자 스터핑과 물리계층의 AMI/HDB-3 스크램블링 측면에서 데이터 전송효율을 높이는 새로운 한글낱자용 부호집합 체계를 제시하였다. 기존 부호집합 체계와 비교를 위해 ($4{\times}4$) 비트 원천부호화 규칙과 한글낱자 사용빈도 통계를 적용한 결과, 약 22.01%의 데이터 처리효율이 향상되는 것으로 나타났다.

PHDCM : 병렬 컴퓨터에서 한글 텍스트의 효율적인 축약 (PHDCM : Efficient Compression of Hangul Text in Parallel)

  • 민용식
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.50-56
    • /
    • 1995
  • 본 논문은 3가지 상태의 전이 그래프를 이용해서, 병렬 컴퓨터인 MasPar에 적합한 한글에 대한 효율적인 부호화를 제시하고자 한다. 본 논문에서 제시한 PHDCM(Parallel Hangul Dynamic Coding Method)의 방법을 이용한 경우에 한글 한음절당 약 3.5비트이상의 축약이 가능함을 보였다. 그리고 기존의 방법과 비교해 볼때 1비트이상의 축약이 가능함도 보였다. 또한 약 천만자의 한글을 이용해서, 병렬 컴퓨터인 MasPar에 프로세서 64개를 이용하여 실제 실행을시켰을때의 가속도 (Speedup)은 49.314임을 보였다.

  • PDF

AN EFFICIENT CODING METHODS FOR THE TWO COMPOSITION TYPES OF THE KOREAN ALPHABET ON A MASPAR MACHINE

  • Min, Yong-Sik
    • Journal of applied mathematics & informatics
    • /
    • 제5권1호
    • /
    • pp.191-200
    • /
    • 1998
  • There are two types of composition systems for the Korean alphabet: a combined system and a composite system. This paper decribes an efficient coding method for both of these two types. Using this coding method with the combined system yields about 10.5% code-length savings per a Korean character while it yields about 45% savings with the composite system. In other words the coding method produces a better result(i.e. 34.5% better) with the composite system than with the combined system. The simulation has been performed on a MasPar machine having 64 processors. The results show that the combined system achieved a 45.851-fold speedup while the composite system achieved a 47.274-fold speedup.

패턴매칭에 의한 이진 한글문서의 유.무손실 압축에 관한 연구 (The Study on Lossy and Lossless Compression of Binary Hangul Textual Images by Pattern Matching)

  • 김영태;고형화
    • 한국통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.726-736
    • /
    • 1997
  • The textual image compression by pattern matching is a coding scheme that exploits the correlations between patterns. When we compress the Hangul (Korean character) text by patern matching, the collerations between patterns may decrease due to randoem contacts between phonemes. Therefore in this paper we separate connected phonemes to exploit effectively the corrlation between patterns by inducting the amtch. In the process of sequation, we decide whether the patterns have vowel component or not, and then vowels connected with consonant ae separated. When we compare the proposed algorithm with the existing algorith, the compression ratio is increased by 1.3%-3.0% than PMS[5] in lossy mode, by 3.4%-9.1% in lossless mode than that of SPM[7] which is submitted to standard committe for second generation binary compression algorithm.

  • PDF

신경망 학습 코드에 따른 오프라인 필기체 한글 인식률 비교 (Comparisons of Recognition Rates for the Off-line Handwritten Hangul using Learning Codes based on Neural Network)

  • 김미영;조용범
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.150-159
    • /
    • 1998
  • 본 논문은 필기체 한글의 특징을 추출한 후 이를 신경망을 이용하여 인식하였다. 한글의 특징 추출을 위해 $5{\times}5$ 윈도우 방법을 사용하였는데, 이는 $3{\times}3$ 윈도우 방법을 수정한 것이다. 추출된 특징을 이진화 코드로 변환하여 신경망의 입력으로 사용하며, 백프로퍼게이션 알고리즘으로 학습시켰다. 수직 모음, 수평모음, 자음 인식을 위한 3개의 신경망을 각각 구성하였고, 결과를 비교하기 위하여 3가지 학습 방법을 사용하였다. 3가지 학습 방법은 고정 코드 방법, 학습 코드 방법 I, 학습 코드 방법 II이고 학습 코드 방법 II가 가장 좋은 결과를 보였다. 이 경우 수직 모음과 수평 모음은 100%의 인식률을, 자음은 93.75%의 인식 결과를 보였다.

  • PDF