The Probabilities and Entropies of HANGUL Elements including the sopace

공백소를 포함한 한글 자소발생 확률과 엔트로피

  • 안수길 (서울대학교 공과대학 전자과) ;
  • 안지환 (서울대학교 공과대학 전자과)
  • Published : 1980.04.01

Abstract

The foundation of information theory mainly established by C. E. Shannon , opened the way to profuse studies on the linguistics of various languages. The statistics of Korean letters composed of elements and space are analyzed. The Korean alphabetic elements including the space have their probabilities . And information techniques can be applied to them. This paper extended the previous statistics of Korean letters to include the space. We have also calculated the entropies and redundancy for the case. The result can be used to modify the evaluation of Korean letter information processing devices and used as the basis for letter coding method for eventual future information processors.

C.E.Shannon에 의하여 정보이론의 기초가 확립된 이래 각국언어에 대한 많은 연구가 발표되고 있다. 마찬가지로 한글 element(요소)를 정보공학에 적용하기 위해서는 한글 정보원을 구성하는 모든 element(요소)에 대한 확률이 적용되어야 한다. 본 논문에서는 그간 누락된 Space(공백소)가 포함되었을 때의 엔트로피(entropy)와 리던던시(redundancy)를 고려하였다. 따라서 본 결과는 기존 각종 한글 정보처리장치의 재평가 및 새로운 정보장치의 코-드(code)화에 있어서 수요한 자료로서 사용될 것이다.

Keywords