• 제목/요약/키워드: Hangul Code

검색결과 72건 처리시간 0.021초

현행 KS 완성형 한글 코드의 문제점 (Issues in KS Complete Type Hangul Code)

  • 김충회
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.21-28
    • /
    • 1989
  • 국내에 컴퓨터가 처음 도입된 이후부터 컴퓨터의 한글 처리 문제는 '과연 컴퓨터에서 한글 처리가 가능할까?'하는 의구심에서부터 시작하여 그동안 한글 처리 방식이 각양각색으로 N 바이트나, 3 바이트, 7 비트 2 바이트 완성형, 8 비트 2 바이트 완성형, 8 비트 2 바이트 조합형이니 하여 난립하여 왔다. 이로 말미암아 소프트웨어의 호환은 물론 한글 문서의 호환마저 불가능하여 사용자가 겪는 불편이란 이루 말할 수 없을 뿐 아니라 정보화시대에 정보 교환을 가로막는 장애 요소로 등장하게 된 것이다. 이런 배경 속에서 자연스럽게 한글 코드의 표준화의 중요성을 인식하게 되어 정부에서는 1987년 3월 '정보 교환용 부호에 관한 한글 공업 규격' (KS C-5601-1987)을 새로 정하게 되었다. 그러나 한글의 가장 뛰어난 조합에 의한 확장성을 무시한 '2 바이트 완성형'을 채택 2,350 자의 한글로 제한을 해 놓았기 때문에 제 나라 국어도 재대로 표현할 수 없는 절름발이 한글이 되고 말았다. 이와 같은 결합이 있는 한글을 이제 교육용 컴퓨터에서까지 채택함에 이르러 우리의 지혜를 모아야 할 때라고 생각하면서 문제를 제기하고자 한다.

  • PDF

한글 데이터 압축코드를 위한 엔트로피 감소 (Entropy Reduction for the Code of Hangul Data Compression)

  • 이재영;성굉모;이종각
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.54-57
    • /
    • 1989
  • 본 논문에서는 정보원의 집합이 여러개의 부집합으로 나누어지며 정보 발생 방법은 이들 부집합을 순서적으로 선택한 후 그 부집합에서 확률에 따라 원소를 발생시키는 성질을 갖는 정보원을 인코딩할 때 데이타를 압축시킬 수 있는 엔트로피 감소 모델을 제시하였다. 방법은 정보를 전송하는 과정에서 정보원이 갖고있는 성질에 관한 정보를 제외시킴으로서 평균 정보량 즉 엔트로피를 줄이는 것이다. 이와 같은 원리로 인코딩을 하면 데이타를 압축시킬수 있다.

  • PDF

한국어 정보처리를 위한 최적화 한글 코드에 관한 연구 (An Optimal Hangul Code System For The Korean Language Processing)

  • 변정용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.39-43
    • /
    • 1989
  • 컴퓨터에 의한 한글정보처리의 주체는 한글이며, 객체는 그 처리도구인 컴퓨터라는 전제하에서 한글문자의 개별성에 의한 주체적 파악을 통하여, 한국어 정보처리에 최적한 코드로의 개선안을 제안한다. 개선안의 구체적 대상 범주로서 최근의 한국어 정보처리의 응용분야인 자연언어처리, 문자인식, 음성 인식 및 합성, 전자출판등이 점차 확대되어 가고 있다는 관점에서 보아서 기존의 코드가 가지고 있는 문제점을 분석하고 이들에 최적한 코드는 무엇이며 어떠한 성격을 가져야 하며, 그들이 기존의 코드가 중요시하던 처리효율이나 저장 효율의 문제에 어떠한 영향을 미치는지에 대하여 해당 알고리즘을 개발하고 이들에 대한 평가를 해보인다.

  • PDF

한글 문서화일의 관리와 효과적인 코드변환에 관한 연구 (A Study on Hangul Text File Management and Effective Code Conversion)

  • 윤호상;손진곤;황종선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.191-196
    • /
    • 1989
  • 한글 문서화일을 작성할 때 한글코드로서 일반적으로 많이 사용되는 것은 2 Byte 완성형 코드와 2 Byte 조합형 코드이다. 이 두 코드체제는 각각 내제된 장점이 있으며 이로 인하여 많은 논란이 되어 왔으나, 두 코드체제를 이용하여 작성되는 한글 문서 화일은 여전히 늘어나고 있는 것이 현 실정이다. 이러한 배경에서 한글 문서화일의 코드변환에 관해서는 계속 연구되어 왔고 현재 여러종류의 변환프로그램이 실용화되어 있다. 본 논문에서는 기존의 변환프로그램에서 한글 문서화일을 화일 단위로 변환시키는 것을 표시난 (tag field) 개념을 도입하여 디스크 단위로 변환시킬 수 있도록 개선된 변환프로그램을 제시하였다. 아울러 코드변환시 변환이 필요한 화일을 쉽게 찾을 수 있도록 한글 문서화일에 대하여 그 작성 코드의 종류를 표시할 수 있는 DOS 명령어를 제시하였다.

  • PDF

한글 글자 단위 인덱스를 위한 검색 유형 정의 및 한글 부호계와의 연관성에 관한 연구 (A Study of the framework of search patterns for Hangul characters and its relationship with Hangout code for Hangout Character based Index)

  • 이중화;이종민;김성우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.327-330
    • /
    • 2007
  • 본 논문에서는 한글 인덱스를 구현할 때 글자 단위를 기본으로 하는 경우 적용될 수 있는 검색유형 (search pattern) 들은 어떠한 것들이 존재할 수 있는지에 대해 살펴보고, 검색 알고리즘에 적용시켜 본다. 이 때 부호계와의 연관성과 효율성을 따져보기 위해서 $KS\;{\times}\;1001$의 두 바이트 조합형과 두 바이트 완성형, 그리고 유니코드 3.0의 조합형 부호계와 완성형 부호계 등 여러가지 부호계를 사용할 때에 대해 기본 검색 알고리즘을 적용해 본다.

  • PDF

HMM 네트워크 기반의 한글 인식기를 위한 구조 특성열의 적용 (Application of Structure Code Sequence for HMM Network-Based Hangul Recognizer)

  • 하진영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.345-350
    • /
    • 1998
  • 온라인 필기 한글 인식 연구 중 HMM 네트워크를 기반으로 한 방법이 흘려 쓴 한글 인식에 있어서 우수한 성능을 보여주고 있다. 하지만, 또박또박 쓴 정서체 한글 인식에 대해서는 때때로 예측하지 못한 결과를 출력하기도 한다. 필기자가 정성 들여 필기했을 경우 보다 일관성 있는 인식 결과를 출력할 수 있는 것이 중요하다. 또한 계산 능력이 떨어질 수밖에 없는 휴대용 컴퓨터에서의 활용을 위해 인식 속도의 향상도 필요하다. 따라서 본 논문에서는 정서체 인식률 및 인식 속도 개선을 위해 16-방향 체인코드 대신 구조적 정보를 포함하는 새로운 코딩 방식을 제안하고자 한다.

  • PDF

한글 전자우편시스템의 설계 및 구현 (A Design and Implementation of Hangul Mail System)

  • 김종상;김영호
    • 대한전자공학회논문지
    • /
    • 제22권4호
    • /
    • pp.8-15
    • /
    • 1985
  • 한글 전자 우편 시스템을 설계하고 이를 DECnet에 구현하였다. 기존 전산기망의 우편 시스템이 영문을 기준으로 구성되어 있어 한글 처리에는 부적합하므로 한글 명령의 처리, 한글 지명 (지명) 기능등을 포함시켜 이용자로 하여금 한글의 사용을 쉽게 할 수 있도록 했다 또 여러 가지의 상이한 한글 코오드 문제를 고려하여 우편 전달 구조 자체의 유연성 (flexibility)을 유지하도록 하였다.

  • PDF

공백소를 포함한 한글 자소발생 확률과 엔트로피 (The Probabilities and Entropies of HANGUL Elements including the sopace)

  • 안수길;안지환
    • 대한전자공학회논문지
    • /
    • 제17권2호
    • /
    • pp.23-28
    • /
    • 1980
  • C.E.Shannon에 의하여 정보이론의 기초가 확립된 이래 각국언어에 대한 많은 연구가 발표되고 있다. 마찬가지로 한글 element(요소)를 정보공학에 적용하기 위해서는 한글 정보원을 구성하는 모든 element(요소)에 대한 확률이 적용되어야 한다. 본 논문에서는 그간 누락된 Space(공백소)가 포함되었을 때의 엔트로피(entropy)와 리던던시(redundancy)를 고려하였다. 따라서 본 결과는 기존 각종 한글 정보처리장치의 재평가 및 새로운 정보장치의 코-드(code)화에 있어서 수요한 자료로서 사용될 것이다.

  • PDF

AN EFFICIENT CODING METHODS FOR THE TWO COMPOSITION TYPES OF THE KOREAN ALPHABET ON A MASPAR MACHINE

  • Min, Yong-Sik
    • Journal of applied mathematics & informatics
    • /
    • 제5권1호
    • /
    • pp.191-200
    • /
    • 1998
  • There are two types of composition systems for the Korean alphabet: a combined system and a composite system. This paper decribes an efficient coding method for both of these two types. Using this coding method with the combined system yields about 10.5% code-length savings per a Korean character while it yields about 45% savings with the composite system. In other words the coding method produces a better result(i.e. 34.5% better) with the composite system than with the combined system. The simulation has been performed on a MasPar machine having 64 processors. The results show that the combined system achieved a 45.851-fold speedup while the composite system achieved a 47.274-fold speedup.

국제 문자 부호계에 포함된 한글 부호계의 개선 방안 (A Method of Improving Hangul Code Systems Embedded in UCS)

  • 변정용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.192-194
    • /
    • 1998
  • 현행 국제문자부호계(KS C 5700-1995)에는 세 가지 종류의 한글 부호계인 완성 음절형, 자소형, 자모형이 포함되어 있으며, 이들을 적용할 때 구현 수준에 따라서 표현이 불가능하거나 혼합 부호계 표현으로 혼란이 일어날 소지가 매우 크다. 뿐만 아니라 완성 음절형 부호계를 주된 부호계로 삼고 있기 때문에 이런 기반 위에서 국어정보처리를 하는 것은 불가능하며, 옛 한글 표현은 수준을 달리하였을 때 가능하다. 본 논문은 국제문자보호계에 세가지 한글 부호계를 분석 평가하여 이들이 함께 존재할 필요성이 있는지 여부와 제정자의 관점 그리고 각각의 한계점과 파생될 문제점을 검토하고 국제문자 보호계의 바른 나아갈 바에 대하여 2 가지 방안을 모색한다.

  • PDF