• Title/Summary/Keyword: 유니코드

Search Result 58, Processing Time 0.028 seconds

A Study on the Unicode Architecture (유니코드의 구조와 문제점)

  • 주리정
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2001.08a
    • /
    • pp.23-28
    • /
    • 2001
  • 유니코드는 현재 또는 과거에 존재했던 다양한 언어의 문자를 처리하기 위한 국제 표준코드이며 2바이트로 형성될 수 있는 65,000여 개의 영역에 전세계문자들을 차례대로 배열, 각 문자에 일련의 코드값을 지정하였다. 우리나라는 ISO 10646-1:1993의 유니코드 체계를 그대로 수용하여 1995년 KS C 5700-1995 표준규격으로 채택하였다. 이러한 유니코드의 경우 한글과 한자의 정렬문제, 옛한글이나 구결문자의 표현에 있어 제약이 있다. 이에 본고에서는 유니코드의 기본적인 개념, 그리고 한글 유니코드와 그 문제점에 대해 고찰하였다.

  • PDF

A Chinese Character(Hanja) Input System Based on Unicode 3.0 (유니코드 3.0 한자 입력시스템)

  • 윤지헌;변정용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.375-377
    • /
    • 2000
  • 인터넷의 급속한 보급은 인간 생활의 많은 부분을 바꾸어 놓고있는데, 가장 대표적인 예로 전자상거래와 온라인 문서를 들 수 있다. 전자상거래와 온라인 문서는 과거 자국의 문자위주 PC통신상에서만 이루어지고 있었지만 현재는 대부분이 인터넷과 연동되어있다. 따라서 전자상거래와 온라인 문서 등을 전세계 사람들이 이용하기 위해서 만국 공통의 코드가 필요하게 되었다. 이러한 요구로 ISO10646 코드가 제정되고 발전하여 현재의 유니코드 3.0에 이르게 되었다. 유니코드 3.0에는 세계각국의 문자가 포함되어있고, 한국, 중국, 일본 등 한자문화권에서 공통적으로 많이 사용하는 한자 2만 7천여자도 포함되어있다. 이것은 과거 국내 표준인 완성형 한자 4천 8백여자와 비교하면 무척 많은 양이라 할 수 있다. 이러한 유니코드의 출현으로 국내외의 고문헌과 법전 등의 한자가 포함된 각종 문서를 인터넷상에서 제공할 수 있지만, 현재 유니코드 한자를 입력하기위한 방법은 MS Word2000의 한자 입력기만 있고 다른 운영체제나 인터넷 환경에서는 거의 전무한 상태이다. 본 논문에서는 운영체제에 독립적으로 작동하는 유니코드 한자입력시스템에 관하여 연구 개발하였다.

  • PDF

An Arrangement of Hangul Codes in Unicode (유니코드에서 한글코드 정비 방안)

  • Byun, Jeongyong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.234-236
    • /
    • 2018
  • 유니코드에 있는 3가지 한글코드를 훈민정음의 과학적 원리를 기준으로 정비하기 위하여 각각을 분석해서 평가한 다음 훈민정음 창제원리를 반영한 정음형 코드 즉 한글자모 코드가 나머지 음절표현을 포괄한다는 결과에 따라서 U+1100만 남기고 나머지 공간은 반납해야 한다는 정비 방향을 제안한다.

  • PDF

A Sorting of Unicode 3.0 CJK Chinese Characters (유니코드 3.0의 CJK 한자 정렬)

  • 윤지헌;변정용
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.04a
    • /
    • pp.462-465
    • /
    • 2000
  • 최근 많은 양의 문서가 전자화되어 컴퓨터에 저장되고 인터넷을 통하여 공유가 되고 있고, 그 범위를 고문헌에까지 넓혀가고 있다. 그러나 한자 문화권의 고문헌은 대부분 2만에서 3만여자의 한자로 작섣되어 있어서 한자 입력시 코드문제가 뒤따른다. 하지만 유니코드 3.0에서는 27,786자의 한자를 코드화 하여 놓아서 한자 문화권 나라에 많은 도움을 주고 있다. 하지만 한중일 3개국에서 많이 쓰이는 한자를 대상으로 하여 부수, 획수 순으로 정렬하여 국내 실정에 맞지 않고 그나마 유니코드 한자를 입력할 수 있는 환경도 MS Word 2000 정도로 제한적이다. 본 논문에서는 유니코드 3.0 한자 입력기에서 기본 한자 코드로 상요될 CJK 한자 영역에 배정된 한자를 정렬하는 방안을 제안하고 운영체제 독립적인 한자 입력 시스템에 활용한다.

  • PDF

Problems with Chinese Ideographs Search in Unicode and Solutions to Them (유니코드 한자 검색의 문제점 및 개선방안)

  • Lee, Jeong-hyeon
    • Informatization Policy
    • /
    • v.19 no.3
    • /
    • pp.50-63
    • /
    • 2012
  • This thesis is designed to analyze how the search for Chinese ideographs is done in Koreanology-related domestic databases, domestic library databases, domestic academic databases, and overseas library databases, with a view to identifying problems and suggesting solutions to them. The major reasons that impede Chinese ideographs search in Unicode are classified as 'multicode characters', 'simplified characters', and 'variant characters', and three characters are chosen as samples to describe the current practice. Thirteen Koreanology-related databases, five domestic library databases, five domestic academic databases and two overseas library databases are analyzed in terms of Chinese ideographs search. To support search for multicode characters, the open source of the Unicode consortium must be applied. To improve search for simplified and variant characters, a matching table must be standardized and proposed to the Unicode consortium.

  • PDF

An Anti-Forensic Technique for Hiding Data in NTFS Index Record with a Unicode Transformation (유니코드 변환이 적용된 NTFS 인덱스 레코드에 데이터를 숨기기 위한 안티포렌식 기법)

  • Cho, Gyu-Sang
    • Convergence Security Journal
    • /
    • v.15 no.7
    • /
    • pp.75-84
    • /
    • 2015
  • In an "NTFS Index Record Data Hiding" method messages are hidden by using file names. Windows NTFS file naming convention has some forbidden ASCII characters for a file name. When inputting Hangul with the Roman alphabet, if the forbidden characters for the file name and binary data are used, the codes are convert to a designated unicode point to avoid a file creation error due to unsuitable characters. In this paper, the problem of a file creation error due to non-admittable characters for the file name is fixed, which is used in the index record data hiding method. Using Hangul with Roman alphabet the characters cause a file creation error are converted to an arbitrary unicode point except Hangul and Roman alphabet area. When it comes to binary data, all 256 codes are converted to designated unicode area except an extended unicode(surrogate pairs) and ASCII code area. The results of the two cases, i.e. the Hangul with Roman alphabet case and the binary case, show the applicability of the proposed method.

Support on Ideograph Characters Search of Unicode Based Information System (정보 시스템의 유니코드 기반 한자 검색 지원)

  • Yoon, So-Young
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.4
    • /
    • pp.375-391
    • /
    • 2007
  • Unicode Han ideograph character set differed from the our principle of the phonetic value ordering in that it followed the principle of KangXi radical-stroke ordering of the characters. Therefore, information system should support ideograph search on precise analysis of materials which consist of korean character (hangul) and ideograph character (hanja). History Information system has been maintaining Hanja(Chinese Character) to Hangul Dictionary, Terminology Dictionary for composition, borrowing, non-ideographic principles, Variant Forms Dictionary, and Recently discovered Chinese Characters List.

Manipulation of Image and Font for Mobile Stations (무선 단말기 상에서의 효율적인 이미지 및 폰트 처리)

  • 강신상;옥경달;이상범
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.685-687
    • /
    • 2004
  • 본 논문에서는 우선 단말기에서 이미지 및 폰트를 효율적으로 처리할 수 있는 비트맵 처리 기법을 제안하고 이를 이용한 이미지 및 폰트 처리 시스템을 소개 하고자 한다. 초기에는 컴퓨터 상에 문자를 표현하기 위하여 아스키코드가 개발되었고 이에 표현하지 못하는 부분을 더하고자 유니코드가 개발되어 사용하고 있으나 코드에 대한 표준화 작업은 지금도 계속 되고 있다. 이러한 아스키코드와 유니코드를 무선 단말기상에 적용하고자 하는 시도는 많이 했지만 시간과 노력이 많이 요구되는 비효율적인 잔업이 계속 되어 온 것도 사실이다. 본 논문에서는 이러한 문제점을 채결하고자 아스키코드 및 유니코드를 무선 단말기에 적용시키는 일련의 과정을 단축하고 능률적인 처리시스템을 소개하고자 한다. 본 연구에서는 이미지 및 폰트 처리의 불필요한 작업을 단축하여 최소 비용의 처리 시스템을 설계 및 구현하였다.

  • PDF

Correction for Hangul Normalization in Unicode (유니코드 환경에서의 올바른 한글 정규화를 위한 수정 방안)

  • Ahn, Dae-Hyuk;Park, Young-Bae
    • Journal of KIISE:Software and Applications
    • /
    • v.34 no.2
    • /
    • pp.169-177
    • /
    • 2007
  • Hangul text normalization in current Unicode makes wrong Hangul syllable problems when using with precomposed modern Hangul syllables and composing old Hangul by using conjoining-Hangul Jamo and compatibility Hangul Jamo. This problem comes from allowing incorrect normalization form of compatibility Hangul Jamo and Hangul Symbol and also permitting to use conjoining-Hangul Jamo mixture with precomposed Hangul syllable in Unicode Hangul composing rule. It is caused by lack of consideration of old Hangul and/or insufficient understanding of Hangul code processing when writing specification for normalization forms in Unicode. Therefore on this paper, we study Hangul code in Unicode environment, specifically problems of normalization used for Web and XML, IDN in nowadays. Also we propose modification of Hangul normalization methods and Hangul composing rules for correct processing of Hangul normalization in Unicode.

Study on Scrambling Occurrence in Line Coder for UTF-8 Hangul Syllable Code based on Unicode (유니코드 기반 UTF-8 한글글자마디 부호의 회선부호기내 스크램블링 발생에 관한 연구)

  • Hong, Wan-Pyo
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.10 no.7
    • /
    • pp.831-836
    • /
    • 2015
  • This paper studied scrambling occurrence in the line coder for UTF-8 hangul syllable code based on unicode. The paper suggested that scrambling is occurred when consecutive four "0" bit is entered into the line coder from the source codes. Currently, ITU-T is applying HDB-3 scrambling method in AMI line coder, According to the study result, scrambling is occurred about 39% in UTF-8 code on Unicoe Hangul syllable.