DOI QR코드

DOI QR Code

A Study on a Method of Selecting Variant Groups to be Reviewed for LGR (Label Generation Rule) of Internet Top-Level Hanja Domain

인터넷 최상위 한자 도메인의 국제 생성 규칙(LGR)을 위한 검토 대상 이체자 묶음 선정 방안 연구

  • 김경석 (부산대학교 정보컴퓨터공학부)
  • Received : 2015.10.16
  • Accepted : 2015.12.07
  • Published : 2016.01.31

Abstract

This paper discusses a method of selecting variant groups to be reviewed for LGR (Label Generation Rule) of Internet Top-Level Hanja Domain. The most difficult problem in setting up LGR of Internet Top-Level Hanja Domain is how to treat Hanja variants. If domains containing variants (e.g.: 東海國) are directed to different addresses, confusion will arise. Therefore, it is desirable that such domains are directed to the same address. Since variant groups of Korea and China are not same, we need to unify variant groups of Korea and China. In the process of reviewing 3093 Chinese variant groups, the author found that Korea does not need to review Chinese variant groups which include no or just one Korean Hanja character. Korea only need to review Chinese variant groups which include two or more Korean Hanja characters. By doing so, the author could reduce the number of Chinese variant groups to be reviewed by Korea from 3093 to 303, which is only one-tenth of the original number of Chinese variant groups. After Korea finishes reviewing 303 Chinese variant groups selected according to the method suggested in this paper, the job of setting up LGR of Internet Top-Level Hanja domain will be accelerated by negotiating with China.

이 논문은 인터넷 최상위 한자 도메인의 국제 생성 규칙(LGR)을 위하여 검토 대상 이체자 묶음 선정 방안을 연구한다. 한자 도메인의 국제 생성 규칙을 정하는데 있어 가장 어려운 점은 한자 이체자를 어떻게 처리할 것인가이다. 만일 이체자가 들어간 도메인들(보기: 동해국(東海國), 동해국)이 각각 다른 주소로 접속된다면 혼란이 일어나므로 같은 주소로 접속되는 것이 바람직하다. 그런데 한중의 이체자 묶음이 같지 않으므로 한중의 이체자 묶음을 통합할 필요가 있다. 이런 이유로 저자는 중국 이체자 묶음 3093개에 대한 검토 작업을 진행하다가 한국 한자가 전혀 없거나 한 글자만 있는 중국 이체자 묶음은 한국이 검토할 필요가 없음을 발견하였다. 한국은 중국 이체자 묶음 가운데 한국 한자가 2자 이상 있는 것만 검토하면 된다. 이렇게 함으로써 저자는 한국이 검토해야 할 중국 이체자 묶음의 개수를 3093개에서 303개로 줄일 수 있었는데, 이는 원래 중국 이체자 묶음 개수의 1/10 이다. 본 논문에서 제안한 방법에 따라 중국 이체자 묶음 303개에 대한 검토가 마무리되면 중국과의 협의를 통해 인터넷 최상위 한자 도메인의 국제 생성 규칙을 정하는 작업이 가속화될 것이다.

Keywords

References

  1. Guidelines for Developing Script-Specific Label Generation Rules for Integration into the Root Zone LGR [Internet], https://www.icann.org/en/system/files/files/Guidelines-for-LGR-20150424.pdf.
  2. Procedure to Develop and Maintain the Label Generation Rules for the Root Zone in Respect of IDNA Labels [Internet], https://www.icann.org/en/system/files/files/lgr-procedure-20mar13-en.pdf.
  3. K. Konishi, K. Juang, H. Qian, and Y. Ko. RFC 3743, Joint Engineering Team (JET) Guidelines for Internationalized Domain Names (IDN) Registration and Administration for Chinese, Japanese, and Korean. Apr., 2004.
  4. X. Lee, W. Mao, E. Chen, N. Hsu, and J. Klensin. RFC 4713, Registration and Administration Recommendations for Chinese Domain Names, Oct., 2006.
  5. CDNC Chinese Domain Name Consortium [Internet], http://www.cdnc.org/english/introduction/index.html.
  6. ISO/IEC 10646, Information technology - Universal Coded Character Set (UCS).
  7. The Whole Table of Simplified Characters (簡化字 總表), 1964, China Character Reform Committee, China Ministry of Culture, China Ministry of Education [Internet], http://www.china-language.gov.cn/wenziguifan/managed/002.htm.
  8. CGP MSS 20150430 (Chinese repertoire of 12563 Hanzi characters and variants, 2015.04.30. Meeting document).
  9. K-LGR v0.3, Korean repertoire of Hangeul syllables and Hanja characters and variants. Document number klgp171_4. 2015.08.13.
  10. KIM Kyongsok. Possible errors in C-LGR-1 (2015.04.30.). Document number 165_31. 2015.07.16.