DOI QR코드

DOI QR Code

한글-로마자 인명 변환의 통계적 순위 추천 시스템

Statistical Ranking Recommendation System of Hangul-to-Roman Conversion for Korean Names

  • 이정훈 (부산대학교 전기전자컴퓨터공학과) ;
  • 김민호 (부산대학교 전기전자컴퓨터공학과) ;
  • 권혁철 (부산대학교 전기컴퓨터공학부)
  • 투고 : 2017.08.08
  • 심사 : 2017.10.12
  • 발행 : 2017.12.15

초록

본 논문에서는 한글-로마자 인명 변환을 다루며, 기존에 사용되고 있는 다양한 표기를 인정하고 인명 변환의 사용 빈도에 따라 결과를 제공함을 목표로 한다. 한글-로마자 인명 표기가 다양해진 이유는 크게 두 가지이다. 첫째로 국내외에서 만들어진 다양한 표기법의 무분별한 사용이며, 둘째로 현행표기법에서의 관습적인 표기를 허용하기 때문이다. 이런 이유로 한글 인명 하나에도 다양한 로마자 표기가 가능해졌다. 시스템에서는 400만 명의 인명 데이터를 통계 사전으로 구축하여 변환한다. 첫 단계에서는 성씨의 매칭과정을 통해 인명 유무를 판단하고, 두 번째 단계에서는 이름 전체를 통계사전에서 비교하여 변환한다. 마지막 단계에서는 이름의 음절을 비교 후 변환하여 결과를 사용 빈도에 따라 순위로 제공한다. 본 논문에서는 기존의 웹에서 서비스 중인 시스템과 비교하여 성능을 측정하였으며, 타 시스템에 비해서 다소 높은 성능을 보였다.

This paper focuses on the Hangul-to-roman conversion of Korean names. The proposed method recognizes existing notation and provides results according to the frequency of use. There are two main reasons for the diversity in Hangul-to-roman name conversion. The first is the indiscreet use of varied notation made domestically and overseas. The second is the customary notation of current notation. For these reasons, it has become possible to express various Roman characters in Korean names. The system constructs and converts data from 4 million people into a statistical dictionary. In the first step, the person's name is judged through a process matching the last name. In the second step, the first name is compared and converted in the statistical dictionary. In the last step, the syllables in the name are compared and converted, and the results are ranked according to the frequency of use. This paper measured the performance compared to the existing service systems on the web. The results showed a somewhat higher performance than other systems.

키워드

과제정보

연구 과제 주관 기관 : 부산대학교

참고문헌

  1. Hye-Sook Kim, “Unity and Consistency in the Romanization of Korean Personal Names,” Korea Journal of English Language and Linguistics, Vol. 1, No. 3, pp. 417-435, Sep. 2001. (in Korea)
  2. Gahye Jo, Minho Kim, Aesun Yoon, and Hyuk-Chul Kwon, "Implementation of a Korean Romanization System Supporting Compatibility with Mccune-Reischauer Romanization," Proc. of the KIISE Korea Computer Congress 2014, pp. 1728-1730, Jun. 2014. (in Korea)
  3. Byeong-seon Yang, “A Study of How to Write Korean Personal Names in Romanization: Syllablebased Englishization,” Journal of the Linguistic Association of Korea, Vol. 8, No. 3, pp. 281-302, 2000. (in Korea)
  4. Jaedeok Bae, "The Points at Issue and Betterments on Korean Romanisation System," Journal of North-east Asian cultures, Vol. 21, pp. 129-146, Dec. 2009. (in Korea)
  5. Jeong-Woo Kim, “Korean Orthography of Loanwords and Romanization of Korean From the Viewpoint of Translation,” The Journal of Translation Studies, Vol. 9, No. 2, pp. 67-93, Sep. 2008. (in Korea) https://doi.org/10.15749/jts.2008.9.2.003
  6. Akegapon Tangverapong, Atiwong Suchato, and Proadpran Punyabukkana, "Romanization of Thai Proper Names Based on Popularity of Usages," Advances in Knowledge Discovery and Data Mining, pp. 580-587, 2016.
  7. PA, Chenchen Ding1 Vichet Chea2 Win; SUMITA, Pa3 Masao Utiyama1 Eiichiro. Statistical Romanization for Abugida Scripts: Data and Experiment on Khmer and Burmese. 2017.