Design and Implementation of a Language Identification System for Handwriting Input Data

필기 입력데이터에 대한 언어식별 시스템의 설계 및 구현

  • 임채균 (을지대학교 의료산업학부) ;
  • 김규호 (을지대학교 의료산업학부) ;
  • 이기영 (을지대학교 의료산업학부)
  • Received : 2010.01.22
  • Published : 2010.02.28

Abstract

Recently, to accelerate the Ubiquitous generation, the input interface of the mobile machinery and tools are actively being researched. In addition with the existing interfaces such as the keyboard and curser (mouse), other subdivisions including the handwriting, voice, vision, and touch are under research for new interfaces. Especially in the case of small-sized mobile machinery and tools, there is a increasing need for an efficient input interface despite the small screens. This is because, additional installment of other devices are strictly limited due to its size. Previous studies on handwriting recognition have generally been based on either two-dimensional images or algorithms which identify handwritten data inserted through vectors. Futhermore, previous studies have only focused on how to enhance the accuracy of the handwriting recognition algorithms. However, a problem arisen is that when an actual handwriting is inserted, the user must select the classification of their characters (e.g Upper or lower case English, Hangul - Korean alphabet, numbers). To solve the given problem, the current study presents a system which distinguishes different languages by analyzing the form/shape of inserted handwritten characters. The proposed technique has treated the handwritten data as sets of vector units. By analyzing the correlation and directivity of each vector units, a more efficient language distinguishing system has been made possible.

최근, 유비쿼터스 시대로의 도약을 위하여 모바일 기기의 입력 인터페이스에 대한 연구가 활발하게 진행되고 있으며, 기존의 마우스, 키보드뿐만 아니라 필기, 음성, 시각, 터치와 같이 다분야로 세분화되어 새로운 인터페이스가 연구되고 있다. 특히 소형 모바일 기기에서는 크기로 인하여 추가가능한 장치의 제약이 심하기 때문에, 작은 화면에서도 효율적인 입력 인터페이스로 필기 인식이 대두되고 있다. 필기 인식에 대한 이전 연구는 2차원 영상을 기반으로 하거나 벡터로 입력받은 필기데이터를 인식하는 알고리즘이 대부분이며, 필기 인식 알고리즘의 정확성을 향상시키는 연구에만 초점을 두고 있는 실정이다. 또한 실제 필기 입력하는 경우에는 현재 문자가 영문 대/소문자, 한글, 숫자 등의 어느 분류에 속하는지 선택해야하는 문제가 있다. 따라서 본 논문에서는 입력된 필기 데이터를 기반으로 형상 분석을 통하여, 영문이나 한글의 여부를 판단하고 언어식별이 가능한 시스템을 제안하였다. 제안 기법은 벡터 단위의 집합으로 필기 데이터를 취급하여 각 벡터 간의 상호관계와 방향성을 분석함으로써 효율적인 언어식별을 가능하도록 하였다.

Keywords

References

  1. 이성훈, 김진형, "베이지안 망을 이용한 필기 문자 인식 및 생성", 한국정보과학회, 정보과학회지, 제24권 제12호, 56-62쪽, 2006년.
  2. 조미경, 조환규, "PDA상에서의 한글 필기체 매칭 알고리즘", 한국정보과학회, 정보과학회논문지:소프트웨어 및 응용, 제29권, 제9.10호, 684-693쪽, 2002년.
  3. Jia Zeng, Zhi-Qiang Liu, "Type-2 Fuzzy Markov Random Fields and Their Application to Handwritten Chinese Character Recognition", IEEE Trans. Fuzzy Syst., vol. 16, no. 3, pp. 747-760, June 2008. https://doi.org/10.1109/TFUZZ.2007.905916
  4. Huaigu Cao, Venu Govindaraju, "Handwritten Carbon Form Preprocessing Based on Markov Random Field", In CVPR07, pp. 1-7, 2007.
  5. Kai Ding, Zhibin Liu, Lianwen Jin, Xinghua Zhu, "A Comparative Study of Gabor Feature and Gradient Feature for Handwritten Chinese Character Recognition", Proc. of ICWAPR, pp. 1182-1186, November 2007.
  6. http://www.dt.co.kr/contents.html?article_no=2007072302011832718002
  7. Cheng-Lin Liu, "Normalization-Cooperated Gradient Feature Extraction for Handwritten Character Recognition", IEEE Trans. PAMI, vol. 29, no. 8, pp. 1465-1469, August 2007. https://doi.org/10.1109/TPAMI.2007.1090
  8. Marcus Liwicki, Horst Bunke, "Feature Selection for On-Line Handwriting Recognition of Whiteboard Notes", Proc. of the Conf. of the Graphonomics Society, pp. 101-105, 2007.