T2XG System Design and Implementation for General Text To XML Document Translation

일반 텍스트 문서를 XML로 변환하기 위한 T2XG 시스템 설계 및 구현

  • Published : 2002.03.01

Abstract

HTML, a very ordinary language for making web pages, as a restricted ability to share information. XML is what we call ‘extension mark-up language’. It is being watched with keen interest for the communication and saving of information. Information represented in XML provides more accuracy and a higher-speed of reference after the process of being implication. For that reason, an instrument which can convert existing general text documents into XML is in great demand. In this thesis, I will describe an algorithm for converting general text documents into XML and create a system to implement this algorithm.

HTML이 웹 페이지를 만드는 데 사용되는 가장 흔한 언어이지만, HTML은 정보 공유에는 제한된 능력을 가지고 있다. 확장형 마크업 언어라고 하는 XML은 현재 웹 상에서 정보를 전달하고 저장하는 데 있어 가장 주목을 받고 있는 언어이다. XML로 표현된 정보는 의미가 부여되므로서 보다 정확하고 빠른 검색을 제공하게 된다. 전자상거래나 가상교육 등의 시스템을 개발하는 최근의 경향은 XML로 구현되고 있는 추세이다. 따라서 기존의 일반 텍스트 문서를 XML로 변환하기 위한 도구가 요구된다. 본 논문에서는 일반 텍스트 문서를 XML로 변환하기 위한 알고리즘을 제시하고, 시스템을 구현하였다.

Keywords