An implementation of PDF-to-XML conversion software

PDF 문서에 대한 XML 변환 소프트웨어 구현

  • Published : 2015.11.06

Abstract

PDF는 미국 어도비 시스템즈(Adobe Systems) 사에서 만든 전자 문서 파일 포맷이다. PDF에는 일반 문서 및 문자, 도형 그림, 글꼴 등을 포함할 수 있으며, 동일한 문서를 컴퓨터 운영체제와 관계없이 모니터, 프린터 등의 출력 장치로 같은 모습으로 출력하기 위한 목적으로 개발되었다. 현재 거의 모든 운영체제에서 PDF 문서를 읽거나 인쇄할 수 있으며, 온라인 및 오프라인 환경에서도 쉽게 PDF 문서를 공유할 수 있으며, 보안성이 높아 공공기관, 연구소 등에서 자료를 배포할 때 많이 사용되고 있다. XML은 사람이 쉽게 읽을 수 있고 컴퓨터와 같은 기계가 쉽게 판독할 수 있는 형식으로 부호화된 문서를 작성하기 위한 일련의 규칙을 정의하는 데 사용하는 마크업 언어로서 W3C에서 정의하였다. 현재 XML은 인터넷 상에서 데이터를 표현 하거나 교환, 저장, 검색할 때 가장 널리 쓰이고 있다. 본 논문에서는 PDF 문서를 인터넷 상에서 쉽게 활용하도록 도와주며, XML 데이터 처리가 가능한 응용 프로그램에서 PDF 문서를 활용할 때 쉽게 사용할 수 있도록 도와주는 PDF-to-XML 변환 소프트웨어를 구현하였다.

Keywords