Abstract
HTML5, new standard for web language, is being standardized corresponding to the development of web. Since several new semantic elements have been added into HTML5 standard, current Web Environment is becoming more and more semantic. In order to provide better user experience by using information extraction from HTML5 page, new HTML5 Elements should be mapped to a corresponding Ontology. In this research, we will focus on new semantic elements to build Ontology from HTML5 document. For this purpose, we will propose a methodology of Schema level mapping rule and instance mapping rule.
웹의 발전으로 말미암아 새롭게 부상하고 있는 차세대 웹 언어인 HTML5의 웹 기술 언어 표준화가 현재 진행 중이다. 웹의 관점에서 볼 때 HTML5에 새롭게 추가된 구조적 시맨틱 요소들로 인하여 예전보다 웹의 기술에서 웹에서의 데이터들을 더욱 의미적으로 표현할 수 있게 해주는 것이 가능하게 되었다. 이는 또한 새로운 HTML5로 기술된 웹 문서에서 유용한 정보를 쉽게 추출할 수 있음을 나타내기도 한다. 따라서 웹 문서에 새롭게 추가된 시맨틱 요소들에 대한 온톨로지화를 통하여 웹 문서 정보에 대한 직관적이고 구조적인 접근방식이 필요하다. 본 연구에서는 HTML5에 새로 추가된 시맨틱 요소들에 입각하여 웹 문서 요소들의 온톨로지 모델과 인스턴스들의 매핑 방법론을 통하여 효과적인 HTML5 문서의 온톨로지화 방법론을 제안하고자 한다.