• Title/Summary/Keyword: HTML 문서

Search Result 396, Processing Time 0.026 seconds

Implementation of an XML-Based Editor/Transformer for Large Volume of Similar Documents (XML 기반의 대용량 유사 문서 편집기/변환기 구현)

  • 황인준
    • The Journal of Society for e-Business Studies
    • /
    • v.9 no.1
    • /
    • pp.21-38
    • /
    • 2004
  • With its recent popularity, Web is now considered as a huge repository of information. Most documents on the web have been created using HTML(Hyper Text Markup Language). Even though HTML is simple and easy to learn, it has several features that are obstacles to the efficient information retrieval. XML(eXtensible Markup Language) can provide a solution to such problems and in fact, has already been used in many applications, XML is a standard markup language for exchanging data on the web. It can describe a document structure freely by defining its DTD, which enables efficient integration and retrieval of data on the web. In this paper, we propose a versatile and efficient XML document manager. Its features include (i) form-based XML editor that enables easy creation of new XML documents, (ii) automatic document converter that can transform HTML documents with similar structure into XML documents automatically, and (iii) GUI-based DTD editor.

  • PDF

A Conversion from HTML5 to OWL Ontology (HTML5 문서로부터 OWL 온톨로지 구축 기법)

  • Sun, Taimao;Yoon, Yiyeon;Kim, Wooju
    • The Journal of Society for e-Business Studies
    • /
    • v.18 no.3
    • /
    • pp.143-158
    • /
    • 2013
  • HTML5, new standard for web language, is being standardized corresponding to the development of web. Since several new semantic elements have been added into HTML5 standard, current Web Environment is becoming more and more semantic. In order to provide better user experience by using information extraction from HTML5 page, new HTML5 Elements should be mapped to a corresponding Ontology. In this research, we will focus on new semantic elements to build Ontology from HTML5 document. For this purpose, we will propose a methodology of Schema level mapping rule and instance mapping rule.

HTML Document Conversion System for Effective Retrieval of Text Document (문서의 효율적인 검색을 위한 HTML 문서 변환 시스템)

  • 김수의;장대용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.184-186
    • /
    • 2000
  • 이 연구에서는 텍스트 문서를 웹에서 HTML 문서 형태로 효율적으로 검색할 수 있는 변환 시스템을 개발하였다. 웹상에 사용자가 원하는 부분만을 HTML 문서 형태로 제공하도록 문서의 논리적인 구조를 파악하며 그 구조에 대한 정보와 각 논리 단위에 해당하는 부분의 범위 정보를 저장할 수 있도록 관계형 데이터베이스 스키마를 개발하였다. 개발한 시스템은 문서의 목차 테이블을 자동으로 구축하고 목차 테이블의 각 항목에 하이퍼링크를 설정한다. 문서를 웹에서 검색하기 위한 첫 화면은 목차 테이블이며, 그 중 한 항목이 클릭되면 그 항목의 내용이 제공되고, 만약 그 하위에 속하는 항목들이 있다면 그들에 대한 링크를 역시 제공한다. 이러한 방법으로 한 문서의 전체를 그 논리 구조에 따라 사용자가 원하는 대로 검색할 수 있다. 이 시스템은 멀티미디어 타입의 문서를 하이퍼미디어 문서 형식으로 변환할 수 있도록 확장하여 보완 개발될 수 있고, 장래에 전자 출판과 전자 도서관에 응용될 수 있다.

  • PDF

A Study on HTMLtoVoiceXML Converter (HTMLtoVoiceXML 변환기에 관한 연구)

  • 최훈일;장영건
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.373-375
    • /
    • 2001
  • 음성 기술의 발달과 VoiceXML 1.0의 제정으로 인해 표준화된 방식으로 이동 단말기와 전화를 통해 음성으로 웹 컨텐츠에 접근할 수 있게 되였다. 거의 모든 웹 컨텐츠들은 HTML로 작성되어 있으며, 기존의 HTML로 작성된 수많은 웹 컨텐츠에 음성으로 접근하기 위해서는 HTML 문서들을 VoiceXML 문서로 변환하여야 한다. 이를 수동으로 변환하기 위해서는 많은 시간과 비용이 필요하게 된다. 본 논문에서는 이 문제를 해결하기 위해여 HTML 문서률 VoiceXML 문서로 자동 변환하는 HTMLtoVoiceXML변환기의 설계 방안을 제시하였다.

  • PDF

Development of a Form-based XML Editing and Converting System Using Integrated DTD (통합 DTD를 이용한 폼(Form) 기반 XML 편집 및 변환 시스템 개발)

  • 손원성;이현찬;김재경;최윤철;유범종
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.3-7
    • /
    • 2000
  • 전자문서를 정의하기 위해서는 구조문서 정의가 가능한 SGML(Standard Generalized Markup Language) 및 XML(eXtensible Markup Language), 그리고 웹문서를 위한 HTML을 이용할 수 있다. 그러나 SGML은 매우 복잡한 구문을 포함하기 때문에 일반 사용자들이 쉽게 사용하기가 어렵고 HTML은 비 구조적인 문서정보 및 스타일 정보를 포함하기 때문에, 근래에 개발된 대부분의 전자문서 시스템에서는 XML을 응용하고 있다. 전자문서 시스템은 복잡한 구조의 다양한 문서들을 포함하고 있으며 이러한 문서들은 DTD를 정의하고 있기 때문에 DTD의 구조 정의 및 관리가 매우 비효율적이다. 따라서 본 연구에서는 다양한 구조를 모두 표현할 수 있는 통합 DTD를 정의하고 이를 효율적으로 관리 및 처리하기 위한 폼 기반 구조문서 처리 방법을 제안한다. 통합 DTD와 폼을 통하여 사용자는 폼 단위의 문서 인스턴스만을 입력 및 편집함으로써 복잡한 DTD 구조에 독립적으로 문서를 처리할 수 있으며, 처리된 문서는 DTD에 위배되지 않는 정확한 XML 인스턴스가 된다. 또한 기존의 HTML문서를 XML로 변환하기 위하여 본 논문에서는 누구나 손쉽게 사용할 수 있는 중간단계(semi-auto)의 XML 변환시스템을 제공한다. 그 결과 본 연구에서 개발한 시스템에서는 다양하고 복잡한 문서에 대하여 효율적인 문서구조가 가능하고, XML문서를 폼을 이용하여 누구나 쉽고, 정확하게 작성할 수 있다. 그리고 웹에서 사용된 HTML 문서를, 본 연구에서 정의한 통합 DTD구조에 일치하는 XML 문서로 간단히 변환할 수 있다.

  • PDF

FromTo-$Web/EK^{TM}$: English-to-Korean Machine Translation System for HTML Documents (에서로-웹/$EK^{TM}$: 영한 웹 문서 번역 시스템)

  • Sim, Chul-Min;Yuh, Sang-Wha;Jung, Han-Min;Kim, Tae-Wan;Park, Dong-In;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.277-282
    • /
    • 1997
  • 최근 들어 웹 상의 문서를 번역해 주는 번역 시스템이 상용화되고 있다. 일반 문서와 달리 웹 문서는 HTML 태그를 포함하고 있어 번역 시스템에서 문장 단위로 분리하는데 어려움이 있다. 또한 그 대상 영역이 제한되지 않으므로 미등록어 및 구문 분석 실패에 대한 대처 기능이 필요하다. 따라서 웹 문서의 번역 품질이 일반 문서 번역에 비해 현저히 떨어지게 된다. 이 논문에서는 HTML 태그를 보유한 영어 웹 문서를 대상으로 하는 번역 시스템인 "에서로-웹/EK"에 대해 기술한다. 에서로-웹/EK는 HTML 문서의 특성을 고려하여 태그를 분리, 복원하는 태그 관리자를 별도로 가진다. 또한 태그를 유지하면서 영어에서 한국어로 변환되는 과정에서 발생하는 어휘 분리, 어휘 통합, 어순 변환 둥의 다양한 변환 현상을 처리한다. 이 시스템은 변환 방식에 기반한 번역 시스템으로서 영어 해석, 영한 변환, 한국어 생성의 단계를 거친다. 구현된 시스템은 Netscape와 DDE(Dynamic Data Exchange) 방식으로 연동하여 HTML 문서를 번역한다.

  • PDF

HTML specification and semantics analysis of korean news sites (한국 인터넷신문 HTML 규격 및 시맨틱스 수준 분석)

  • Lee, Byoung-Hak
    • Journal of Digital Contents Society
    • /
    • v.18 no.5
    • /
    • pp.949-956
    • /
    • 2017
  • Visual interfaces of news sites look similar while their HTML have lots of different specifications and qualities. It's getting more and more significant to describe HTML semantically to make every computer able to understand contents to be shared as HTML5 specification refers. In this study, I have analysed HTML codes of 110 korean news sites in comparison to those of 8 global news sites. As results, 68% of news sites are still described in HTML4 specifications and only 10 out of 110 are in HTML5 specification and as high quality and strong semantics as global news sites. The result shows most korean news sites platforms had not been changed since they developed in mid-2000 and it's needed to be upgraded as language translation technologies are making it possible to share korean digital contents with the rest of world.

Construction of a HTML Filter in Wireless Communication Environment (무선통신 환경을 위한 HTML 필터 구축)

  • Kwon, Jung-Sun;Park, Kee-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.1561-1564
    • /
    • 2000
  • 최근 WAP(Wireless Application Protocol)을 이용한 무선 인터넷 사용에 대한 관심이 높아지고 있다. WAP은 무선환경에 적합하도록 설계되어 있으며, 유선 인터넷과 비슷한 구조를 가지고 있다. 그러나 기존의 인터넷이 HTML 문서 형태로 정보를 저장하고 있는데 비해서, WAP에서는 WML(Wireless Markup Language) 문서 형태로 정보가 저장되어야 한다. 따라서 HTML 문서를 WML 문서로 자동 변환해 주는 소프트웨어가 필요하며, 본 연구에서는 이러한 역할을 하는 HTML 필터(filler)를 개발한다. 즉, 본 논문에서는 WML의 구성 및 특징에 대해서 알아보고, HTML 필터의 설계, 구현 및 작동결과에 대하여 설명한다.

  • PDF

Automatic Classification of Web documents According to their Styles (스타일에 따른 웹 문서의 자동 분류)

  • Lee, Kong-Joo;Lim, Chul-Su;Kim, Jae-Hoon
    • The KIPS Transactions:PartB
    • /
    • v.11B no.5
    • /
    • pp.555-562
    • /
    • 2004
  • A genre or a style is another view of documents different from a subject or a topic. The style is also a criterion to classify the documents. There have been several studies on detecting a style of textual documents. However, only a few of them dealt with web documents. In this paper we suggest sets of features to detect styles of web documents. Web documents are different from textual documents in that Dey contain URL and HTML tags within the pages. We introduce the features specific to web documents, which are extracted from URL and HTML tags. Experimental results enable us to evaluate their characteristics and performances.

Automatically Converting HTML Documents with Similar Pattern into XML Documents (유사 패턴을 갖는 HTML 문서의 XML 자동 변환)

  • O, Geum-Yong;Hwang, In-Jun
    • The KIPS Transactions:PartD
    • /
    • v.9D no.3
    • /
    • pp.355-364
    • /
    • 2002
  • Recently, WWW(World Wide Web) has become a source of a large amount of information, and is now recognized not only as an information-sharing tool, but also as an information repository. Currently, the majority of documents on the web were created using HTML(Hypertext Markup Language). Although HTML is simple and easy to learn, its inherent lack of describing document structure makes it difficult to retrieve information effectively. One possible solution would be to convert such HTML documents into XML (extensible Markup Language) documents. This is a standard markup language for exchanging data on the web. It can describe a document structure freely by defining its own DTD (Document Type Definition). This makes it possible to integrate, store, and retrieve data on the web efficiently In this paper, we will propose a converter that automatically converts HTML documents with similar pattern into XML documents by analyzing the document structure and recognizing its path information.