• Title/Summary/Keyword: HTML 문서

Search Result 396, Processing Time 0.027 seconds

A Design and Implementation of WYSIWYG XML Editor Based on CSS 1 (CSS 1 기반 WYSIWYG XML 편집기의 설계 및 구현)

  • 김정훈;전상수;채진석;최한석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.293-295
    • /
    • 2000
  • XML은 HTML의 단순성과 SGML의 복잡성을 동시에 극복하기 위한 노력으로 시작되어 HTML이나 SGML과는 다른 새로운 세계를 만들어 내고 있으며, 인터넷 문서 표현과 관련된 여러 분야에서 활발하게 연구되고 있다. XML의 특징 중 하나는 문서의 내용과 표현이 분리되어 있어 하나의 문서를 여러 방법으로 표현할 수 있다는 점이다. 그러나 이러한 점은 문서의 외형을 정의하기 위해 스타일시트를 따라 만들어야 하며, 같은 결과물을 얻기 위해 HTML보다 많은 작업량이 필요하게 되는 등의 문제를 야기하게 되었다. 이 논문에서는 이러한 문제를 해결하기 위해 비교적 간단한 스타일시트 언어인 CSS 1을 기반으로 나모 웹 편집기와 같은 WYSIWYG 인터페이스를 제공하여 XML 문서를 편집할 수 있는 XML 문서편집기를 제안한다. 이 논문에서 제안하는 XML 문서편집기를 사용하면 스타일시트에 대해 잘 모르는 초보자라도 쉽게 XML 문서를 편집할 수 있을 것으로 기대된다.

  • PDF

Learning Web-Document Characteristics Using Evolutionary Computation (진화연산을 이용한 웹 문서의 특성 학습)

  • Kim, Sun;Jang, Byung-Tak
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.43-46
    • /
    • 2000
  • 대용량의 문서를 대상으로 한 정보 검색은 인터넷과 WWW이 대중화되면서 웹 분서로 확장되었다. 기존의 문서는 주로 텍스트만으로 구성되는데 반해 웹 문서는 HTML을 기반으로 문서가 작성된다. HTML은 문서의 형태를 이루게 하는 여러 종류의 태그들로 구성되어 있고 문서 작성자는 이를 이용, 자기 의도를 홈페이지에 반영한다. 따라서 태그 정보의 학습은 검색 효율을 향상시키는데 도움을 줄 수 있다. 본 논문에서는 이러한 HTML의 태그 특성을 이용해 검색 효율을 향상하는 방법을 제시한다. 제시된 방법은 진화 알고리즘을 사용하여 질의와 검색결과를 담고 있는 데이터를 학습한다. 학습을 통해 얻어지는 결고는 각 태그에 대한 가중치 정보들이며, 이는 검색엔진의 문서 가중치 정보로 사용된다. TREC 데이터를 사용하여 실험 하였으며 태그 정보를 이용함에 따른 검색 성능 변화를 비교 분석하였다.

  • PDF

Design and Implement of an XSLT Processor Using Object-Oriented Modeling Method (객체모델링 기법을 이용한 XSLT 처리기의 설계 및 구현)

  • In, Kyung-Sook;Ha, Yan;Lee, Kyung-Whan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.508-510
    • /
    • 2001
  • 본 XSLT 처리기는 객체모델링 기법인 UML을 기반으로 설계하였고 핵심적인 부분은 XSL 스타일 시트를 HTML 패스/스타일로부터 구성해 내는 것이다 즉 문서 작성자는 XML문서를 작성하고 파싱하여 패스 테이블을 형성하고 이 패스 테이블에 작성자는 HTML패스/스타일을 추가한다. 이를 통해 XSL의 복잡한 스타일에 대한 고려없이 문서구조와 정보에 집중하여 견고한 문서를 만들 수 있다. 즉 구조 문서인 XML과 콘텐츠 타인의 대중적인 문서형인 HTML을 이용함으로써 적은 비용으로 다양한 문서 스타일을 구성할 수 있게 하여 XML 기술을 쉽게 보급시키며 컴포넌트 제작을 통해 다른 산업영역 문서교환에서 활용할 수 있다.

  • PDF

XML 스키마의 발전

  • Hong, Gi-Hyeong
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.8
    • /
    • pp.97-106
    • /
    • 2002
  • HTML이 90년대에 일반인에게 인터넷과 웹을 확산시킨 기술이라면, 1998년 W3C에 의하여 표준(recommendation)으로 제정된 XML은 HTML이 가진 한계를 극복하는 차세대 인터넷 표준 마크업 언어이다. HTML이 문서 내의 내용을 브라우저를 통하여 어떻게 보여 줄 것인가에 초점이 맞추어진 반면, XML은 문서의 내용을 정보 처리를 위한 데이터로 본다는 것이 XML의 가장 큰 특징이다.

  • PDF

Design and Implementation of a HTMLtoVoiceXML Converter (HTMLtoVoiceXML 변환기의 설계 및 구현)

  • Choi, Hoon-il;Jang, Young-Gun
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.7 no.6
    • /
    • pp.559-569
    • /
    • 2001
  • It is possible to access web contents by mobile terminals and telephones due to the evolution of voice and VoiceXML technologies. Nevertheless, because these days most of all the web contents are constructed by HTML, it is impossible to access them by using the new technology. Therefore, to access the contents through voices requires the conversion of the web document from HTML to VoiceXML, but its manual conversion process should be involved additional time and expenditure. In this paper, we design and implement HTMLtoVoiceXML converter, suggest a system structure of it and propose a practical identification algorithm of meaningful fragmented group of contents to solve the problem. To test the performance and validity of the converter, we apply it to more than 400 web pages in Korean web sites, it works well except for web pages which involve invalid HTML codes.

  • PDF

A Preprocessing System for Multi-Lingual Machine Translation of Web Pages (웹용 다국어 기계번역을 위한 전처리기)

  • 이영우;안동원;서진원;정성종
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.204-206
    • /
    • 1998
  • 여러 언어들로 작성된 웹문서들을 다국어 기계번역기에서 번역하기 위해서는 우선 해당 웹문서가 어떠한 언어로 작성되었는지를 알아내야 한다. 코드 분석을 통하여 웹문서를 작성한 언어를 알게되면 해당 언어를 번역하는 기계번역기를 작동시킬 수 있다. 또한, 웹문서에서 기계번역의 대상은 HTML 태그를 제외한 일반 문장이다. 따라서, 웹용 기계번역의 전처리기에서 웹문서에서 HTML 태그를 분리하여야 하며 번역이 완료된 후 번역된 문서에 HTML 태그를 복원하여 웹브라우저에서 번역된 문서를 볼 수 있어야 한다. 본 논문에서는 웹용 다국어 기계번역을 위한 전처리기의 태그관리기와 코드인식기를 설명한다.

  • PDF

A Design and Implementation for processing Query Links in Virtual Documents (가상문서에서 질의 링크 처리를 위한 설계 및 구현)

  • 강민구;김철수;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.169-171
    • /
    • 2001
  • XML을 기반으로 하는 가상문서는 인터넷 상의 정보 공유를 가능하게 하여 새로운 지식을 생성할 수 있도록 한다. 가상문서에서는 비정형(텍스트, 이미지, 멀티미디어 데이터)과 준정형(HTML, XML) 데이터를 링크로 연결하여 정보를 제공하고 있다. HTML과 같은 기존의 웹 문서에서는 스크립트나 CGI 같은 것을 통하여 정형 데이터(데이터베이스)의 정보를 제공하고 있으므로 가상문서에서도 자연스럽게 정형 데이터를 연결하여 사용이 가능하다. 본 논문에서는 디지털 도서관 시스템에서 정형 데이터를 지원하기 위해 질의 링크를 포함하는 가상문서를 효율적으로 처리할 수 있도록 데이터베이스를 설계 및 구현하며, 데이터베이스 스키마 정보를 관리하여 필요한 데이터베이스를 검색하여 질의 링크의 생성을 돕도록 하였다.

  • PDF

Design of an XML Documents search system (XML 문서 검색 시스템 설계)

  • 정지문;이문목;최성
    • Proceedings of the KAIS Fall Conference
    • /
    • 2000.10a
    • /
    • pp.134-139
    • /
    • 2000
  • 컴퓨터의 보급 확대, 초고속 통신망 구축 그리고 사용하기 쉬운 브라우저의 개발에 힘입은 웹의 급속한 발전에 의해 인터넷 이용자들이 기하급수적으로 증가하게 되었다. 이러한 웹의 발전에 무엇보다도 크게 영향을 끼친 것 중의 하나가 바로 HTML(Hyper-Text Markup Language)일 것이다. HTML은 SGML(Standard Generalized Markup Language)을 기반으로 한 DTD(Document Type Definition)에 의해 정의되어 있는 한정된 태그(Tag)만을 사용하도록 되어 있어 단순한 홈페이지 작업을 하기에는 매우 용이하나 대용량의 복잡하고 다양한 작업을 하기는 쉽지 않았다. HTML의 단점을 극복하기 위해 개발된 XML은 문서에 대한 의미 공유와 서로 다른 애플리케이션 및 호환이 되지 않는 데이터베이스간의 정보 전달 기능들을 효율적으로 수행할 수 있다. 하지만, 현재 대부분의 XML문서 검색 엔진들은 문서의 구조 정보에 기반한 검색에 중점을 둔 반면, 태그의 의미를 이용한 검색은 지원하지 못한다. 본 논문에서는 XML문서의 보다 효율적인 검색을 지원하기 위해 데이터 레지스트리를 이용하여 태그의 의미를 명시하고 이에 기반한 XML문서 검색 시스템을 연구하였다.

An Efficient Algorithm for Detecting Tables in HTML Documents (HTML 문서의 테이블 식별을 위한 효율적인 알고리즘)

  • Kim Yeon-Seok;Lee Kyong-Ho
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.10
    • /
    • pp.1339-1353
    • /
    • 2004
  • < TABLE > tags in HTML documents are widely used for formatting layout of Web documents as well as for describing genuine tables with relational information. As a prerequisite for information extraction from the Web, this paper presents an efficient method for sophisticated table detection. The proposed method consists of two phases: preprocessing and attribute-value relations extraction. For the preprocessing where genuine or ungenuine tables are filtered out, appropriate rules are devised based on a careful examination of general characteristics of < TABLE > tags. The remaining is detected at the attribute-value relations extraction phase. Specifically, a value area is extracted and checked out whether there is a syntactic coherency Futhermore, the method looks for a semantic coherency between an attribute area and a value area of a table that may be inappropriate for the syntactic coherency checkup. Experimental results with 11,477 < TABLE > tags from 1,393 HTML documents show at the method has performed better compared with previous works, resulting in a precision of 97.54% and a recall of 99.22% in average.

  • PDF

XSLT document editing for XML document conversion in WYSIWYG environment (WYSIWYG 환경에서 XML 문서 변환을 위한 XSLT 문서편집 시스템)

  • 차원준;박주상;이용준;정회경
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2003.10a
    • /
    • pp.500-503
    • /
    • 2003
  • XML been using extensively by standard of data exchanging in the Internet is observed by a technology to replace existent document creation language of HTML etc. Biggest characteristic of this XML is that logic information and physical information that express style of document that do that express structural substance of document were detached. Hereupon, W3C advised XSL that oner style function of form similar to HTML for XML's style and data conversion. Also, XSL's conversion function offers function that change XML document to other data format, and can describe style information through conversion of various document format. But, a XML document conversion technology that use XSLT know-how in domestic is unprepared real condition, and necessity about solution that can edit XSLT document efficiently is putting. This paper does XML document so that conversion and output are available in various document format. And offered research of XSLT document editing system that can edit and create XSLT document efficiently under WYSIWYG environment.

  • PDF