• 제목/요약/키워드: HTML 문서

검색결과 396건 처리시간 0.032초

CSS 1 기반 WYSIWYG XML 편집기의 설계 및 구현 (A Design and Implementation of WYSIWYG XML Editor Based on CSS 1)

  • 김정훈;전상수;채진석;최한석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.293-295
    • /
    • 2000
  • XML은 HTML의 단순성과 SGML의 복잡성을 동시에 극복하기 위한 노력으로 시작되어 HTML이나 SGML과는 다른 새로운 세계를 만들어 내고 있으며, 인터넷 문서 표현과 관련된 여러 분야에서 활발하게 연구되고 있다. XML의 특징 중 하나는 문서의 내용과 표현이 분리되어 있어 하나의 문서를 여러 방법으로 표현할 수 있다는 점이다. 그러나 이러한 점은 문서의 외형을 정의하기 위해 스타일시트를 따라 만들어야 하며, 같은 결과물을 얻기 위해 HTML보다 많은 작업량이 필요하게 되는 등의 문제를 야기하게 되었다. 이 논문에서는 이러한 문제를 해결하기 위해 비교적 간단한 스타일시트 언어인 CSS 1을 기반으로 나모 웹 편집기와 같은 WYSIWYG 인터페이스를 제공하여 XML 문서를 편집할 수 있는 XML 문서편집기를 제안한다. 이 논문에서 제안하는 XML 문서편집기를 사용하면 스타일시트에 대해 잘 모르는 초보자라도 쉽게 XML 문서를 편집할 수 있을 것으로 기대된다.

  • PDF

진화연산을 이용한 웹 문서의 특성 학습 (Learning Web-Document Characteristics Using Evolutionary Computation)

  • 김선;장병탁
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 춘계학술대회 학술발표 논문집
    • /
    • pp.43-46
    • /
    • 2000
  • 대용량의 문서를 대상으로 한 정보 검색은 인터넷과 WWW이 대중화되면서 웹 분서로 확장되었다. 기존의 문서는 주로 텍스트만으로 구성되는데 반해 웹 문서는 HTML을 기반으로 문서가 작성된다. HTML은 문서의 형태를 이루게 하는 여러 종류의 태그들로 구성되어 있고 문서 작성자는 이를 이용, 자기 의도를 홈페이지에 반영한다. 따라서 태그 정보의 학습은 검색 효율을 향상시키는데 도움을 줄 수 있다. 본 논문에서는 이러한 HTML의 태그 특성을 이용해 검색 효율을 향상하는 방법을 제시한다. 제시된 방법은 진화 알고리즘을 사용하여 질의와 검색결과를 담고 있는 데이터를 학습한다. 학습을 통해 얻어지는 결고는 각 태그에 대한 가중치 정보들이며, 이는 검색엔진의 문서 가중치 정보로 사용된다. TREC 데이터를 사용하여 실험 하였으며 태그 정보를 이용함에 따른 검색 성능 변화를 비교 분석하였다.

  • PDF

객체모델링 기법을 이용한 XSLT 처리기의 설계 및 구현 (Design and Implement of an XSLT Processor Using Object-Oriented Modeling Method)

  • 인경숙;하얀;이경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.508-510
    • /
    • 2001
  • 본 XSLT 처리기는 객체모델링 기법인 UML을 기반으로 설계하였고 핵심적인 부분은 XSL 스타일 시트를 HTML 패스/스타일로부터 구성해 내는 것이다 즉 문서 작성자는 XML문서를 작성하고 파싱하여 패스 테이블을 형성하고 이 패스 테이블에 작성자는 HTML패스/스타일을 추가한다. 이를 통해 XSL의 복잡한 스타일에 대한 고려없이 문서구조와 정보에 집중하여 견고한 문서를 만들 수 있다. 즉 구조 문서인 XML과 콘텐츠 타인의 대중적인 문서형인 HTML을 이용함으로써 적은 비용으로 다양한 문서 스타일을 구성할 수 있게 하여 XML 기술을 쉽게 보급시키며 컴포넌트 제작을 통해 다른 산업영역 문서교환에서 활용할 수 있다.

  • PDF

XML 스키마의 발전

  • 홍기형
    • 지식정보인프라
    • /
    • 통권8호
    • /
    • pp.97-106
    • /
    • 2002
  • HTML이 90년대에 일반인에게 인터넷과 웹을 확산시킨 기술이라면, 1998년 W3C에 의하여 표준(recommendation)으로 제정된 XML은 HTML이 가진 한계를 극복하는 차세대 인터넷 표준 마크업 언어이다. HTML이 문서 내의 내용을 브라우저를 통하여 어떻게 보여 줄 것인가에 초점이 맞추어진 반면, XML은 문서의 내용을 정보 처리를 위한 데이터로 본다는 것이 XML의 가장 큰 특징이다.

  • PDF

HTMLtoVoiceXML 변환기의 설계 및 구현 (Design and Implementation of a HTMLtoVoiceXML Converter)

  • 최훈일;장영건
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.559-569
    • /
    • 2001
  • 음성 기술의 발달과 VoiceXML 1.0의 등장으로 인하여 표준화된 방식으로 이동 단말기와 전화를 통해 음성으로 웹 컨텐츠에 접근할 수 있게 되었다. 거의 모든 웹 컨텐츠들은 HTML로 작성되어 있으며, 기존의 HTML로 작성된 수많은 웹 컨텐츠에 음성으로 접근하기 위해서는 HTML 문서들을 VoiceXML 문서로 변환하여야 한다. 이를 수동으로 변환하기 위해서는 많은 시간과 비용이 필요하게 된다. 본 논문에서는 이 문제를 해결하기 위하여 HTML 문서를 VoiceXML 문서로 자동 변환하는 HTMLtoVoiceXML 변환기를 설계하고 구현하였으며, 그 구조를 제시하고 웹 페이지에서 중요한 내용을 포함한 조각을 지정하는 실용적인 알고리즘을 제안한다. 국내의 400여 개의 웹 페이지를 대상으로 개발된 변환기의 성능을 시험하였고, HTML문법을 정확히 지키지 않은 경우를 제외하고, 거의 모두가 VoiceXML 문서로 변화되어, 유효성과 실용성이 검증되었다.

  • PDF

웹용 다국어 기계번역을 위한 전처리기 (A Preprocessing System for Multi-Lingual Machine Translation of Web Pages)

  • 이영우;안동원;서진원;정성종
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.204-206
    • /
    • 1998
  • 여러 언어들로 작성된 웹문서들을 다국어 기계번역기에서 번역하기 위해서는 우선 해당 웹문서가 어떠한 언어로 작성되었는지를 알아내야 한다. 코드 분석을 통하여 웹문서를 작성한 언어를 알게되면 해당 언어를 번역하는 기계번역기를 작동시킬 수 있다. 또한, 웹문서에서 기계번역의 대상은 HTML 태그를 제외한 일반 문장이다. 따라서, 웹용 기계번역의 전처리기에서 웹문서에서 HTML 태그를 분리하여야 하며 번역이 완료된 후 번역된 문서에 HTML 태그를 복원하여 웹브라우저에서 번역된 문서를 볼 수 있어야 한다. 본 논문에서는 웹용 다국어 기계번역을 위한 전처리기의 태그관리기와 코드인식기를 설명한다.

  • PDF

가상문서에서 질의 링크 처리를 위한 설계 및 구현 (A Design and Implementation for processing Query Links in Virtual Documents)

  • 강민구;김철수;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.169-171
    • /
    • 2001
  • XML을 기반으로 하는 가상문서는 인터넷 상의 정보 공유를 가능하게 하여 새로운 지식을 생성할 수 있도록 한다. 가상문서에서는 비정형(텍스트, 이미지, 멀티미디어 데이터)과 준정형(HTML, XML) 데이터를 링크로 연결하여 정보를 제공하고 있다. HTML과 같은 기존의 웹 문서에서는 스크립트나 CGI 같은 것을 통하여 정형 데이터(데이터베이스)의 정보를 제공하고 있으므로 가상문서에서도 자연스럽게 정형 데이터를 연결하여 사용이 가능하다. 본 논문에서는 디지털 도서관 시스템에서 정형 데이터를 지원하기 위해 질의 링크를 포함하는 가상문서를 효율적으로 처리할 수 있도록 데이터베이스를 설계 및 구현하며, 데이터베이스 스키마 정보를 관리하여 필요한 데이터베이스를 검색하여 질의 링크의 생성을 돕도록 하였다.

  • PDF

XML 문서 검색 시스템 설계 (Design of an XML Documents search system)

  • 정지문;이문목;최성
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2000년도 추계학술대회
    • /
    • pp.134-139
    • /
    • 2000
  • 컴퓨터의 보급 확대, 초고속 통신망 구축 그리고 사용하기 쉬운 브라우저의 개발에 힘입은 웹의 급속한 발전에 의해 인터넷 이용자들이 기하급수적으로 증가하게 되었다. 이러한 웹의 발전에 무엇보다도 크게 영향을 끼친 것 중의 하나가 바로 HTML(Hyper-Text Markup Language)일 것이다. HTML은 SGML(Standard Generalized Markup Language)을 기반으로 한 DTD(Document Type Definition)에 의해 정의되어 있는 한정된 태그(Tag)만을 사용하도록 되어 있어 단순한 홈페이지 작업을 하기에는 매우 용이하나 대용량의 복잡하고 다양한 작업을 하기는 쉽지 않았다. HTML의 단점을 극복하기 위해 개발된 XML은 문서에 대한 의미 공유와 서로 다른 애플리케이션 및 호환이 되지 않는 데이터베이스간의 정보 전달 기능들을 효율적으로 수행할 수 있다. 하지만, 현재 대부분의 XML문서 검색 엔진들은 문서의 구조 정보에 기반한 검색에 중점을 둔 반면, 태그의 의미를 이용한 검색은 지원하지 못한다. 본 논문에서는 XML문서의 보다 효율적인 검색을 지원하기 위해 데이터 레지스트리를 이용하여 태그의 의미를 명시하고 이에 기반한 XML문서 검색 시스템을 연구하였다.

HTML 문서의 테이블 식별을 위한 효율적인 알고리즘 (An Efficient Algorithm for Detecting Tables in HTML Documents)

  • 김연석;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권10호
    • /
    • pp.1339-1353
    • /
    • 2004
  • HTML의 table 태그는 연관된 정보를 기술하기 위한 테이블은 물론이고 웹 문서의 레이아웃을 표현하기 위하여 사용된다. 본 논문에서 는 웹으로부터 유용한 정보를 추출하기 위한 목적의 일환으로 HTML 문서로부터 테이블을 식별하는 효율적인 방법을 제안한다. 제안된 방법은 전처리와 속성-값 연관관계 추출의 두 단계로 구성된다. 전처리 단계에서는 진짜 테이블 또는 레이아웃용으로 사용된 table 태그의 일반적인 특징을 반영한 규칙을 적용하여 진짜 또는 가짜로 명확히 식별이 가능한 table태그를 추출한다. 속성-값 연관관계 추출 단계에서는 테이블 영역을 속성 및 값 영역으로 구분한 후, 값 영역에 대하여 구문적 일관성 검사를 수행한다. 또한 값 영역의 크기가 작아서 구문적 일관성 검사를 수행할 수 없는 경우, 속성-값 영역의 의미적 일관성을 검사한다. 제안된 방법의 성능을 평가하기 위하여 1,393개의 HTML문서로부터 추출한 11,477개의 table 태그를 대상으로 실험한 결과, 평균적으로 97.54%의 정확률과 99.22%의 재현률을 보여 기존 연구보다 우수하였다.

  • PDF

WYSIWYG 환경에서 XML 문서 변환을 위한 XSLT 문서편집 시스템 (XSLT document editing for XML document conversion in WYSIWYG environment)

  • 차원준;박주상;이용준;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.500-503
    • /
    • 2003
  • 인터넷 상에서 데이터 교환의 표준으로 광범위하게 사용되고 있는 XML(extensible Markup Language)은 HTML(HyperText Markup Language) 등의 기존의 문서 작성 언어를 대치할 기술로 주목받고 있다. 이러한 XML의 가장 큰 특징은 문서의 구조적인 내용을 표함하는 논리정보와 문서의 스타일을 표현하는 물리적인 정보가 분리되었다는 점이다. 이에 W3C(World Wide Web Consortium)에서는 XML의 스타일과 데이터 변환을 위하여 HTML과 유사한 형식의 스타일 기능을 제공하는 XSL(eXtensible Stylesheet Language)을 권고하였다. 또한 XSL의 변환(XSLT : XSL Transformation)기능은 XML 문서를 다른 데이터 형식으로 변환해주는 기능을 제공하며, 다양한 문서 형식으로의 변환을 통해 스타일 정보를 기술할 수 있다. 그러나 국내에는 XSLT 기술을 이용한 XML 문서 변환 기술이 미비한 실정이며, XSLT 문서를 효율적으로 편집할 수 있는 솔루션에 대한 필요성이 대두되고 있다. 이에 본 논문은 XML 문서를 다양한 문서 형식으로 변환 및 출력이 가능하고, WYSIWYG 환경하에서 XSLT문서를 효율적으로 편집하고 저작할 수 있는 XSLT 문서편집 시스템을 설계 및 구현하였다.

  • PDF