• Title/Summary/Keyword: HTML 문서

Search Result 396, Processing Time 0.035 seconds

Dictionary based Web Mail Document Generator (사전기반 웹메일 문서 생성기)

  • Choi, Ji-Yeon;Min, Su-Hong;Cho, Dong-Sub
    • Proceedings of the KIEE Conference
    • /
    • 2003.07d
    • /
    • pp.2636-2638
    • /
    • 2003
  • WWW(World Wide Web)은 인터넷상에 광범위하게 분산된 다양한 형식의 데이터를 손쉽게 검색할 수 있도록 하며, 모든 응용의 사용자 환경을 손쉽게 포함시킴으로써 새로운 미디어 타입의 통합을 위한 가장 성공적인 기술로 평가받고 있다. 처음 Tim Berners-Lee에 의해 처음 개발될 당시 WWW는 텍스트 기반의 구조에 맞추어 비동기적인 형태의 검색과 상호작용을 지원하도록 설계되었다. 반면 최근 인터넷상의 상당수를 차지하는 오디오, 비디오와 같은 실시간 환경의 멀티미디어 데이터들은 연속적, 동기적이며, 대화형 특징을 포함하고 있어 WWW에서 이러한 미디어들을 통합하기 위해서는 구조적인 확장이 요구된다. 본 논문에서는 현재 가장 많이 쓰이는 WWW 기능인 e-Mail 서비스에 대한 동기적 방법론을 제안하고자 한다. e-Mail 사용자가 HTML tag에 대한 사전 지식이 없이도 사전을 기반으로 e-Mail의 형식을 지정할 수 있도록 하며 이렇게 함으로써 보다 동기적인 형태의 서비스를 구현하도록 한다.

  • PDF

A Probabilistic Method for Recognizing Unlabeled Text on Web Pages (웹페이지에서 레이블이 없는 텍스트 인식을 위한 확률 모델)

  • 정창후;이민호;주원균;맹성현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.163-165
    • /
    • 2003
  • 도메인 지식은 텍스트의 포맷과 의미 정보를 이용하여 웹에 존재하는 텍스트의 다양한 의미를 이해할 수 있도록 도와준다. 그러나 도메인 지식은 텍스트에 데이터의 의미를 표현하는 레이블이 존재하지 알을 경우에 텍스트 인식을 제대로 수행할 수 없기 때문에 무용지물이 되고 만다. 이러한 문제를 해결하기 위해 본 논문에서는 레이블이 존재하지 않는 텍스트의 의미를 효과적으로 추론할 수 있는 엔티티 인식 모델을 제안한다 엔티티 인식 모델은 베이지언 모델과 컨텍스트 정보를 결합한 방법으로서, 구조 분석을 수행한 HTML 문서의 텍스트 토큰에 대해서 어떤 엔티티에 속할 것인가를 결정하는 기능을 수행한다. 실험 결과 본 모델을 사용할 경우 기존에는 레이블이 없어서 인식되지 않았던 텍스트들을 효과적으로 인식하는 것을 확인할 수 있었다.

  • PDF

The XML-based Web Dictionary Framework (XML 기반 웹 사전 프레임워크)

  • You, Eung-Gu;Koo, Ja-Ryong;Kim, Go-Woon;Lee, Keum-Suk;Kim, Byung-Gu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1025-1028
    • /
    • 2002
  • 인터넷이 널리 사용되면서 인터넷 사용자들의 웹 사전 사용 빈도가 크게 증가하였다. 현재 다양한 형태의 웹 사전들이 다양한 서비스를 제공하고 있지만, 대부분의 웹 사전들은 검색엔진 형태의 단순질의 검색과 인덱스를 이용한 검색 기능을 제공하고, 고정된 표현 형식만을 제공한다. 또한 사전내용, 인덱스, 참조 및 관련 사이트 정보를 관리하기 위한 도구의 부재로 관리가 어렵고, 저장형식으로 HTML 을 사용하기 때문에 사전 데이터의 재사용에 문제가 있다. 따라서 본 논문에서는 기존의 웹 사전들을 사용자-관리자 측면에서 분석하여 문제점을 제시하고, 이를 해결할 수 있도록 카테고리 검색 및 히스토리 검색 서비스를 지원하고, 데이터를 XML 문서로 저장하며, 전용의 사전 관리 도구를 제공하는 XML 기반 웹 사전 프레임워크를 제안하고 구현하였다.

  • PDF

Judging Translated Web Document & Constructing Bilingual Corpus (웹 번역문서 판별과 병렬 말뭉치 구축)

  • Jee-hyung, Kim;Yill-byung, Lee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.787-789
    • /
    • 2004
  • People frequently feel the need of a general searching tool that frees from language barrier when they find information through the internet. Therefore, it is necessary to have a multilingual parallel corpus to search with a word that includes a search keyword and has a corresponding word in another language, Multilingual parallel corpus can be built and reused effectively through the several processes which are judgment of the web documents, sentence alignment and word alignment. To build a multilingual parallel corpus, multi-lingual dictionary should be constructed in each language and HTML should be simplified. And by understanding the meaning and the statistics of document structure, judgment on translated web documents will be made and the searched web pages will be aligned in sentence unit.

  • PDF

Performance Enhancement of Web Server Through Integration of Web CGI Modules (Web CGI 모듈의 통합운영 방식에 의한 웹 서버 성능개선)

  • Han, So-Hee;Min, Su-Hong;Cho, Dong-Sub
    • Proceedings of the KIEE Conference
    • /
    • 2007.07a
    • /
    • pp.1831-1832
    • /
    • 2007
  • WWW(World Wide Web)의 개발 이래 내 컴퓨터 안에만 존재하는 워드와 한글 등의 문서들은 네트워크를 타고 지구 어딘가에 있는 누군가의 모니터에 디스플레이되고 있다. 그러나 컴퓨터 기술은 이와 같은 단순한 HTML파일을 보여주기보다 방명록이나 동영상처럼 동적으로, 실시간으로 정보를 보여주는 수준으로 진화해야 했다. 이러한 기술을 처음으로 가능하게 한 것이 CGI 기술이다. 초기의 CGI 기술은 성능상의 문제로 개발과 발전을 거듭해 현재의 FastCGI나 mod_perl과 같은 기술이 제안되었다. 그러나 FastCGI나 mod_perl도 아직은 동적 정보를 제공하는 완벽한 기술은 아니며 각각 장단점을 지니고 있다. 본 논문에서는 각 기술의 장단점을 살펴보고 이들의 장점을 통합한 개선된 CGI기술을 제안한다.

  • PDF

Design and Implementation of a XML Generating Interface for an ISO 11179-based Data Registry (ISO 11179 기반 데이터 레지스트리에서의XML 생성 인터페이스 설계 및 구현)

  • Yang, Yoo-Seung;Park, Hea-Sook;Na, Hong-Seok;Baik, Doo-Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.67-70
    • /
    • 2000
  • 메타데이터를 표준화된 형태로 저장하기 위해서 제안된 데이터 레지스트리(DR)는 메타데이터의 유통을 위한 구체적인 방안을 제시하고 있지 않으며, 현재 데이터 레지스트리는 HTML을 이용한 인터페이스만을 제공하고 있다. 본 연구에서는 데이터 레지스트리에 저장된 메타데이터를 효율적으로 유통할 수 있는 방법으로 XML을 이용하였으며, 이를 위해 ISO/IEC 11179에 기반한 데이터 레지스트리로부터 XML 문서를 생성할 수 있는 인터페이스를 설계 및 구현하였다. 구현한 XML 생성 인터페이스는 데이터 레지스트리에 저장된 메타데이터를 XML 형식으로 만들어 줌으로써, 응용 프로그램들이 효과적으로 데이터 레지스트리에 접근하여 메타데이터를 이용할 수 있는 환경을 제공한다.

  • PDF

A Study on the Content Category for the Efficient Internet Content Rating System in Korea (국내에서의 효율적인 인터넷 내용등급제를 위한 내용등급 기준에 대한 연구)

  • Kim, Ung-Cheol;Kim, Il-Gon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.593-596
    • /
    • 2004
  • 인터넷은 지역이나 시간에 구애받지 않기 때문에 정보의 확산 속도가 무척 빠르다. 이에 따른 좋은 점도 많이 있지만 반면에 유해한 정보도 범람하고 있어 사회적 문제를 발생시키고 있다. 따라서 유해 정보 차단에 대한 연구 및 개발의 중요성이 부각되고 있다. 유해 정보 차단 기술중 하나인 HTML 문서를 일정한 기준에 따라 등급을 매기는 내용등급 제는 등급 및 범주가 복잡하여 등급설정에 어려움이 많아 제대로 실용이 안되고 있다. 따라서 본 논문에서는 내용등급제의 실용성을 높이기 위한 내용등급 및 범주를 제시하고자 한다.

  • PDF

A Study on Protection for Web Contents against a Spam-Robot (스팸로봇으로부터 웹컨텐츠 보호에 대한 연구)

  • Yoon, Seung-Hyun;Kim, Chang-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.1205-1208
    • /
    • 2004
  • 인터넷의 빠른 성장과 함께 다양한 웹 컨텐츠들이 사용자들에게 서비스되고 있다. 특히 상업적 목적으로 만든 사이트나 사용자들이 많은 컴뮤니티 사이트 같은 경우, 웹 컨텐츠의 정보 가치가 높기 때문에 스팸로봇에 의해 정보가 유출되는 경우가 발생한다. 이는 대부분의 웹컨텐츠가 HTML문서로 작성되어 있어 스팸로봇과 같은 도구들로부터 보안이 취약하다. 본 연구는 스팸로봇으로부터 웹컨텐츠를 보호하기 위해 이미지 보호를 위한 이미지 경로 은닉화 방법을 제시하고, 텍스트와 전자우편 메일을 보호하기 위한 방법을 제시한다.

  • PDF

A Digital Library Prototype for Access to Diverse Collections (다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축)

  • Choi Won-Tae
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.32 no.2
    • /
    • pp.295-307
    • /
    • 1998
  • This article is an overview of the digital library project, indicating what roles Koreas diverse digital collections may play. Our digital library prototype has simple architecture, consisting of digital repositories, filters, indexing and searching, and clients. Digital repositories include various types of materials and databases. The role of filters is to recognize a format of a document collection and mark the structural components of each of its documents. We are using a database management system (ORACLE and ConText) supporting user-defined functions and access methods that allows us to easily incorporate new object analysis, structuring, and indexing technology into a repository. Clients can be considered browsers or viewers designed for different document data types, such as image, audio, video, SGML, PDF, and KORMARC. The combination of navigational tools supports a variety of approaches to identifying collections and browsing or searching for individual items. The search interface was implemented using HTML forms and the World Wide Web's CGI mechanism.

  • PDF

Development of I-HTTP for supporting Interactive Learning Object (상호작용적 학습 객체 지원을 위한 I-HTTP 개발)

  • 정영식
    • Journal of the Korea Computer Industry Society
    • /
    • v.4 no.10
    • /
    • pp.713-722
    • /
    • 2003
  • The purpose of this study was to define an interactive learning object of ILO through implementation of learning object content standardization technology for the reuse of interactive tools between learners, and to develop I(Interactive)-HTTP for the ILO to properly communicate with LMS. 1-HTTP developed here was enabled to keep connection status during the entire session by improving the existing HTTP with its stateless connection property. This ceaseless connection made it possible to provide users with the real-time interactivity between learners that happened frequently in the ILO. Also, because the I-HTTP was an expanded version of HTTP, it was possible to conduct general HTML documentation as well as ILO. In particular, the standardized launch process between LMS and ILO was embodied in adding the INIT, GETVAL, SETVAL, COMMBT, FINISH methods in the protocol, and the results from the interactivity between ILO learners were channeled to the database storage to save them through separately defined data models.

  • PDF