• 제목/요약/키워드: HTML 문서

검색결과 396건 처리시간 0.033초

사전기반 웹메일 문서 생성기 (Dictionary based Web Mail Document Generator)

  • 최지연;민수홍;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 D
    • /
    • pp.2636-2638
    • /
    • 2003
  • WWW(World Wide Web)은 인터넷상에 광범위하게 분산된 다양한 형식의 데이터를 손쉽게 검색할 수 있도록 하며, 모든 응용의 사용자 환경을 손쉽게 포함시킴으로써 새로운 미디어 타입의 통합을 위한 가장 성공적인 기술로 평가받고 있다. 처음 Tim Berners-Lee에 의해 처음 개발될 당시 WWW는 텍스트 기반의 구조에 맞추어 비동기적인 형태의 검색과 상호작용을 지원하도록 설계되었다. 반면 최근 인터넷상의 상당수를 차지하는 오디오, 비디오와 같은 실시간 환경의 멀티미디어 데이터들은 연속적, 동기적이며, 대화형 특징을 포함하고 있어 WWW에서 이러한 미디어들을 통합하기 위해서는 구조적인 확장이 요구된다. 본 논문에서는 현재 가장 많이 쓰이는 WWW 기능인 e-Mail 서비스에 대한 동기적 방법론을 제안하고자 한다. e-Mail 사용자가 HTML tag에 대한 사전 지식이 없이도 사전을 기반으로 e-Mail의 형식을 지정할 수 있도록 하며 이렇게 함으로써 보다 동기적인 형태의 서비스를 구현하도록 한다.

  • PDF

웹페이지에서 레이블이 없는 텍스트 인식을 위한 확률 모델 (A Probabilistic Method for Recognizing Unlabeled Text on Web Pages)

  • 정창후;이민호;주원균;맹성현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.163-165
    • /
    • 2003
  • 도메인 지식은 텍스트의 포맷과 의미 정보를 이용하여 웹에 존재하는 텍스트의 다양한 의미를 이해할 수 있도록 도와준다. 그러나 도메인 지식은 텍스트에 데이터의 의미를 표현하는 레이블이 존재하지 알을 경우에 텍스트 인식을 제대로 수행할 수 없기 때문에 무용지물이 되고 만다. 이러한 문제를 해결하기 위해 본 논문에서는 레이블이 존재하지 않는 텍스트의 의미를 효과적으로 추론할 수 있는 엔티티 인식 모델을 제안한다 엔티티 인식 모델은 베이지언 모델과 컨텍스트 정보를 결합한 방법으로서, 구조 분석을 수행한 HTML 문서의 텍스트 토큰에 대해서 어떤 엔티티에 속할 것인가를 결정하는 기능을 수행한다. 실험 결과 본 모델을 사용할 경우 기존에는 레이블이 없어서 인식되지 않았던 텍스트들을 효과적으로 인식하는 것을 확인할 수 있었다.

  • PDF

XML 기반 웹 사전 프레임워크 (The XML-based Web Dictionary Framework)

  • 유응구;구자룡;김고운;이금석;김병구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1025-1028
    • /
    • 2002
  • 인터넷이 널리 사용되면서 인터넷 사용자들의 웹 사전 사용 빈도가 크게 증가하였다. 현재 다양한 형태의 웹 사전들이 다양한 서비스를 제공하고 있지만, 대부분의 웹 사전들은 검색엔진 형태의 단순질의 검색과 인덱스를 이용한 검색 기능을 제공하고, 고정된 표현 형식만을 제공한다. 또한 사전내용, 인덱스, 참조 및 관련 사이트 정보를 관리하기 위한 도구의 부재로 관리가 어렵고, 저장형식으로 HTML 을 사용하기 때문에 사전 데이터의 재사용에 문제가 있다. 따라서 본 논문에서는 기존의 웹 사전들을 사용자-관리자 측면에서 분석하여 문제점을 제시하고, 이를 해결할 수 있도록 카테고리 검색 및 히스토리 검색 서비스를 지원하고, 데이터를 XML 문서로 저장하며, 전용의 사전 관리 도구를 제공하는 XML 기반 웹 사전 프레임워크를 제안하고 구현하였다.

  • PDF

웹 번역문서 판별과 병렬 말뭉치 구축 (Judging Translated Web Document & Constructing Bilingual Corpus)

  • Jee-hyung, Kim;Yill-byung, Lee
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.787-789
    • /
    • 2004
  • People frequently feel the need of a general searching tool that frees from language barrier when they find information through the internet. Therefore, it is necessary to have a multilingual parallel corpus to search with a word that includes a search keyword and has a corresponding word in another language, Multilingual parallel corpus can be built and reused effectively through the several processes which are judgment of the web documents, sentence alignment and word alignment. To build a multilingual parallel corpus, multi-lingual dictionary should be constructed in each language and HTML should be simplified. And by understanding the meaning and the statistics of document structure, judgment on translated web documents will be made and the searched web pages will be aligned in sentence unit.

  • PDF

Web CGI 모듈의 통합운영 방식에 의한 웹 서버 성능개선 (Performance Enhancement of Web Server Through Integration of Web CGI Modules)

  • 한소희;민수홍;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.1831-1832
    • /
    • 2007
  • WWW(World Wide Web)의 개발 이래 내 컴퓨터 안에만 존재하는 워드와 한글 등의 문서들은 네트워크를 타고 지구 어딘가에 있는 누군가의 모니터에 디스플레이되고 있다. 그러나 컴퓨터 기술은 이와 같은 단순한 HTML파일을 보여주기보다 방명록이나 동영상처럼 동적으로, 실시간으로 정보를 보여주는 수준으로 진화해야 했다. 이러한 기술을 처음으로 가능하게 한 것이 CGI 기술이다. 초기의 CGI 기술은 성능상의 문제로 개발과 발전을 거듭해 현재의 FastCGI나 mod_perl과 같은 기술이 제안되었다. 그러나 FastCGI나 mod_perl도 아직은 동적 정보를 제공하는 완벽한 기술은 아니며 각각 장단점을 지니고 있다. 본 논문에서는 각 기술의 장단점을 살펴보고 이들의 장점을 통합한 개선된 CGI기술을 제안한다.

  • PDF

ISO 11179 기반 데이터 레지스트리에서의XML 생성 인터페이스 설계 및 구현 (Design and Implementation of a XML Generating Interface for an ISO 11179-based Data Registry)

  • 양유승;박혜숙;나홍석;백두권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.67-70
    • /
    • 2000
  • 메타데이터를 표준화된 형태로 저장하기 위해서 제안된 데이터 레지스트리(DR)는 메타데이터의 유통을 위한 구체적인 방안을 제시하고 있지 않으며, 현재 데이터 레지스트리는 HTML을 이용한 인터페이스만을 제공하고 있다. 본 연구에서는 데이터 레지스트리에 저장된 메타데이터를 효율적으로 유통할 수 있는 방법으로 XML을 이용하였으며, 이를 위해 ISO/IEC 11179에 기반한 데이터 레지스트리로부터 XML 문서를 생성할 수 있는 인터페이스를 설계 및 구현하였다. 구현한 XML 생성 인터페이스는 데이터 레지스트리에 저장된 메타데이터를 XML 형식으로 만들어 줌으로써, 응용 프로그램들이 효과적으로 데이터 레지스트리에 접근하여 메타데이터를 이용할 수 있는 환경을 제공한다.

  • PDF

국내에서의 효율적인 인터넷 내용등급제를 위한 내용등급 기준에 대한 연구 (A Study on the Content Category for the Efficient Internet Content Rating System in Korea)

  • 김웅철;김일곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.593-596
    • /
    • 2004
  • 인터넷은 지역이나 시간에 구애받지 않기 때문에 정보의 확산 속도가 무척 빠르다. 이에 따른 좋은 점도 많이 있지만 반면에 유해한 정보도 범람하고 있어 사회적 문제를 발생시키고 있다. 따라서 유해 정보 차단에 대한 연구 및 개발의 중요성이 부각되고 있다. 유해 정보 차단 기술중 하나인 HTML 문서를 일정한 기준에 따라 등급을 매기는 내용등급 제는 등급 및 범주가 복잡하여 등급설정에 어려움이 많아 제대로 실용이 안되고 있다. 따라서 본 논문에서는 내용등급제의 실용성을 높이기 위한 내용등급 및 범주를 제시하고자 한다.

  • PDF

스팸로봇으로부터 웹컨텐츠 보호에 대한 연구 (A Study on Protection for Web Contents against a Spam-Robot)

  • 윤승현;김창수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1205-1208
    • /
    • 2004
  • 인터넷의 빠른 성장과 함께 다양한 웹 컨텐츠들이 사용자들에게 서비스되고 있다. 특히 상업적 목적으로 만든 사이트나 사용자들이 많은 컴뮤니티 사이트 같은 경우, 웹 컨텐츠의 정보 가치가 높기 때문에 스팸로봇에 의해 정보가 유출되는 경우가 발생한다. 이는 대부분의 웹컨텐츠가 HTML문서로 작성되어 있어 스팸로봇과 같은 도구들로부터 보안이 취약하다. 본 연구는 스팸로봇으로부터 웹컨텐츠를 보호하기 위해 이미지 보호를 위한 이미지 경로 은닉화 방법을 제시하고, 텍스트와 전자우편 메일을 보호하기 위한 방법을 제시한다.

  • PDF

다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축 (A Digital Library Prototype for Access to Diverse Collections)

  • Choi Won-Tae
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.295-307
    • /
    • 1998
  • 본 논문은 다양한 유형으로 구성되어 있는 디지털 도서관의 장서가 어떠한 역할을 수행하는지를 나타내는 디지털 도서관의 구축에 관한 것이다. 본 연구에서 구축된 디지털도서관의 프로토타입은 디지털 리포지토리, 필터, 색인 및 검색, 클라이언트의 구조로 되어 있다. 디지털 리포지토리는 여러 가지 유형의 문서유형과 다양한 형태의 데이터베이스로 구성된다. 필터는 다양한 문헌의 포맷을 인식하고 문헌 각각의 조직적인 요소를 지능적으로 구분하는 역할을 수행한다. 본 시스템은 관계형 데이터베이스 관리 시스템인 ORACLE과 ConText를 이용하여 구성되었으며 새로운 객체의 분석 및 조직화, 색인기술의 적용을 용이하게 처리할 수 있다. 클라이언트는 여러 유형의 데이터 포맷(이미지, 오디오 비디오 SGML, PDF, KORMARC 등)의 디스플레이를 위한 브라우저, 뷰어이다. 이용자는 이러한 도구들을 이용하여 문헌을 구분하고 각각의 아이템을 브라우징하고 탐색할 수 있다. 본 연구의 탐색 인터페이스는 HTML과 WWW의 CGI를 이용하여 구현되었다.

  • PDF

상호작용적 학습 객체 지원을 위한 I-HTTP 개발 (Development of I-HTTP for supporting Interactive Learning Object)

  • 정영식
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권10호
    • /
    • pp.713-722
    • /
    • 2003
  • 본 연구에서는 학습자간 상호작용 도구를 재사용하기 위해서 학습 객체 콘텐츠 표준화 기술을 적용하여 상호작용적 학습 객체인 ILO를 정의하고, 이것이 LMS와 원활하게 통신할 수 있도록 I-HTTP를 개발하였다. 1-HTTP는 비지속적 연결성을 갖는 기존의 HTTP를 개선하여 일정 세션 유지 시간 동안 접속 상태를 지속하도록 하였다. 이러한 지속적인 연결로 인해 ILO 내에서 빈번하게 발생하는 학습자간 상호작용을 실시간으로 제공할 수 있었다. 또한 I-HTTP는 기존의 HTTP를 확장하였기 때문에 ILO는 물론 일반 HTML 문서도 처리할 수 있게 하였다 특히 LMS와 ILO간의 표준화된 런치 과정을 프로토콜 내의 INIT, GETVAL, SETVAL, COMMIT, FINISH 메소드를 추가하여 구현하였으며, ILO의 학습자간 상호작용 결과는 별도로 정의된 데이터 모델을 통하여 데이터베이스 서버에 저장될 수 있도록 하였다.

  • PDF