• 제목/요약/키워드: HTML 문서

검색결과 396건 처리시간 0.022초

사용자 정보에 기반한 XML문서 전달 시스템 (A Personalized XML Documents Delivery System)

  • 유상원;이형동;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권5호
    • /
    • pp.487-497
    • /
    • 2003
  • 그동안 메일이나 뉴스등을 필터링하여 사용자에게 전달해 주는 많은 시스템들이 개발되었다. 이 시스템들이 필터링하는 문서들은 일반 덱스트나 HTML으로 작성된 것들이었다. 새로운 정보 교환 표준으로 떠오르고 있는 XML은 문서를 필터링하는 시스템들에 있어서도 다른 접근 방법을 요구하고 있다. 본 논문에서 구현한 시스템은 XML이 가진 스키마 표현 능력과 구조 정보를 이용하여 사용자 정보를 기술하는 방법을 제안한다. 사용자 정보는 DTD로부터 추출된 정보를 이용하여 DTD를 따르는 문서내의 특정 부분을 가리킬 수 있도록 만들어진다. 또한 기존의 필터링 시스템이 문서단위의 필터링에 초점을 맞추고 있는 것을 개선하기 위해 문서에서 사용자가 원하는 부분만을 제공하고 있다. 사용자 정보는 XML질의에 반영되어 XML로 이루어진 문서에서 일부분을 얻어내는데 사용된다.

온라인 대화 행위에서 XML 기반 메시지를 이용한 미디어 지원 (Supporting Media using XML-based Messages on Online Conversational Activity)

  • 김경덕
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.91-98
    • /
    • 2004
  • 본 논문에서는 온라인 대화 행위에서 다양한 미디어를 지원하기 위하여 XML(eXtensible Markup Language)을 이용하는 방법을 제안한다. 제안한 방법은 온라인 대화 행위에서 미디어 정보를 XML 기반 메시지로 변환하여 기존 텍스트 기반 메시지와 유사하게 처리한다. 이때 XML 기반 메시지와 미디어는 서버에 저장되며, XML 기반 메시지는 하나의 XML 문서로 통합된 후 XSLT 문서를 적용하여 HTML 문서를 생성한다. 각 클라이언트의 대화자는 HTML 문서의 하이퍼링크를 이용하여 미디어를 재생 및 프레젠테이션 한다. 제안한 방법은 온라인 대화 행위에서 텍스트, 이미지, 오디오, 비디오 등의 다양한 미디어의 사용을 효율적으로 지원하고, 또한 XML 태그의 확장 및 변경에 따라 텍스트 기반 메시지의 글자 크기, 색깔, 스타일 등의 유지보수에 효율적이다. 적용 예로서, 온라인 대화 행위에서 미디어를 지원하기 위하여 클라이언트-서버구조를 가지는 시스템을 구현하였으며, 각 대화자는 웹 브라우저에서 JAVA 애플릿과 서블릿을 사용하여 텍스트 및 미디어 기반 메시지를 입력하며, 대화자가 메시지를 입력할 때마다 대화 메시지가 자동으로 갱신되도록 하였다. 대화자는 사용자 인터페이스상의 대화 메시지에서 하이퍼링크의 클릭으로 미디어를 재생 및 프레젠테이션 한다. 제안한 방법의 응용 분야로는 원격 교육, 게임, 협업 등이다.

전문 웹 사이트에서의 통계적 기법과 태그 정보를 이용한 문서 분류 (Web Document Clustering Using Statistical Techniques & Tag Information on the Specific-Domain Web site)

  • 조은휘;변영태
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.297-302
    • /
    • 2002
  • 특정 영역에 대해 사용자에게 관련 정보를 제공하는 서비스를 위해 정보 에이전트를 개발하고 있다. 이 시스템은 웹 상에서 문서를 수집해 오는데 특정 영역과 관련한 지식베이스를 토대로 하고 있는데, 이들 중 몇몇 전문 사이트 내의 정보가 많이 포함되어 있음을 볼 수 있다. 그러므로 전문 사이트 내의 관련 문서 수집은 중요한 의의가 있다. 본 논문에서는 이들 전문 사이트 내의 전문 문서 수집을 위해 문서간의 유사성을 토대로 클러스터링 한다. 즉, 문서내의 텀(term)과 HTML 태그(tag), 지식베이스의 WordNet 계층구조를 data로 하고 SVD(Singular Value Decomposition)을 사용하여 문서간의 관계를 밝혀내었다.

  • PDF

학습 추론을 이용한 GUI 기반의 HTML2XML 래퍼 (GUI-based HTML2XML Wrapperusing Inductive Reasoning)

  • 장문성;정재목;최일환;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.311-320
    • /
    • 2002
  • 래퍼(wrapper)는 미리 입력된 추출 규칙을 바탕으로 특정 정보 소스에서 원하는 정보를 추출, 가공하는 모듈이다. HTML-XML 래퍼(HTML Wrapper for XML)는 HTML로 이루어진 웹 정보에서 특정 정보를 XML 문서 형태로 추출한다. 사람이 추출 규칙을 직접 작성하는 일은 단순 반복적이고 지루한 일이므로, 최소의 노력으로 쉽고 빠르게 이를 생성할 수 있어야 한다. 본 논문에서는 기존의 스크립팅 방식에 GUI를 통한 학습 추론 방법을 통합하여 추출 규칙 생성 작업을 최소화 하는 방법을 제시한다.

XML 컴포넌트 명세서 기반의 컴포넌트 검색 기법 (A Search Method for Components Based-on XML Component Specification)

  • 박서영;신영길;우치수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권2호
    • /
    • pp.180-192
    • /
    • 2000
  • 최근 들어 컴포넌트는 소프트웨어 재사용의 핵심 기술로 인식되고 있다. 컴포넌트는 인터페이스 부분만을 이용하여 개발되는 소프트웨어에 바로 바인딩시켜 재사용될 수 있는 독립적인 바이너리 코드이다. 많은 컴포넌트 사용자들이 인터넷 상에서 적합한 컴포넌트를 검색하고 사용할 수 있도록, 컴포넌트 명세서는 웹 문서 형태를 사용하는 것이 바람직하다. 기존의 HTML 웹 문서 기반의 검색 엔진을 통하여 컴포넌트를 검색할 때 정확한 의미 검색이 불가능하다는 문제점이 있다. 본 논문에서는 정확한 의미 검색을 수행할 수 있도록 컴포넌트 명세서를 HTML 문서 대신 XML 문서로 사용할 것을 제안한다. 또한, XML 컴포넌트 명세서를 통하여 사용자가 원하는 컴포넌트를 정확하게 검색할 수 있는 XML 문맥 기반 검색(context-based search)을 제안한다. 문맥 기반 검색은 컴포넌트의 특성을 나타내는 문맥(context)과 컴포넌트 특성의 실제 값인 용어(term)를 사용하여 사용자가 원하는 컴포넌트의 특성을 정확하게 질의하고 검색할 수 있는 방법이다. 이 검색 방법은 용어-문맥-컴포넌트 명세서 순으로 된 역화일 인덱싱 (Inverted File Indexing) 방법을 사용한다. 이와 함께 사용자의 편의를 위하여, 기존의 소프트웨어 재사용 라이브러리에서 사용되던 검색 방법인 키워드 검색, 퍼싯 검색, 브라우징 검색 방법 등을 지원한다. 이들 다양한 검색 방법들은 인터페이스 레이어, 질의 확장 레이어, XML 검색 엔진 레이어 등 3-레이어 검색엔진 구조를 통한 효율적인 인덱스 스킴에 의해 지원된다. 본 논문에서는 컴포넌트 사용자들이 원하는 컴포넌트를 정확하게 검색할 수 있도록 하기 위하여 컴포넌트 명세서를 대한 XML DTD(Document Type Definition)를 정의하고, HTML 기반 검색 방법과 XML 기반 검색 방법에 대한 컴포넌트 검색 성능을 비교한다.

  • PDF

HTML 논리적 구조분석을 통한 본문추출 알고리즘 (Text Extraction Algorithm using the HTML Logical Structure Analysis)

  • 전현지;고찬
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권3호
    • /
    • pp.445-455
    • /
    • 2015
  • 인터넷과 컴퓨터 기술이 발전함에 따라 정보의 양이 폭발적으로 증가하였으며, 이로 인해 다양한 웹 저작 도구 및 새로운 웹 표준의 출현과 웹에 대한 접근성이 보다 편리해지면서 매우 다양한 종류의 웹 콘텐츠들이 아주 빠르게 생산되고 있다. 하지만 웹 문서는 여러 블록으로 나누어 다양한 주제를 담아내고 있으며, 각각의 블록들이 서로 연관성이 없는 주제를 다루는 경우가 많을 뿐만 아니라 네비게이션, 단순한 장식물, 광고, 저작권 정보 등과 같이 콘텐츠로 볼 수 없는 블록들도 존재한다. 이러한 문제를 해결하기 위해 HTML 웹 문서의 정확한 본문영역만을 추출하여 사용자 요구조건을 충족하고 효과적으로 정보를 학습할 수 있도록 하며, 추후에는 문서를 체계적으로 관리할 수 있게 최적화된 웹 검색 시스템으로서의 재구성 방법을 제안하고자 한다.

인터넷 웹페이지의 음성합성을 위한 엔진 및 플러그-인 설계 및 구현 (Design and Implementation of a Speech Synthesis Engine and a Plug-in for Internet Web Page)

  • 이희만;김지영
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.461-469
    • /
    • 2000
  • 본 논문은 인터넷 웹페이지의 텍스트 정보를 추출하여 이를 음성으로 합성하기 위한 음성합성 엔진 및 넷스케이프 플러그인의 설계 및 구현에 관한 것이다. 인터넷 웹페이지를 음성으로 합성하는 방법은 audio/x-esp MIME 타입을 임베딩한 웹페이지가 발견되면서 이에 상응하는 플러그-인이 작되며 해당 플러그인은 URL로 지정된 HTML 문서를 네트워크에서 가져와 컴맨더 모브젝트에 보내교, 컴맨더 오브젝트는 HTML 문서를 파싱하여 합성엔진 제어용 TAG를 추출한다. 제어용 TAG에는 음성합성 데이터베이스 변경 및 합성음의 길이 또는 피치조절 파라미터 등의 정보를 갖고 있어 동적으로 합성음을 제어할 수 있다. 또한 컴맨더 오브젝트는 HTML 문서 내부의 특정 태그로 지정된 문장을 추출하여 전처리 과정을 수행한 후 합성엔진을 위한 컴맨드 스트림을 발생한다. 음성합성엔진은 컴맨드 스트림을 훼치(Fetch)하여 명령어를 해석하고 해당 명령어를 상응하는 멤버함수를 실행하여 음성을 합성한다. 컴맨더 오브젝트와 음성합성엔진은 각각 독립적인 객체로 설계하여 이식성과 유연성을 높인다.

  • PDF

XML 문서를 위한 역할 기반 접근 제어 (Role-based Access Control for XML Documents)

  • 신휴근;이원석;김동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.323-325
    • /
    • 2003
  • 인터넷이 대중화 되면서 HTML 기반의 웹 어플리케이션을 통한 정보 공유가 활발해지고 있다. 그러나 HTML이 가지는 한계로 인해 HTML만을 이용하여 정보 보호 서비스를 제공하는 것은 불가능하다. 이를 해결하기 위해 SGML의 복잡한 특성을 단순화하여 만든 " 언어를 위한 언어" XML (extensible Markup Language) 을 이용할 수 있다. 본 논문에서는 계층적 특성을 가지는 XML을 이용하여 다양한 정보 보호 서비스 중에서 접근제어 서비스를 제공하려 한다. 기존의 임의적 접근제어 모델(MAC)과 강제적 접근제어 모델 (DAC)이 가지는 단점을 보완하면서 사용자와 객체간의 관계를 유연하게 설정할 수 있는 역할 기반 접근제어(RBAC) 모델을 적용하는 “XML문서를 위한 접근제어 모델” 을 제안하려고 한다. 제안하려고 한다.

  • PDF

Java 프로그램의 정보공유를 위한 XML DTD 설계 (The Design of XML DTD for Information Sharing of Java Program)

  • 장근실;유철중;장옥배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.510-512
    • /
    • 1999
  • 개발환경이 고정된 장소에서 분산된 장소로 점차 변함에 따라서 프로젝트나 프로그래밍에 관련된 주변인들 사이에 발생할 수 있는 정보 공유와 교환이 어려워지고 있다. 인터넷과 인트라넷의 급격한 증가로 인해 개발자들은 분산된 환경에서 작업을 수행하는 일이 많아지면서 기존의 HTML을 이용한 문서의 공유나 교환은 HTML의 제한점들로 인해 많은 부담이 된다. 본 논문에서는 분산환경에서 정보공유와 교환을 위해 HTML의 제한점들을 보안하여 확장성이 뛰어나고, 사용자 정의 태그를 지원하며, 문서의 논리적인 정보를 제공할 수 있는 XML을 이용하여 급격한 사용자 증가를 얻고 있는 Java 프로그램을 대상을 하는 정보 공유와 교환에 필요한 정보들을 각 모듈별로 제안하고, 제안된 정보에 대한 HML DTD를 설계한다.

  • PDF

Oracle8i XDK를 이용한 XML 문서의 저장 (Storing XML Documents using Oracle8i XDK)

  • 하상호;이강석;백인천
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.324-327
    • /
    • 2000
  • XML은 웹 상에서 데이터의 원활한 교환을 위해서 HTML을 보완하여 설계된 차세대 인터넷문서작성용언어이다. XML 문서와 같은 반구조(semistructured) 의 특성을 갖는 데이터를 효과적으로 다루기 위한 새로운 데이터모델과 질의어가 제안되어 오고 있지만, 여기서는 관계형 데이터베이스에 XML 문서를 효과적으로 저장하는 방법에 관해서 논의한다. 먼저, 도서를 표현하는 XML 문서를 위한 DTD를 제시하고, 이 DTD를 관계 테이블로 변환하는 방법을 논의한다. 다음에는 Oracle서 지원하는 XDK를 이용하여 XML문서를 Oracle8i DB에 저장하는 방법에 대해서 논의한다.

  • PDF