• 제목/요약/키워드: Hypertext Structure

검색결과 28건 처리시간 0.03초

유사 패턴을 갖는 HTML 문서의 XML 자동 변환 (Automatically Converting HTML Documents with Similar Pattern into XML Documents)

  • 오금용;황인준
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.355-364
    • /
    • 2002
  • 최근 들어, WWW(World Wide Web)의 급속한 보급으로 많은 양의 정보가 생성되고 있다. 이로 인하여 웹은 이제 정보 교환의 도구로서 뿐 아니라 정보의 저장소로 인식되게 되었다. 현재 웹상의 많은 문서들은 HTML(Hypertext Markup Language)을 사용하여 제작되었다. HTML은 간단하고 배우기가 쉬운 반면, 데이터에 대한 기술을 명확하게 하지 못하는 단점으로 인해 정보 검색에 있어서 효율성을 제공하지 못한다. 이를 보완하기 위한 방법 중에 하나가 구조적인 언어로 부상하고 있는 XML(eXtensible Markup Language) 문서로 변환하는 것이다. XML은 웹 상에서 데이터 교환을 위해 제안된 표준 메타 언어이다. 효과적인 데이터의 교환을 위해, XML은 DTD(Document Type Definition)를 통하여 문서의 구조를 기술할 수 있고 사용자가 원하는 대로 정의할 수 있다. 이러한 구조적 유동성은 웹에서 운용되는 모든 데이터를 통합, 저장, 처리할 수 있는 기반을 제공한다. 본 논문에서는 특히 유사한 패턴을 갖는 HTML 문서의 구조를 분석하고 그에 관련된 경로 정보를 인식하는 방식을 이용하여 XML 문서로의 변환을 자동적으로 수행할 수 있는 XML 변환기를 구현하였다.

웹의 연결구조로부터 Hub와 Authority를 효과적으로 도출하기 위한 상호강화모델의 확장 (An Extended Mutual Reinforcement Model for Finding Hubs and Authorities from Link Structures on the WWW)

  • 황인수
    • 한국경영과학회지
    • /
    • 제30권2호
    • /
    • pp.1-11
    • /
    • 2005
  • The network structures of a hyperlinked environment can be a rich source of information about the contents of the environment and it provides effective means for understanding it. Recently, there have been a number of algorithms proposed analyzing hypertext link structure so as to determine the best authorities for a given topic or query. In this paper, we review the algorithm of mutual reinforcement relationship for finding hubs and authorities from World Wide Web, and suggest SHA, a new approach for link-structure analysis, which uses the relationships among a set of relative authoritative pages, a set of hub pages, and a set of super hub pages.

Analysis of Aggregated HTTP-based Video Traffic

  • Biernacki, Arkadiusz
    • Journal of Communications and Networks
    • /
    • 제18권5호
    • /
    • pp.826-836
    • /
    • 2016
  • Increase of hypertext transfer protocol (HTTP)-based video popularity causes that broadband and Internet service providers' links transmit mainly multimedia content. Network planning, traffic engineering or congestion control requires understanding of the statistical properties of network traffic; therefore, it is desirable to investigate the characteristic of traffic traces generated, among others, by systems which employ adaptive bit-rate streaming. In our work, we investigate traffic originating from 120 client-server pairs, situated in an emulated laboratory environment, and multiplexed onto a single network link. We show that the structure of the traffic is distinct from the structure generated by first and second generation of HTTP video systems, and furthermore, not similar to the structure of general Internet traffic. The obtained traffic exhibits negative correlations, anti-persistence, and its distribution function is skewed to the right. Furthermore, we show that the traffic generated by clients employing the same or similar play-out strategies is positively correlated and synchronised (clustered), whereas traffic originated from different play-out strategies shows negative or no correlations.

Hierarchical Web Structuring Using Integer Programming

  • 이우기;김승;김한도;강석호
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2004년도 추계학술대회 및 정기총회
    • /
    • pp.51-67
    • /
    • 2004
  • World Wide Web is nearly ubiquitous and the tremendous growing number of Web information strongly requires a structuring framework by which an overview visualization of Web sites has provided as a visual surrogate for the users. We have a viewpoint that the Web site is a directed graph with nodes and arcs where the nodes correspond to Web pages and the arcs correspond to hypertext links between the Web pages. In dealing with the WWW, the goal in this paper is not to derive a naive shortest path or a fast access method, but to generate an optimal structure based on the context centric weight. We modeled a Web site formally so that a integer programming model can be formulated. Even if changes such as modification of the query terms, the optimized Web site structure can be maintained in terms of sensitivity.

  • PDF

하이퍼텍스트의 정보구조를 제공한 e-Book 인터페이스 환경에서 학습자의 정보처리유형이 학업성취도 및 사용편의성에 미치는 효과 (An e-Book Interface by Providing Visual Information of Hypertext Structure Will be Affect Learning Comprehension and Usability According to Learner's Learning Preferences)

  • 성은모
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.483-496
    • /
    • 2012
  • 학습자의 정보처리유형에 따른 e-Book 인터페이스의 설계 및 개발은 학습자 중심의 적성처지교수를 위해 중요한 이슈가 된다. 이에 본 연구에서는 하이퍼텍스트 정보구조가 제공된 e-Book 학습환경에서 학습자의 정보처리유형이 학습내용 이해 및 사용 편의성에 있어 어떠한 차이를 보이는지를 검증해 봄으로써 보다 처방적인 e-Book 인터페이스의 설계전략에 대한 시사점을 제공하고자 하였다. 본 연구를 위해 대학생 68명이 참여하였으며, 하이퍼텍스트 정보구조가 제공된 e-Book 콘텐츠를 통해 학습한 후 정보처리유형(시각 정보처리, 언어 정보처리)에 따른 학업성취도 (텍스트 구조 파악 및 학습내용이해)와 사용 편의성에 대한 효과성을 검증하였다. 연구결과, 학업성취도에 있어서는 정보처리 유형에 따라 텍스트 구조 파악에는 유의미한 차이가 나타났으나, 학습내용 이해에는 유의미한 차이가 나타나지 않았다. 사용 편의성에 있어서는 학습자의 정보처리유형에 따라 유의미한 차이가 나타났으며, 구체적으로는 텍스트 구조 파악의 용이성, 텍스트 분량 파악의 용이성, 네비게이션의 용이성, 그리고 내용기억의 편의성 등에 있어 유의미한 차이가 나타났다. 또한 학업성취도에 영향을 미친 사용 편의성의 주요요인은 학습위치 파악의 용이성이었으며, 정보처리유형의 집단간 분류의 정확도는 79.4%로 비교적 높은 것으로 나타났다. 이러한 결과를 바탕으로 e-Book 콘텐츠 설계 및 개발에 대한 전략적 시사점에 논의 되었다.

하이퍼 텍스트의 가중치 조절과 링크 구조 분석 기법을 통한 검색 엔진 성능 개선 (Performance Improvement of Information Retrieval System through Weight Adjustment of Hypertext and Link Structure Analysis)

  • 이상호;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.108-112
    • /
    • 2003
  • 웹 문서의 가장 큰 특징 중 하나는 링크 구조이다. 이 링크들을 이용하여 전체 웹 문서를 커다란 하나의 네트워크로 구성할 수 있으며 이러한 네트워크를 분석함으로써 보다 중요한 문서, 보다 유용한 사이트를 찾아낼 수 있다. 전통적인 검색 모델인 벡터 모델의 성능 개선을 위해 이러한 링크 분석 기법을 활용하여 검색 정확도를 향상시키기 위한 방법을 제안한다. 또한 하이퍼 텍스트는 보다 정확한 키워드를 포함할 확률이 높으므로, 이를 가중치 계산에 적용하여 보다 정확한 결과를 산출한다.

  • PDF

XML 링크정보를 이용한 정보 검색 색인 기법의 설계 (Design of an Information Retrieval Indexing Method using XML Links)

  • 김은정;배종민
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2020-2027
    • /
    • 2000
  • The hypertext document is used for information exchange in the Web environments. Its structure is considered as having graph structures with links, which makes nonlinear processing of documents possible. This paper proposes an indexing method for information retrieval system using XML links. We define new attributes that control links of a remote document and assign an unique identifier for the attribute of each link. Each identifier has a different weight according to its occurrence position that is local or remote documents. We index a word not only from a local document but a remote document based on the given weight. Experimental results show that the proposed method outperforms conventional retrieval systems that ignore links.

  • PDF

하이퍼링크 구조를 이용한 웹 검색의 순위 알고리즘에 관한 연구 (The Study on the Ranking Algorithm of Web-based Sear ching Using Hyperlink Structure)

  • 김성희;오건택
    • 정보관리연구
    • /
    • 제37권2호
    • /
    • pp.33-50
    • /
    • 2006
  • 본 연구에서는 하이퍼 링크 구조를 이용한 웹 검색 알고리즘에 대해 살펴 본 후 페이지 품질을 측정하기 위해 웹의 하이퍼 구조를 이용하고 있는 알고리즘인 HITS와 PageRank를 분석하였다. 이어서 이들 방법을 이용한 검색 엔진인 Google과 Ask.com을 검색 알고리즘의 특성을 기준으로 분석하였다. 이런 연구는 미래의 웹 문서의 중요도를 평가하는 데 기초자료로 활용할 수 있으며, 웹 정보검색의 검색성능을 향상시키는 시스템 개발에 도움이 될 수 있을 것이라 생각한다.

혼성 디자인의 의미구성과 표현특성에 관한 연구 - 개념적 혼성이론의 방법론을 중심으로 - (A Study on the Meaning Construction and Expression Characteristics of Hybrid Design - Focus on the Methodology of Conceptual blending theory -)

  • 김은지;이정욱
    • 한국실내디자인학회논문집
    • /
    • 제15권2호
    • /
    • pp.81-90
    • /
    • 2006
  • This treatise makes clear not only a structural methodology of 'the conceptual blending theory' using in a linguistics could be applied to the similar process in a hybrid design but also both methods include the same meaning construction in the sense of a mutual educational system. Both methods have something in common that they are fundamentally focused on a metaphorical expression which implies poetic messages to be concentrated on a formal structure. Therefore, the purpose of this treatise is to examine the structural characteristics in the hybrid design in order to analyze the rhetorical expressions(metaphor, allegory) as symbols of communication. One of the those is intertextuality that expresses metaphorically by blending and borrowing codes and another is hypertextual space where various texts twines around each other making brand-new and diverse organizations, as the combined allegory with a number of hidden expression. Ultimately, it is important that this approach could verify whether it deals the illogical present state of a spacial form or structure with a kind of mechanism of a 'conceptual blending theory' or not.

Multitier 웹 어플리케이션 환경에서 악의적인 SQL Query 탐지를 위한 HTTP Request - SQL Query 매핑 기법 (HTTP Request - SQL Query Mapping Scheme for Malicious SQL Query Detection in Multitier Web Applications)

  • 서영웅;박승영
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.1-12
    • /
    • 2017
  • 지속적으로 증가하는 인터넷 서비스 요구사항을 만족하기 위하여 인터넷 서비스를 제공하는 시스템은 웹 서버와 DB(database) 서버로 구성된 multitier 구조로 변화되어왔다. 이러한 multitier 웹 어플리케이션 환경에서 기존의 IDS(intrusion detection system)는 웹 서버와 DB 서버에서 misused traffic pattern들이나 signature들을 매칭하여 이미 알려진 공격을 검출하고 해당 접속을 차단하는 방식으로 동작한다. 하지만 이러한 방식의 IDS는 정상적인 HTTP(hypertext transfer protocol) request를 이용하여 악의적으로 DB 서버의 내용의 변조를 시도하는 attacker의 공격을 DB 서버단에서 제대로 검출하지 못한다. 그 이유는 DB 서버는 웹 서버로부터 받은 SQL(structured query language) query가 어떤 사용자의 HTTP request에 의해 발생한 것인지 알지 못하는 상태에서 처리하며, 웹 서버는 SQL query 처리 결과 중 어떤 것이 악의적으로 DB 서버 변조를 시도한 SQL query에 의한 결과인지 알 수 없기 때문이다. 이런 공격을 검출하기 위해서는 HTTP request와 SQL query 사이의 상호작용관계를 명확히 파악하고, 이를 이용하여 악의적인 SQL query를 발생시킨 사용자를 추적해야 한다. 이를 위해서는 해당 시스템의 소스코드를 분석하거나 application logic을 완벽하게 파악해야 하므로 현실적으로 불가능하다. 본 논문에서는 웹 서버와 DB 서버에서 제공하는 로그만을 이용하여 모든 HTTP request와 SQL query간의 mapping 관계를 찾아내고, 이를 이용하여 특정 SQL query를 발생시킨 HTTP request를 추정하는 기법을 제안한다. 모의실험을 통하여 94%의 정확도로 HTTP request를 추정할 수 있음을 확인하였다.