• 제목/요약/키워드: web Graph

검색결과 218건 처리시간 0.028초

시맨틱 웹 데이터의 경로 기반 질의 처리 기법 (The Scheme for Path-based Query Processing on the Semantic Data)

  • 김연희;김지현
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.31-41
    • /
    • 2009
  • 시맨틱 웹에서는 메타데이터와 온톨로지를 이용해 정보 리소스의 개념을 정의하고 의미적 연관성을 표현함으로써 지능적인 정보 검색과 자동화된 웹 서비스의 제공이 가능하다. 이러한 시맨틱 웹의 핵심적인 기능을 구현하기 위해서는 온톨로지와 메타데이터와 같은 시맨틱 웹 데이터를 효율적으로 관리하는 것이 무엇보다 중요하다. 따라서 본 논문에서는 시맨틱 웹 데이터의 의미와 구조적인 특성을 고려하여 보다 정확한 질의 결과의 검색과 효율적인 질의 처리를 지원할 수 있는 인덱스 구조를 제안한다. 특히 시맨틱 웹 데이터의 의미와 구조적인 특성을 그대로 표현하기 위해 그래프 데이터 모델을 이용하고 다양한 질의 형태를 그래프 모델 기반의 경로식으로 처리한다. 본 논문에서 제안한 인덱스는 1차적으로 추출 가능한 구조적 경로 정보는 물론 온톨로지를 이용한 추론을 통해 2차적으로 추출 가능한 구조적 경로 정보에 대한 질의를 처리 대상으로 하여 기존연구들과 차별화하며 시맨틱 웹의 개념을 온전히 반영하는 것을 목표로 한다. 또한 실험적 평가를 통해 본 논문에서 제안한 인덱스 구조가 정확성과 효율성 측면에서 우수하며 시맨틱 웹의 다양한 애플리케이션 개발에 적용 가능함을 보인다.

Vulnerable Path Attack and its Detection

  • She, Chuyu;Wen, Wushao;Ye, Quanqi;Zheng, Kesong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권4호
    • /
    • pp.2149-2170
    • /
    • 2017
  • Application-layer Distributed Denial-of-Service (DDoS) attack is one of the leading security problems in the Internet. In recent years, the attack strategies of application-layer DDoS have rapidly developed. This paper introduces a new attack strategy named Path Vulnerabilities-Based (PVB) attack. In this attack strategy, an attacker first analyzes the contents of web pages and subsequently measures the actual response time of each webpage to build a web-resource-weighted-directed graph. The attacker uses a Top M Longest Path algorithm to find M DDoS vulnerable paths that consume considerable resources when sequentially accessing the pages following any of those paths. A detection mechanism for such attack is also proposed and discussed. A finite-state machine is used to model the dynamical processes for the state of the user's session and monitor the PVB attacks. Numerical results based on real-traffic simulations reveal the efficiency of the attack strategy and the detection mechanism.

Visualizing Geographical Contexts in Social Networks

  • Lee, Yang-Won;Kim, Hyung-Joo
    • Spatial Information Research
    • /
    • 제14권4호
    • /
    • pp.391-401
    • /
    • 2006
  • 이 논문에서는 지리적 표현이 보강된 사회네트워크 모형을 제시하고, 이 모형을 통해 사회네트워크의 지리적 맥락을 시각화하는 3D 웹서비스를 구현한다. 이 연구에서 제안하는 사회네트워크 그래프 개선의 핵심요소는 (i) 네트워크 노드들의 상호작용 강도 및 공간적 인접성이 반영된 '지리적 가중치가 부여된 중심화 지수' 그리고 (ii) 이러한 중심화 지수를 3차원 심볼을 이용하여 표현함과 동시에 네트워크 노드들을 단계 구분도와 중첩하여 시각화하는 '지도와 결합된 사회네트워크 그래프'이다 개선된 사회네트워크 그래프는 X3D (Extensible 3D)를 이용하여 구현하였으며, 시도간 R&D 협력의 사례분석을 통해 그 적용가능성이 확인되었다. 이 논문에서 제시하는 방법론은 사회네트워크에 내재하는 공간적 집중화의 경향 등 기존의 네트워크 분석에서 간과되었던 사회네트워크의 지리적 맥락에 대한 시각적 단서를 제공한다.

  • PDF

Easier-to-use 매쉬업을 위한 시맨틱 기반 자동 Open API 조합 알고리즘 (Semantic-based Automatic Open API Composition Algorithm for Easier-to-use Mashups)

  • 이용주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권5호
    • /
    • pp.359-368
    • /
    • 2013
  • 매쉬업은 공개된 Open API를 이용하여 두 가지 이상의 서로 다른 자원을 섞어서 완전히 새로운 서비스를 만드는 웹 애플리케이션이다. 지난 몇 년간 매쉬업에 대한 관심도가 매우 높아 졌지만 수많은 API들을 매쉬업 속으로 결합할 때 여러 가지 이슈들이 존재한다. 특히, 조합 가능한 API들이 매쉬업 개발자에 의해 수동으로 통합될 때 이는 더욱 심각해진다. 본 논문에서는 Open API 자동 조합을 위한 하나의 새로운 알고리즘을 제안한다. 제안된 알고리즘은 오퍼레이션 연결 그래프 구축 및 조합 후보군 탐색으로 구성되어 있다. 우리는 Open API 입출력 사이의 시맨틱 유사도를 기반으로 오퍼레이션 연결 그래프를 구축하고, 원하는 목표를 만족하는 출력을 산출할 수 있는 사이클 없는 방향성 그래프(DAG)를 생성한다. 또한, DAG들을 효율적으로 생성하기 위해 조합에 도움이 되지 않은 API들은 사전에 신속히 필터링되는 전략을 수립한다. 본 논문에서 제안된 알고리즘은 ProgrammableWeb.com 사이트로부터 REST와 SOAP API 집합을 다운로드 받아 실험 분석을 수행하였다.

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

시멘틱웹 구축을 위한 스키마 관리 기법 연구 (Schema management skills for semantic web construction)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.9-15
    • /
    • 2007
  • 전 세계적으로 인터넷의 사용이 일반화되면서 인터넷상의 정보의 양이 기하급수적으로 증가하였고, 이에 따라 이러한 정보들을 수집하고 통합하여 특정집단 또는 일반인들의 의사결정을 지원하기 위한 시멘틱웹에 대한 중요성이 갈수록 증대되고 있다. 시멘틱웹을 구성하는 기본 구조는 온톨로지이며, XML, RDF/RDF스키마, OWL 같은 언어들은 온톨로지의 스키마를 구성하는 기본 수단이다. 온톨로지의 스키마를 구성하고 관리할 때 중요한 고려사항 중 하나는 스키마는 시간이 지남에 따라 변화한다는 것이다. 그러므로 스키마상의 도메인의 변화 데이터 개념의 변화 혹은 자원간의 관계의 변화 등을 감지하고 이를 반영할 수 있는 형태로 구현되어야 한다. 본 연구에서는 시멘틱웹의 스키마관리를 위한 버전 관리 기법을 제안한다. 이를 위하여 버전의 변화 형태를 카테고리 별로 분류하고 이를 바탕으로 버전 그래프를 생성하였다. 생성된 그래프를 바탕으로 이행성규칙 등을 정의하여 적용하였으며, 좀 더 세세한 적용이 가능하도록 표식을 사용하여 적용 가능한 버전 스키마의 범위를 확장하도록 하였다.

  • PDF

Web기반의 상습침수지구 관리시스템 개발 (The Management System Development for Frequently Flooded Area by Web based)

  • 장경수;전지영;금도훈;지홍기
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2007년도 정기총회 및 학술발표대회
    • /
    • pp.636-639
    • /
    • 2007
  • The frequently flooded area has been known as very vulnerable area. This area has nature disasters such as typhoon, storm and flood almost every year. The purpose of this study is to develop a management system for frequently flooded area by Web based. So this system is possible to disaster management which irrespective of time and place. Through this system, general user can easily retrieve status information and obtain that in visual way such as maps. graph, and texts if they have only certain web browsers.

  • PDF

전문가 검색 엔진에서 개념 그래프를 이용한 Web 정보 획득 (Information acquision of WEB using the conceptual graph in expert search engine)

  • 박사준;김상경;황수철;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.295-297
    • /
    • 2000
  • 전문가 검색 엔진은 전문가 시스템과 같은 목적에서 특정 전문 분야에 대한 특수한 정보를 수집 검색하기 위한 검색 엔진을 내용이다. 본 논문은 전문가 검색 엔진을 만드는 과정에서 초기 작업에 해당하는 웹 정보 수집에 대한 논문이다. 본 논문은 웹 페이지에서 하이퍼링크와 참조되는 웹 페이지에 대한 표면 지식을 이용하여, 홈페이지 그래프를 작성한다. 그리고 나서 홈페이지 그래프와 사전에 미리 준비된 개념 그래프를 이용하여, 웹 페이지 수집 중 특정 전문 분야에 해당하는 웹 페이지인지를 판별하여 사용자가 수집하고자 하는 분야에 대한 웹 페이지만을 수집한다. 본 논문은 이에 대한 개념, 설계 및 구현과 앞으로의 개선 상황을 제안한다.

  • PDF

Hierarchical Structure in Semantic Networks of Japanese Word Associations

  • Miyake, Maki;Joyce, Terry;Jung, Jae-Young;Akama, Hiroyuki
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.321-329
    • /
    • 2007
  • This paper reports on the application of network analysis approaches to investigate the characteristics of graph representations of Japanese word associations. Two semantic networks are constructed from two separate Japanese word association databases. The basic statistical features of the networks indicate that they have scale-free and small-world properties and that they exhibit hierarchical organization. A graph clustering method is also applied to the networks with the objective of generating hierarchical structures within the semantic networks. The method is shown to be an efficient tool for analyzing large-scale structures within corpora. As a utilization of the network clustering results, we briefly introduce two web-based applications: the first is a search system that highlights various possible relations between words according to association type, while the second is to present the hierarchical architecture of a semantic network. The systems realize dynamic representations of network structures based on the relationships between words and concepts.

  • PDF

GCNXSS: An Attack Detection Approach for Cross-Site Scripting Based on Graph Convolutional Networks

  • Pan, Hongyu;Fang, Yong;Huang, Cheng;Guo, Wenbo;Wan, Xuelin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.4008-4023
    • /
    • 2022
  • Since machine learning was introduced into cross-site scripting (XSS) attack detection, many researchers have conducted related studies and achieved significant results, such as saving time and labor costs by not maintaining a rule database, which is required by traditional XSS attack detection methods. However, this topic came across some problems, such as poor generalization ability, significant false negative rate (FNR) and false positive rate (FPR). Moreover, the automatic clustering property of graph convolutional networks (GCN) has attracted the attention of researchers. In the field of natural language process (NLP), the results of graph embedding based on GCN are automatically clustered in space without any training, which means that text data can be classified just by the embedding process based on GCN. Previously, other methods required training with the help of labeled data after embedding to complete data classification. With the help of the GCN auto-clustering feature and labeled data, this research proposes an approach to detect XSS attacks (called GCNXSS) to mine the dependencies between the units that constitute an XSS payload. First, GCNXSS transforms a URL into a word homogeneous graph based on word co-occurrence relationships. Then, GCNXSS inputs the graph into the GCN model for graph embedding and gets the classification results. Experimental results show that GCNXSS achieved successful results with accuracy, precision, recall, F1-score, FNR, FPR, and predicted time scores of 99.97%, 99.75%, 99.97%, 99.86%, 0.03%, 0.03%, and 0.0461ms. Compared with existing methods, GCNXSS has a lower FNR and FPR with stronger generalization ability.