• 제목/요약/키워드: graph embedding

검색결과 80건 처리시간 0.025초

GCNXSS: An Attack Detection Approach for Cross-Site Scripting Based on Graph Convolutional Networks

  • Pan, Hongyu;Fang, Yong;Huang, Cheng;Guo, Wenbo;Wan, Xuelin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.4008-4023
    • /
    • 2022
  • Since machine learning was introduced into cross-site scripting (XSS) attack detection, many researchers have conducted related studies and achieved significant results, such as saving time and labor costs by not maintaining a rule database, which is required by traditional XSS attack detection methods. However, this topic came across some problems, such as poor generalization ability, significant false negative rate (FNR) and false positive rate (FPR). Moreover, the automatic clustering property of graph convolutional networks (GCN) has attracted the attention of researchers. In the field of natural language process (NLP), the results of graph embedding based on GCN are automatically clustered in space without any training, which means that text data can be classified just by the embedding process based on GCN. Previously, other methods required training with the help of labeled data after embedding to complete data classification. With the help of the GCN auto-clustering feature and labeled data, this research proposes an approach to detect XSS attacks (called GCNXSS) to mine the dependencies between the units that constitute an XSS payload. First, GCNXSS transforms a URL into a word homogeneous graph based on word co-occurrence relationships. Then, GCNXSS inputs the graph into the GCN model for graph embedding and gets the classification results. Experimental results show that GCNXSS achieved successful results with accuracy, precision, recall, F1-score, FNR, FPR, and predicted time scores of 99.97%, 99.75%, 99.97%, 99.86%, 0.03%, 0.03%, and 0.0461ms. Compared with existing methods, GCNXSS has a lower FNR and FPR with stronger generalization ability.

Knowledge Recommendation Based on Dual Channel Hypergraph Convolution

  • Yue Li
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권11호
    • /
    • pp.2903-2923
    • /
    • 2023
  • Knowledge recommendation is a type of recommendation system that recommends knowledge content to users in order to satisfy their needs. Although using graph neural networks to extract data features is an effective method for solving the recommendation problem, there is information loss when modeling real-world problems because an edge in a graph structure can only be associated with two nodes. Because one super-edge in the hypergraph structure can be connected with several nodes and the effectiveness of knowledge graph for knowledge expression, a dual-channel hypergraph convolutional neural network model (DCHC) based on hypergraph structure and knowledge graph is proposed. The model divides user data and knowledge data into user subhypergraph and knowledge subhypergraph, respectively, and extracts user data features by dual-channel hypergraph convolution and knowledge data features by combining with knowledge graph technology, and finally generates recommendation results based on the obtained user embedding and knowledge embedding. The performance of DCHC model is higher than the comparative model under AUC and F1 evaluation indicators, comparative experiments with the baseline also demonstrate the validity of DCHC model.

피라미드의 3-차원 메쉬로의 신장율 개선 임베딩 (A Dilation-Improved Embedding of Pyramids into 3-Dimensional Meshes)

  • 장정환
    • 정보처리학회논문지A
    • /
    • 제10A권6호
    • /
    • pp.627-634
    • /
    • 2003
  • 본 논문에서는 주어진 손님 그래프 모델의 정점들과 간선들을 신장율, 혼잡율 등의 성능 파라미터들을 보다 우수하게 유지하면서 주인 그래프의 대응되는 정점들 및 경로들오 매핑시키는 "그래프 임베딩 문제"라고 불리는 그래프이론 문제를 다른다. 먼저 높이가 N인 파라미트 모델을 높이가 $(4^{(N+1)/3}+2)/3$ 이고 2-차원 정방현 메쉬의 한 변의 길이가 $2^{(2N-1)/3}$인 3-차원 메쉬 구조의 대규모 병렬처리시스템으로 임베딩 할 수 잇는 새로운 매핑함수를 제안하고, 해당 임베딩 하에서 인접된 두 정점들 상호간 통신에 필요한 단계의 수를 반영하는 신장율의 관점에서 성능을 분석한다. 본 임베딩의 신장율이 $2{\cdot}4^{(N-2)/3}+4)/3$ 임을 증명한다. 이러한 결과는 동일한 조건 하에서 기존의 결과인 $4^{N+183}+2)/3$ 보다 우수한 것이다.다 우수한 것이다.

Gated Multi-channel Network Embedding for Large-scale Mobile App Clustering

  • Yeo-Chan Yoon;Soo Kyun Kim
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권6호
    • /
    • pp.1620-1634
    • /
    • 2023
  • This paper studies the task of embedding nodes with multiple graphs representing multiple information channels, which is useful in a large volume of network clustering tasks. By learning a node using multiple graphs, various characteristics of the node can be represented and embedded stably. Existing studies using multi-channel networks have been conducted by integrating heterogeneous graphs or limiting common nodes appearing in multiple graphs to have similar embeddings. Although these methods effectively represent nodes, it also has limitations by assuming that all networks provide the same amount of information. This paper proposes a method to overcome these limitations; The proposed method gives different weights according to the source graph when embedding nodes; the characteristics of the graph with more important information can be reflected more in the node. To this end, a novel method incorporating a multi-channel gate layer is proposed to weigh more important channels and ignore unnecessary data to embed a node with multiple graphs. Empirical experiments demonstrate the effectiveness of the proposed multi-channel-based embedding methods.

GROUP ACTION FOR ENUMERATING MAPS ON SURFACES

  • Mao, Linfan;Liu, Yanpei
    • Journal of applied mathematics & informatics
    • /
    • 제13권1_2호
    • /
    • pp.201-215
    • /
    • 2003
  • A map is a connected topological graph $\Gamma$ cellularly embedded in a surface. For any connected graph $\Gamma$, by introducing the concertion of semi-arc automorphism group Aut$\_$$\frac{1}{2}$/$\Gamma$ and classifying all embedding of $\Gamma$ undo. the action of this group, the numbers r$\^$O/ ($\Gamma$) and r$\^$N/($\Gamma$) of rooted maps on orientable and non-orientable surfaces with underlying graph $\Gamma$ are found. Many closed formulas without sum ∑ for the number of rooted maps on surfaces (orientable or non-orientable) with given underlying graphs, such as, complete graph K$\_$n/, complete bipartite graph K$\_$m, n/ bouquets B$\_$n/, dipole Dp$\_$n/ and generalized dipole (equation omitted) are refound in this paper.

컴뮤트 타임 기반의 다양체 임베딩을 이용한 파형 신호 인식에 관한 연구 (A Study on Classification of Waveforms Using Manifold Embedding Based on Commute Time)

  • 한희일
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.148-155
    • /
    • 2014
  • 본 논문에서는 파형 신호에서 패치를 추출하고 이를 패치 그래프로 구성한 다음, 이로부터 대표적인 다양체 임베딩 방식인 컴뮤트 타임 임베딩 기법을 구현하고, 이의 특성을 분석한다. 특히 음성 신호나 악기 음 등, 시간에 따라 스펙트럼이 가변적인 신호를 임베딩하면 스펙트럼의 변화에도 불구하고 그 신호 고유의 기하 구조를 생섬함을 실험으로 확인한다. 다양체 임베딩은 비선형 공간에 놓여 있는 고차원 데이터를 저차원 공간으로의 효율적인 맵을 가능하게 하지만 그래프 구성에 이용된 데이터에 대한 정보만 알 수 있고 그렇지 않은 데이터(out-of-sample data)에 대해서는 정보를 얻기 어렵다. 따라서 다양체 임베딩은 데이터 클러스터링에 적절히 적용 가능하지만, 훈련 과정을 통해 얻은 정보를 기초로 유추 기능이 요구되는 인식 등에는 응용하기 어려운 제약이 따른다. 이를 해결하기 위하여 본 논문에서는 다양체 임베딩이 인식 분야에도 적용 가능하도록 새로운 알고리즘을 제안하고 악기 음 분류 실험을 통하여 그 특성을 분석한다.

하이퍼큐브와 스타 그래프 종류 사이의 임베딩 알고리즘 (Embedding algorithms among hypercube and star graph variants)

  • 김종석;이형옥
    • 컴퓨터교육학회논문지
    • /
    • 제17권2호
    • /
    • pp.115-124
    • /
    • 2014
  • 하이퍼큐브와 스타 그래프는 상호연결망으로 널리 알려져 있다. 상호연결망의 임베딩은 임의의 연결망 G를 다른 연결망 H에 사상하는 것이다. 상호연결망 G가 H에 적은 비용으로 임베딩 가능하다는 것은 연결망 G에서 개발된 알고리즘들을 연결망 H에서 효율적으로 이용할 수 있는 장점이 있다. 본 논문에서는 HCN과 HON 사이의 임베딩과 스타(star)그래프와 하프팬케익그래프 사이의 임베딩을 분석한다. 연구 결과로 HCN(n,n)은 HON($C_{n+1},C_{n+1}$)에 연장율 3에 임베딩 가능하고, HON($C_d,C_d$)를 HCN(2d-1,2d-1)에 임베딩 비용은 O(d)임을 보인다. 또한 스타그래프는 하프팬케익그래프에 연장율 11, 확장율 1에 임베딩 가능하고, 평균 연장율은 8이다. 본 연구 결과는 HCN 연결망과 스타그래프에서 이미 개발된 여러 가지 알고리즘을 HON 연결망과 하프팬케익그래프에서 효율적으로 이용할 수 있음을 의미한다.

  • PDF

대용량 컴뮤트 타임 임베딩을 위한 연산 속도 개선 방식 제안 (Proposing the Methods for Accelerating Computational Time of Large-Scale Commute Time Embedding)

  • 한희일
    • 전자공학회논문지
    • /
    • 제52권2호
    • /
    • pp.162-170
    • /
    • 2015
  • 컴뮤트 타임 임베딩을 구현하려면 그래프 라플라시안 행렬의 고유값과 고유벡터를 구하여야 하는데, $o(n^3)$의 계산량이 요구되어 대용량 데이터에는 적용하기 어려운 문제가 있다. 이를 줄이기 위하여 표본화 과정을 통하여 크기가 줄어든 그래프 라플라시안 행렬에서 구한 다음, 원래의 고유값과 고유벡터를 근사화시키는 Nystr${\ddot{o}}$m 기법을 주로 채택한다. 이 과정에서 많은 오차가 발생하는데, 이를 개선하기 위하여 본 논문에서는 그래프 라플라시안 대신에 가중치 행렬을 표본화하고 이로부터 구한 고유값과 고유벡터를 그래프 라플라시안의 고유값과 고유벡터로 변환하는 기법을 이용하여 대용량 데이터로 구성된 스펙트럴 그래프를 근사적으로 컴뮤트 타임 임베딩하는 기법을 제안한다. 하지만, 이 방식도 스펙트럼 분해를 계산하여야 하므로 데이터의 크기가 증가하면 적용하기 어려운 문제가 발생한다. 이의 대안으로, 스펙트럼 분해를 계산하지 않고도 데이터 집합의 크기에 영향을 받지 않으면서 컴뮤트 타임을 근사적으로 계산하는 방식을 구현하고 이들의 특성을 실험적으로 분석한다.

팬케익 그래프와 스타(Star) 그래프, 매크로-스타(Macro-star) 그래프간의 임베딩 방법 (Embedding Mechanism between Pancake and Star, Macro-star Graph)

  • 최은복;이형옥
    • 한국멀티미디어학회논문지
    • /
    • 제6권3호
    • /
    • pp.556-564
    • /
    • 2003
  • 스타 그래프와 팬케익 그래프는 하이퍼큐브가 갖는 좋은 성질을 가지면서 하이퍼큐브보다 망 비용이 적은 값을 갖는 상호연결망이다. 매크로-스타 그래프는 스타 그래프를 기본 모듈로 하면서 노드 대칭성, 최대고장허용도, 계층적 분할 성질을 가지면서 스타 그래프보다 망 비용이 개선된 상호연결망이다. 본 논문에서는 그래프의 에지 정의를 이용하여 스타 그래프, 팬케익 그래프, 매크로-스타 그래프 사이의 임베딩 방법을 제시한다. 스타 그래프 $S_n$은 팬케익 그래프 $P_n$에 연장율 4에 임베딩 가능하고, 매크로-스타 MS(2,n)은 팬케익 그래프에 연장율 4에 임베딩 가능함을 보인다. 또한, 팬케익 그래프를 스타 그래프와 매크로-스타 그래프에 임베딩하는 비용이 O(n)임을 보인다.

  • PDF