• 제목/요약/키워드: web Graph

검색결과 218건 처리시간 0.025초

GIS 공간분석과 소셜 네트워크 분석의 통합을 위한 WebGIS 구현 (Implementation of WebGIS for Integration of GIS Spatial Analysis and Social Network Analysis)

  • 최효석;염재홍
    • 한국측량학회지
    • /
    • 제32권2호
    • /
    • pp.95-107
    • /
    • 2014
  • 일반적으로, 공간 도메인의 공간자료는 지형적인 현상을 도형적으로 표현하고 비공간 도메인의 속성자료는 공간 자료의 특징을 서술적으로 설명한다. GIS에서 속성자료를 이용한 분석은 조건을 이용한 검색이나 통계분석에 제한적으로 활용되고 있다. 최근 소셜 네트워크 분석의 그래프 모델링 및 네트워크 분석기법은 인문 사회적 현상을 분석하는데 사용되고 있으며, 본 연구에서는 이러한 네트워크 분석기법을 GIS의 비공간적인 속성자료 처리에 적용하여 분석기능을 다양하게 하였다. 또한, 공간 데이터베이스와 그래프 데이터베이스를 이용하여 GIS 공간분석과 비공간적 네트워크 분석의 통합분석 방법을 설계하였고, 이를 WebGIS를 구현하여 보다 효과적인 의사결정을 가능하도록 하였다. 구현된 WebGIS를 상수도 보급 대상 가구 선정 업무와 구제역 질병의 2차 전파 분석 업무에 적용하여 실험 및 평가하였다. 실험 결과, 구현된 시스템의 통합 분석을 통해 공간적인 요인 및 사회적 친밀도와 같은 비공간적인 요인을 고려한 방역을 제시하였으며, 이는 질병 전파의 효과적인 차단에 기여할 것으로 판단한다.

EMFG를 이용한 웹사이트 표현의 간략화 (The Simplification of Web Sites Representation with the EMFG)

  • 여정모;안정숙
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.327-334
    • /
    • 2005
  • 복잡한 구조의 웹사이트를 표현하기 위해 EMG(Extended Mark Flow Graph)를 이용한 웹사이트의 표현이 연구되고 있다. 대부분의 웹사이트들은 반복구조가 많이 나타나고, 이러한 웹사이트들을 EMFG로 표현하면 너무 복잡하여 때로는 웹사이트의 구조의 파악이 어려워지게 된다. 따라서 본 논문에서는 웹사이트를 EMG로 표현할 때 나타나는 반복구조를 직렬반복구조와 병렬반복구조로 분류하고, 이를 간략화하여 박스, 아크, 트랜지션의 수를 줄여 전체 웹사이트의 구조 및 웹페이지 간의 이동관계를 효율적으로 설계하고 관리할 수 있는 방법을 제시하고자 한다.

개최장소 추출을 위한 LGG의 구축 (Construction of LGG for Extracting Meeting Location)

  • 김경렬;최동현;김은경;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.49-54
    • /
    • 2011
  • 본 논문에서는 회의공지 이메일을 대상으로 하는 개최장소 추출시스템에 대하여 소개한다. 개최장소 추출 시스템은 두 단계로 구성되는데, 첫 번째 단계는 본문에 포함된 개최장소의 추출이고, 두 번째 단계는 추출된 개최장소의 Geocoding이다. 개최장소의 추출을 위하여 문맥 패턴을 분석하여 개최장소가 포함된 문장 주변의 패턴을 반영하는 Local-Grammar Graph를 구축하며, 개최장소의 Geocoding을 위하여는 Addr2Geocode API를 사용한다. 본 논문은 일정공지메일의 개최장소를 추출하기 위한 LGG 방법론 기반의 어휘-통사적 언어 정보를 기술하는 것을 목적으로 한다.

  • PDF

다중 홉 질문 응답을 위한 쌍 선형 그래프 신경망 기반 추론 (Bilinear Graph Neural Network-Based Reasoning for Multi-Hop Question Answering)

  • 이상의;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권8호
    • /
    • pp.243-250
    • /
    • 2020
  • 지식 그래프 기반의 질문 응답 문제는 자연어 질문들에 대한 깊은 이해뿐만 아니라, 대규모 지식 그래프 상에서 올바른 답변을 찾기 위한 효과적인 추론 능력을 필요로 한다. 본 논문에서는 다중 홉 추론을 요구하는 복잡한 자연어 질문에 대해 연관 지식 그래프 위에서 답변 추론을 효과적으로 수행할 수 있는 심층 신경망 모델을 제안한다. 제안 모델에서는 지식 그래프 상의 각 개체 노드와 이웃 노드 간의 양방향 특징 전파를 허용할뿐만 아니라, 두 이웃 노드 쌍 간의 맥락 정보까지 활용할 수 있는, 표현력이 뛰어난 쌍 선형 그래프 신경망(BGNN)을 이용한다. 본 논문에서는 오픈 도메인의 지식 베이스인 Freebase, 자연어 질문 응답을 위한 벤치마크 데이터 집합들인 WebQuestionsSP와 MetaQA를 이용한 실험들을 통해, 제안 모델의 효과와 우수성을 확인하였다.

그래프마이닝을 활용한 빈발 패턴 탐색에 관한 연구 (A Methodology for Searching Frequent Pattern Using Graph-Mining Technique)

  • 홍준석
    • Journal of Information Technology Applications and Management
    • /
    • 제26권1호
    • /
    • pp.65-75
    • /
    • 2019
  • As the use of semantic web based on XML increases in the field of data management, a lot of studies to extract useful information from the data stored in ontology have been tried based on association rule mining. Ontology data is advantageous in that data can be freely expressed because it has a flexible and scalable structure unlike a conventional database having a predefined structure. On the contrary, it is difficult to find frequent patterns in a uniformized analysis method. The goal of this study is to provide a basis for extracting useful knowledge from ontology by searching for frequently occurring subgraph patterns by applying transaction-based graph mining techniques to ontology schema graph data and instance graph data constituting ontology. In order to overcome the structural limitations of the existing ontology mining, the frequent pattern search methodology in this study uses the methodology used in graph mining to apply the frequent pattern in the graph data structure to the ontology by applying iterative node chunking method. Our suggested methodology will play an important role in knowledge extraction.

Min-Hash를 이용한 효율적인 대용량 그래프 클러스터링 기법 (An Efficient Large Graph Clustering Technique based on Min-Hash)

  • 이석주;민준기
    • 정보과학회 논문지
    • /
    • 제43권3호
    • /
    • pp.380-388
    • /
    • 2016
  • 그래프 클러스터링은 서로 유사한 특성을 갖는 정점들을 동일한 클러스터로 묶는 기법으로 그래프 데이터를 분석하고 그 특성을 파악하는데 폭넓게 사용된다. 최근 소셜 네트워크 서비스와 월드 와이드 웹, 텔레폰 네트워크 등의 다양한 응용분야에서 크기가 큰 대용량 그래프 데이터가 생성되고 있다. 이에 따라서 대용량 그래프 데이터를 효율적으로 처리하는 클러스터링 기법의 중요성이 증가하고 있다. 본 논문에서는 대용량 그래프 데이터의 클러스터들을 효율적으로 생성하는 클러스터링 알고리즘을 제안한다. 우리의 제안 기법은 그래프 내의 클러스터들 간의 유사도를 Min-Hash를 이용하여 효과적으로 추정하고 계산된 유사도에 따라서 클러스터들을 생성한다. 실세계 데이터를 이용한 실험에서 우리는 본 논문에서 제안하는 기법과 기존 그래프 클러스터링 기법들과 비교하여 제안기법의 효율성을 보였다.

Efficient Mining of Frequent Subgraph with Connectivity Constraint

  • Moon, Hyun-S.;Lee, Kwang-H.;Lee, Do-Heon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.267-271
    • /
    • 2005
  • The goal of data mining is to extract new and useful knowledge from large scale datasets. As the amount of available data grows explosively, it became vitally important to develop faster data mining algorithms for various types of data. Recently, an interest in developing data mining algorithms that operate on graphs has been increased. Especially, mining frequent patterns from structured data such as graphs has been concerned by many research groups. A graph is a highly adaptable representation scheme that used in many domains including chemistry, bioinformatics and physics. For example, the chemical structure of a given substance can be modelled by an undirected labelled graph in which each node corresponds to an atom and each edge corresponds to a chemical bond between atoms. Internet can also be modelled as a directed graph in which each node corresponds to an web site and each edge corresponds to a hypertext link between web sites. Notably in bioinformatics area, various kinds of newly discovered data such as gene regulation networks or protein interaction networks could be modelled as graphs. There have been a number of attempts to find useful knowledge from these graph structured data. One of the most powerful analysis tool for graph structured data is frequent subgraph analysis. Recurring patterns in graph data can provide incomparable insights into that graph data. However, to find recurring subgraphs is extremely expensive in computational side. At the core of the problem, there are two computationally challenging problems. 1) Subgraph isomorphism and 2) Enumeration of subgraphs. Problems related to the former are subgraph isomorphism problem (Is graph A contains graph B?) and graph isomorphism problem(Are two graphs A and B the same or not?). Even these simplified versions of the subgraph mining problem are known to be NP-complete or Polymorphism-complete and no polynomial time algorithm has been existed so far. The later is also a difficult problem. We should generate all of 2$^n$ subgraphs if there is no constraint where n is the number of vertices of the input graph. In order to find frequent subgraphs from larger graph database, it is essential to give appropriate constraint to the subgraphs to find. Most of the current approaches are focus on the frequencies of a subgraph: the higher the frequency of a graph is, the more attentions should be given to that graph. Recently, several algorithms which use level by level approaches to find frequent subgraphs have been developed. Some of the recently emerging applications suggest that other constraints such as connectivity also could be useful in mining subgraphs : more strongly connected parts of a graph are more informative. If we restrict the set of subgraphs to mine to more strongly connected parts, its computational complexity could be decreased significantly. In this paper, we present an efficient algorithm to mine frequent subgraphs that are more strongly connected. Experimental study shows that the algorithm is scaling to larger graphs which have more than ten thousand vertices.

  • PDF

하이퍼텍스트 정보 관점에서 의도적으로 왜곡된 웹 페이지의 검출에 관한 연구 (Detecting Intentionally Biased Web Pages In terms of Hypertext Information)

  • 이우기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.59-66
    • /
    • 2005
  • 웹(World Wide Web)은 정보의 저장 및 검색에 있어서 보편적인 매체가 되고 있다 웹에서는 일반적으로 검색엔진(Web search engine)을 통해 정보 검색을 수행하지만, 그 결과가 사용자의 요구와 늘 일치하는 것은 아니며 때로는 의도적으로 조작된 검색 결과가 제시되기도 한다. 웹 페이지에 대한 평가를 조작하는 것을 의도적 조작이라고 부른다. 최근에 가장 각광을 받는 링크 기반 검색 방식에는 의도적 조작이 상대적으로 어렵지만, 링크 기반 검색 방식의 대표격인 구글의 페이지 점수법(PageRank algorithm)도 구글밤처럼 조작할 수 있는 방법이 있다 본 논문에서는 기본적으로 링크 기반 검색 방식을 기초로 웹을 하나의 유향그래프(directed graph)로 인식하여 각 웹 페이지들은 하나의 노드로, 하이퍼텍스트 링크를 에지(edge)로 표현하며. 하이퍼텍스트 정보관점에서 링크 내역과 대상 페이지(target page) 사이의 유사도(similarity)를 구하고. 이것을 이용하여 페이지 점수화 (PageRank) 접근법의 전이 행렬(transition matrix)을 재구성하는 방법을 취했다 결과적으로 기존의 점수화 방법과 비교하여 효과가 $60\%$ 이상 될 수 있음을 입증했다.

  • PDF

Web-enabled Healthcare System for Hypertension : Hyperlink-based Inference Approach

  • Song Yong Uk;Chae Young Moon;Ho Seung Hee;Cho Kyoung Won
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.271-285
    • /
    • 2003
  • In the conduct of this study, a web-enabled healthcare system for the management of hypertension was implemented through a hyperlink-based inference approach. The hyperlink-based inference platform implemented using the hypertext capacity of HTML which ensured accessibility, multimedia facilities, fast response, stability, ease of use and upgrade, and platform independency of expert systems. Many HTML documents, which are hyperlinked to each other based on expert rules, were uploaded beforehand to perform the hyperlink-based inference. The HTML documents were uploaded and maintained automatically by our proprietary tool called the Web-Based inference System (WeBIS) that supports a graphical user interface (GUI) for the input and edit of decision graphs. Nevertheless, the editing task of the decision graph using the GUI tool is a time consuming and tedious chore when the knowledge engineer must perform it manually. Accordingly, this research implemented an automatic generator of the decision graph for the management of hypertension. As a result, this research suggests a methodology for the development of Web-enabled healthcare systems using the hyperlink-based inference approach and, as an example, implements a Web-enabled healthcare system for hypertension, a platform which peformed especially well in the areas of speed and stability.

  • PDF

다양한 웹 기반 소프트웨어의 테스트를 위한 효율적인 테스트 케이스의 생성 (Effective Test Case Generation for Various Types of Web-based Software)

  • 김현수;최은만
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.569-582
    • /
    • 2005
  • 인터넷을 통한 정보의 교류와 비즈니스가 활발해지면서 웹 기반 소프트웨어도 확대되고 있고 그만큼 품질 측면의 노력이 중요하다. 웹 컨텐츠의 링크나 웹 기반 프로그램을 검증하는 연구가 시도되었으나 다양한 웹 기반 구성 방법들을 커버하는 방법은 찾기 어려웠고 또한 적용 실험이 부족하다. 이 논문에서는 다양한 동적인 웹 기반 소프트웨어들을 타입별로 나누어 보고 동일한 방법으로 모델링 한 후 테스트 케이스를 생성하는 방법을 제안한다. 웹 기반 소프트웨어를 구성하는 개체들을 파악한 후 이를 개체 제어흐름 그래프(Object Control of Flow Graph)와 개체 관계 다이어그램(Object Relationship Diagram)으로 모델링 한다. 모델에서 테스트 경로를 파악하고 테스트 키 포인트를 구동하는 테스트 케이스를 찾는다. 제안한 방법으로 다섯 가지 타입의 웹 기반 소프트웨어를 적용하여 실용성을 보였으며 이제까지 제안된 방법과 어떤 차이를 보이는지 비교하였다.