• Title/Summary/Keyword: 그래프 검색

검색결과 224건 처리시간 0.04초

위키피디아 문서로부터 트리플 추출과 RDF 그래프 생성 (Triple Extraction for RDF Graph Construction from Wikipedia Articles)

  • 이순웅;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.106-110
    • /
    • 2009
  • 웹이 발전하면서 점점 더 많은 정보가 웹을 통해 생성되고 공유되고 있다. 하지만 정보의 급격한 증가로 인해 정작 정확한 정보를 찾는 것은 오히려 더 어려워지고 있고, 이로 인해 특히 구조화되지 않은 텍스트에 대한 정확한 정보 검색의 필요성이 증가하고 있다. 본 논문에서는 위키피디아 문장들로부터 RDF 트리플을 추출하고 이를 하나의 연결된 RDF 그래프로 구성함으로써 효과적인 정보 검색을 수행하는 방법을 제안하고자 한다. 트리플 추출 방법은 문장에 대한 파스 트리를 탐색함으로써 이루어지는데, 약 81%의 정확도를 나타내었다. 최종적으로 생성되는 RDF 그래프는 입력 문장들의 문법적인 요소만을 고려하기 때문에 방법이 단순하지만 그래프 탐색을 통해 다양한 쿼리에 대한 정보 검색이 가능하다.

  • PDF

이미지 정보를 표현하기 위한 이중 그래프 데이터 모델 (A Dual Graph Data Model for the Representation of Image Information)

  • 박미화;엄기현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.262-264
    • /
    • 1998
  • 이미지 데이터베이스를 구성하여 사용자가 원하는 정보를 추출하는 의미 기반 검색을 지원하기 위해서는 이미지 내용에 관한 의미 정보들이 데이터 모델로 구조화되어야 한다. 본 논문에서는 다양한 정적 이미지 내용 정보들을 분류하고 그를 체계적으로 표현하기 위한 이미지 데이터 모델을 소개한다. 특히 본 이미지 데이터 모델은 그래프 이론을 이용하여 이미지내에 포함된 시각 객체들의 내용 정보를 표현하고 객체들간의 의미 관계를 정의한다. 이는 이미지 내용에 대한 정확한 정보 표현과 질의에 대한 이미지 검색 효율을 향상시킬 수 있으며 객체들간의 의미 관계를 이용한 질의와 검색을 가능하게 한다.

건물 데이터베이스 구축을 위한 그래프 토폴로지 설계 및 패턴매칭 구현 (Graph Topology Design for Generating Building Database and Implementation of Pattern Matching)

  • 최효석;염재홍;이동천
    • 한국측량학회지
    • /
    • 제31권5호
    • /
    • pp.411-419
    • /
    • 2013
  • 3차원 건물을 모델링하기 위해 항공영상 또는 라이다 데이터를 이용하여 건물 외곽선 추출이나 지붕을 구성하는 패치를 추출하는 단계를 거친다. 이러한 3차원 정보를 자동으로 획득하는 알고리즘 개발과 같은 효과적인 정보의 획득에 대한 연구가 활발히 진행되고 있으나, 추후 추출된 정보의 활용이나 유지관리에 대한 연구는 미흡한 상태이다. 본 연구는 3차원 정보를 얻었다는 가정 하에 건물의 형태에 따른 검색을 위한 연구이다. 이를 위하여 벽면, 분할 지붕면, 바닥과 같은 건물의 구성체를 노드(node)로 표현하고 이들의 인접성 관계를 그래프 구조로 객체의 형태를 정의하는 토폴로지 설계 방법을 제안하였다. 제안된 방법에 의해 생성된 토폴로지를 건물 그래프 데이터베이스에 저장하고, 토폴로지 정보를 이용한 패턴매칭을 수행하여 건물을 검색한 결과의 분석을 통해 제안된 객체 토폴로지 설계방법의 효용성을 입증하였다. 그래프 구조의 토폴로지를 기반으로 건물을 검색할 수 있었으며, 검색 조건을 부여하여 건물의 유사 정도를 조절하며 검색할 수 있었다. 또한 축척 및 회전에 불변한 객체의 형태묘사 방법으로 사용될 수 있다고 사료된다.

멀티미디어 상연 그래프의 검색 언어 (Query Language for Multimedia Presentation Graph)

  • 이태경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.289-291
    • /
    • 1998
  • 최근 멀티미디어 자료(Multimedia Data)들을 이용한 멀티미디어 상연물(Multimedia Presentation)의 제작에 많은 관심이 쏟아지고 있다. 한편, 멀티미디어 상연물들의 효과적인 사용을 위해서는 멀티미디어 상연물과 데이터베이스 시스템(Database System)의 통합(Integration)이 필요하며 이에 그래프 타입(Graph Type)을 이용하여 표현되고 있는 멀티미디어 상연물의 검색을 위한 검색 언어(Query Language)의 필요성이 대두되고 있다. 검색언어는 멀티미디어 자료들의 물리적 특징과 내용(Content), 상연물을 표현하는 데이터 타입(Data Type)을 표현할 수 있어야 한다. 또한 검색 언어는 사용자(end-user)가 손쉽게 사용할 수 있어야 한다. 이에 앞서 언급된 멀티미디어 상연물 검색 언어가 갖추어야할 요소들을 가지고 있으며 또한 사용자가 편리(user-friendly)하게 사용하는 visual language의 formal basis가 되는 calculus에 바탕을 둔 검색 언어인 GCaluculus/S를 소개한다.

그래프 이력 데이터 접근을 위한 효과적인 저장 관리 기법 (Efficient Storage Management Scheme for Graph Historical Retrieval)

  • 김기훈;김이나;최도진;김민수;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제18권2호
    • /
    • pp.438-449
    • /
    • 2018
  • 최근 소셜 네트워크, 인용 네트워크 등 여러 분야에서 다양한 그래프 데이터가 활용되고 있다. 시간에 따라 그래프가 동적으로 변화함에 따라 변경 내용 추적 및 특정 시점 그래프 검색을 위해 그래프 이력 데이터를 관리하는 것이 필요하다. 대부분의 이력 데이터는 시간에 따라 부분적인 변화가 발생하기 때문에 시간 단위로 데이터를 저장할 경우 변경되지 않은 데이터가 중복 저장된다. 본 논문에서는 시간별 그래프의 중복 저장을 최소화하기 위한 그래프 이력 저장 관리 기법을 제안한다. 제안하는 기법은 그래프의 변화를 계속적으로 탐지하여 과거 그래프와 중복되는 서브 그래프를 하나의 중복 스냅샷에 저장한다. 중복 스냅샷에는 다수의 델타 스냅샷이 연결되어 각 시간에 따른 변화 데이터를 유지한다. 중복 스냅샷에 저장된 중복 데이터를 공통으로 관리하여 공간의 효율을 향상시킨다. 또한, 해당 시점의 그래프를 탐색하기 위해서 중복 스냅샷과 델타 스냅샷을 연결하였다. 제안하는 기법의 우수성을 보이기 위해 다양한 성능평가를 수행한다.

퍼지 다중특성 관계 그래프를 이용한 내용기반 영상검색 (Content-based Image Retrieval Using Fuzzy Multiple Attribute Relational Graph)

  • 정성환
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.533-538
    • /
    • 2001
  • 본 연구에선는 FAGA(Fuzzy Attribute Relational Graph) 노드의 단일특성을 실제 영상을 응용하여 다중특성으로 확장하고, 노드의 레이블뿐만 아니라, 칼라 질감 그리고 공간관계를 고려한 다중특성 관계 그래프를 이용한 새로운 영상검색을 제안하였다. 1,240 개의 영상으로 구성된 합성영상 데이터베이스와 NETRA 및 Corel Drew 의 1,026개의 영상으로 구성된 자연영상 데이터베이스를 사용하여 실험한 결과, 다중특성을 고려한 접근방법이 단일 특성만 고려하는 방법에 비하여, 합성영상의 경우 Recall에서 6~30% 성능 증가를 보였고, 자연연상의 경우에도 Displacement 척도들과 유사 검색 영상의 수에서 검색 성능이 우수함을 실험을 통하여 확인하였다.

  • PDF

지능형 전자상거래를 위한 온톨로지의 효율적인 생성

  • 김태석;양진혁;이지홍;손종수;정인정
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.273-279
    • /
    • 2005
  • 월드와이드웹 (WWW) 기반의 전자상거래는 주로 데이터베이스를 기반으로 서비스를 제공하고 있다. 그러나 월드와이드웹 기반의 전자상거래는 단순 키워드 검색에만 의존하고 있다. 이러한 검색은 데이터베이스 자체로는 의미적인 정보를 효과적으로 처리하기에는 많은 문제점이 있다. 1999년 말에 의미적인 정보를 효과적으로 처리하기 할 수 있는 시맨틱 웹 이 제안되었다. 시맨틱 웹은 의미적인 정보를 담고 있는 지식베이스(Knowledge Bases)인 온톨로지를 기반으로 하고 있다. 그러나 온툴로지의 생성은 많은 부분을 휴리스틱에 의존하고 있기 때문에 많은 시간과 비용이 소비된다. 따라서 우리는 이와 같은 문제를 해결하기 위하여 데이터베이스에서 온톨로지를 생성하는 방법을 제안한다. 데이터베이스는 도메인을 잘 나타내고 있는 정보의 저장소이므로 데이터베이스로부터의 온톨로지 생성은 분석, 설계 등의 사전 작업이 필요하지 않아 시간과 비용의 소비를 줄 일 수 있는 장점이 있다. 우리는 데이터베이스에서 스키마를 추출, 뼈대그래프$^{1}$ 를 생성하고 개념그래프로 확장하여 도메인을 잘 나타낼 수 있는 온톨로지를 생성하는 알고리즘을 제안하고 제안된 알고리즘을 통하여 온톨로지를 생성을 함으로서 제안된 생성 방법을 검증한다. 제안한 방법으로 생성된 온톨로지는 단순 키워드 검색에서 의미적인 검색을 할 수 있는 시맨틱 웹 서비스의 기반이 되므로 의미적 검색이 가능한 전자상거래 서비스를 구축하는데 시간과 비용의 소비를 줄임으로 차세대 전자상거래의 초석이 된다.

  • PDF

그래프 구조를 갖는 서지 빅데이터의 효율적인 온라인 탐색 및 분석을 지원하는 그래픽 인터페이스 개발 (Developing Graphic Interface for Efficient Online Searching and Analysis of Graph-Structured Bibliographic Big Data)

  • 유영석;박범준;조선화;이수안;김진호
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.77-88
    • /
    • 2020
  • 최근 다양한 실세계의 복잡한 관계를 그래프의 형태로 구성하고 분석하는 다양한 연구들이 진행되고 있다. 특히 DBLP와 같은 컴퓨터 분야 문헌 데이터 시스템은 논문의 저자, 그리고 논문과 논문들이 서로 인용 관계로 표현되는 대표적인 그래프 데이터이다. 그래프 데이터는 저장 구조 및 표현이 매우 복잡하므로, 문헌 빅데이터의 검색과 분석, 그리고 시각화는 매우 어려운 작업이다. 본 논문에서는 문헌 빅데이터를 그래프의 형태로 시각화한 그래픽 사용자 인터페이스 도구, 즉 EEUM을 개발하였다. EEUM은 그래프 데이터를 시각적으로 표시하여 연결된 그래프 구조에 따라 문헌 데이터를 브라우징 하는 기능을 제공하며, 문헌 빅데이터에 대한 검색 및 관리, 분석이 가능하도록 구현하였다. 또한 EEUM을 DBLP가 제공하는 문헌 그래프 빅데이터에 적용하여 편리하게 검색, 탐색 및 분석하는 할 수 있음을 시연한다. EEUM을 이용하여 모든 연구 분야에서 영향력 있는 저자나 논문을 쉽게 찾을 수 있으며, 여러 저자와 논문 사이의 모든 관계를 한 눈에 볼 수 있는 등 복잡한 문헌 그래프 빅데이터의 검색 및 분석 도구로 편리하게 사용할 수 있다.

간선 유형 및 가중치를 고려한 연속 서브 그래프 매칭 기법 (Continuous Subgraph Matching Scheme Considering Edge Types and Weights)

  • 최도진;복경수;이병엽;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.451-452
    • /
    • 2019
  • 논문 검색 서비스 응용에서는 공저자, 출판 정보 등을 표현하기 위해서 다양한 정점 레이블 (논문,저자) 및 간선 정보(주저자, 공저자)를 이용하여 그래프로 표현한다. 이와 함께 다양한 간선 특징 정보를 질의로 입력하는 연속 서브 그래프 매칭에 대한 요구가 존재한다. 본 논문에서는 간선의 다양한 특성을 지원하고 색인의 부하를 감소시킨 연속 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 거리 값과 질의 연관 정보만을 관리하여 간선의 다양한 특성을 지원하는 효율적인 서브 그래프 매칭을 수행한다.

  • PDF

그래프 데이터에 대한 비-중복적 키워드 검색 방법 (A Method for Non-redundant Keyword Search over Graph Data)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제16권6호
    • /
    • pp.205-214
    • /
    • 2016
  • 최근 소셜 네트워크, 시맨틱 웹, 바이오 인포매틱스 등 여러 응용 분야에서 그래프 구조를 갖는 대용량 데이터들에 활용됨에 따라 이런 데이터들에 대한 키워드 기반 검색 방법이 많은 관심을 받고 있다. 본 논문에서는 그래프 구조 데이터에 대한 키워드 질의에 대해 질의와 연관성이 높으면서 구조적인 중복성을 갖지 않는 top-k 결과 집합을 효율적으로 검색하는 방법을 제안한다. 키워드 질의에 대한 비-중복적인 결과 트리 구조와 그것의 연관도 척도를 정의하고, 그래프 내에 포함된 유용한 경로 정보들에 대한 효과적인 인덱싱 방법을 제안한다. 그리고 기 생성된 인덱스를 활용하여 주어진 키워드 질의에 대해 비-중복적이면서 연관도가 큰 top-k 결과 집합을 생성하는 효율적인 질의 처리 알고리즘을 제시한다. 실 데이터를 이용한 실험을 통해 제안한 방법의 효과와 성능을 기존 방법과 비교 분석한다.