DOI QR코드

DOI QR Code

A Design of Spark Based System for Extracting Hierarchical Relationships from RDB View Definitions

RDB 뷰 정의로부터 상하위 관계를 추출하는 스파크 기반 시스템 설계

  • Ahn, Jinhyun (Biomedical Knowledge Engineering Laboratory, Seoul National University) ;
  • Im, Dong-Hyuk (Department of Computer and Information Engineering, Hoseo University) ;
  • Kim, Hong-Gee (Biomedical Knowledge Engineering Laboratory, Seoul National University)
  • 안진현 (서울대학교 의생명지식공학 연구실) ;
  • 임동혁 (호서대학교 컴퓨터정보공학부) ;
  • 김홍기 (서울대학교 의생명지식공학 연구실)
  • Published : 2016.04.29

Abstract

기계가 읽을 수 있는 형태의 정보로 구성된 시맨틱웹 환경이 주목을 받고 있다. 온톨로지는 정보를 구조적으로 표현하는 방법론의 일종으로 시맨틱웹에서 중요한 역할을 한다. 사람이 일일이 정보를 처음부터 온톨로지로 만드는 것은 쉽지 않기 때문에 관계형 데이터베이스를 온톨로지로 자동으로 변환하는 연구가 진행되고 있다. 최근 하둡을 활용하여 관계형 데이터베이스의 뷰 정의로부터 상하위 관계를 추출하는 연구가 제안 됐다. 하지만, 하둡은 디스크 기반이기 때문에 속도가 느리다는 단점이 있다. 본 논문에서는 관계형 데이터베이스의 뷰 정의로부터 상하위 관계를 추출하는 과정을 인메모리 분산 처리 시스템인 스파크에서 수행하는 방법을 제안한다. 주어진 뷰 정의에 있는 테이블 이름으로 분산시킨 후 각각에서 독립적으로 상하위 관계를 추출한다.

Keywords