한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2016년도 춘계학술발표대회
- /
- Pages.80-81
- /
- 2016
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
RDB 뷰 정의로부터 상하위 관계를 추출하는 스파크 기반 시스템 설계
A Design of Spark Based System for Extracting Hierarchical Relationships from RDB View Definitions
- Ahn, Jinhyun (Biomedical Knowledge Engineering Laboratory, Seoul National University) ;
- Im, Dong-Hyuk (Department of Computer and Information Engineering, Hoseo University) ;
- Kim, Hong-Gee (Biomedical Knowledge Engineering Laboratory, Seoul National University)
- 발행 : 2016.04.29
초록
기계가 읽을 수 있는 형태의 정보로 구성된 시맨틱웹 환경이 주목을 받고 있다. 온톨로지는 정보를 구조적으로 표현하는 방법론의 일종으로 시맨틱웹에서 중요한 역할을 한다. 사람이 일일이 정보를 처음부터 온톨로지로 만드는 것은 쉽지 않기 때문에 관계형 데이터베이스를 온톨로지로 자동으로 변환하는 연구가 진행되고 있다. 최근 하둡을 활용하여 관계형 데이터베이스의 뷰 정의로부터 상하위 관계를 추출하는 연구가 제안 됐다. 하지만, 하둡은 디스크 기반이기 때문에 속도가 느리다는 단점이 있다. 본 논문에서는 관계형 데이터베이스의 뷰 정의로부터 상하위 관계를 추출하는 과정을 인메모리 분산 처리 시스템인 스파크에서 수행하는 방법을 제안한다. 주어진 뷰 정의에 있는 테이블 이름으로 분산시킨 후 각각에서 독립적으로 상하위 관계를 추출한다.
키워드