Data Linkage Method Using LOD in the Healthcare Big Data Platform

보건의료 빅데이터 플랫폼에서 LOD를 활용한 데이터 연계 방안

  • 이경희 (충북대학교 대학원 빅데이터학과) ;
  • 김기남 (충북대학교 대학원 빅데이터학과) ;
  • 조완섭 (충북대학교 경영정보학과)
  • Received : 2019.12.04
  • Accepted : 2019.12.31
  • Published : 2019.12.30

Abstract

Linked Open Data (LOD) is rated as the best of any kind of data disclosure, and allows you to search related data by linking them in a standard format across the Internet. There is an increasing number of cases in which relevant data are constructed in the LOD form in the global environment, but in the domestic healthcare sector, the disclosure of data in the form of LOD is still at the beginning stage. In this paper, we introduce a case of LOD platform construction that provides services by linking domestic and international related data by LOD method, based on the data of Korean medical research paper data and health care big data linkage platform. Linking all data from each DB into an LOD requires a lot of time and effort, and is basically an infrastructure task that government or public institutions should be in charge of rather than the private sector. In this study, ten domestic and foreign LOD sites were linked with only a portion of each DB, enabling users to link data from various domestic and foreign organizations in a convenient manner.

LOD(Linked Open Data)는 데이터 공개방식 중에서 가장 우수한 수준으로 평가받고 있으며, 인터넷 상에서 서로 관련있는 데이터를 표준방식으로 연결하여 하나의 거대한 데이터베이스처럼 검색할 수 있도록 한다. 글로벌 환경에서 관련있는 데이터들이 LOD 형태로 구축되는 사례가 증가하고 있으나 국내 보건의료 분야에서 LOD 형태의 데이터 공개는 아직 초보적인 수준에 머물러 있다. 본 논문에서는 한국의학연구논문 데이터와 보건의료 빅데이터 연계 플랫폼 데이터를 중심으로 국내외 관련있는 DB들을 LOD 방식으로 연계하여 서비스하는 LOD 플랫폼 구축사례를 소개한다. 각 DB의 모든 데이터를 LOD로 연계하는 것은 시간과 노력이 많이 필요하며, 기본적으로 민간보다 국가나 공공기관이 담당해야 하는 인프라성 연구이다. 본 연구에서는 각 DB의 일부만을 대상으로 하여 LOD국내외 10개 사이트를 연계하였으며, 이를 통해 사용자는 편리한 방식으로 국내외 여러 기관의 데이터를 연계하여 검색할 수 있게 된다.

Keywords

References

  1. KMBASE, http://kmbase.medric.or.kr/.
  2. LOD Cloud, https://lod-cloud.net/.
  3. MeSH (Medical Subject Headings), https://www.ncbi.nlm.nih.gov/mesh.
  4. CHHAYA PHALPHEAKTRA, 한국의학논문 데이터베이스를 위한 Linked Open Data 구축(Linked Open Data Construction for Korean Medical Database), 석사학위논문, 충북대학교, 2016.
  5. LOD, https://5stardata.info/ko/.
  6. 공공데이터 포털, LOD 서비스, https://www.data.go.kr/participation/lodService/index.do.
  7. 김지영, 박선아, 이선희, 과학인물 LOD 구축에 관한 연구, 한국도서관정보학회지, 2014.
  8. 배범석, 공공데이터 개방 효과 증대를 위한 링크드 오픈 데이터 적용 방안에 대한 연구, 석사학위논문, 연세대학교, 2014.
  9. 오미애, 보건복지분야 데이터 연계 필요성 및 활용방안, 보건복지포럼: 통권 제227호, 2015.
  10. 이현주, 국립중앙도서관 국가서지 LOD 구축 사례, 한국디지틀도서관포럼, 2015.
  11. 정보화진흥원, LOD 기반의 데이터 관리 패러다임 전환전략, IT & Future Strategy, 2014.4.
  12. 조대웅, 김명호, 링크드 법령 데이터 구축과 LOD 연계, 한국컴퓨터정보학회, 2016.
  13. 조완섭, 보건의료빅데이터연계플랫폼, 보건복지부 R&D과제 보고서, 2018.
  14. 온톨로지, 프로토마, http://www.frotoma.com/sub2_7.do.
  15. 현은석, 링크드 데이터 관점의 빅데이터와 공공데이터, 한국디지털도서관포럼, 2014.
  16. 황금하 외2, 개념 및 관계 분류를 통한 분야 온톨로지 구축, 정보과학회논문지 : 소프트웨어 및 응용, 35(9), 2008.9.