DOI QR코드

DOI QR Code

A Study on Establishing the Strategies for Integrated Management and Utilization of Disaster & Safety Research Data

재난안전연구데이터 통합관리·활용을 위한 전략 수립 연구

  • Ryu, Shin-Hye (Disaster Information Research Division, National Disaster Management Research Institute) ;
  • Yoon, Heewon (Disaster Information Research Division, National Disaster Management Research Institute) ;
  • Kim, Daewuk (STADT Co.) ;
  • Choi, Seon-Hwa (Disaster Information Research Division, National Disaster Management Research Institute)
  • 류신혜 (국립재난안전연구원 재난정보연구실) ;
  • 윤희원 (국립재난안전연구원 재난정보연구실) ;
  • 김대욱 ((주)슈타트) ;
  • 최선화 (국립재난안전연구원 재난정보연구실)
  • Received : 2022.10.25
  • Accepted : 2022.12.07
  • Published : 2022.12.31

Abstract

With the increase of data and the development of AI technology, the strategies and policies related to integrated data are being actively established to increase the usability of data all over the world. Recently, in the research field, infrastructure projects and management systems are being prepared to utilize research data at the initiative of the government. Also, in Korea, platforms for searching and sharing research data are being actively developed. The National Disaster Management Research Institute (NDMI) has been conducting extensive research on disaster & safety as a national institute, but data-oriented management and utilization are insufficient. Because it still lacks consistent data management systems, metadata for outcomes of research, experts on data and policies for utilization of data to research. In order to move to the data-based research paradigm, we defined the master plans and verified a target model for the integrated management and utilization of disaster & safety research data. In this study, we found out the need to establish differentiated data governance, such as data standardization and unification of the data management system, and dedicated organization for managing data, based on the necessity and actual demands of NDMI. In order to verify the effectiveness of the target model reflecting the derived implications, we intend to establish a pilot mode. In the future, major improvement measures to establish a disaster & safety research data management system will be implement.

데이터의 증가와 AI 기술의 발전에 따라 전 세계적으로 데이터의 활용성을 높이고자 통합 데이터 전략 및 정책 수립이 활발히 진행되고 있다. 최근 연구 분야에서도 국가주도적으로 연구데이터를 활용하기 위해 세계적으로 인프라 사업 및 관리·활용 체계 마련이 이뤄지고 있으며 국내 역시 연구데이터의 검색과 공유를 위한 플랫폼 개발이 활발히 진행되고 있다. 국립재난안전연구원은 국가 재난과 안전관리 총괄 연구기관으로서 재난안전과 관련한 방대한 연구를 수행해 왔으나, 일관성 있는 데이터 관리 체계 및 생산 데이터에 대한 메타데이터 부재, 데이터 활용을 위한 전문인력과 관리 정책 부족 등 원활한 데이터 관리 및 활용이 미흡한 실정이다. 이에 데이터 기반 연구 패러다임의 전환을 위해 재난안전연구데이터의 통합 관리, 활용을 위한 기본계획과 목표모델 검증을 수행하였다. 본 연구를 통해 원내 데이터 통합 관리의 필요성과 실제 수요를 기반으로 데이터 표준화 및 관리 체계 일원화, 전담 조직/인력 구성 등 차별화된 데이터 거버넌스 마련의 필요성을 도출할 수 있었다. 도출된 시사점을 반영한 목표모델의 실효성을 검증하기 위해 파일럿 모델 구축 및 주요 개선 방안을 도출하여 향후 재난안전연구데이터 관리 시스템 구축을 위한 실행 과제로 삼고자 한다.

Keywords

1. 서론

2007년 4월 OECD에서 ‘정부 지원 연구데이터 접근에 대한 원칙과 지침’을 발표함에 따라 연구데이터 공유에 관한 관심이 증대되었다. 더불어 데이터 중심 연구인 4세대 연구 패러다임이 주목받고 있다.

세계 선진국들은 데이터의 증가, AI 기술의 발전 등에 의해 데이터 활용을 국제 경쟁력의 핵심으로 삼고, 통합적 데이터 전략 수립과 정책적 움직임을 서두르고 있다(KISTI, 2018; KISTI, 2021; Korea Data Agency, 2021; NIA, 2019).

미국은 2010년 ‘미국 경쟁력 강화법(America Competes Reauthorization Act)’에 의한 과학데이터 관리원칙 규정을 수립한 바 있다. 미국의 과학데이터 공유활용 정책은 과학기술정책사무국(Office of Science and Technology Policy, OSTP)이 주관하여 연방 내 관리 계획에 따라 연구데이터를 수집하고, 연구데이터의 생산·관리·공개 및 보존은 미국과학재단(National Science Foundation, NSF)에서 관리한다. 2015년 공공·연구·민간 분야 간 협업을 촉진하기 위해 250여 개 이상의 대학, 재단, 기업 등의 참여를 통해 사회 문제를 해결하는 Big Data Regional Innovation Hubs (BD Hubs) 프로젝트가 본격적으로 추진되었다. 이를 기반으로 미국과학재단은 저비용, 고속, 고용량 네트워크 제공이 가능한 개방저장네트워크(Open Storage Network, OSN)를 구축하는 방안을 발표하고 2020년까지 개발 사업에 총 180만 달러(약 20억 원)을 투자하기로 하였다.

유럽연합은 2020년 ‘유럽데이터전략(European Data Strategy)’을 수립하여 글로벌 경쟁력과 주권을 보장할 수 있는 단일 데이터 시장을 만들고, 시장을 구축함으로써 경제·사회적으로 데이터 사용 활성화를 추구하고 있다. 특히 생활방식, 건강관리, 나아가 삶 전체를 변화시킬 수 있는 데이터를 통해 경제·사회 발전을 꾀하고자 하였다. 또한, 데이터 보호·권리·사이버 보안 등 강력한 법적 기틀을 구축함으로써 데이터 경제 시대를 선도하는 리더가 될 수 있음을 강조하고 있다.

이러한 배경하에 정부에서는 데이터의 활용성을 높이는 디지털 혁신과 역동성을 확산하고자 디지털 뉴딜 정책을 선언하고, 2025년까지 27조 원을 투자하여 데이터 댐, 지능형 정부 등의 과제를 추진하고 있다(Interagency Association, 2021).

국립재난안전연구원은 1997년 개원 이후 국가 재난과 안전관리 총괄 연구기관으로서 실용적 재난관리 기술을 연구하고 정부 재난 및 안전관리 정책 개발 지원 목적을 충실히 수행하고 있다. 정책연구, 기술개발, R&D 기획·관리, 재난안전정보 관리, 국제협력 등 재난 안전 관련 방대한 연구 활동을 수행하고 있으나, 데이터 중심 재난안전 R&D를 위한 데이터 통합관리·활용은 미흡한 실정이다.

따라서 국립재난안전연구원은 데이터 기반 연구 패러다임의 전환을 위해 재난안전연구데이터 통합관리·활용을 극대화할 수 있는 기본계획 및 중장기 전략 연구에 대한 필요성이 대두되고 있다.

본 연구에서는 데이터 기반 재난안전 R&D 지원을 위한 재난안전연구데이터 통합관리·활용 기본계획 수립 및 목표모델 검증을 수행하였다. 국립재난안전연구원 내·외부 환경 및 현황을 분석하고, 실태진단을 기반으로 하여 재난안전연구데이터 통합관리·활용을 위한 기본계획, 목표모델을 수립하고 제시한다.

논문 구성은 다음과 같다. 2장에서는 국립재난안전연구원의 데이터 현황과 수요조사 결과를 제시하고, 분석 결과를 기반으로 수립한 기본계획 및 중장기 전략, 목표모델을 3장에서 제시한다. 4장에서는 목표모델 수립에 따른 파일럿 시스템을 간략히 소개한다. 마지막으로 5장에서 연구 결과를 정리하며 마무리한다.

2. 재난안전연구데이터 활용 실태진단

재난안전연구데이터 통합관리·활용의 기본계획과 목표모델을 수립하기 위해 국립재난안전연구원의 실태진단을 수행하였다. 연구원에서 운영하는 시스템과 데이터의 현황을 분석하고, 내부 연구자를 대상으로 한 설문조사와 간부급 대상의 인터뷰를 수행하였다. 실태 진단 항목별로 도출한 시사점을 기반으로 기본계획, 목표모델 수립 방향을 마련하였다.

1) 시스템 및 데이터 현황 분석

국립재난안전연구원 시스템 전수조사 결과를 바탕으로 시스템 현황을 분석하였다. 조사한 시스템은 총 49개이며 그 중 11개 시스템이 신규 과제로 구축 진행 중인 것으로 확인되었다. 운영 상태를 보면 운영 중인 시스템이 20개, 미 운영 시스템이 14개로 나타났고 구축 중인 시스템 11개, 기타(개선 중, 확인 불가능) 시스템이 2개로 파악되었다. 20개의 운영 시스템 중 17개 시스템(85%)이 국립재난안전연구원 인프라를 활용하여 구동중인 것으로 나타났으며, 나머지 3개 시스템의 외부 운영 장소로는 국가정보자원관리원(광주센터), 외부 클라우드 인프라, 행정안전부 국가재난관리정보시스템(National Disaster Management System, NDMS)으로 조사되었다. 또한, 20개 운영 시스템 중 대부분은 WEB 기반의 형태로 서비스를 제공 중이었으며 Web과 App을 모두 지원하는 시스템은 단 1개로 파악되었다.

시스템 현황 분석 결과, 접근성이나 활용성을 높이기 위해 서비스 방식이 다양화가 필요한 것으로 분석되었으며 시스템이나 데이터를 통합적으로 관리하지 않고 담당 부서에서 개별적으로 관리하여 활용성과 효율성이 낮았다. 또한, 시스템 운영률은 41%로 저조하여 활용성 높은 시스템을 구축할 필요가 있음을 시사하였다.

시스템 별 수집·생산 데이터를 살펴본 결과, 각각 659건, 170건으로 파악되었다. 시스템 운영 및 재난안전 R&D를 위해 데이터를 수집하는 기관은 30개 이상이며, 행정안전부에서 수집하는 데이터가 40%로 가장 많은 것으로 나타났다. 자체 생산 및 원내 보유 데이터의 활용은 약 1.7%로 나타나 외부 기관의 비중이 큰 것으로 파악되었다. 데이터 수집 방식으로는 웹 다운로드가 55%로 가장 많았고 FTP 연계, DB 연계 순으로 나타났다. 수집 데이터의 유형으로는 엑셀 기반의 스프레드시트 형식이 49%로 대부분을 차지하며 공간정보, 데이터베이스 순으로 나타났다. 표 형식의 스프레드시트 데이터를 수집하여 목적에 맞게 데이터를 후처리하는 작업이 많은 것으로 파악되었다.

생산 데이터는 총 170건으로 그 중 58%가 데이터베이스 형식이며 공간 정보, 스프레드시트 순으로 많은 것으로 파악하였다. 84%의 데이터가 비정기적으로 생산되고 있어 향후 생성된 자료에 대한 재활용성 및 데이터 관리 방안 마련 등이 필요한 것으로 분석되었다.

데이터 현황 분석 결과, 수집의 측면에서는 다양한 기관에서 폭넓게 데이터를 수집하고 있는 것을 확인할 수 있었고, 수집 방식은 웹 다운로드의 비중이 높아 시스템 연계 등의 효율적인 데이터 수집 방안을 마련할 필요성이 있는 것으로 분석되었다. 데이터 활용의 측면에서는 반정형 유형인 스프레드시트 구조의 데이터 활용 비중이 크나 그 외 다양한 유형의 데이터를 활용하는 것으로 나타나 데이터의 메타정보 생성 및 표준화가 필요한 것으로 파악되었다. 또한, 외부 기관의 데이터 활용 의존도가 높은 것으로 나타나, 특화 데이터 마련 등을 통해 자체 생성 데이터의 활용도를 제고할 필요가 있음을 시사하였다.

2) 설문조사 결과

연구원 내 데이터 활용 현황과 관련 요구를 파악하기 위해 10일 간 연구원 전 직원을 대상으로 ‘연구데이터 수집·관리·공유·활용과 향후 연구데이터 통합관리’에 관한 모바일 설문조사를 실시하였다. 전 직원 197명 중 118명이 응답하여 응답률 60%를 달성하였다.

(1) 연구데이터 작업 프로세스

연구데이터의 수집·관리 주체에 대해 확인한 결과, 수집과 관리 모두 ‘연구원 본인’이 연구 주제와 관련된 데이터의 수급처를 직접 확인하고 작업을 수행하는 것으로 파악되었다. 전문인력을 지정하지 않고 데이터를 수집·관리하는 것이 중장기적 관리 차원에서는 위험한 것으로 판단된다. 또한 데이터 공유 인식과 관련하여 대체로 데이터를 공유해야 한다는 공감대를 나타내었으나 실제 공유 경험은 매우 빈약한 수준으로 파악되어 ‘공유환경 미비’가 한계로 지적된다.

(2) 연구데이터 수집 활동

연구데이터를 수집하는 기관으로는 행정안전부가 가장 높은 빈도였으며, 통계청, 기상청, 국토교통부 등의 순으로 나타났다. 수집 방법의 경우 실시간 연계 서비스가 잘 갖춰진 기관의 데이터는 실시간 연계, 웹 다운로드 활용 빈도가 높은 것으로 나타났고, 평상시 업무상 자주 소통을 하는 행정안전부의 경우 ‘직접 방문’도 많은 것으로 집계되었다.

(3) 연구데이터 작업 과정에서의 고충

연구데이터를 저장·관리하는 과정 중 어려움으로는 ‘데이터 저장 관리에 대한 전문성을 지닌 인력 부족(28%)’과 ‘저장관리 의무기한 및 관리 기준 모호(21%)’ 순으로 나타났다. 공유 과정에서의 어려움은 ‘공유할 데이터를 찾고 정리해서 보충 설명하는 추가적인 시간과 노력의 필요(40%)’와 ‘공유할 데이터를 요구에 맞게 제공하기 위한 전문성 부족(31%)’으로 조사되었다.

(4) 연구데이터 작업 프로세스에 대한 인지

연구데이터의 수집에서 관리, 활용, 공유에 이르기까지 모든 과정에 대해 연구원 대부분 ‘대체로 어려움’으로 응답하였으며, 응답자 중 약 70%가 연구데이터의 통합관리·활용에 대해 필요하다고 응답하였다.

최종적으로 설문 결과를 통해 세부 부문별 이슈 사항과 시사점을 정리해보면 다음과 같다. 부문별 이슈로는 데이터 수집과 관련하여 자료의 요청, 수집 과정에서 업무 협의에 대한 고충이 있으며 자료 수집 과정의 간소화가 필요하다는 것을 파악할 수 있었다. 데이터 품질의 경우 수집 데이터에 대한 품질이 만족스럽지 않아 데이터를 재생산해야 하는 문제가 언급되었다. 데이터 형태에 있어서는 수집되는 데이터의 형태가 상이하여 표준화가 요구되는 점, 공유 방식에 있어서는 데이터를 공유할 수 있는 채널과 창구가 부재하다는 문제점이 확인되었다. 데이터 제공 방식 및 가공 측면에서는 자료 요청사항에 맞게 데이터를 재수정 해야하는 문제점과 원하는 형태로의 가공 과정이 필요하며 이 과정에서 전문성이 요구된다는 점도 거론되었다. 데이터 관리, 활용, 정책적인 부분에서는 일관성 있는 관리 체계가 부재하여 발생하는 문제에 대한 어려움이 언급되었으며, 생산 데이터에 대한 메타정보 부재 및 활용을 위한 전문 인력 부족, 데이터 관리 정책 및 접근 권한 등 제도적인 뒷받침이 필요하다는 의견이 제시되었다. 이에 따른 시사점으로는 다섯 가지 항목으로 정리할 수 있다. 데이터 통합 및 관리 시스템의 필요, 데이터 수집 절차의 간소화, 데이터 품질관리 및 조직 구성, 활용 데이터의 표준화, 데이터 공유 및 관리 정책 마련으로 시사점을 도출하였다.

3) 사용자 요구 분석 결과

사용자 요구 분석을 위해 실무자와 간부급을 대상으로 대면 인터뷰를 실시하였다. 실무자 인터뷰는 액상화 위험 지도, 연구원 도서관 홈페이지, 소셜 빅보드, 실시간 재난안전 뉴스 모니터링 시스템, 재난연구정보관리 시스템, 지진 방재 콘텐츠 공유 서버, 빅데이터 클라우드 인프라, 재난아카이브 원인정보 분석 시스템(NDMI, 2020)까지 총 8개 시스템과 위성정보연구팀의 각 담당자를 대상으로 인터뷰를 수행하였고, 간부급 대상 인터뷰는 연구원의 각 실장(안전연구실, 방재연구실, 재난 정보연구실, 재난원인조사실) 및 센터장(사회재난연구센터, R&D관리평가센터, 지진방재센터)을 대상으로 수행하였다. 연구데이터 관리 및 활용 실태, 운영 및 조직에 관한 요구사항 파악을 목적으로 인터뷰를 수행하였다.

인터뷰 결과 실무담당자는 연구원 내부에서 생산하는 연구데이터의 공유와 외부 기관에서 생산되는 데이터의 연계가 가능한 연구데이터 통합관리시스템의 도입이 필요하다는 내용으로 대부분 비슷한 견해를 보이고 있었다. 간부급 인터뷰에서는 데이터의 정의 및 범위 설정, 데이터 통합을 위한 표준화 방안, bottom-up 방식을 통한 사용자 요구사항 반영, 연구원의 특성 반영 필요 등을 주요 의견으로 제시하였다.

4) 시사점 및 전략 도출

시스템·데이터 현황 분석, 설문조사, 실무자· 간부급 인터뷰 조사에서 도출된 시사점을 종합적으로 분석하였다. 공통되는 시사점을 바탕으로 재난안전연구데이터 통합관리 기본계획을 세분화하여 (1) 데이터 수집 및 연계, (2) 플랫폼 운영, (3) 데이터 품질관리, (4) 데이터 표준화, (5) 데이터 공유 및 관리 정책, (6) 전문 조직, (7) 데이터 보안의 7가지 방향으로 도출하였다.

Table 1. Summary of implications

OGCSBN_2022_v38n6_3_1789_t0001.png 이미지

현황 분석을 기반으로 SWOT 분석을 실시하여 연구자 중심의 실효성 있는 3P (Platform, Process, People) 전략을 마련하였다. SO, WO, ST, WT 각각의 세부 전략은 Table 2와 같다.

Table 2. SO-WO-ST-WT strategy

OGCSBN_2022_v38n6_3_1789_t0002.png 이미지

이 같은 전략을 바탕으로 도출된 3P 전략은 Process (정책), Platform (플랫폼), People (조직)의 세 가지 기조로 귀결된다. 각 부문별 세부 전략으로 Process (정책)는 ‘데이터 표준화 및 보안체계’, ‘데이터 품질관리 계획 방안’, Platform (플랫폼)은 ‘데이터 수집 및 연계방안’, ‘재난안전 통합 플랫폼 운영 계획 방안’, People (조직)은 ‘데이터 공유 및 관리정책’, ‘전문 조직 계획 방안’을 도출하였다.

3. 재난안전 연구데이터 통합관리·활용 기본계획 수립

앞서 2장에서 정의한 3P 전략을 도식화한 것은 다음 Fig. 1과 같다. 이를 기반으로 Process (정책), Platform (플랫폼), People (조직) 3가지 부문으로 나누어 재난안전연구데이터 통합관리·활용 기본계획을 수립하고자 한다.

OGCSBN_2022_v38n6_3_1789_f0001.png 이미지

Fig. 1. 3P (Process, Platform, People) strategy.

1) 정책(Process)

정책(Process) 전략의 중점 추진내용으로는 데이터 표준화 및 보안체계 마련, 데이터 품질관리가 있다.

(1) 데이터 표준화 및 보안 체계 마련

데이터 표준화 및 보안 체계에서는 재난안전연구데이터에 대한 메타데이터 정의, 분류체계 마련, 보안 및 저작 라이선스 체계 마련이 필요하다. 재난안전연구데이터의 메타데이터는 재난안전 연구의 체계적인 활용을 지원하고 데이터 소재를 관리하는 목적으로 기본 데이터 단위를 설명하는 정보로 정의할 수 있다(KIPA, 2020). 과학기술정보통신부에서 수행한 재난안전정보 공동활용 플랫폼 구축 방안 연구에서는 재난안전정보 관리 및 공유를 위한 메타데이터 표준(TTA.KO-10.1126) 항목을 제시하였다(TTA, 2019; KISTI, 2020; Ministry of Science and ICT, 2019). 이는 재난안전유형, 재난관리단계, 피해대상, 주관기관 등 여러 관점에서 적용될 수 있도록 구성되어 있어 재난안전연구데이터 메타데이터 표준에 활용하기에는 방대하고 적합하지 않은 항목이 존재한다. 따라서 재난안전정보 관리 및 공유를 위해 연구원 데이터 전수조사 분석 내용을 바탕으로 재난안전 연구데이터 메타데이터 표준을 정의할 필요가 있으며 그 결과는 Table 3과 같다.

Table 3. Metadata of disaster safety research data

OGCSBN_2022_v38n6_3_1789_t0003.png 이미지

재난안전연구데이터 분류체계의 목적은 수집 및 연계되는 데이터를 일관성 있게 분류하고 활용하는데 있다. 연구원의 내부 데이터와 외부 데이터를 모두 수용할 수 있는 분류 기준이 필요하고 정확한 조회와 관리가 가능하도록 일반적이고 직관적인 분류 기준을 적용해야 한다. 따라서 재난안전연구데이터 분류체계는 TTAK.KO-10.1047의 재난안전유형 분류체계를 준용하고 그 외 외부데이터의 분류는 행정안전부의 공공데이터포털 대분류 체계를 적용하였다(TTA, 2018). 공공 행정, 과학기술, 재난안전 등 16개 대분류, 기상, 기후 등 14개 중분류, 강풍, 낙뢰 등 61개 소분류로 구성하여 분류체계를 정의하였다. 재난안전을 제외한 15개 대분류의 중·소분류는 제공 기관의 분류체계를 적용한다.

데이터 보안은 공공데이터의 제공 및 이용 활성화에 관한 법률 제17조에 의해 추진된다. 이에 근거하여 재난 안전연구데이터의 보안 사항을 확인하기 위해서는 1차적으로 비공개 대상 정보 포함 여부를 확인하고, 2차적으로 저작권 등 제3자 권리 포함 여부를 확인하여 결정한다. 데이터 보안 등급은 3개 등급으로 분류된다. 개인 정보, 직무상 비밀 엄수 등의 중대한 보안 사항이 있는 데이터는 보안의 경중에 따라 비공개 또는 일부 공개로 지정하고 그 외 보안을 설정할 필요가 없는 데이터는 전체 공개로 지정하여 관리한다. 전체 공개 데이터는 사용자가 자유롭게 데이터를 취득할 수 있고, 비공개 데이터는 다운로드가 불가능하며, 데이터를 생산 또는 등록한 담당자에게 문의하여 처리할 수 있도록 안내한다. 일부 공개 데이터는 부서 공개 또는 사용자 등급에 따라 공개를 제한하고, 보안서약서를 플랫폼 내에서 전자 문서화하여 처리 후 다운로드할 수 있도록 안내한다. 데이터 라이선스 정책에 적용할 수 있는 기준은 연구원 업무 특성상 원시데이터의 변경 및 재변경 등이 많기 때문에 2차 가공 데이터의 라이선스 등록에 보다 자유로운 CC라이선스를 적용하는 것이 적합한 것으로 사료된다.

(2) 데이터 품질관리

재난안전연구데이터의 품질관리를 위해서는 용어 표준화와 품질 관리체계 수립, 수집·연계 데이터의 품질관리 방안 마련이 필요하다. 먼저 용어 표준화는 플랫폼에서 데이터를 관리하기 위해 사용하는 용어의 구성 요소와 생성 기준을 정의하고 표준 용어 사전을 만드는 작업을 의미한다. 재난안전연구데이터의 용어 표준화는 재난안전 플랫폼 기술 개발 사업의 재난안전정보 아카이빙 및 기반 요소 기술 개발 연구(Ministry of Science and ICT, 2020)에서 제안한 재난안전 표준 용어 사전을 준용할 수 있다. 이 용어 사전은 국제 표준, 공신력 있는 단행본, 현행 법령, 매뉴얼(Standard Operating Procedure, SOP)의 용어를 정리하여 재난안전정보 용어 목록을 작성한 것으로, 2020년 기준 구축된 용어 사전에는 38,918건이 정리되어 있다. 또한 연구원에서 사용하는 통상 용어를 추가적으로 조사하여 재난안전연구데이터의 용어 표준화를 수립한다.

실효성 있는 데이터 취득과 공동 활용을 목적으로 재난안전연구데이터의 특징을 분석하여 품질 관리체계 방향을 수립하였다. 데이터 생애주기를 고려하여 계획, 구축, 운영, 활용으로 단계를 나누어 품질관리를 수행한다. 계획 단계에서는 품질관리 조직 및 인력을 구성하고 품질관리 중점 대상 데이터를 선정한다. 데이터 표준화 및 연계 데이터의 품질 확보 방안을 마련하고 매년 데이터 품질관리 계획을 수립하여 최신성을 유지한다. 구축 단계에서는 데이터 표준을 지속적으로 관리하고, 중복 데이터가 발생하지 않도록 일관성을 유지하며 연계 데이터의 정합성을 확보하기 위한 방안을 마련한다. 운영 단계에서는 품질 진단을 정기적으로 실시하여 발견되는 오류 데이터를 개선하고 품질관리 운영의 산출물을 관리한다. 활용 단계에서는 품질 오류 신고 접수와 오류 개선 체계를 마련하고, 데이터 오류를 신속히 개선할 수 있도록 관리한다.

외부 시스템에서 수집·연계되는 데이터에 대한 품질 관리를 위해서는 데이터의 수집·연계 과정에서 품질관리 활동이 병행되어야 하며 이를 실현하기 위해서는 수집·연계 플랫폼과 품질관리 시스템의 유기적 연계가 필수적이다. 또한, 지속적인 오류값 관리를 통해 데이터의 최신성을 확보하여 서비스 신뢰성을 높여야 한다.

2) 플랫폼(Platform)

플랫폼(Platform) 전략은 데이터 수집 및 연계, 재난 안전 통합 플랫폼 운영이 중점 추진 내용이다.

(1) 데이터 수집 및 연계

앞서 수행한 시스템 및 데이터 전수조사 분석 결과를 기반으로 내부 데이터 수집 방안을 마련하였다. 연구원의 내부 데이터는 데이터 유형, 생산 주기, 운영 시스템 등이 매우 다양한 것이 특징이다. 이러한 특성을 고려하여 여러 시스템에서 분산 운영되는 각각의 데이터를 효율적으로 통합하여 관리하는데 특화된 데이터 웨어하우스(Data Warehouse)의 개념을 도입하여 데이터 적재가 필요하다. 외부 데이터의 연계는 외부 기관에서 제공하는 연계 채널에 따른 통합 DB 구축이 필요하다. 데이터 전수조사 분석 결과를 기반으로 주요 외부 데이터 수집 기관을 도출하고, 크롤링(crawling), Enterprise Service Bus (ESB), Open API 등 여러 검증된 방법을 이용한 연계 방안을 마련해야 한다. 외부 데이터는 유형, 크기 등 정보 파악이 힘들기 때문에 우선적으로 저장할 수 있는 방대한 저장 방안이 필요하며, 이러한 다양한 구조의 외부 데이터 특성을 고려하여 원시데이터의 저장 및 통합에 적합한 데이터 레이크(Data Lake) 방식을 채택하였다. 여기에 저장되는 데이터는 사용자가 바로 활용할 수 있도록 추출, 변환, 정제, 적재가 가능한 Extract·Transform·Load (ETL) 솔루션을 도입하여 구성한다.

외부 연계 데이터는 정형과 비정형 데이터가 혼재되어 있어 표준화의 문제가 발생할 수 있다. 데이터 레이크에 적재되는 외부 데이터의 정형·비정형 데이터를 데이터 웨어하우스로 이동하기 위해 ETL의 표준화 자동 변환 기술을 적용해야 한다. 표준화된 DB 적재 및 품질 관리 수행 활동을 기반으로 재난안전연구데이터 특성에 적합한 ETL 솔루션을 적용해야 한다.

(2) 재난안전 통합 플랫폼 운영

재난안전연구데이터 통합관리 및 활용을 위한 시스템 구축을 위해서는 하드웨어적, 소프트웨어적 인프라 구축이 필요하다. 시스템 운영을 위한 서버 장비는 관리 및 보안을 위해 연구원에 위치해야 한다. 이에 필요한 소프트웨어는 연구원 특성과 타기관에서의 데이터 연계로 인해 전자정부프레임워크 개발의 서비스 운영 환경을 제공해야 한다. 그 외 네트워크 인프라 측면에서는 폭넓은 데이터 활용을 위해 기관별 망 분리 현황을 고려하고, 보안을 위해 사용자 접근 권한을 고려하여 시스템을 설계한다.

재난안전연구데이터 통합 플랫폼은 사용자가 관심 키워드를 입력하였을 때 해당 결과물을 쉽게 취득할 수 있는 통합검색 기능을 강화하여 구성한다. 방대한 통합 검색 결과를 필터링 할 수 있는 상세 검색 기능을 도입하여 데이터 분류, 제공기관, 형식 등을 상세히 설정할 수 있도록 구성해야 하며, 검색 결과로 가장 유사한 연관 데이터를 제공하도록 한다. 연관 데이터를 단순히 리스트 형태로 제공하는 것이 아니라, 데이터 맵 형태로 제공하여 쉽게 파악할 수 있도록 한다.

데이터 분석은 연구원 업무 특성을 고려하여, 방대한 데이터에서 유용한 정보를 발굴하고 사용자가 의사결정을 할 수 있도록 지원하는 목적으로 데이터를 정리, 변환, 모델링하는 기능으로 개발되어야 한다. 시각화는 분석 데이터의 활용도 제고를 위해 차트, 그래프, 맵 등의 형태로 나타낼 수 있도록 서비스를 설계한다. 데이터 분석 및 시각화는 오픈소스로 구축하는 것에 한계가 있기에 사용자의 수요를 분석하여 상용화된 툴을 적용하는 것이 적절할 것으로 판단된다.

3) 조직(People)

조직(People) 전략의 중점 추진내용으로는 데이터 관리 및 공유 정책, 전문 조직이 있다.

(1) 데이터 관리 및 공유 정책

재난안전연구데이터의 통합관리·활용을 위해서는 연구자들이 쉽게 접근할 수 있는 표준 지침이 있어야 하며, 정책적으로 연구데이터의 공유에 대한 의무와 권리를 보장하고 있어야 한다. 현재 국립재난안전연구원에는 연구데이터의 관리 및 공유를 위한 표준 지침이나 가이드라인, 정책이 부재한 실정이다. 앞서 언급한 데이터 표준화, 라이선스, 보안, 품질관리 등의 지침을 내부 규정으로 신설해야 한다. 지속적인 재난안전연구데이터의 관리 및 공유 활성화를 위해서는 연구자가 연구데이터를 공유해야만 하는 당위성을 포함하는 의무와 권리를 정책적으로 제시하여야 한다.

전담조직 구성 및 정책 마련과 함께 연구자들의 인식 전환이 필요하다. 과거에 비해 데이터 공유에 대한 인식이 데이터를 공유함으로써 활용도를 제고하고 더 높은 가치를 재생산할 수 있는 패러다임으로 변화하고 있다. 데이터를 공유함으로써 반복적이고 비효율적인 업무 절차의 개선이 가능하고, 업무 효율성이 높아지게 된다. 데이터 공유를 통해 데이터 공급자와는 다른 시각으로 데이터를 재이용 및 재생산하여 의미 있는 새로운 데이터가 만들어지고, 데이터 공급자가 새롭게 만들어진 데이터를 활용하는 선순환 공유 체계를 마련할 수 있다.

(2) 전문조직

현재 국립재난안전연구원은 재난정보연구실에서 IT 업무를 일부 지원하고 있지만, 연구자를 위한 연구데이터 관리 등의 활동은 거의 이루어지지 못하고 있는 실정이다. 선진국의 경우 재난안전 연구기관에서는 IT 전담 조직을 보유하여 연구자들이 연구 업무를 원활하게 수행할 수 있도록 지원하고 있다. 미국 Federal Emergency Management Agency (FEMA)는 Mission Support 전문조직을 통해 위험 관련 준비, 예방, 대응, 복구, 완화에 필요한 지원 및 자원을 제공하고 있다. 또한, 일본의 National Research Institute for Earth Science and Disaster Prevention (NIED)는 Research Service Group, 호주의 Commonwealth Scientific and Industrial Research Organization (CSIRO)는 Information Management & Technology, 대만의 National Science and Technology Center for Disaster Reduction (NCRD)는 Information Division 전문 조직을 운영하고 있다. 재난안전연구데이터의 통합관리와 공유 활성화에 따라 연구데이터의 종류와 양이 많아질수록 품질관리, 표준화, 라이선스, 지침 관리 등에 필요한 전문 인력 투입이 필수적이므로 상시적 데이터 관리 전담조직을 구성하여 운영할 필요가 있다. 전문조직에서는 데이터 정책 방향, 관리 규정, 접근 권한 및 보안 정책 수립, 데이터 생애 전주기 관련 의사결정 및 가이드라인 마련, 데이터 품질관리, 표준화 총괄, 데이터 통합 플랫폼 운영 등의 역할을 수행해야 한다. 전담조직 신설을 통해 현재 부서별 분산되어 있는 연구데이터를 체계적으로 관리할 수 있을 것으로 기대된다.

또한 연구자들의 데이터 역량 강화를 통해 연구데이터 관리 프로세스의 이해도를 높여 데이터 공유 및 활용도를 제고할 필요가 있다. 조직역량 강화를 위해서 플랫폼 사용 방법, 데이터 분석 방법, 그래프 및 차트 이용 방법 등 연구데이터의 다양한 활용 방법을 교육하고, 표준화 및 분류체계 가이드라인 등의 원내 정책을 소개하여 향후 생산되는 연구데이터의 관리 역량을 강화한다. 전문 조직 대상의 교육은 연구데이터 관리 프로세스의 이해도를 높이기 위해 데이터 관리에서 수행되고 있는 절차를 파악하도록 하며, 관련 업무 용어 및 표준화 등 전문 교육을 실시한다. 향후 재난안전연구데이터의 활용도 제고를 위한 AI 기술 도입을 위해 AI 전문가 양성 교육도 필수적인 것으로 사료된다.

4. 목표모델 및 파일럿 시스템 개발

1) 목표모델 수립

환경·현황 분석을 통해 도출한 시사점과 추진, 개선 방향을 종합하여 목표모델을 정의하고 모델의 실효성을 검증하기 위한 파일럿 모델 구축을 진행하였다. 목표 모델에 대한 시스템 아키텍처는 Fig. 2와 같다.

OGCSBN_2022_v38n6_3_1789_f0002.png 이미지

Fig. 2. Architecture of target model.

목표 모델에서 데이터 수집·연계 부분은 국립재난안전연구원에 축적된 정형, 비정형 연구데이터를 대상으로 필수 메타정보 생성 및 DB 구조화 작업을 수행하도록 한다. 연구원 내에서 생성·관리하고 있는 기존 데이터 통합 저장소와, 수집·연계 채널을 통한 외부 데이터 저장 프로세스를 구성해야 한다. 이때 원시 자료에 대한 데이터 유형과 주제별에 따라 갱신 일정을 고려하여 취합을 진행해야 한다. 정제된 데이터는 적정성뿐만 아니라 누락, 중복되는 데이터가 있는지 확인하고 최신성을 유지하도록 노력해야 한다.

데이터 가공·저장 단계에서는 정의된 자료 유형에 맞게 데이터의 등록 및 정제, 갱신과 2차 가공된 데이터의 품질, 이력, 현황 관리를 통해 데이터의 정확성과 일관성, 적합성, 완전성을 유지할 수 있도록 저장 환경 및 품질관리 방안을 마련해야 한다. 또한 이 과정에서 발생하는 운영·관리 데이터, 메타데이터, 로그 데이터를 별도로 관리하여 다양한 목적에 대한 정보 가공 및 활용이 이뤄질 수 있도록 한다.

데이터 활용 부분은 데이터 검색, 조회, 다운로드, 분석, 시각화 등으로 구성되며 활용성 제고를 위해 데이터 분석과 표출(시각화) 기능이 중요한 요소로 파악되었다. 데이터 분석은 데이터 마이닝 기반의 클러스터링(군집화)과 개체명 인식 기술에 해당하는 분석 활용방안이 도출되었다. 최종적으로 사용자에게는 직관적이고 효율성 높은 데이터 운영을 위해 대시보드 형태의 데이터뷰 제공과 그래프, 리포팅 기능이 업무에 필요한 주요 기능으로 파악되어 이를 기반으로 Proof of Concept(PoC)를 구현하였다.

사용자 특성과 요구사항, 개선방안을 종합하여 인프라, 데이터 표준화, 관리, 보안, 공유, 서비스체계의 6가지 항목에 대해 문제점을 분석하고 이를 해결하기 위한 방안을 도출하였다.

(1) 인프라

연구원 내 공동 활용이 가능한 데이터 통합·관리 시스템의 부재로 비효율적인 운영 환경 개선을 위해 통합 인프라 구성이 필요한 것으로 나타났다. 현재 운영되고 있는 빅데이터 클라우드 인프라에 대한 고도화가 필요하며, 향후 구체적인 데이터 수집·연계 규모에 따라 수집 DB에 해당하는 데이터 레이크(Data Lake), 적재 DB에 해당하는 데이터 웨어하우스 등의 주요 인프라 구성을 새롭게 진행할 필요성이 있다. 현재 운영되고 있는 국립재난안전연구원의 빅데이터 클라우드 시스템은 시스템 고도화 등의 문제로 빅데이터 기반의 데이터 운영 인프라를 구성하기에는 부적합한 것으로 판단되며, 이에 대한 고도화가 필요할 것으로 보인다.

(2) 데이터 표준화

데이터 및 DB 표준화 방안 수립에 따른 데이터 저장 방법에 대한 정립이 필요한 것으로 나타났다. 따라서 내·외부 데이터에 대한 연계 취합과 특화된 ETL 솔루션 및 별도의 데이터 추출·변환·적재 프로세스가 개발되어야 한다. 또한, 데이터 생산과 전처리 단계에서 데이터 표준화를 위한 분류, 메타정보 생성에 대한 정의가 필요하다. 또한 연구원 내부 데이터를 대상으로 서비스 및 활용이 필요한 데이터를 선정, 마스터 DB 정의와 설계에 따라 데이터 구조화 작업이 우선적으로 이뤄져야 한다.

(3) 관리체계

일원화된 데이터 저장과 개별 데이터 관리·운영 환경에서 벗어나 체계적으로 데이터를 관리하고 운영하기 위해 사용자 관리체계 관점에서 일원화된 프로세스의 필요성이 중요한 요소로 나타났다. 마스터 DB 및 메타 정보에 따라 표준화된 방식으로 데이터를 저장·관리해야 하며, 데이터 일관성과 완전성이 보장될 수 있도록 품질관리 방안이 마련되어야 한다. 따라서 데이터 수집 및 연계 단계에서부터 표준화된 프로세스와 인터페이스를 설계하여 데이터를 수집하고, 내·외부의 면밀한 환경 분석을 통해 연구원에 특화된 ETL 솔루션 도입이 필요하다. 또한 데이터 추출, 변환, 가공의 각 진행 과정에서 품질관리를 위한 상세 모델을 수립하여 무결성 데이터 통합 DB를 구성해야 한다.

(4) 보안체계

데이터 접근 권한 및 수집 데이터의 저작권 문제, 비공개 데이터 활용 등의 문제로 데이터 통합 운영을 위한 보안체계 수립이 필요한 것으로 확인되었다. 이를 위해 데이터 생산 및 전처리 단계에서 보안 등급을 정의할 수 있다. 저장된 데이터는 사용자의 등급에 따라 이용 권한이 주어지며, 필요할 경우 데이터 활용에 대한 보안서약서를 수집함으로써 투명하고 체계적인 데이터 공유 환경을 마련할 수 있다.

(5) 공유체계

연구 네트워크 강화와 연구원 내 협업 환경 조성을 위해 개별 관리된 자료 공유와 데이터 수집·공유 절차 간소화가 중요한 요소로 확인되었다. 따라서 산발·개별적인 데이터 저장·관리에서 벗어나 중앙 집중식 데이터 저장·관리를 통해 내부에서 생산된 데이터를 쉽고 간편하게 공유, 협력할 수 있는 환경을 구성하였다.

특히 재난 안전 분야의 데이터 수요처 입장에서 벗어나, 데이터 공급처 중심으로의 위상 변화가 필요하다. 생산데이터의 양적인 측면에서 실적인 측면으로의 발전을 위해 고유한 연구데이터 생산이 필요하며, 특화된 융·복합 데이터 발굴이 필요하다.

(6) 서비스체계

내·외부 데이터를 한 번에 검색하고 기존 연구를 활용·분석할 수 있는 플랫폼 기반의 서비스 운영 환경 마련이 필요한 것으로 나타났다. 따라서 수집된 외부데이터를 통합 검색할 수 있는 검색 환경을 마련하고, 최종적으로 빅데이터 거버넌스 체계와 정책 정립을 기반으로 데이터 수집·연계, 가공·저장, 분석·시각화로 나누어 목표모델을 정의하였다. 먼저 데이터 수집 단계에서는 연구원에 축적된 정형·비정형 연구데이터를 대상으로 메타정보 생성과 DB 구조화 작업이 수행되어야 한다. 이때 기존 연구원의 내부 데이터는 통합 저장소에 연계·등록하고, 외부 데이터는 저장 프로세스를 별도 구성해야 한다. 데이터 가공 단계에서는 정의된 자료 유형에 맞게 속성·공간·메타 정보에 대한 2차 가공과 데이터 품질 관리 방안을 마련해야 한다. 마지막으로 데이터 활용 단계에서는 검색·조회·등록·관리·공유·저장·분석 부분으로 기능을 구성하고, 데이터 활용성 제고를 위해 중요한 요소인 분석 및 시각화 기능을 구성한다.

데이터 분석은 활용하고자 하는 데이터의 유형과 DB 구조, 가공 범위 및 다양한 분석 방법론에 맞게 이뤄져야 한다. 또한 향후 연구와 운영 데이터 현황 등을 종합적으로 고려하여 연구원에 맞는 데이터 분석 모델 도출이 필요하다. 이처럼 IT 및 빅데이터 기반의 데이터 거버넌스 운영을 위해 전담 조직 및 전문가 운영이 필요하다. 데이터 수집, 저장, 가공, 품질관리, 데이터 보안 및 교육을 포함한 시스템 운영을 전반적으로 진행할 전문 조직이 필요할 것으로 도출된다.

2) 시스템 설계

목표모델의 실효성 검증을 위해 프로토 타입 형태의 파일럿 모델을 구축하였다. 재난안전 통합 데이터 기반의 활용 플랫폼 서비스로 발전하기 위해 요구되는 주요 메뉴 및 기능을 도출하고, 개발을 수행하였다.

(1) DB설계 및 데이터 구축

데이터가 생성·활용될 때 품질을 위해 동일한 기준으로 사용되는 마스터 데이터를 구축하여 일관성 있는 정보를 제공한다. 구조화된 운영 데이터는 메타정보를 포함해야 하고, 정의한 메타정보를 기준으로 파일럿 모델 운영을 위한 DB 구축을 진행하였다.

구축한 데이터는 내부와 외부로 구분된다. 먼저 내부 데이터는 국립재난안전연구원에서 수집 가능한 자료를 중심으로 연구보고서 색인집 및 코로나19 관련 자료, 일 단위 기상정보 등의 데이터를 수집하였다. 색인집은 연구원에서 생산·활용하고 있는 보고서, 문헌 등의 현황을 중심으로 3,087건의 목록 데이터와 코로나19·기상 정보 1,930건등총 5,017건의 샘플 데이터로 DB를 구성하였다.

Table 4. Metadata of pilot DB

OGCSBN_2022_v38n6_3_1789_t0004.png 이미지

다양한 데이터 서비스를 위해 외부 기관에서 생산·제공되는 데이터 연계가 필수적이다. 파일럿 모델에서는 공공데이터포털의 데이터를 외부 데이터로 구축하였으며, 파일데이터로 제공되는 38,861건의 자료 목록을 수집하고, OpenAPI 기반 자료를 연계하여 관련 데이터를 검색·다운로드 할 수 있게 구성하였다.

(2) 시스템 개발

시스템 표준프레임워크는 전자정부개발프레임워크를 기반으로, 오픈소스 기반의 tomcat 8.5, java 1.8, postgresql 9.6, eGovFramework 8.5로 구성하였다. 하드웨어 인프라는 국립재난안전연구원 내 빅데이터 클라우드 인프라 자원을 활용하여 보안 및 활용 규정에 맞게 시스템 통합 작업이 진행되었다.

OGCSBN_2022_v38n6_3_1789_f0003.png 이미지

Fig. 3. Main page.

파일럿 시스템은 ‘재난안전연구테이터맵’이라고 명하고, 데이터 검색·조회에 대한 접근성과 집중성을 높일 수 있도록 콘텐츠 검색창을 가운데에 배치하였다.

먼저 NDMI 데이터 메뉴에서는 국립재난안전연구원 전체에서 운영·생산되는 데이터를 체계적으로 관리, 활용할 수 있도록 기능을 구성하였다. 세부적으로는 등록된 전체 데이터 현황을 파악할 수 있는 종합 현황, 개인이 등록한 데이터 현황을 파악할 수 있는 개인 현황 기능이 있으며 연구과제를 중심으로 과제별 데이터 현황을 파악할 수 있는 연구과제 현황이 있다. 또한, 생산·등록된 데이터가 어떤 연구과제에서 산출되었는지 파악할 수 있는 연구 과제 성과, 그리고 사용자가 신규 데이터를 등록하고 관리할 수 있는 데이터 등록·현황 기능, 사용자 정보를 조회하는 사용자 현황, 마지막으로 데이터 관련 다양한 의견과 사용자 네트워크를 강화하기 위한 리서치 포럼 메뉴로 기능을 구성하였다.

OGCSBN_2022_v38n6_3_1789_f0004.png 이미지

Fig. 4. Data visualization page.

OGCSBN_2022_v38n6_3_1789_f0005.png 이미지

Fig. 5. Word cloud page.

통합 검색 메뉴에서는 연계 및 정제된 내·외부 통합 데이터를 사용자가 쉽게 검색하거나 조회함으로써 맞춤형 정보를 찾을 수 있도록 하였다. 또한 유사 연관 데이터 자동 검색, 시각화 기반의 데이터 검색 지원을 통해 활용성을 높였으며 등록된 자료의 등급 및 사용자의 데이터 활용 권한 등을 고려하여 자료를 다운로드할 수 있도록 구성하였다.

또한, 시스템에서 제공·운영하는 전체 데이터 현황을 한 눈에 파악할 수 있도록 다양한 그래프를 이용하여 시각화한 데이터 현황 화면을 구성하였다. 데이터 현황 기준은 분류 기준에 따라 데이터 현황을 파악할 수 있으며, 기관 혹은 자료 유형에 따라 다양한 시각화 그래프를 통해 확인할 수 있다.

데이터 분석은 향후 연구 관련 업무와 운영 데이터 현황 등을 종합적으로 고려하여, 연구에 맞는 데이터 분석 모델 도출이 필요할 것으로 예상된다. 파일럿 모델에서는 데이터 분석 및 통계의 대표적 모델을 구축하였다. 기술 통계, 요약 분석, 빅데이터 기반의 주요 키워드 도출이 가능한 단어분석으로 활용 모델을 도출하여 시나리오에 따라 구성하였다.

목표모델 구축 후 서비스 시나리오를 기반으로 한 자문회의를 통해 모델 방향성, 메뉴 및 기능의 효과성, 데이터 운영방안의 적절성, 인프라 구성의 이식성, 시스템 운영을 위한 개선점 등을 종합 검토하여 모델 진단을 수행하였다.

3) 개선 방안

모델 검증 및 진단 활동을 통해 재난안전연구데이터 통합관리·활용 모델 구축에 필요한 주요 개선 이행 방안은 다음과 같다.

(1) 연구원 내부 데이터 DB의 구조화

데이터 표준화 정책 수립 후 현재 운영되고 있는 연구원 내부 데이터를 대상으로 서비스·활용이 필요한 데이터를 선정하여 구조화 작업이 우선적으로 이뤄져야한다.

(2) 체계적인 데이터 축적·연계 활용방안 마련

데이터 수집·연계 단계부터 표준화된 프로세스를 통해 데이터를 수집하고, 내·외부 면밀한 환경 분석을 통해 연구원에 특화된 솔루션 도입이 필요하다.

(3) 데이터 통합 시 단계별 통합 로드맵 필요

빅데이터 기반의 연구 기초 데이터 제공을 위해 연구원 내·외부 기관의 데이터 연계가 필요하나, 명확한 연계 및 통합 범위를 결정하여 현실적이고 효율적인 통합 저장소 구축이 필요하다. 우선 연구원 내부 데이터를 대상으로 수집·통합 진행이 필요하며, 연계·취합 프로세스 환경에 따라 단계별 데이터 연계·통합이 필요한 것으로 판단된다.

(4) 연계·수집 데이터의 메타데이터 관리

방대한 자료를 통합하다 보면 자료 검색과 서비스를 위해 메타데이터 생성과 관리가 중요하다. 이를 해결하기 위해 정의된 메타데이터 기준에 맞는 표준화 작업과 체계적인 관리가 필요하다.

(5) 적재 데이터 검수 및 품질관리 방안

데이터 적재를 위해 추출, 변환, 가공 등의 단계별 진행 과정에서 품질관리 방안의 상세 모델 수립을 통해 무결성 데이터 통합 DB를 구성해야 한다.

(6) 특화된 데이터 생산 및 발굴

재난안전 데이터의 공급처로서의 변화가 필요하다. 생산데이터의 양적 측면뿐만 아니라 질적 측면으로의 발전을 위해 연구원만의 고유 연구데이터 생산과 특화된 융·복합데이터 모델 발굴이 필요하다.

(7) 연구원 업무를 고려한 맞춤형 데이터 분석 모델 정의

데이터 분석은 활용하고자 하는 데이터 유형과 DB 구조, 데이터 가공 범위 및 다양한 분석 방법론에 맞게 분석 절차가 이뤄져야 하며, 향후 연구 업무와 운영 데이터 현황 등을 종합적으로 고려하여 연구원에 맞는 데이터 분석 모델 도출이 필요하다.

(8) 빅데이터 클라우드 인프라 고도화 필요

현재 운영되고 있는 연구원의 빅데이터 클라우드 인프라 시스템은 구축 후 별도의 시스템 고도화가 이뤄지지 않아 장비 노후화 등의 문제가 있다. 따라서 효율적인 운영을 위해 인프라 고도화가 필요하다.

(9) 관리체계 조직 수립

IT 및 빅데이터 기반의 데이터 거버넌스 운영을 위해 전담 조직과 전문가 운영이 필요하다. 전문인력에 대한 역량은 데이터 수집, 저장, 가공, 품질관리, 데이터 보안 및 교육을 포함한 시스템 운영을 전반적으로 진행할 전문 조직이 필요한 것으로 도출된다.

5. 결론

본 논문에서는 재난안전연구데이터 통합관리·활용 기본계획과 목표모델을 소개하였다. 국립재난안전연구원 데이터 활용 실태 진단을 위해 시스템·데이터 현황분석과 내부 연구자 대상 모바일 설문조사, 간부급·실무자 인터뷰를 수행하였다. 이를 통해 도출된 시사점을 종합적으로 분석하여 기본계획과 목표모델의 수립 방향을 설정하였다. 목표모델의 실효성을 검증하기 위해 프로토타입의 파일럿 모델을 구축하고 이에 따른 주요 개선 방안을 도출하였다.

국립재난안전연구원의 데이터 기반의 재난안전 R&D를 위한 방안은 다음 세 가지 관점으로 정리할 수 있다. 첫째, IT 관리 현황 분석 관점에서는 데이터와 시스템의 관리가 연구자 혹은 부서에서 개별적으로 관리하고 있어 업무 비효율이 발생하고, 활용성과 일관성 등에 한계가 있는 것으로 나타났다. 타 부서의 연구데이터를 활용하고자 하여도 데이터 형식, 양식 등이 상이하여 데이터의 통합관리가 필요한 상황이었다. 따라서 연구원 내 데이터 연계, 보유, 생산 데이터를 정리한 연구데이터 체계 수립과 표준화, 전담 조직 혹은 전문 인력에 의한 체계적인 시스템 관리가 필요하다.

둘째, IT 관리 기본 정책의 관점에서는 시스템 간 중복 기능 탑재, 활용도가 저조한 시스템 운영 등에 따른 불필요한 IT 자산 낭비로 인해 효율적인 IT 자산관리에 한계가 있는 것으로 나타났다. 데이터 또한 관리 업무 규정과 품질관리의 부재로 효율적인 관리가 이루어지고 있지 않았다. 사용자의 만족도를 충족시키기 위해 활용성 높은 시스템을 구축하고, 시스템에서 관리하는 데이터의 품질 관리를 통해 IT자산의 유휴화를 방지하도록 해야 할 것이다.

마지막으로 IT 전담 조직 및 인력 구성 방안의 관점에서는, 데이터 기반 재난안전 R&D의 전환과 더불어 연구원만의 차별화된 경쟁력을 확보하는 수단으로 데이터를 효과적으로 수집·구축·분석·활용하기 위해 이에 대한 기획, 운영 및 관리를 전담할 수 있는 전문 전담 조직이 필요할 것이다. 데이터와 관련된 기술적인 문제들은 어느 정도 완비되었다고 볼 수 있으나, 많은 조직들이 실제 데이터·시스템 전문가나 적절한 조직체계를 갖추지 못해 어려움에 봉착하는 경우가 많다. 이에 따라 지속적인 재난안전연구데이터 플랫폼 운영 및 활용을 위해서는 전문인력과 전담조직이 반드시 필요하다. 향후 재난안전연구데이터 통합관리 및 활용 극대화를 위한 시스템 구축과 데이터 통합 설계 및 표준화에 대한 업무재설계(Business Processing Reengineering, BPR)/정보전략계획수립(Information Strategic Planning, ISP)을 통해 체계적이고 효율적인 재난안전연구데이터 통합 플랫폼 구축에 대해 기획하고자 한다.

사사

본 연구는 국립재난안전연구원의 “재난안전 연구데이터 통합관리·활용 기본계획 및 전략 마련” 연구 사업의 지원으로 수행되었음(NDMI-기본-2021-11-01).

References

  1. Interagency Association, 2021. Korean New Deal 2.0, Interagency Association, Sejong, Republic of Korea, pp. 1-107.
  2. KIPA (Korea Institute of Public Administration), 2020. Construction of Disaster and safety information analysis sharing platform, Korea Institute of Public Administration, Daejeon, Republic of Korea.
  3. KISTI (Korea Institute of Science and Technology Information), 2018. Establishing a system for sharing and disseminating research data, Korea Institute of Science and Technology Information, Daejeon, Republic of Korea.
  4. KISTI (Korea Institute of Science and Technology Information) 2020. Development of a Disaster and Safety Information Sharing Platform, Korea Institute of Science and Technology Information, Daejeon, Republic of Korea.
  5. KISTI (Korea Institute of Science and Technology Information), 2021. A Development on the Scientific Data Sharing and Utilizing System, Korea Institute of Science and Technology Information, Daejeon, Republic of Korea.
  6. Korea Data Agency, 2021. Global News Trends in the USA, Korea Data Agency - Data Economy, Seoul, Republic of Korea, vol. 7, pp. 1-17.
  7. Ministry of Science and ICT, 2019. Development of Disaster and Safety Information Integrated Platform, Ministry of Science and ICT, Sejong, Republic of Korea.
  8. Ministry of Science and ICT, 2020. A Study on Development of Foundation Technologies and Archiving for Disaster Safety Information, Ministry of Science and ICT, Sejong, Republic of Korea.
  9. NIA (National Information Society Agency), 2019. Global AI Insight, National Information Society Agency, Daegu, Republic of Korea, vol. 20, pp. 1-8.
  10. NDMI (National Disaster Management Research Institute), 2020. Development of cause information analysis and utilization technology in disaster archive, National Disaster Management Research Institute, Ulsan, Republic of Korea.
  11. TTA (Telecommunication Technology Association), 2018. Classification Scheme for Development of Integrated Metadata for Disaster and Safety Information, Telecommunication Technology Association, Seongnam, Republic of Korea.
  12. TTA (Telecommunication Technology Association), 2019. Metadata for Management and Sharing of Disaster and Safety Information, Telecommunication Technology Association, Seongnam, Republic of Korea.