• Title/Summary/Keyword: 데이터과학과

Search Result 5,237, Processing Time 0.045 seconds

Data Intensive Cloud Service for Large Scientific Data Analysis (대규모 과학 데이터 분석을 위한 데이터 집약형 클라우드 서비스)

  • Hahm, Jae-Gyoon;Woo, Joon;Kim, Suk-Moon;Jang, Ji-Hoon;Park, Chan-Yeol
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.21-23
    • /
    • 2012
  • 과학 연구에 있어서 데이터 집약형 컴퓨팅은 데이터의 대형화와 함께 그 중요성이 날로 더하여지고 있다. 데이터 집약형 컴퓨팅은 대용량 데이터의 분석을 통해 과학적 지식을 발견하는 것을 목적으로 하고 있으며, 그 처리 방법에 있어서 데이터 병렬화 기법을 주로 사용하게 되는데, 이는 클라우드 컴퓨팅을 통해 도움을 받을 수 있는 계산 처리 방식이다. 또 데이터 집약형 컴퓨팅 서비스에서는 데이터의 검색 및 추출, 전송 등에 있어서 대용량의 데이터를 다룰 수 있는 고도화된 기술을 필요로 하게 된다. 본 연구에서는 대규모 과학 데이터 분석을 위해서 필요한 연구 환경을 유연하고 확장성 있게 제공하는 데이터 집약형 클라우드 서비스를 제안하였다. 본 연구의 목표 시스템은 대량의 데이터 분석을 위해 필요한 다양한 형태의 플랫폼, 응용 프로그램, 시스템 프로그램 등을 제공하는 클라우드 기반의 분석 서비스와 데이터 속성에 기반하여 빠른 검색 및 추출, 효율적인 전송을 제공하는 데이터 서비스로 이루어진다.

Development and Validation of Data Science Education Instructional Model (데이터 과학 교육을 위한 수업모형 개발 및 타당성 검증)

  • Bongchul Kim;Bomsol Kim;Jonghoon Kim
    • Journal of The Korean Association of Information Education
    • /
    • v.26 no.5
    • /
    • pp.417-425
    • /
    • 2022
  • The 'Comprehensive Plan for Nurturing Digital Talents' reported at the Cabinet meeting of the Ministry of Education in August 2022 focuses on qualitative and quantitative expansion of informatics education centered on SW, AI education. With the advent of the era of artificial intelligence, data science education is also drawing attention as a field of informatics education. Data science is originally a field where various studies are fused, and advanced technologies are being used for data analysis, modeling, and machine learning. This study devised a draft of the instructional model of data science education through literature research and analysis of previous studies, and developed a final instructional model through usability test and expert validation.

Development of AI Data Science Education Program to Foster Data Literacy of Elementary School Students (초등학생의 데이터 리터러시 함양을 위한 AI 데이터 과학 교육 프로그램 개발)

  • Hong, Ji-Yeon;Kim, Yungsik
    • Journal of The Korean Association of Information Education
    • /
    • v.24 no.6
    • /
    • pp.633-641
    • /
    • 2020
  • The development of intelligent information technology based on intelligence and data and network technology implemented by artificial intelligence has instigated innovation in society as a whole and has shown wide social and economic impact. Therefore, not only overseas but also in Korea, AI education is in a hurry to cultivate talents who will lead the upcoming society. Data is an important part of artificial intelligence, and data literacy, which can collect, process, and analyze data, to make data-based decisions, can be seen as an important competency to be developed along with AI literacy. Therefore, in this study, an AI data science education program that can increase data literacy of elementary school students was developed and applied to the experimental group, and its effectiveness was verified through a pre- and post response sample t-test. As a result, all of the four detailed competencies of data literacy, data understanding, collection, analysis, and expression, showed statistically significant improvement, indicating that the AI data science education program was effective in improving students' data literacy.

A Study on Awareness and Experience of Data Publishing by Scientists (과학기술분야 연구자들의 데이터 출판경험 및 인식 연구)

  • Hyekyong Hwang;Youngim Jung;Sung-Nam Cho;Tae-Sul Seo;Jihyun Kim
    • Journal of Korean Library and Information Science Society
    • /
    • v.54 no.1
    • /
    • pp.45-68
    • /
    • 2023
  • This study aims to investigate the awareness and experiences of domestic researchers regarding data publishing, which has been recognized as a new channel of data sharing as scholarly communication evolves in the open science environment. A survey is conducted among researchers from five government-funded research institutes in the field of science and technology and members of the GeoAI Data Society to confirm the awareness of data publishing. As a result of the study, domestic researchers recognized providing explanations for data, stable access to data, citation, and quality assurance through peer review as the advantages of data journals. On the contrary, a low level of recognition for data paper as one of the research outputs was presented. With regard to the properties of data publication, the respondents answered that the data description, metadata description, and permanent identifiers are highly related, however, their recognition of the relation between the properties of data publication and the data submission to a repository and data peer review was relatively low. Finally, to expand the data publication, the need for the development of an editorial system that supports data paper peer review and cross-linking to a data repository as well as the development of a repository that supports data citation was identified. This study on the domestic researchers' experience and awareness of data publishing can provide insights for the implementation of data publishing services and infrastructure in the future.

A Construction of Management System and Its Portal Site for NTIS Data Quality Management (NTIS 데이터 품질관리 체계와 포털 사이트 구축)

  • Lee, Byeong-Hee;Jung, Ock-Nam;Choi, Heeseok;Lim, ChulSu;Kim, Jaesoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.984-987
    • /
    • 2009
  • 데이터가 기업 및 기관 활동의 중요한 자산으로 인식이 높아지고 있지만 저 품질 데이터로 인한 막대한 손실과 비용의 증가는 큰 문제가 되고 있다. 본 논문에서는 교육과학기술부와 KISTI에서 2007년부터 범부처 차원에서 수행중인 국가R&D 정보자원의 데이터 품질관리를 위해 각 부처와 협의하고 수행해 온 국가R&D 데이터 품질관리 체계 수립과 포털 사이트 구축에 관하여 알아본다. 범부처 국가R&D정보 자원의 데이터 품질관리체계 수립과 범부처 적용 지침 및 가이드라인 제시를 위해 NTIS사업단 및 15개 부처(16개 대표전문기관)의 실무팀장 및 DB 관리자 중심으로 총 33명의 설문을 실시하여 품질관리체계 현황을 조사 분석하였다. 또한 부처(기관)별로 국가R&D표준정보 데이터품질 지표 마련과 주기별 데이터 품질 및 개선도 자체점검을 지원하기 위해, 데이터 점검기준과 절차를 마련하고 이를 기반으로 부처(기관)와 협력하여 데이터품질 점검을 기반을 마련하였다. 이렇게 마련된 품질관리체계와 프로세스를 지원하기 위한 자동화 솔루션을 운영하고자 본 논문에서는 NTIS 데이터 품질관리 체계 및 프로세스, 기능이 통합된 웹 포털 구축에 대해서도 알아본다.

Design and Implementation of Workflow Federation Method for Multi-cluster Based Korea Research Data Commons (멀티 클러스터 기반 국가연구데이터커먼즈 간 워크플로우 연계 방안 설계 및 구현)

  • Dasol Kim;Sang-baek Lee;Seong-eun Park;Minhee Cho;Mikyoung Lee;Sa-kwang Song;Hyung-jun Yim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.100-102
    • /
    • 2023
  • 최근 오픈 사이언스 문화가 확산됨에 따라 오픈 데이터, 오픈 소스 소프트웨어와 같은 공개된 리소스들을 효율적으로 공유 및 활용하기 위한 방법이 주목을 받고 있다. 본 논문에서는 연구 소프트웨어의 재현성을 향상시키기 위한 국가연구데이터커먼즈(KRDC)를 소개하고 다중 KRDC 클러스터 간 워크플로우 연계 방안을 제안한다. 국가연구데이터커먼즈는 연구 소프트웨어와 분석 환경인 인프라를 결합하여 함께 제공하는 서비스로, 멀티 노드 쿠버네티스(kubernetes) 클러스터를 기반으로 동작한다. 따라서, 서로 다른 KRDC 프레임워크에 존재하는 리소스들을 하나의 워크플로우로 연계하는 것은 복잡한 사용자 인증/인가 문제, 보안 상의 문제를 고려하여야 한다. 본 논문에서는 프록시(proxy) 앱을 사용하는 워크플로우 연계 기능을 제안하고, 이를 지원하기 위한 통합 인증, 인가 체계와 연계 방안을 구현한다. 제안하는 방법을 두 개의 KRDC 프레임워크를 대상으로 적용하여 제안 워크플로우 연계 방법의 유효함을 확인한다. 본 논문에서 제안하는 워크플로우 연계 방법과 시나리오는 실제 멀티 클러스터 연계 방안을 구현한 사례로, KRDC 프레임워크 뿐만 아니라 다양한 쿠버네티스 기반 리소스 연계에 활용할 수 있는 우수한 결과로 사료된다.

과학기술데이터위원회(CODATA)의 조직과 활동

  • Waddington, Guy
    • Journal of Information Management
    • /
    • v.6 no.5
    • /
    • pp.127-130
    • /
    • 1973
  • 1966년에 국제학술연합회의(ICSU)는 과학기술데이터위원회(CODATA)를 조직하였는데 이는 세계적으로 수치데이터 수집에 관한 조정(調整)을 꾀하고 유도해주며 해당 사기관, 정부기관 및 정부간기관의 데이터 수집을 적극 지원해 주기 위한 것이었다. 현재 위원회는 8개국으로부터의 회원과 10개의 국제연맹을 가지고 있으며 이들은 CODATA의 목적을 달성하기 위하여 내부적인 수법을 사용해 오고 있고, 또한 각국의 관련단체들은 비공식적인 전달수단을 통하여 서로 연결되어져 있다. CODATA의 중앙국은 원래 워싱턴에 있었으나, 지금은 독일의 프랑크푸르트에 위치하고 있으며, 중요한 데이터평가 및 수집센터의 간행물을 분석한 요약판이 곧 발행될 것이다. 그밖에 특수한 문제를 해결하기 위하여 기본상수, 수치데이터처리를 위한 전자계산기의 응용, 수집가가 사용하는 중요입력데이터의 표준 등에 관한 작업반이 설치되었다. 한편, 세계적으로 수치데이터 수집가들간의 협력이 활발히 이루어지고 있다.

  • PDF

GIVI: The Integrated Interface for Controlling Rotor Dynamics Data Visualized On Immersive Virtual Reality Environments (GIVI: 몰입형 가상현실 환경에서 가시화된 데이터를 제어하는 통합 인터페이스)

  • Hur, YoungJu;Kim, MinAh;Lee, JoongYoun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.799-802
    • /
    • 2010
  • HPC에서 시뮬레이션을 수행한 결과로 생성된 데이터는 크기가 방대하고 구조가 복잡해지는 양상을 보이고 있다. 데이터 크기로만 보더라도 기가바이트를 넘어 테라바이트에 이를 정도로 대형화되는 경향을 보이고 있으며, 이렇게 복잡도가 놓은 대형 데이터는 이미 컴퓨터 한 대에서 처리하고 분석할 수 있는 범주는 넘어서고 있다. 본 논문에서는 이런 복잡한 과학 시뮬레이션 데이터 중, 특히 로터 동역학 분야의 데이터를 가시화하고 제어하는데 필요한 통합 가상현실 인터페이스를 소개하기로 한다. 현재 개발중인 GLOVE 프레임워크는 대용량 데이터를 연구자가 필요로 하는 형태로 다양하게 가공해서 가시화해서 분석할 수 있게 하는 프레임워크이며, GIVI는 그 중 사용자와의 인터페이스 부분을 담당하는 프레임워크다. GIVI는 가상현실 환경에서 시뮬레이션 데이터를 실시간으로 상호작용을 통해 분석하는데 필요한 기반환경을 제공하며, 향후에는 실시간 시뮬레이션을 위한 인터페이스로도 확장될 것이다.

Global Open Research Commons and Implications (글로벌 개방형 연구데이터 커먼즈 및 시사점)

  • Sa-kwang Song;Minhee Cho;Mikyoung Lee;Hyung-Jun Yim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.85-88
    • /
    • 2023
  • 오픈 사이언스 운동의 활성화로 인해 다양한 연구 관련 자원들 간의 상호 운용성 확보를 위한 노력이 활발해지고 있다. 특히, 글로벌 연구데이터 커먼즈(Global Open Research Commons) 모델 개발 관련 표준화 활동이 세계 최대 연구데이터 커뮤니티인 RDA(Research Data Alliance)의 주도로 진행되어 왔고, 최근에 GORC Working Group 에서 버전 1.0 모델을 오픈하였다. 이에 이 모델에 대해 살펴보고 국내의 연구데이터 커먼즈인 KRDC(Korea Research Data Commons)와 비교 및 시사점을 논하고 향후 연구 방향을 소개한다.

A Study on the analysis of Research Data Management and Sharing of Science & Technology Government-funded Research Institutes (과학기술분야 출연연구기관 연구데이터 관리 및 공유 사례 분석 연구)

  • Park, Miyoung;Ahn, Inja;Nam, Seungjoo
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.29 no.4
    • /
    • pp.319-344
    • /
    • 2018
  • As a part of the open science policy, this study compared the perception of research data sharing and utilization by academic field. Based on this, in - depth interviews were conducted with semistructured questions to the data task managers of 27 government - funded research institutes in science and technology. Among them, nine excellent organizations were selected from the viewpoint of data management and cases of research data collection and management were specifically presented. The State of the collection and management of research data by the participating research institutes is generally a pilot project stage, and the level of collection and establishment of data also differs by institution. In terms of institutions, they are divided into three levels: the level of collection and establishment of data(KIOM), the advanced level of it (KIST), And level of steps to start sharing (KRIBB, KRICT).