• Title/Summary/Keyword: 데이터과학과

Search Result 5,207, Processing Time 0.04 seconds

A Study on Building the Scientific Data Repository Involving Human Data and Its Application (인체 데이터를 포함한 과학 데이터 리파지터리의 구축 및 활용에 관한 연구)

  • Lee, Sang-ho;Lee, sang-hwan
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2012.05a
    • /
    • pp.170.1-170.1
    • /
    • 2012
  • 본 발표에서는 KISTI에서 현재 구축하고 있는 인체 데이터의 현황과 인체 데이터를 포함한 과학 데이터 리파지터리의 구축과 활용에 대한 전반적인 내용을 소개한다. 인체 데이터는 인체 절단면 영상을 중심으로 한 Visible Korean 데이터와 CT, MR 영상과 인체 뼈대 물성을 중심으로 한 Digital Korean 데이터로 나누어지며 이들 데이터의 제작 과정과 활용 내용을 주로 소개한다. 과학 데이터 리파지터리 구축 내용은 현재 국가의 연구개발 예산으로 수행되고 있는 연구과제에서 생성된 다양한 과학 데이터들을 국가적 차원에서 수집, 관리, 유통시키기 위해 기관별 또는 분야별로 과학데이터센터를 육성하고 이를 거점으로 하여 국내의 과학데이터가 수집, 관리, 유통, 활용될 수 있도록 국가적 과학데이터 관리체계를 구축한다. 또한 이렇게 수집된 과학데이터의 활용을 위해 연구자들이 데이터 기반의 연구 과제를 수행할 수 있도록 데이터 기반의 첨단 연구 환경을 구축하고 연구에 필요한 S/W, H/W 및 기타 필요한 IT 기반의 요소기술들을 개발, 지원한다. 또한 KISTI가 제작 주체가 되어 생산한 상기의 인체 데이터뿐만 아니라 의료 관련 분야의 연구 현장에서 생산되고 있는 다양한 인체 데이터를 수집, 관리, 공유할 수 있도록 인체 데이터 리파지터리를 구축하기 위해 Visible Korean, Digital Korean 데이터를 포함한 다양한 의료 데이터의 리파지토리를 설계하고 이러한 의료 데이터 기반 연구의 활성화 및 데이터 리파지터리의 활성화를 위한 정부 및 분야별 커뮤니티 차원의 다양한 대책들을 소개한다.

  • PDF

A Temporal Data Model for Managing Scientific Database (과학 응용 데이터베이스 관리를 위한 시간지원 데이터 모델)

  • 김진호;옥수호
    • The Journal of Information Technology and Database
    • /
    • v.4 no.1
    • /
    • pp.51-64
    • /
    • 1997
  • 최근 컴퓨터 응용이 우주 항공, 천체 기상, 환경 관리, 공장 자동화(FA) 등의 분야로 확산되면서 물리, 화학, 생물, 기계 등의 과학 응용에서 생성되는 자료를 처리하는 기법에 대한 요구가 늘어나고 있다. 이들 과학 응용에서는 물리적 실험 장치나 측정 기계, 또는 시뮬레이션으로부터 데이터를 시간별로 측정(또는 수집)하므로 이들 과학 데이터는 시간에 종속된 데이터이다. 많은 과학 응용의 시간 지원 데이터는 과학 분야의 특성에 따라 매우 정밀한 시간 단위로 수집하기도 하고 실험 시작부터 경과된 상대적인 시간에 따라 데이터를 수집한다. 달력상의 시간을 사용하는 기존의 시간지원 데이터베이스는 과학 응용의 이러한 특징을 지원하지 못한다. 따라서 이 논문에서는 과학 실험 응용에서 요구하는 시간에 대한 특징과 요구 사항을 분석하고, 이들 과학 응용의 요구 사항을 만족하도록 확장한 새로운 시간 지원 데이터 모델을 제안한다. 이 모델에서는 실험이 경과된 상대적인 시간에 대한 데이터의 이력을 확장형 집합 개념을 사용하여 표현한다. 기존의 관계 데이터 모델과 유사하게, 이 모델은 집합 개념에 바탕을 두고 있으므로 데이터 모델과 그 연산의 의미를 쉽게 이해하고 사용할 수 있다는 장점이 있다.

  • PDF

A Study on the Intellectual Structure of Data Science Using Co-Word Analysis (동시출현단어분석을 통한 데이터과학 분야의 지적구조에 관한 연구)

  • Kim, Hyunjung
    • Journal of the Korean Society for information Management
    • /
    • v.34 no.4
    • /
    • pp.101-126
    • /
    • 2017
  • Data Science is emerging as a closely related field of study to Library and Information Science (LIS), and as an interdisciplinary subject combining LIS, statistics and computer science in an attempt to understand the value of data by applying what LIS has been doing for collecting, storing, organizing, analyzing, and utilizing information. To investigate which subject fields other than LIS, statistics, and computer science are related to Data Science, this study retrieved 667 materials from Web of Science Core Collection, extracted terms representing Web of Science Categories, examined subject fields that are studying Data Science using descriptive analysis, analyzed the intellectual structure of the field by co-word analysis and network analysis, and visualized the results as a Pathfinder network with clustering created with the PNNC clustering algorithm. The result of this study might help to understand the intellectual structure of the Data Science field, and may be helpful to give an idea for developing relatively new curriculum.

Building a computing infrastructure in the era of data science (데이터과학 시대에 적합한 컴퓨팅 인프라 구축)

  • Sookhee Choi;Kyungsoo Han;Zhe Wang
    • The Korean Journal of Applied Statistics
    • /
    • v.37 no.1
    • /
    • pp.49-59
    • /
    • 2024
  • The popularity of data science, influenced by the trends from the United States around 2010, has significantly impacted the education of various statistics departments at domestic universities. However, it is challenging to find research papers in domestic academic journals that address the efficient teaching of data science topics in relation to computing environment. This article will discuss and propose the establishment of a suitable computing infrastructure for the education and research in statistics and data science departments in domestic universities.

A Study on Elementary Education Examples for Data Science using Entry (엔트리를 활용한 초등 데이터 과학 교육 사례 연구)

  • Hur, Kyeong
    • Journal of The Korean Association of Information Education
    • /
    • v.24 no.5
    • /
    • pp.473-481
    • /
    • 2020
  • Data science starts with small data analysis and includes machine learning and deep learning for big data analysis. Data science is a core area of artificial intelligence technology and should be systematically reflected in the school curriculum. For data science education, The Entry also provides a data analysis tool for elementary education. In a big data analysis, data samples are extracted and analysis results are interpreted through statistical guesses and judgments. In this paper, the big data analysis area that requires statistical knowledge is excluded from the elementary area, and data science education examples focusing on the elementary area are proposed. To this end, the general data science education stage was explained first, and the elementary data science education stage was newly proposed. After that, an example of comparing values of data variables and an example of analyzing correlations between data variables were proposed with public small data provided by Entry, according to the elementary data science education stage. By using these Entry data-analysis examples proposed in this paper, it is possible to provide data science convergence education in elementary school, with given data generated from various subjects. In addition, data science educational materials combined with text, audio and video recognition AI tools can be developed by using the Entry.

A scalable and automated feature data extraction system for AI analysis of computational science data (계산과학 데이터의 인공지능 분석을 위한 확장성 있는 특징 데이터 추출 자동화 시스템)

  • Ahn, Sunil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.102-105
    • /
    • 2020
  • AI 분석 과정에서 특징 데이터 추출은 분석 성능에 큰 영향을 미칠 뿐만 아니라 가장 많은 시간을 소요하는 과정 중의 하나이다. 계산과학 데이터는 HPC를 활용하여 생산되므로 데이터가 크고 복잡할 뿐 아니라 데이터의 수도 방대한 경우가 많다. 이 때문에 계산과학 데이터로부터 특징 데이터 추출하는 과정은 복잡성이 크고, 소요 시간도 매우 크다. 본 논문은 먼저 계산과학 데이터로부터 특징 데이터 추출하는 과정에 대한 요구사항과 이슈들을 분석한다. 그리고 확장성을 고려한 계산과학 데이터의 인공지능 분석을 위한 특징 데이터 추출 자동화 시스템을 제안한다.

Analysis on NDN Testbeds for Large-scale Scientific Data: Status, Applications, Features, and Issues (과학 빅데이터를 위한 엔디엔 테스트베드 분석: 현황, 응용, 특징, 그리고 이슈)

  • Lim, Huhnkuk;Sin, Gwangcheon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.7
    • /
    • pp.904-913
    • /
    • 2020
  • As the data volumes and complexity rapidly increase, data-intensive science handling large-scale scientific data needs to investigate new techniques for intelligent storage and data distribution over networks. Recently, Named Data Networking (NDN) and data-intensive science communities have inspired innovative changes in distribution and management for large-scale experimental data. In this article, analysis on NDN testbeds for large-scale scientific data such as climate science data and High Energy Physics (HEP) data is presented. This article is the first attempt to analyze existing NDN testbeds for large-scale scientific data. NDN testbeds for large-scale scientific data are described and discussed in terms of status, NDN-based application, and features, which are NDN testbed instance for climate science, NDN testbed instance for both climate science and HEP, and the NDN testbed in SANDIE project. Finally various issues to prevent pitfalls in NDN testbed establishment for large-scale scientific data are analyzed and discussed, which are drawn from the descriptions of NDN testbeds and features on them.

A Study on Publishing and Citing the Scientific Data (과학 데이터의 출판과 인용에 관한 연구)

  • Lee, Sang-Ho;Lee, Yu-Seon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2011.05a
    • /
    • pp.303-304
    • /
    • 2011
  • 과학적 논문의 기초가 되는 과학 데이터들은 국가 차원에서 체계적으로 관리가 되지 않아 원활하게 유통 및 재활용이 되지 않고 있으며 논문 원문과 데이터들이 서로 연계, 통합되지 않아서 과학 데이터의 유통이 더욱 어려워지고 있다. 이 연구에서는 유통 측면에서 과학 논문과 데이터를 비교하고 연계, 통합을 위한 영구식별자의 도입 및 제도적 측면에서 데이터 기탁 및 데이터 리파지토리의 활성화 방안에 대해 논의한다.

  • PDF

Research Data Management of Science and Technology Research Institutes in Korea (국내 과학기술분야 연구기관의 과학데이터 관리 현황)

  • Choi, Myung-Seok;Lee, Seung-Bock;Lee, Sanghwan
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.12
    • /
    • pp.117-126
    • /
    • 2017
  • As the recent research environment and research paradigm have become data-driven, Open Science, based on openness and sharing of public research results, has emerged as a global agenda for scientific research. National policies for sharing and re-use of research data from publicly-funded research are in effect globally. Therefore, in Korea, it is urgent to build policies and infrastructure for sharing and re-use of research data. In this paper, we investigate the current status of research data management of science and technology research institutes in Korea. We conducted in-depth interviews with researchers from 22 research institutes belonging to the National Research Council of Science & Technology, and 20 universities in Korea, asking about terms of creation management utilization of research data, willingness to share data, and needs for sharing and re-use of research data. From these interviews, we drew implications for open research data and future directions.

A Study on Establishment of Performance Analysis Model for National Science Data Center Construction (국가 과학데이터센터 구축을 위한 성과분석 모델 수립에 관한 연구)

  • Park, Sung-Uk;Hahn, Sun-Hwa;Lee, Pill-Woo;Lee, Yun-Seock;Kim, Sun-Tae
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2011.05a
    • /
    • pp.433-434
    • /
    • 2011
  • 학술 정보유통의 패러다임이 데이터중심 과학으로 연구방법이 변화됨에 따라 사실데이터, 실험데이터 등으로 구성된 과학데이터의 중요성은 커지고 있다. 이에 분야별로 구축된 과학데이터의 개별적 활용 체제보다는 국가 차원에서의 과학데이터센터 구축을 통해 효율적인 과학데이터의 보존, 활용이 필요한 시점에 와 있다. 본 논문에서는 국가 과학데이터센터 구축이 가져오는 경제적 파급효과에 대한 성과분석 모델을 수립하여 차후에 보다 체계적인 성과분석의 효율성 제고와 발전방향의 모색에 활용하고자 한다.

  • PDF