• Title/Summary/Keyword: 데이터과학과

Search Result 5,237, Processing Time 0.038 seconds

A Study on Library Data Open Status and Improvement Strategies (도서관 분야 데이터 개방 현황과 개선방안 연구)

  • Kim, Hye-Sun;Kim, Wan-Jong
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2016.08a
    • /
    • pp.77-80
    • /
    • 2016
  • 국내의 공공기관들은 정부 3.0 정책에 의해 다양한 분야의 데이터를 민간에 개방하고 있다. 본 연구는 국내외의 주요 데이터 개방 사이트를 중심으로 도서관 분야 데이터 개방현황을 살펴보았다. 조사대상 사이트는 서울 열린데이터 광장, 공공데이터 포털, Data.gov 이다. 이 사이트들에서 나타난 문제점을 중심으로 오픈 데이터의 활용성 제고를 위한 개선방안을 제안하였다.

  • PDF

Design of Metadata for Provenance Management of Genome Data (유전체 데이터의 유래(Provenance) 관리를 위한 메타데이터의 설계)

  • Song, Myoung-Seon;Chang, Jae-Woo;Um, Jung-Ho;Choi, Dong-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1195-1198
    • /
    • 2011
  • 최근 의료 분야에 대한 관심이 높아짐에 따라 유전체 데이터를 수집하고 관리하여 분석하는 기술에 대한 많은 연구가 수행되고 있다. 유전체 데이터는 크게 유전체 데이터를 분석하는 전처리단계와 유전체 데이터로부터 변이된 유전체 데이터를 생성하는 후처리단계를 통해 분석된다. 이러한 분석 과정은 많은 시간이 소요되며, 후처리단계에서 결과 데이터는 분석 알고리즘 및 처리 기법에 따라 상이한 결과 데이터를 생성한다. 또한, 유전체 데이터의 각 파이프라인 별 분석된 데이터의 관리가 필요하다. 본 논문에서는 유전체 데이터의 특성을 고려하여, 유전체 데이터 유래 관리를 위한 메타데이터를 설계한다. 아울러 데이터 유래 메타데이터는 자신의 이전데이터들의 결과데이터에 신속한 접근이 가능해야하며, 자신과 유사한 데이터 유래를 지닌 파이프라인의 상세 정보를 신속하게 검색하는 색인구조가 필요하다. 따라서 이를 고려한 유래 메타데이터 검색 알고리즘을 설계한다.

A Study on ScienceDMZ Construction for High Speed Transfer of Science Big Data (과학빅데이터 고속전송을 위한 ScienceDMZ 구축 방안 연구)

  • Moon, Jeong-hoon;Kwak, Jai-seung;Hong, Won-taek;Kim, Ki-heyon;Lee, Sang-kwon;Kim, Dong-kyun;Kim, Yong-hwan;Yu, Ki-sung
    • KNOM Review
    • /
    • v.22 no.2
    • /
    • pp.12-21
    • /
    • 2019
  • There is a rapid development of experimental equipment and ICT technology in data-intensive scientific areas, thus, big data of more than exabyte size is being generated. However, the big data transmission technology does not satisfy the needs of the application researchers who utilize it. Various high-performance transmission technologies have been developed based on QoS(Quality of Service), but they also require changes in the clean slate method. On the other hand, ScienceDMZ technologies improve the performance of scientific big data transmission by bypassing the firewall that causes a big problem in transmission performance. In addition, it is possible to implement without changing the existing network. In this paper, we built ScienceDMZ in an international long-distance environment based on KREONET(Korea Research Environment Open NETwork), and we verified the performance. We also introduced how GPU platform could be linked in a distributed ScienceDMZ environment.

Error filtering technology using change rate of moving object data in real-time video (실시간 영상의 이동 객체 데이터 변화율을 이용한 에러 필터링 기술)

  • Yoon, Kyoung-Ho;Kim, Dhan-Hee;Lee, Won-Suk
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.155-158
    • /
    • 2019
  • 최근 지능형 CCTV 관제 시스템에 대한 수요가 증가하고 있다. CCTV 영상 데이터의 양이 폭발적으로 증가하고 있어 이를 분석하기 위한 기술의 발전이 필요한 실정이다. 대부분의 지능형 CCTV 관제 시스템은 영상 속 객체를 찾고 이 객체의 메타데이터를 통해 지능형 관제 시스템을 수행한다. 하지만 영상 속 객체의 로그가 항상 정확하지 않다. 현재의 객체 인식 기술로는 CCTV 영상의 밝기, 해상도 조건에 따라 성능의 차이가 심하고, 영상의 프레임 대비 빠르게 움직인 CCTV 영상 속 모든 객체를 사람이 인식하는 정도로 인식하기 어렵다. 이러한 이동 객체의 크기, 위치를 분석한 메타데이터에는 에러가 포함되기 쉽다. 본 논문에서는 지능형 CCTV 관제 시스템에서 분석한 영상 속 객체의 프레임 메타데이터 에러를 학습기반 실시간 에러 필터링 알고리즘을 통해 개선하여 에러가 필터링된 데이터를 사용하는 지능형 관제 시스템의 정확도 향상에 기여 할 것을 기대한다.

  • PDF

Metadata Design for Supporting Data-driven Convergence Research in Various Fields (다분야 데이터 기반 융합 연구 지원을 위한 메타데이터 설계)

  • Han, Sunggeun;Choi, Hoon;Lee, Jae-Kwang;Lee, Jeongchoel
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.94-96
    • /
    • 2022
  • 4세대 연구 패러다임의 도래와 함께 데이터가 연구의 중심이 되었고, 인공지능(AI)에 대한 연구가 활발히 진행되면서 데이터의 중요성이 심화되고 있다. 인공지능 기술을 다양한 분야에 적용하려는 노력이 증가하고 있으며, 다양한 분야의 데이터를 다루기 위한 융합 연구의 필요성이 높아지고 있다. 본 논문에서는 융합 연구 플랫폼에서 데이터를 분석 및 활용하는데 필요한 메타데이터를 정의하고 다양한 분야에서 데이터 기반 융합 연구를 지원한다.

The Effects of Scientific Inquiry Class Using Data Measured with Digital Inquiry Tools on Elementary School Students' Competencies (디지털 탐구도구로 측정한 데이터를 활용하는 과학 탐구 수업이 초등학생의 역량에 미치는 영향)

  • Jeong, Eunju;Son, Jeongwoo
    • Journal of Science Education
    • /
    • v.44 no.2
    • /
    • pp.205-213
    • /
    • 2020
  • The purpose of this study is to investigate the effects of elementary school students' knowledge and information processing competence and collaborative problem-solving ability in scientific inquiry class using data measured with digital inquiry tools. To this end, three classes of 5th grade elementary schools in S-city, Gyeongnam were selected as experimental groups and three classes as control groups. The control group conducted traditional lecture-style classes, and the experimental group conducted scientific inquiry classes using scientific data. The following results were obtained through questionnaires after class. First, science inquiry classes using scientific data helped elementary school students improve their knowledge and information processing competence. Second, scientific inquiry classes using scientific data improved elementary school students' cooperative problem-solving ability. From the above results, it was found that scientific inquiry classes using scientific data are needed to improve the knowledge information processing competence and cooperative problem solving ability of elementary school students. Based on this research, it is necessary to study a specific teaching and learning environment that can activate scientific inquiry class using data measured with digital inquiry tools in the future.

A Case Study of Basic Data Science Education using Public Big Data Collection and Spreadsheets for Teacher Education (교사교육을 위한 공공 빅데이터 수집 및 스프레드시트 활용 기초 데이터과학 교육 사례 연구)

  • Hur, Kyeong
    • Journal of The Korean Association of Information Education
    • /
    • v.25 no.3
    • /
    • pp.459-469
    • /
    • 2021
  • In this paper, a case study of basic data science practice education for field teachers and pre-service teachers was studied. In this paper, for basic data science education, spreadsheet software was used as a data collection and analysis tool. After that, we trained on statistics for data processing, predictive hypothesis, and predictive model verification. In addition, an educational case for collecting and processing thousands of public big data and verifying the population prediction hypothesis and prediction model was proposed. A 34-hour, 17-week curriculum using a spreadsheet tool was presented with the contents of such basic education in data science. As a tool for data collection, processing, and analysis, unlike Python, spreadsheets do not have the burden of learning program- ming languages and data structures, and have the advantage of visually learning theories of processing and anal- ysis of qualitative and quantitative data. As a result of this educational case study, three predictive hypothesis test cases were presented and analyzed. First, quantitative public data were collected to verify the hypothesis of predicting the difference in the mean value for each group of the population. Second, by collecting qualitative public data, the hypothesis of predicting the association within the qualitative data of the population was verified. Third, by collecting quantitative public data, the regression prediction model was verified according to the hypothesis of correlation prediction within the quantitative data of the population. And through the satisfaction analysis of pre-service and field teachers, the effectiveness of this education case in data science education was analyzed.

A Study on the Supporting System for Scientific Data Visualization at the National Level (국가수준의 과학데이터 시각화 지원체계에 관한 연구)

  • Park, Dong-Jin;Chae, Kyun-Shik;Ryu, Beom-Jong;Lee, Sang-Tae
    • Journal of Information Management
    • /
    • v.42 no.2
    • /
    • pp.85-102
    • /
    • 2011
  • Conventionally, scientific data visualization is thought of as one of activities performed by scientists during the scientific data analysis. However, recently, there exits a set of research papers which count scientific data visualization as a independent research area. They show the research subjects for studying the scientific data visualization technology and methods. In case, a scientist or group of scientists can not solve their own visualization problem due to the unskillfulness and inexperience on using visualization tool. Therefore, it needs to help them by the systematic way for solving the problem. In this study, we analyze and propose the national level scientific visualization support system for scientists. In particular, we first analyze the existing papers and find out the critical success factors. Then, by integrating the findings of the analysis, we propose the research areas which need to be focused, and the strategic direction and specific research topics for scientific data visualization support system in national level.

Analysis of detection rate according to the artificial dataset construction system and object arrangement structure (인조 데이터셋 구축 시스템과 오브젝트 배치 구조에 따른 검출률 분석)

  • Kim, Sang-Joon;Lee, Yu-Jin;Park, Goo-Man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.74-77
    • /
    • 2021
  • 최근 딥러닝을 이용하여 객체 인식 학습을 위한 데이터셋을 구축하는데 있어 시간과 인력을 단축하기 위해 인조 데이터를 생성하는 연구가 진행되고 있다. 하지만 실제 환경과 관계없이 임의의 배경에 배치되어 구축된 데이터셋으로 학습된 네트워크를 실제 환경으로 구성된 데이터셋으로 테스트할 경우 인식률이 저조하다. 이에 본 논문에서는 실제 배경 이미지에 객체 이미지를 합성하고, 다양성을 위해 3차원으로 회전하여 증강하는 인조 데이터셋 생성 시스템을 제안한다. 제안된 방법으로 구축된 인조 데이터셋으로 학습한 네트워크와 실제 데이터셋으로 학습된 네트워크의 인식률을 비교한 결과, 인조 데이터셋의 성능이 실제 데이터셋의 성능보다 2% 낮았지만, 인조 데이터셋을 구축하는 시간이 실제 데이터셋을 구축하는 시간보다 약 11배 빨라 시간적으로 효율적인 데이터셋 구축 시스템임을 증명하였다.

  • PDF

Data Model Study for National Research Data Commons Service (국가연구데이터커먼즈 서비스를 위한 데이터모델 연구)

  • Cho, Minhee;Lee, Mikyoung;Song, Sa-kwang;Yim, Hyung-Jun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.436-438
    • /
    • 2022
  • National Research Data Commons aims to build a system that can be used jointly by arranging analysis resources such as computing infrastructure, software, toolkit, API, and services used for data analysis together with research data to maximize the use of research data. do. The sharing and utilization system for publications and research data in the R&D process is well known. However, the environment in which data and tightly coupled software and computing infrastructure can be shared and utilized is insignificant and there is no management system. In this study, a data model is designed to systematically manage information on digital research resources required in the data-oriented R&D research process. This will be used to register and manage digital research resource information in the National Research Data Commons Service.

  • PDF