• Title/Summary/Keyword: 데이터과학과

Search Result 5,369, Processing Time 0.039 seconds

A Study on the Supporting System for Scientific Data Visualization at the National Level (국가수준의 과학데이터 시각화 지원체계에 관한 연구)

  • Park, Dong-Jin;Chae, Kyun-Shik;Ryu, Beom-Jong;Lee, Sang-Tae
    • Journal of Information Management
    • /
    • v.42 no.2
    • /
    • pp.85-102
    • /
    • 2011
  • Conventionally, scientific data visualization is thought of as one of activities performed by scientists during the scientific data analysis. However, recently, there exits a set of research papers which count scientific data visualization as a independent research area. They show the research subjects for studying the scientific data visualization technology and methods. In case, a scientist or group of scientists can not solve their own visualization problem due to the unskillfulness and inexperience on using visualization tool. Therefore, it needs to help them by the systematic way for solving the problem. In this study, we analyze and propose the national level scientific visualization support system for scientists. In particular, we first analyze the existing papers and find out the critical success factors. Then, by integrating the findings of the analysis, we propose the research areas which need to be focused, and the strategic direction and specific research topics for scientific data visualization support system in national level.

Analysis of detection rate according to the artificial dataset construction system and object arrangement structure (인조 데이터셋 구축 시스템과 오브젝트 배치 구조에 따른 검출률 분석)

  • Kim, Sang-Joon;Lee, Yu-Jin;Park, Goo-Man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.74-77
    • /
    • 2021
  • 최근 딥러닝을 이용하여 객체 인식 학습을 위한 데이터셋을 구축하는데 있어 시간과 인력을 단축하기 위해 인조 데이터를 생성하는 연구가 진행되고 있다. 하지만 실제 환경과 관계없이 임의의 배경에 배치되어 구축된 데이터셋으로 학습된 네트워크를 실제 환경으로 구성된 데이터셋으로 테스트할 경우 인식률이 저조하다. 이에 본 논문에서는 실제 배경 이미지에 객체 이미지를 합성하고, 다양성을 위해 3차원으로 회전하여 증강하는 인조 데이터셋 생성 시스템을 제안한다. 제안된 방법으로 구축된 인조 데이터셋으로 학습한 네트워크와 실제 데이터셋으로 학습된 네트워크의 인식률을 비교한 결과, 인조 데이터셋의 성능이 실제 데이터셋의 성능보다 2% 낮았지만, 인조 데이터셋을 구축하는 시간이 실제 데이터셋을 구축하는 시간보다 약 11배 빨라 시간적으로 효율적인 데이터셋 구축 시스템임을 증명하였다.

  • PDF

Data Model Study for National Research Data Commons Service (국가연구데이터커먼즈 서비스를 위한 데이터모델 연구)

  • Cho, Minhee;Lee, Mikyoung;Song, Sa-kwang;Yim, Hyung-Jun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.436-438
    • /
    • 2022
  • National Research Data Commons aims to build a system that can be used jointly by arranging analysis resources such as computing infrastructure, software, toolkit, API, and services used for data analysis together with research data to maximize the use of research data. do. The sharing and utilization system for publications and research data in the R&D process is well known. However, the environment in which data and tightly coupled software and computing infrastructure can be shared and utilized is insignificant and there is no management system. In this study, a data model is designed to systematically manage information on digital research resources required in the data-oriented R&D research process. This will be used to register and manage digital research resource information in the National Research Data Commons Service.

  • PDF

A study on the method of linking heterogeneous data between collection systems (수집 시스템간의 이기종 데이터 연계 방법 연구)

  • Park, Min-woo;Shim, Hyeong-seop
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.585-586
    • /
    • 2022
  • 사회현안을 해결하기 위한 데이터 분석을 위해서는 많은 양의 데이터 수집과 데이터 분석에 활용할 수 있도록 데이터 전처리가 필요하다. 많은 양의 데이터를 수집 및 처리를 위해 데이터 수집, 데이터 저장, 활용 시스템이 기능적으로 분리하여 시스템을 구성하고, 이에 따른 시스템간의 데이터 상호 연계가 필요하게 된다. 또한 외부 네트워크에 구성되어 있는 시스템간의 데이터 연계나, OpenAPI와 같이 다양한 데이터 서비스에서도 적용이 가능할 수 있도록 확장성과 유연성을 고려할 필요가 있다. 본 논문에서는 부산 지역현안 해결을 위한 시스템 구성에 있어, 확장성을 고려한 데이터 수집 시스템간의 효율적인 데이터 연계 방법을 제안하고자 한다.

  • PDF

Developing an integrated System and Network performance monitoring environment for High-speed Big data transfer on ScienceDMZ technology (ScienceDMZ 기반 초고속 빅데이터 전송을 위한 시스템과 네트워크 통합 성능 모니터링 환경 개발)

  • Kim, Dong-Hak;Moon, Jeong-Hoon;Lee, Sang-gwon;Park, Jong-sun;Kim, Byung-Seo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.110-113
    • /
    • 2018
  • 본 논문은 최근 데이터 집약형과학분야 연구개발의 비약적인 발전과 관측, 실험, 분석 장비들의 고도화에 따라 생산되는 과학데이터의 빅데이터화, 고부가가치화 등으로 연구 패러다임의 변화가 빅데이터 중심으로 가속되고 있다. 이러한 과학 빅데이터는 ExaByte 급의 대용량으로서 한 곳에서 관리되기보다는 전 세계적으로 분산되어 관리 운영되고 있다. 응용연구자들은 이러한 과학 빅데이터에 대한 초고속 전송/저장/공유에 대한 요구가 높아지고 있으며, 이러한 문제의 해결을 위해 ScienceDMZ 기반의 다양한 고속전송환경이 구축 개발되고 있다. 따라서 본 논문에서는 장러기 빅데이터 전송을 위한 ScienceDMZ의 핵심 기술인 DTN(Data Transfer Node)을 통한 빅데이터의 장거리 전송 시 고대역 네트워크 환경과 시스템 성능에 대한 통합 모니터링 환경을 구축 개발하였다.

Analysis on Nutrition Facts of McDonald's Menu using Data Science Techniques (데이터과학 기법을 적용한 맥도날드 메뉴 영양소 분석)

  • Kim, Dongjun;Lim, Kyungseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.407-408
    • /
    • 2018
  • 데이터과학의 분석기법을 사용한 문제해결 방법은 많은 분야에서 활용되고 있다. 본 연구에서는 청소년들이 즐겨먹는 맥도날드 메뉴의 영양소 데이터를 분석하고 시각화를 통해 새로운 가설을 설정하고 새로운 발견을 할 수 있는 연구를 진행하였다. 영양소에 따라 건강한 메뉴와 해로운 메뉴를 구분하고자 하였으며, 데이터 분석을 통하여 새로운 건강음식 인덱스를 설정하고 그에 따른 재분석을 통하여 맥도날드 메뉴에 대한 새로운 발견을 하게 되었다.

An Application Model for Clustering in Water Sensor Data Mining (수질센서 데이터 마이닝을 위한 클러스터링 적용 모델)

  • Kweon, Daehyeon;Cho, Soosun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.29-30
    • /
    • 2009
  • 센서 데이터의 마이닝 기술은 의사결정을 위한 통합정보 및 예측정보를 제공하는 USN 지능형 미들웨어의 주요 구성 요소이다. 본 논문에서는 수질 센서 데이터 마이닝 시스템을 개발하기위해 대표적인 데이터 마이닝 기법인 클러스터링의 적용 모델을 소개한다. 적용 모델의 클러스터링을 통해 중간노드에서의 데이터 이상치 검출과 호스트에서의 시간대별 데이터 변화 검출이 가능하다.

The gene prediction method considering stages of cancer, obtained by integrating gene expression, genetic interaction data and document (문헌정보와 유전자 발현 및 상호 작용 데이터를 통합, 암의 단계를 고려한 질병 유전자 예측 방법)

  • Kim, Jungrim;Yeu, Yunku;Park, Sanghyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1113-1116
    • /
    • 2013
  • 유전체에 대한 관심이 크게 증가하면서, 이에 따른 다양한 연구가 이루어졌다. 그 결과 유전체와 관련된 다양한 종류의 데이터가 얻어졌으며, 그것을 해석하고 다른 데이터와 통합하는 것이 중요한 연구과제 중 하나가 되었다. 본 논문은 유전자 상호작용(genetic interaction) 데이터, 유전자 발현 데이터, 문헌으로부터 텍스트마이닝 기술을 통해 얻은 이종(heterogeneous) 데이터를 통합하여 암과 관련이 있는 유전자를 찾는 실험을 수행하였다. 또한, 단순히 질병(disease)-정상(normal)의 대조가 아니라 암의 단계(stage)를 고려한 실험을 수행하였다. 데이터를 통합하지 않거나 암의 단계를 고려하지 않았을 경우에 비하여 제안하는 방법이 더 높은 유전자 예측 성능을 나타냈다.

XMDR-DQP for Data Integration Service on Data Grid Environment (데이터 그리드 환경에서 데이터 통합 서비스를 위한 XMDR-DQP)

  • Moon, Seok-Jae;Jung, Gye-Dong;Shin, Hyo-Young;Choi, Young-Keun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.183-186
    • /
    • 2010
  • 데이터 그리드는 분산된 다량의 데이터를 공유, 처리 및 관리 지원하도록 만들어진 인프라이다. 이러한 인프라는 분산된 데이터들의 통합할 수 있는 서비스를 제공하도록 구성되어있다. 본 논문은 그리드 환경에서 전사적 데이터에 대한 통합 접근을 제공할 수 있도록 XMDR-DQP 를 이용한 프레임워크를 제시한다. XMDR-DQP 는 그리드 상에 DB 데이터를 접근하기 위해서 사용자가 요청한 쿼리를 처리하는데 이용된다. 그리고 분산 쿼리를 실행하는데 발생되는 이질성은 XMDR 기반의 글로벌 스키마와 로컬 스키마를 이용하여 해결한다.

Development of XMP Metadata merge tool (정지영상 메타데이터 정합 도구 개발)

  • Kim, Sung-Jun;Lee, Jae-Kook;Hong, Tae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.540-541
    • /
    • 2021
  • 최근 드론산업이 발전하면서 다양한 드론 활용방법에 대한 연구와 특허 출원이 진행되고 있다. 드론에서 촬영된 사진은 실종자 수색, 농작물 생육 분석 등 다양한 목적을 위해서 활용되고 있으며, 다양한 분야에서 연구개발이 이루어지고 있다. 사진에 저장되는 정보는 실제 촬영 이미지와 다양한 메타데이터를 포함하고 있으나, 카메라 제조사별로 포함되는 메타데이터의 구성이 상이한 상태이다. 본고에서는 드론에서 촬영된 사진내의 메타데이터를 사전에 정의된 표준 명세를 만족할 수 있도록 메타데이터를 정합하는 응용프로그램을 제시하였다. 본 프로그램을 활용하여 현재 수행중인 DNA+드론기술 개발과제의 참여기업들이 촬영한 드론 사진내의 메타데이터의 표준화를 함으로써, 이를 활용하여 다양한 응용 기술 개발을 담당하는 참여기업들이 표준화된 데이터를 활용하여 보다 용이하게 개발이 가능할 것으로 예상된다.