• Title/Summary/Keyword: 데이터과학과

Search Result 5,482, Processing Time 0.029 seconds

XMDR-DQP for Data Integration Service on Data Grid Environment (데이터 그리드 환경에서 데이터 통합 서비스를 위한 XMDR-DQP)

  • Moon, Seok-Jae;Jung, Gye-Dong;Shin, Hyo-Young;Choi, Young-Keun
    • Annual Conference of KIPS
    • /
    • 2010.04a
    • /
    • pp.183-186
    • /
    • 2010
  • 데이터 그리드는 분산된 다량의 데이터를 공유, 처리 및 관리 지원하도록 만들어진 인프라이다. 이러한 인프라는 분산된 데이터들의 통합할 수 있는 서비스를 제공하도록 구성되어있다. 본 논문은 그리드 환경에서 전사적 데이터에 대한 통합 접근을 제공할 수 있도록 XMDR-DQP 를 이용한 프레임워크를 제시한다. XMDR-DQP 는 그리드 상에 DB 데이터를 접근하기 위해서 사용자가 요청한 쿼리를 처리하는데 이용된다. 그리고 분산 쿼리를 실행하는데 발생되는 이질성은 XMDR 기반의 글로벌 스키마와 로컬 스키마를 이용하여 해결한다.

Development of XMP Metadata merge tool (정지영상 메타데이터 정합 도구 개발)

  • Kim, Sung-Jun;Lee, Jae-Kook;Hong, Tae-Young
    • Annual Conference of KIPS
    • /
    • 2021.05a
    • /
    • pp.540-541
    • /
    • 2021
  • 최근 드론산업이 발전하면서 다양한 드론 활용방법에 대한 연구와 특허 출원이 진행되고 있다. 드론에서 촬영된 사진은 실종자 수색, 농작물 생육 분석 등 다양한 목적을 위해서 활용되고 있으며, 다양한 분야에서 연구개발이 이루어지고 있다. 사진에 저장되는 정보는 실제 촬영 이미지와 다양한 메타데이터를 포함하고 있으나, 카메라 제조사별로 포함되는 메타데이터의 구성이 상이한 상태이다. 본고에서는 드론에서 촬영된 사진내의 메타데이터를 사전에 정의된 표준 명세를 만족할 수 있도록 메타데이터를 정합하는 응용프로그램을 제시하였다. 본 프로그램을 활용하여 현재 수행중인 DNA+드론기술 개발과제의 참여기업들이 촬영한 드론 사진내의 메타데이터의 표준화를 함으로써, 이를 활용하여 다양한 응용 기술 개발을 담당하는 참여기업들이 표준화된 데이터를 활용하여 보다 용이하게 개발이 가능할 것으로 예상된다.

Design of an Arm Gesture Recognition System using Kinect Sensor (키넥트 센서를 이용한 팔 제스처 인식 시스템의 설계)

  • Heo, Se-Kyeong;Shin, Ye-Seul;Kim, Hye-Suk;Kim, In-Cheol
    • Annual Conference of KIPS
    • /
    • 2013.05a
    • /
    • pp.250-253
    • /
    • 2013
  • 최근 카메라 영상을 이용한 제스처 인식 관련 연구가 활발히 진행되고 있다. 카메라 영상을 이용한 제스처 인식에서 많이 사용되는 학습 알고리즘에는 확률 그래프 모델인 HMM과 CRF 등이 있다. 이 학습 알고리즘들은 다차원의 연속된 실수 데이터를 가지고 모델을 학습하면 계산량이 많아진다. 본 논문에서는 팔 관절 위치 데이터를 k-평균 군집화 과정을 거쳐 1차원의 시계열 데이터로 변환 후, 제스처별로 HMM 모델을 학습하는 방법을 제안한다. 키넥트 센서를 통해 얻은 팔 관절 위치 데이터에 k-평균 군집화를 적용하여 1차원 시계열 데이터를 생성하고, 이를 HMM의 학습 및 인식에 사용한다. 본 논문에서 제안하는 방법의 성능을 분석하기 위하여, 다른 시계열 학습 알고리즘인 AP+DTW를 이용한 방법과의 비교 실험을 포함해 다양한 실험들을 수행하였다.

Agriculture Bigdata Management and AI Research Platform Development (농업 빅데이터 관리 및 인공지능 연구 플랫폼 개발)

  • Kim, Ki-Hyeon;Seok, Woojin;Moon, Junghoon;Kim, Kwangsoo;Sim, Joonyong
    • Annual Conference of KIPS
    • /
    • 2022.11a
    • /
    • pp.507-509
    • /
    • 2022
  • 농업은 우리의 삶에서 빼놓을 수 없는 중요한 분야이며, 농업은 토지를 이용하여 다양한 작물들을 길러 음식을 만드는 기본이라고 말할 수 있다. 이렇게 중요한 농업 분야를 ICT 분야에서 가장 이슈가 되는 기술인 인공지능 기술과 결합하여 스마트팜과 같은 농업의 디지털화를 구축할 수 있다. 이와 같은 스마트팜 구축을 위해서는 기본적으로 다양한 작물의 빅데이터를 제공하고, 이 데이터를 바탕으로 인공지능을 수행하여 다양한 결과를 제공할 수 있다. 하지만 인공지능 연구를 수행하기 위한 시스템 및 플랫폼의 부재라는 문제점이 존재한다. 이러한 문제점을 해결하기 위해 농업 빅데이터 관리 및 인공지능 연구 플랫폼 개발을 위한 과제를 통해 농업 빅데이터를 관리하고 인공지능을 연구자들이 손쉽게 수행할 수 있는 플랫폼을 개발하여 농업 분야의 작물 생산성 향상에 기여하고자 한다.

Development of the Liberal Arts Course for Informatics, Mathematics, and Science Convergence Education using No Code Data Analysis Tool (노 코드 데이터 분석 도구를 활용한 정보·수학·과학 융합교육 교양 강좌 개발)

  • Soyul Yi;Youngjun Lee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.447-448
    • /
    • 2023
  • 본 연구에서는 비전공자들을 위한 디지털 교육을 위하여 노 코드 프로그램을 활용한 정보, 수학, 과학 융합교육 교양 강좌를 개발하였다. 노 코드 프로그램으로는 오렌지3 데이터 마이닝을 선정하였는데, 이는 데이터 분석, 시각화, 머신러닝 모델의 활용이 용이하다는 강점을 가지고 있다. 또한, 산업환경 변화에 대비하는 핵심 교과인 과학, 수학, 정보의 중요성과 데이터 분석과의 밀접성을 고려하여 교육 내용을 융합할 수 있도록 선정하였다. 개발된 교육 프로그램은 8인이 전문가 검토 결과 내용 타당도가 확보되었음을 확인할 수 있었다. 추후 연구에서는 이 강좌를 대학의 학부생에게 적용하여 그 효과성을 확인해 보고자 한다.

  • PDF

A Study on Performance Analysis Data Collection Method Using Batch-job Scheduler onLarge-Scale Cluster System (대규모 클러스터 시스템에서 배치작업 스케줄러를 활용한 성능 분석 데이터 수집 방법 연구)

  • Jae-Kook Lee;Min-Woo Kwon;Do-Sik An;Taeyoung Hong
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.37-39
    • /
    • 2023
  • 사용자 응용 프로그램의 특징을 분석하고 효율적인 시스템 운영을 통하여 사용자 프로그램 최적화를 지원하기 위하여 소프트웨어 프로파일링을 수행한다. 특히 국가 슈퍼컴퓨터인 누리온과 같이 8,400대가 넘는 계산노드로 구성된 클러스터 시스템에서 응용 프로그램의 프로파일링 데이터를 사용자의 개입없이 수집하고 데이터를 분석하는 것에는 한계가 있다. 본 연구에서는 배치작업 스케줄러를 활용하여 사용자의 개입 없이 응용 프로그램의 프로파일링 데이터를 수집하기 위한 방법을 제안한다. 그리고 제안한 방법을 누리온에서 구현하고 사용자 응용 프로그램이 실행될 때 프로파일링 데이터가 수집되는 것을 확인한다.

GLOVE: Distributed Shared Memory Based Parallel Visualization Tool for Massive Scientific Dataset (GLOVE: 대용량 과학 데이터를 위한 분산공유메모리 기반 병렬 가시화 도구)

  • Lee, Joong-Youn;Kim, Min Ah;Lee, Sehoon;Hur, Young Ju
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.6
    • /
    • pp.273-282
    • /
    • 2016
  • Visualization tool can be divided by three components - data I/O, visual transformation and interactive rendering. In this paper, we present requirements of three major components on visualization tools for massive scientific dataset and propose strategies to develop the tool which satisfies those requirements. In particular, we present how to utilize open source softwares to efficiently realize our goal. Furthermore, we also study the way to combine several open source softwares which are separately made to produce a single visualization software and optimize it for realtime visualization of massiv espatio-temporal scientific dataset. Finally, we propose a distributed shared memory based scientific visualization tool which is called "GLOVE". We present a performance comparison among GLOVE and well known open source visualization tools such as ParaView and VisIt.

Deployment and performance measurement of containerized collaborative research platform in Science DMZ environment (Science DMZ 환경에서의 컨테이너 기반 협업연구 플랫폼 구성 및 성능 측정)

  • Hong, Wontaek;Lee, Sangkwon;Kim, Kihyeon;Moon, Jeonghoon
    • Annual Conference of KIPS
    • /
    • 2021.05a
    • /
    • pp.59-61
    • /
    • 2021
  • 고성능 네트워크를 기반으로 하는 과학응용 협업연구 환경에서 대용량 데이터의 고속 전송을 위해 활용되고 있는 전용의 데이터 전송 노드는 이용률을 감안하여 연산을 위한 부수적인 목적을 위해 활용이 가능하다 본. 논문에서는 이러한 분산된 데이터 전송 노드들을 활용한 컨테이너 기반 협업연구 플랫폼의 구성 사례를 소개하고 해당 플랫폼 상에서 분산 학습을 실험하고 소요시간 측면에서 성능을 측정하여 제시한다.

UCI Sensor Data Analysis based on Data Visualization (데이터 시각화 기반의 UCI Sensor Data 분석)

  • Chang, Il-Sik;Choi, Hee-jo;Park, Goo-man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.21-24
    • /
    • 2020
  • 대용량의 데이터를 시각적 요소를 활용하여 눈으로 볼 수 있도록 하는 데이터 시각화에 대한 관심이 꾸준히 증가하고 있다. 데이터 시각화는 데이터의 전처리를 거쳐 차원 축소를 하여 데이터의 분포를 시각적으로 확인할 수 있다. 공개된 데이터 셋은 캐글(kaggle), 아마존 AWS 데이터셋(Amazon AWS datasets), UC 얼바인 머신러닝 저장소(UC irvine machine learning repository)등 다양하다. 본 논문에서는 UCI의 화학 가스의 데이터셋을 이용하여 딥러닝을 이용하여 다양한 환경 및 조건에서의 학습을 통한 데이터분석 및 학습 결과가 좋을 경우와 그렇지 않을 경우의 마지막 레이어의 특징 벡터를 시각화하여 직관적인 결과를 확인 가능 하도록 하였다. 또한 다차원 입력 데이터를 시각화 함으로써 시각화 된 결과가 딥러닝의 학습결과와 연관이 있는지를 확인 한다.

  • PDF

Bigdata Prediction Support Service for Citizen Data Scientists (시민 데이터과학자를 위한 빅데이터 예측 지원 서비스)

  • Chang, Jae-Young
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.19 no.2
    • /
    • pp.151-159
    • /
    • 2019
  • As the era of big data, which is the foundation of the fourth industry, has come, most related industries are developing related solutions focusing on the technologies of data storage, statistical analysis and visualization. However, for the diffusion of bigdata technology, it is necessary to develop the prediction analysis technologies using artificial intelligence. But these advanced technologies are only possible by some experts now called data scientists. For big data-related industries to develop, a non-expert, called a citizen data scientist, should be able to easily access the big data analysis process at low cost because they have insight into their own data. In this paper, we propose a system for analyzing bigdata and building business models with the support of easy-to-use analysis system without knowledge of high-level data science. We also define the necessary components and environment for the prediction analysis system and present the overall service plan.