• Title/Summary/Keyword: 데이터 추세 분석

Search Result 716, Processing Time 0.03 seconds

A Review of the Methodology for Sophisticated Data Classification (정교한 데이터 분류를 위한 방법론의 고찰)

  • Kim, Seung Jae;Kim, Sung Hwan
    • Journal of Integrative Natural Science
    • /
    • v.14 no.1
    • /
    • pp.27-34
    • /
    • 2021
  • 전 세계적으로 인공지능(AI)을 구현하려는 움직임이 많아지고 있다. AI구현에서는 많은 양의 데이터, 목적에 맞는 데이터의 분류 등 데이터의 중요성을 뺄 수 없다. 이러한 데이터를 생성하고 가공하는 기술에는 사물인터넷(IOT)과 빅데이터(Big-data) 분석이 있으며 4차 산업을 이끌어 가는 원동력이라 할 수 있다. 또한 이러한 기술은 국가와 개인 차원에서 많이 활용되고 있으며, 특히나 특정분야에 집결되는 데이터를 기준으로 빅데이터 분석에 활용함으로써 새로운 모델을 발견하고, 그 모델로 새로운 값을 추론하고 예측함으로써 미래비전을 제시하려는 시도가 많아지고 있는 추세이다. 데이터 분석을 통한 결론은 데이터가 가지고 있는 정보의 정확성에 따라 많은 변화를 가져올 수 있으며, 그 변화에 따라 잘못된 결과를 발생시킬 수도 있다. 이렇듯 데이터의 분석은 데이터가 가지는 정보 또는 분석 목적에 맞는 데이터 분류가 매우 중요하다는 것을 알 수 있다. 또한 빅데이터 분석결과 통계량의 신뢰성과 정교함을 얻기 위해서는 각 변수의 의미와 변수들 간의 상관관계, 다중공선성 등을 고려하여 분석해야 한다. 즉, 빅데이터 분석에 앞서 분석목적에 맞도록 데이터의 분류가 잘 이루어지도록 해야 한다. 이에 본 고찰에서는 AI기술을 구현하는 머신러닝(machine learning, ML) 기법에 속하는 분류분석(classification analysis, CA) 중 의사결정트리(decision tree, DT)기법, 랜덤포레스트(random forest, RF)기법, 선형분류분석(linear discriminant analysis, LDA), 이차선형분류분석(quadratic discriminant analysis, QDA)을 이용하여 데이터를 분류한 후 데이터의 분류정도를 평가함으로써 데이터의 분류 분석률 향상을 위한 방안을 모색하려 한다.

An Integrated User Interface for Visualizing User Data Using VR Juggler and OpenSceneGraph (데이터 가시화를 위한 VR Juggler와 OpenSceneGraph를 이용한 통합 사용자 인터페이스)

  • Hur, YoungJu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.455-458
    • /
    • 2011
  • 컴퓨터에서 생성된 시뮬레이션 결과는 가시화(Visualization)라는 과정을 통해 인간이 직관적으로 해석하기 쉬운 형태로 가공된다. 사람이 직관적으로 이해하기 어려운 수치의 나열로 구성돼 있던 데이터가 컴퓨터 그래픽스 기술의 적용을 통해 보다 쉽게 분석할 수 있는 형태로 변형되는 것이다. 최근에는 이런 시뮬레이션 데이터의 크기와 복잡도가 점점 증가하고 있는 추세로, 이런 추세에 따라 고해상도 디스플레이 장치나 몰입형 가상현실 장치의 필요성은 점점 증가하고 있다. 이런 이유로 클러스터 시스템을 이용한 고해상도의 디스플레이 장치에서 해당 시스템에 대한 전문적인 지식을 갖추지 않은 일반 연구자가 상호작용할 수 있는 사용자 인터페이스에 대한 필요성도 높아지고 있다. 본 논문에서는 고해상도 디스플레이 장치에서 데이터를 가시화하는 프레임워크와 그 프레임워크에서 사용하는 통합 환경 인터페이스를 소개하기로 한다. 이 인터페이스는 VR Juggler와 OSG(OpenSceneGraph)를 기반으로 하며, 다양한 형태의 디스플레이 장치와 몰입형 가상현실 환경에서 시뮬레이션 데이터와 실시간 상호작용을 통한 해석을 수행하는데 필요한 기반 환경을 제공한다.

UC Model with ARIMA Trend and Forecasting U.S. GDP (ARIMA 추세의 비관측요인 모형과 미국 GDP에 대한 예측력)

  • Lee, Young Soo
    • International Area Studies Review
    • /
    • v.21 no.4
    • /
    • pp.159-172
    • /
    • 2017
  • In a typical trend-cycle decomposition of GDP, the trend component is usually assumed to follow a random walk process. This paper considers an ARIMA trend and assesses the validity of the ARIMA trend model. I construct univariate and bivariate unobserved-components(UC) models, allowing the ARIMA trend. Estimation results using U.S. data are favorable to the ARIMA trend models. I, also, compare the forecasting performance of the UC models. Dynamic pseudo-out-of-sample forecasting exercises are implemented with recursive estimations. I find that the bivariate model outperforms the univariate model, the smoothed estimates of trend and cycle components deliver smaller forecasting errors compared to the filtered estimates, and, most importantly, allowing for the ARIMA trend can lead to statistically significant gains in forecast accuracy, providing support for the ARIMA trend model. It is worthy of notice that trend shocks play the main source of the output fluctuation if the ARIMA trend is allowed in the UC model.

Multimetric Measurement Data Monitoring System Using Sigmoid Function (시그모이드 함수를 이용한 다중 계측데이터 모니터링 시스템)

  • Jeong-Ho Song;Jun-Woo Shin;Heui-Soo Han
    • The Journal of Engineering Geology
    • /
    • v.33 no.1
    • /
    • pp.137-149
    • /
    • 2023
  • In order to intuitively grasp the earth pressure direction acting on the structure and displacement state, displacement data in the horizontal and vertical directions were processed using the sigmoid function. A displacement coordinate system was set up for each axis. The system can intuitively check the current displacement and assess the management stage of each point. A displacement path can be compiled from continuously recorded points, allowing trends in the displacement's history and stress direction to be known. Analysis of data measured for excavated ground, found that displacement occurred in the direction of destressing at all points, and that the points' management state steady. Similar behavior trends were found among measurement points with high spatial correlation, whereas differing behavior trends occurred among measurement points with low spatial correlation. If the correlation analysis of the precursor and behavior area is performed using the continuously distributed surface settlement data and displacement coordinate system, it will be possible to predict the failure time and area.

Analysis of muddy water generation status using R (R을 이용한 흙탕물 발생현황 분석)

  • Park, Woon Ji;Oh, Seung Min;Lim, Kyoung Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.350-350
    • /
    • 2022
  • R은 통계 및 빅데이터 분석에 널리 사용되는 오픈 소스 프로그래밍 언어로, 통계와 그래픽스에 관련된 기능을 확정할 수 있어 다양한 분야에 활용되고 있다. 특히, 수자원 분야의 연구에서 그 활용이 늘어나고 있으며, 최근 들어 다양한 수자원 관련 R 패키지가 발표되고 있다. 이중, 미국 지질조사국(U.S. Geological Survey, USGS)이 개발한 EGRET은 수질 및 유출량 자료의 장기 추세 변화 분석을 위한 패키지로 R 프로그래밍 언어를 기반으로 구동되며, 분석·처리한 데이터에 대하여 광범위한 그래픽 프리젠테이션을 제공하여 탐색적 자료 분석에 매우 효과적인 도구이다. 특히, EGRET 패키지는 농도와 유출 사이의 관계 특성, 수집된 자료의 계절성 존재 및 특성, 점진적 또는 급격한 경향의 존재를 검토할 수 있는 그래픽 결과를 제시하며, 가중 회귀(Weighted Regressions on Time, Discharge, and Season, 이하 WRTDS) 모델을 적용하여 농도와 부하의 상태와 경향을 특성화한다. 시간, 유량 및 계절에 대한 WRTDS 모델은 농도 및 부하의 상태와 경향을 특성화하는 데 사용할 수 있는 수질 데이터 세트의 분석 방법으로, 근본적으로 탐색적 데이터 분석 방법으로 다양한 유형의 트렌드 시나리오에 민감하도록 설계되었으며 선형 또는 2차 함수형에 맞지 않을 수 있는 시간적 추세를 탐지하여 설명할 수 있고, 불규칙한 간격의 자료를 사용하기에 적합한 장점이 있다. 본 연구에서는 북한강 상류의 지속적인 흙탕물 발생으로 문제가 되고 있는 자운지구의 자운천을 대상으로 흙탕물 발생 현황을 분석하기 R을 이용하여 탐색적 자료 분석을 실시하였다. 자료 분석은 EGRET 패키지를 사용하여 수집된 자료(2016년 4월 - 2021년 7월까지 수집된 191개의 SS 자료와 인근 유량측정망의 유량자료)의 유량과 SS 농도 간의 관계, 시간에 따른 SS 농도 분포, SS 농도의 월별 특성 분석 및 유황별 SS 농도 변화 등을 검토하였으며, WRTDS 모델로 SS와 부하량을 예측하고 검토하여 자운천 유역의 흙탕물 부하 특성을 검토하였다.

  • PDF

Development of CEP-based Real Time Analysis System Using Hospital ERP System (병원 ERP시스템을 적용한 CEP 기반 실시간 분석시스템 개발)

  • Kim, Mi-Jin;Yu, Yun-Sik;Seo, Young-Woo;Jang, Jong-Wook
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.05a
    • /
    • pp.290-293
    • /
    • 2015
  • 개개인의 데이터가 비즈니스적으로 중요하지 않을 수 있지만, 대량으로 모으면 그 안에 숨겨진 새로운 정보를 발견할 가능성이 있는 데이터의 집합체로 빅데이터 분석 활용 사례는 점차 늘어나는 추세이다. 빅데이터 분석 기술 중 전통적인 데이터 분석방법인 하둡(Hadoop)은 예전부터 현재에 이르기까지 정형 비정형 빅데이터 분석에 널리 사용되고 있는 기술이다. 하지만 하둡은 배치성 처리 시스템으로 데이터가 많아질수록 응답 지연이 발생할 가능성이 높아, 현재 기업 경영환경과 시장환경에 대한 엄청난 양의 고속 이벤트 데이터에 대한 실시간 분석이 어려운 상황이다. 본 논문에서는 급변하는 비즈니스 환경에 대한 대안으로 오픈소스 CEP(Complex Event Processing)기반 기술을 사용하여 초당 수백에서 수십만건 이상의 이벤트 스트림을 실시간으로 지연 없이 분석가능하게 하는 실시간 분석 시스템을 개발하여 병원 ERP시스템에 적용하였다.

  • PDF

Visual Analytics Approach for Performance Improvement of predicting youth physical growth model (청소년 신체 성장 예측 모델의 성능 향상을 위한 시각적 분석 방법)

  • Yeon, Hanbyul;Pi, Mingyu;Seo, Seongbum;Ha, Seoho;Oh, Byungjun;Jang, Yun
    • Journal of the Korea Computer Graphics Society
    • /
    • v.23 no.4
    • /
    • pp.21-29
    • /
    • 2017
  • Previous visual analytics researches has focused on reducing the uncertainty of predicted results using a variety of interactive visual data exploration techniques. The main purpose of the interactive search technique is to reduce the quality difference of the predicted results according to the level of the decision maker by understanding the relationship between the variables and choosing the appropriate model to predict the unknown variables. However, it is difficult to create a predictive model which forecast time series data whose overall trends is unknown such as youth physical growth data. In this paper, we pro pose a novel predictive analysis technique to forecast the physical growth value in small pieces of time series data with un certain trends. This model estimates the distribution of data at a particular point in time. We also propose a visual analytics system that minimizes the possible uncertainties in predictive modeling process.

Creating Value for Education through Big Data Analysis Education Programs (빅데이터 분석 교육 프로그램을 통한 대학 교육 가치 창출)

  • Cho, Wooje;Yu, Mi rim
    • The Journal of Bigdata
    • /
    • v.3 no.2
    • /
    • pp.123-130
    • /
    • 2018
  • As the demand for analytics technologies in both industry and academia increases, the demand for analytics experts is also increasing. To meet this trend, universities have begun to develop new analytics curriculum and provide courses for training analytics experts. In this study, we surveyed curriculum of master's analytics programs of 9 Korean universities and 20 overseas universities. As a result of comparing the domestic university program with the overseas university programs, the average number of subjects per school program is more than that of the Korean university program, but it was found to be less in terms of diversity of subjects.

Long term groundwater quality change using electrical conductivity and nitrate in the Geum River Basin, South Korea (금강유역의 전기전도도와 질산염을 이용한 장기적인 지하수 수질변화)

  • Agossou, Amos;Lee, Jae-Beom;Joo, Sin-Young;Han, Yeon-Kyeong;Yang, Jeong-Seoke
    • Journal of Korea Water Resources Association
    • /
    • v.57 no.2
    • /
    • pp.111-125
    • /
    • 2024
  • The study has examined alterations in groundwater quality by investigating the influence of rainfall on electrical conductivity (EC) and nitrate concentration in the groundwater of the Geum River Basin in South Korea. Mann Kendall and Sen's Slope estimator were employed to analyze the trends and estimate the trend's magnitude. The administrative map of the study area was utilized to assess the trends of these parameters within each administrative region. Seventeen years (from 2005 to 2021) of data on EC, groundwater levels (GWL), precipitation, and six years (from 2015 to 2020) of nitrate concentration data were utilized for this analysis. The results indicate that, in most administrative regions, there has been an increase in nitrate concentration, and EC, whereas precipitation has seen a slight decrease in a downstream and an increasing trend in upstream. The correlation coefficients calculated between these parameters reveal that there is no direct impact of precipitation on nitrate and EC, but a negative correlation was observed between GWL and EC. The most significant increasing trend in nitrate concentration was observed in two districts (Iksan and Gunsan ), which correspond to regions with significant agricultural activity; about 50% of these districts area are used for agricultural activities.

Analysis and Trend Curve Derivation of Major Design Parameters of Unmanned and Manned Rotorcrafts (유.무인 회전익기 주요 설계변수의 추세선 식 유도 및 비교 분석 연구)

  • Hwang, Chang-Jeon;Kim, Seung-Beom
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.34 no.2
    • /
    • pp.26-35
    • /
    • 2006
  • Design parameters of manned and unmanned rotorcrafts have been investigated to construct a design database and to derive trend curves. Design parameters of 78 manned rotorcrafts and 33 unmanned rotorcrafts have been collected and analyzed using linear regression method. Six kinds of trend curves equations are derived. Most of trend curves derived are relatively meaningful according to the calculated correlation and determination coefficients. The comparisons between manned and unmanned rotorcraft characteristics are performed. It has been drawn according to the comparisons that unmanned rotorcraft has smaller main rotor diameter and maximum take-off weight, bigger tail rotor size and similar level of empty weight fraction than manned rotorcraft.