• Title/Summary/Keyword: 탐색적 데이터 분석

Search Result 894, Processing Time 0.032 seconds

The Study on the comparative analysis of EFA and CFA (탐색적요인분석과 확인적요인분석의 비교에 과한 연구)

  • Choi, Chang Ho;You, Yen Yoo
    • Journal of Digital Convergence
    • /
    • v.15 no.10
    • /
    • pp.103-111
    • /
    • 2017
  • This study was performed with a view to examine the nature and difference of EFA(Exploratory Factor Analysis) and CFA(Confirmatory Factor Analysis), and to compare the analysis process and result of EFA and CFA with the same data. The result of empirical analysis was as follows. Meanwhile, p.1, p.3 was removed owing to hampering the convergent validity in EFA, p.3 was removed owing to hampering the discriminent validity in CFA. EFA was reduction process of muti measurement variables to a few factor, but CFA was understanding and confirmatory process of measurement and latent variables' relation. Eventually, this study showed that EFA and CFA used different methology, thus the different outcomes appeared although using the same data, and implicated resonable application of methology according to given data.

Study on the Policy of Supporting University Students in the Beauty Field through Social Big Data Analysis: Based on exploratory data analytics (소셜 빅 데이터 분석을 통한 미용분야 대학생 창업지원 정책에 관한 연구 -탐색적 데이터 분석법을 기반으로-)

  • Mi-Yun Yoon;Nam-hoon Park
    • Journal of the Korean Applied Science and Technology
    • /
    • v.39 no.6
    • /
    • pp.853-863
    • /
    • 2022
  • In order to revitalize start-ups in the beauty field, this study attempted to derive characteristic patterns of changes in demand and differences in emotions and meaning for 'beauty start-ups' by dividing the period by year from 2019 to 2021 based on exploratory data analysis (EDA). Most of the search terms related to the keyword "beauty start-up" showed more interest in institutions or certificates that can learn beauty skills than professional start-up education, which still does not recognize the importance of start-up education, and as an alternative, it is necessary to develop customized start-up education programs for each major. We establish hypotheses through exploratory data analysis and verify hypotheses by combining traditional corroborative data analysis (CDA). There has never been an exploratory data analysis method for beauty startups, and rather than mentioning the need for formal start-up education, analyzing changes in interest in beauty startups and the requirements of prospective start-ups with exploratory data will help develop customized start-up programs.

A Spatial Statistical Approach to Residential Differentiation (II): Exploratory Spatial Data Analysis Using a Local Spatial Separation Measure (거주지 분화에 대한 공간통계학적 접근 (II): 국지적 공간 분리성 측도를 이용한 탐색적 공간데이터 분석)

  • Lee, Sang-Il
    • Journal of the Korean Geographical Society
    • /
    • v.43 no.1
    • /
    • pp.134-153
    • /
    • 2008
  • The main purpose of the research is to illustrate the value of the spatial statistical approach to residential differentiation by providing a framework for exploratory spatial data analysis (ESDA) using a local spatial separation measure. ESDA aims, by utilizing a variety of statistical and cartographic visualization techniques, at seeking to detect patterns, to formulate hypotheses, and to assess statistical models for spatial data. The research is driven by a realization that ESDA based on local statistics has a great potential for substantive research. The main results are as follows. First, a local spatial separation measure is correspondingly derived from its global counterpart. Second, a set of significance testing methods based on both total and conditional randomization assumptions is provided for the local measure. Third, two mapping techniques, a 'spatial separation scatterplot map' and a 'spatial separation anomaly map', are devised for ESDA utilizing the local measure and the related significance tests. Fourth, a case study of residential differentiation between the highly educated and the least educated in major Korean metropolitan cities shows that the proposed ESDA techniques are beneficial in identifying bivariate spatial clusters and spatial outliers.

Exploratory data analysis for Korean daily exchange rate data with recurrence plots (재현그림을 통한 우리나라 환율 자료에 대한 탐색적 자료분석)

  • Jang, Dae-Heung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.6
    • /
    • pp.1103-1112
    • /
    • 2013
  • Exploratory data analysis focuses mostly on data exploration instead of model fitting. We can use the recurrence plot as a graphical exploratory data analysis tool. With the recurrence plot, we can obtain the structural pattern of the time series and recognize the structural change points in time series at a glance.

지리정보를 갖는 통계 데이터의 Visualization

  • Lee, Jeong-Jin
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.27-29
    • /
    • 2003
  • 정보화시대의 발전과 더불어 우리 일상생활에 친숙하게 다가온 기술 중의 하나가 지리정보시스템(Geographical Information System: GIS)이다. GIS는 공간(지표, 지하, 해양 등)상에 분포하고 있는 정보에 대해 여러 종류의 세밀한 지도를 이용하여 효율적으로 사용자에게 제공하여 관리하는 종합정보기술이다. 통계 데이터 중에는 지리정보를 가지고 있는 경우가 상당히 많다. 하지만 지리정보를 갖는 통계 데이터의 탐색적 자료분석(Exploratory Data Analysis)을 위한 Visualization 기법에 대해서는 별로 연구된 바가 없다. 본 논문에서는 GIS를 위한 벡터맵(vector map)의 간단한 제작방법과 GIS의 개발방법, 그리고 탐색적 자료분석을 위한 Visualization기법을 소개한다.

  • PDF

Assessment of Landslide Susceptibility in Jecheon Using Deep Learning Based on Exploratory Data Analysis (데이터 탐색을 활용한 딥러닝 기반 제천 지역 산사태 취약성 분석)

  • Sang-A Ahn;Jung-Hyun Lee;Hyuck-Jin Park
    • The Journal of Engineering Geology
    • /
    • v.33 no.4
    • /
    • pp.673-687
    • /
    • 2023
  • Exploratory data analysis is the process of observing and understanding data collected from various sources to identify their distributions and correlations through their structures and characterization. This process can be used to identify correlations among conditioning factors and select the most effective factors for analysis. This can help the assessment of landslide susceptibility, because landslides are usually triggered by multiple factors, and the impacts of these factors vary by region. This study compared two stages of exploratory data analysis to examine the impact of the data exploration procedure on the landslide prediction model's performance with respect to factor selection. Deep-learning-based landslide susceptibility analysis used either a combinations of selected factors or all 23 factors. During the data exploration phase, we used a Pearson correlation coefficient heat map and a histogram of random forest feature importance. We then assessed the accuracy of our deep-learning-based analysis of landslide susceptibility using a confusion matrix. Finally, a landslide susceptibility map was generated using the landslide susceptibility index derived from the proposed analysis. The analysis revealed that using all 23 factors resulted in low accuracy (55.90%), but using the 13 factors selected in one step of exploration improved the accuracy to 81.25%. This was further improved to 92.80% using only the nine conditioning factors selected during both steps of the data exploration. Therefore, exploratory data analysis selected the conditioning factors most suitable for landslide susceptibility analysis and thereby improving the performance of the analysis.

Analysis of muddy water generation status using R (R을 이용한 흙탕물 발생현황 분석)

  • Park, Woon Ji;Oh, Seung Min;Lim, Kyoung Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.350-350
    • /
    • 2022
  • R은 통계 및 빅데이터 분석에 널리 사용되는 오픈 소스 프로그래밍 언어로, 통계와 그래픽스에 관련된 기능을 확정할 수 있어 다양한 분야에 활용되고 있다. 특히, 수자원 분야의 연구에서 그 활용이 늘어나고 있으며, 최근 들어 다양한 수자원 관련 R 패키지가 발표되고 있다. 이중, 미국 지질조사국(U.S. Geological Survey, USGS)이 개발한 EGRET은 수질 및 유출량 자료의 장기 추세 변화 분석을 위한 패키지로 R 프로그래밍 언어를 기반으로 구동되며, 분석·처리한 데이터에 대하여 광범위한 그래픽 프리젠테이션을 제공하여 탐색적 자료 분석에 매우 효과적인 도구이다. 특히, EGRET 패키지는 농도와 유출 사이의 관계 특성, 수집된 자료의 계절성 존재 및 특성, 점진적 또는 급격한 경향의 존재를 검토할 수 있는 그래픽 결과를 제시하며, 가중 회귀(Weighted Regressions on Time, Discharge, and Season, 이하 WRTDS) 모델을 적용하여 농도와 부하의 상태와 경향을 특성화한다. 시간, 유량 및 계절에 대한 WRTDS 모델은 농도 및 부하의 상태와 경향을 특성화하는 데 사용할 수 있는 수질 데이터 세트의 분석 방법으로, 근본적으로 탐색적 데이터 분석 방법으로 다양한 유형의 트렌드 시나리오에 민감하도록 설계되었으며 선형 또는 2차 함수형에 맞지 않을 수 있는 시간적 추세를 탐지하여 설명할 수 있고, 불규칙한 간격의 자료를 사용하기에 적합한 장점이 있다. 본 연구에서는 북한강 상류의 지속적인 흙탕물 발생으로 문제가 되고 있는 자운지구의 자운천을 대상으로 흙탕물 발생 현황을 분석하기 R을 이용하여 탐색적 자료 분석을 실시하였다. 자료 분석은 EGRET 패키지를 사용하여 수집된 자료(2016년 4월 - 2021년 7월까지 수집된 191개의 SS 자료와 인근 유량측정망의 유량자료)의 유량과 SS 농도 간의 관계, 시간에 따른 SS 농도 분포, SS 농도의 월별 특성 분석 및 유황별 SS 농도 변화 등을 검토하였으며, WRTDS 모델로 SS와 부하량을 예측하고 검토하여 자운천 유역의 흙탕물 부하 특성을 검토하였다.

  • PDF

GPS 데이터를 이용한 이동객체의 이동패턴 분석

  • Jo, Jae-Hui;Seo, Il-Jeong;Lee, Deok-Gyu;Ha, Byeong-Guk
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.06a
    • /
    • pp.603-607
    • /
    • 2007
  • GPS 수신기의 지속적인 가격 하락과 GPS 기반의 다양한 위치기반서비스 개발로 인하여 개인 휴대용 GPS 수신기의 보급이 확대되고 있다. 이동객체의 위치 및 시간 정보를 포함하고 있는 GPS 데이터를 분석하면 이전에는 불가능했던 이동패턴을 파악하고 이해하는 것이 가능해진다. 이동객체 데이터의 저장과 분석에 관한 연구들이 진행되고 있지만, 이동객체의 속성에 따른 다차원적 이동패턴 분석에 관한 연구는 찾아보기 힘들다. 본 연구는 개인 휴대용 GPS 수신기를 통해 수집된 이동 데이터와 이동객체의 속성 데이터를 통합하여 이동객체의 시공간적 특성을 다차원적으로 분석할 수 있는 데이터마트를 구현하고 시각적으로 표현하였다. 이러한 과정을 통해 GPS 데이터를 이용한 이동패턴 분석의 유용성과 문제점을 탐색적으로 살펴보았다.

  • PDF

Correlation Analysis and Regression Test on Cryptocurrency Price Data (암호화폐 가격 정보 데이터에 대한 상관관계분석 및 회귀테스트)

  • Kwon, Do-Hyung;Heo, Joo-Seong;Kim, Ju-Bong;Lim, Hyun-Kyo;Han, Youn-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.346-349
    • /
    • 2018
  • 기존의 전통적인 금융 시장에 대한 탐색적 데이터 분석에 비해 암호화폐에 대한 탐색적 데이터 분석은 전무하다. 본 논문에서는 대표적인 암호화폐인 비트코인을 비롯하여 총 12 개의 암호화폐에 대한 상관관계 분석 및 회귀 모델을 적용하기 적합한지 여부를 결정하는 평균회귀테스트를 수행하고 그 결과에 대해 논한다.