• Title/Summary/Keyword: 탐색적 자료 분석

Search Result 1,991, Processing Time 0.034 seconds

Exploratory Data Analysis for Korean Stock Data with Recurrence Plots (재현그림을 통한 우리나라 주식 자료에 대한 탐색적 자료분석)

  • Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.5
    • /
    • pp.807-819
    • /
    • 2013
  • A recurrence plot can be used as a graphical exploratory data analysis tool before confirmatory time series analysis. With the recurrence plot, we can obtain the structural pattern of the time series and recognize the structural change points in a time series at a glance. Korean stock data shows the usefulness of the recurrence plot as a graphical exploratory data analysis tool for time series data.

Exploratory data analysis for Korean daily exchange rate data with recurrence plots (재현그림을 통한 우리나라 환율 자료에 대한 탐색적 자료분석)

  • Jang, Dae-Heung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.6
    • /
    • pp.1103-1112
    • /
    • 2013
  • Exploratory data analysis focuses mostly on data exploration instead of model fitting. We can use the recurrence plot as a graphical exploratory data analysis tool. With the recurrence plot, we can obtain the structural pattern of the time series and recognize the structural change points in time series at a glance.

The study of the Gifted Students Education about Doing Mathematical Task with the Face Plot (얼굴그림(Face Plot)을 활용한 수학영재교육의 사례연구)

  • Kim, Yunghwan
    • Journal of the Korean School Mathematics Society
    • /
    • v.20 no.4
    • /
    • pp.369-385
    • /
    • 2017
  • This study is to figure out the activity and disposition of gifted students with face plot in exploratory data analysis at middle school mathematics class. This study has begun on the basis of the doing mathematics at multivariate analysis beyond one variable and two variables. Gifted students were developed the good learning habits theirselves. According to this result, Many gifted students have an interesting experience at data analysis with Face Plot. And they felt the useful methods of creative thinking about graphics with doing mathematics at mathematical tasks. I think that teachers need to learn the visualization methods and to make and to develop the STEAM education tasks connected real life. It should be effective enough to change their attitudes toward teaching and learning at exploratory data analysis.

  • PDF

비선형모형분석을 위한 탐색적 자료분석

  • Jang, Dae-Heung
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.25-28
    • /
    • 2002
  • 비선형모형분석의 초기 단계에서 초기값(starting value, initial parameter value)를 결정하는 문제는 비선형모형의 모수추정을 위한 반복기법의 수렴속도나 국소값(local minimum)문제에 영향을 주게 된다. 본 논문을 통하여 탐색적 자료분석이 초기값를 결정하는 데 도움을 줄 수 있음을 보이고자 한다.

  • PDF

Analysis of muddy water generation status using R (R을 이용한 흙탕물 발생현황 분석)

  • Park, Woon Ji;Oh, Seung Min;Lim, Kyoung Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.350-350
    • /
    • 2022
  • R은 통계 및 빅데이터 분석에 널리 사용되는 오픈 소스 프로그래밍 언어로, 통계와 그래픽스에 관련된 기능을 확정할 수 있어 다양한 분야에 활용되고 있다. 특히, 수자원 분야의 연구에서 그 활용이 늘어나고 있으며, 최근 들어 다양한 수자원 관련 R 패키지가 발표되고 있다. 이중, 미국 지질조사국(U.S. Geological Survey, USGS)이 개발한 EGRET은 수질 및 유출량 자료의 장기 추세 변화 분석을 위한 패키지로 R 프로그래밍 언어를 기반으로 구동되며, 분석·처리한 데이터에 대하여 광범위한 그래픽 프리젠테이션을 제공하여 탐색적 자료 분석에 매우 효과적인 도구이다. 특히, EGRET 패키지는 농도와 유출 사이의 관계 특성, 수집된 자료의 계절성 존재 및 특성, 점진적 또는 급격한 경향의 존재를 검토할 수 있는 그래픽 결과를 제시하며, 가중 회귀(Weighted Regressions on Time, Discharge, and Season, 이하 WRTDS) 모델을 적용하여 농도와 부하의 상태와 경향을 특성화한다. 시간, 유량 및 계절에 대한 WRTDS 모델은 농도 및 부하의 상태와 경향을 특성화하는 데 사용할 수 있는 수질 데이터 세트의 분석 방법으로, 근본적으로 탐색적 데이터 분석 방법으로 다양한 유형의 트렌드 시나리오에 민감하도록 설계되었으며 선형 또는 2차 함수형에 맞지 않을 수 있는 시간적 추세를 탐지하여 설명할 수 있고, 불규칙한 간격의 자료를 사용하기에 적합한 장점이 있다. 본 연구에서는 북한강 상류의 지속적인 흙탕물 발생으로 문제가 되고 있는 자운지구의 자운천을 대상으로 흙탕물 발생 현황을 분석하기 R을 이용하여 탐색적 자료 분석을 실시하였다. 자료 분석은 EGRET 패키지를 사용하여 수집된 자료(2016년 4월 - 2021년 7월까지 수집된 191개의 SS 자료와 인근 유량측정망의 유량자료)의 유량과 SS 농도 간의 관계, 시간에 따른 SS 농도 분포, SS 농도의 월별 특성 분석 및 유황별 SS 농도 변화 등을 검토하였으며, WRTDS 모델로 SS와 부하량을 예측하고 검토하여 자운천 유역의 흙탕물 부하 특성을 검토하였다.

  • PDF

DD-Plot for ANCOVA Models (ANCOVA 모형을 위한 DD-plot)

  • Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.2
    • /
    • pp.227-237
    • /
    • 2014
  • We use the regression model with the indicator variables in the case that we use qualitative variables as some predictor variables in regression analysis. We use the ANCOVA(Analysis of Covariance) model when comparing the response variable among groups while statistically controlling for variation in the response variable caused by a variation in the covariate. DD-plot can be used as a graphical exploratory data analysis tool before the confirmatory data analysis. With the DD-plot, we can discriminate the difference of groups in the regression model with the indicator variables or the ANCOVA model at a glance. Making DD-plot does not demand the statistical model assumption about error terms in regression model. Several examples show the usefulness of DD-plots as a graphical exploratory data analysis tool for the regression analysis.

Revisiting the validities of the Perfectionism Scale (완벽주의 척도의 타당도 재검증)

  • Rhee, Ki-Jong;Kim, Eun-Joo
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2006.12a
    • /
    • pp.239-262
    • /
    • 2006
  • 이 연구는 Hewitt과 Flett(1991c), 이기종(2006)이 제안한 완벽주의 척도 연구모형의 타당도를 확인적 요인분석을 통해 검증하고, Hewitt과 Flett(1991c)이 개발한 완벽주의 척도의 문항이 몇 개의 요인으로 구성되는지 알아보기 위해 탐색적 요인분석을 실시하였다. 확인적 요인분석 결과 Hewitt과 Flett(1991c), 이기종(2006)이 각각 제안한 연구모형과 수집된 자료가 잘 합치하지 않았다. 따라서 자료에 모형이 잘 맞도록 모형을 수정해야 하고, 의미 없는 자유모수가 모형에서 나타나지 않도록 모형을 다시 설정해야 함을 알 수 있다. 또한 Hewitt과 Flett(1991c)이 개발한 완벽주의 척도의 탐색적 요인분석을 통해 완벽주의 척도의 각 문항들이 완벽주의를 측정하는데 있어서 단일요인으로 제 기능을 하기 보다는 여러 문항에 걸쳐 공통요인이 존재함을 알 수 있다. 따라서 확인적 요인분석과 탐색적 요인분석을 통해 Hewitt과 Flett(1991c)이 개발한 완벽주의 척도가 측정하는 요인은 3개 요인으로 설명될 수 없다고 판단된다. 그러므로 Hewitt과 Flett(1991c)이 개발한 완벽주의 척도의 측정 문항이 수정되어야 하고, 나가서 우리의 사회 문화적 실정을 고려한 완벽주의 척도의 개발이 시급함을 알 수 있다.

  • PDF

Spatial Data Analysis for the U.S. Regional Income Convergence,1969-1999: A Critical Appraisal of $\beta$-convergence (미국 소득분포의 지역적 수렴에 대한 공간자료 분석(1969∼1999년) - 베타-수렴에 대한 비판적 검토 -)

  • Sang-Il Lee
    • Journal of the Korean Geographical Society
    • /
    • v.39 no.2
    • /
    • pp.212-228
    • /
    • 2004
  • This paper is concerned with an important aspect of regional income convergence, ${\beta}$-convergence, which refers to the negative relationship between initial income levels and income growth rates of regions over a period of time. The common research framework on ${\beta}$-convergence which is based on OLS regression models has two drawbacks. First, it ignores spatially autocorrelated residuals. Second, it does not provide any way of exploring spatial heterogeneity across regions in terms of ${\beta}$-convergence. Given that empirical studies on ${\beta}$-convergence need to be edified by spatial data analysis, this paper aims to: (1) provide a critical review of empirical studies on ${\beta}$-convergence from a spatial perspective; (2) investigate spatio-temporal income dynamics across the U.S. labor market areas for the last 30 years (1969-1999) by fitting spatial regression models and applying bivariate ESDA techniques. The major findings are as follows. First, the hypothesis of ${\beta}$-convergence was only partially evidenced, and the trend substantively varied across sub-periods. Second, a SAR model indicated that ${\beta}$-coefficient for the entire period was not significant at the 99% confidence level, which may lead to a conclusion that there is no statistical evidence of regional income convergence in the US over the last three decades. Third, the results from bivariate ESDA techniques and a GWR model report that there was a substantive level of spatial heterogeneity in the catch-up process, and suggested possible spatial regimes. It was also observed that the sub-periods showed a substantial level of spatio-temporal heterogeneity in ${\beta}$-convergence: the catch-up scenario in a spatial sense was least pronounced during the 1980s.

Firework plot as a graphical exploratory data analysis tool for evaluating the impact of outliers in skewness and kurtosis of univariate data (일변량 자료의 왜도와 첨도에서 특이점의 영향을 평가하기 위한 탐색적 자료분석 그림도구로서의 불꽃그림)

  • Moon, Sungho
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.2
    • /
    • pp.355-368
    • /
    • 2016
  • Outliers and influential data points distort many data analysis measures. Jang and Anderson-Cook (2014) proposed a graphical method called a rework plot for exploratory analysis purpose so that there could be a possible visualization of the trace of the impact of the possible outlying and/or influential data points on the univariate/bivariate data analysis and regression. They developed 3-D plot as well as pairwise plot for the appropriate measures of interest. This paper further extends their approach to identify its strength. We can use rework plots as a graphical exploratory data analysis tool to evaluate the impact of outliers in skewness and kurtosis of univariate data.