• 제목/요약/키워드: Longitudinal data analysis

검색결과 834건 처리시간 0.032초

Confounding of Time Trend with Dropout Process in Longitudinal Data Analysis

  • Kim, Ji-Hyun;Choi, Hye-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제9권3호
    • /
    • pp.703-713
    • /
    • 2002
  • In longitudinal studies, outcomes are repeatedly measured over time for each subject. It is common to have missing values or dropouts for longitudinal data. In this study time trend in longitudinal data with dropouts is of concern. The confounding of time trend with dropout process is investigated through simulation studies. Some simulation results are reported for binary responses as well as continuous responses with patterns of dropouts varying. It has been found that time trend is not confounded with random dropout process for binary responses when it is estimated using GEE.

Rank Tests for Multivariate Linear Models in the Presence of Missing Data

  • Lee, Jae-Won;David M. Reboussin
    • Journal of the Korean Statistical Society
    • /
    • 제26권3호
    • /
    • pp.319-332
    • /
    • 1997
  • The application of multivariate linear rank statistics to data with item nonresponse is considered. Only a modest extension of the complete data techniques is required when the missing data may be thought of as a random sample, and an appropriate modification of the covariances is derived. A proof of the asymptotic multivariate normality is given. A review of some related results in the literature is presented and applications including longitudinal and repeated measures designs are discussed.

  • PDF

Semiparametric kernel logistic regression with longitudinal data

  • Shim, Joo-Yong;Seok, Kyung-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.385-392
    • /
    • 2012
  • Logistic regression is a well known binary classification method in the field of statistical learning. Mixed-effect regression models are widely used for the analysis of correlated data such as those found in longitudinal studies. We consider kernel extensions with semiparametric fixed effects and parametric random effects for the logistic regression. The estimation is performed through the penalized likelihood method based on kernel trick, and our focus is on the efficient computation and the effective hyperparameter selection. For the selection of optimal hyperparameters, cross-validation techniques are employed. Numerical results are then presented to indicate the performance of the proposed procedure.

주변화 변량효과모형의 조사 및 고찰 (Review and discussion of marginalized random effects models)

  • 전주영;이근백
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1263-1272
    • /
    • 2014
  • 경시적 범주형자료 (longitudinal categorical data)는 의학, 보건학, 그리고 사회과학에서 많이 발생하는 자료이다. 이러한 자료는 반복측정으로 인한 결과치들의 상관관계를 설명하면서 공변량의 효과를 설명해야 한다. 이 논문에서 모집단에 대한 공변량의 효과를 추정하면서 우도함수에 기초한 모형인 주변화 변량효과모형 (marginalized random effects model)을 소개하고, 그 모형의 어떻게 발전했는지를 고찰한다. 그리고 실제 자료를 이용하여 제시된 모형을 설명한다.

가정외보호 아동의 양육자 관계와 교우관계의 상호 영향: 자기회귀교차지연모형을 활용한 종단연구 (The Reciprocal Relationship between Caregiver Relations and Peer Relations of Children in Out-of-home Care: Longitudinal Study Using Autoregressive Cross-lagged Modeling)

  • 김담이;강현아
    • 아동복지연구
    • /
    • 제16권2호
    • /
    • pp.109-135
    • /
    • 2018
  • The purpose of this study was to analyze the longitudinal causal relationship between caregiver relations and peer relations of children in out-of-home care. We analyzed the three years(2011-2013) of longitudinal data from the Panel Study on Korean Children in Out-of-Home Care. The autoregressive cross-lagged model (ARCL) was used to measure the longitudinal causal relationship between caregiver relations and peer relations. As a result, first, caregiver relations and peer relations showed stability over time. In other words, the results of the measurement at three time points showed that the caregiver relations and peer relations at the previous time had a significant effect on the caregiver relations and peer relations at the later time point. Second, the previous caregiver relations had a significant effect on the subsequent peer relations over time. Third, the previous peer relations had a significant effect on the subsequent caregiver relations over time. This study confirmed the interrelationships of caregiver relations and peer relations of children in care by examining the longitudinal data using the longitudinal analysis method.

다변량 경시적 자료 분석을 위한 공분산 행렬의 모형화 비교 연구 (Comparison study of modeling covariance matrix for multivariate longitudinal data)

  • 곽나영;이근백
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.281-296
    • /
    • 2020
  • 같은 개체로부터 반복 측정한 자료를 경시적 자료(longitudinal data)라고 한다. 이러한 자료를 분석하려면 흔히 사용되는 횡단 자료 분석과는 다른 분석 방법이 필요하다. 즉, 경시적 자료에서 공변량의 효과를 추정할 때에는 반복 측정된 결과 간의 상관성을 고려해야 하며, 따라서 공분산행렬을 모형화 하는 것이 매우 중요하다. 그러나 추정해야 할 모수가 많고, 추정된 공분산행렬이 양정치성을 만족해야 하므로 공분산 행렬의 모형화는 쉽지 않다. 특히 다변량 경시적 자료분석을 위한 공분산행렬의 모형화는 더욱더 심층적인 방법론을 사용해야 한다. 본 논문은 다변량 경시적 자료분석을 위한 공분산행렬을 모형화하기 위해 두 가지 방법론을 고찰한다. 두 방법 모두 수정된 콜레스키 분해(modified Cholesky decomposition)를 이용하여 시간에 따른 응답변수들의 상관관계를 설명하고 있다. 하지만 같은 시간에서 관측된 응답변수들간의 상관관계를 설명하는 방법이 다르다. 첫 번째 방법론에서는 향상된 선형 공분산 모형(enhanced linear covariance models)을 사용하여 공분산행렬이 양정치성을 만족하도록 한다. 두 번째 방법론에서는 분산-공분산 분해(variance-correlation decomposition)와 초구분해(hypersphere decomposition)을 이용하여 공분산 행렬을 모형화 한다. 이 두 방법론의 성능을 비교하고자 모의실험을 진행한다.

수학 교과에 대한 정의적 특성의 종단적 추이 분석 (A longitudinal analysis on trend of mathematical affective domain)

  • 김현주;김원경
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제55권4호
    • /
    • pp.447-465
    • /
    • 2016
  • The purpose of this study is to analyze longitudinal trends of students' mathematical affective domain by use of the data mining method. For this purpose, we used the Korea education longitudinal study(KELS 2005) which was the survey data for students' achievement test, affective domain test, teachers' evaluation, and parents' evaluation from $7^{th}$ grader in the year of 2005 to $11^{th}$ grader in the year of 2010. Subjects of this study is a total of 5040 students who answered to the mathematical affective domain survey in KELS 2005. The result findings are as follows. First, students' affective domain had changed negatively as they went up to higher grade. Second, if students' affective domain had built at a certain level in $7^{th}$ grade, the level did not change easily until $11^{th}$ grade. Third, major factors of students' affective domain were shown to be self-efficacy, intrinsic motivation, efforts and patient, and time management.

실도로 주행 데이터 기반 차선변경 주행 특성 분석 (Lane Change Driving Analysis based on Road Driving Data)

  • 박종철;채흥석;이경수
    • 자동차안전학회지
    • /
    • 제10권1호
    • /
    • pp.38-44
    • /
    • 2018
  • This paper presents an analysis on driving safety in lane change situation based on road driving data. Autonomous driving is a global trend in vehicle industry. LKAS technologies are already applied in commercial vehicle and researches about lane change maneuver have been actively studied. In autonomous vehicle, not only safety control issue but also imitating human driving maneuver is important. Driving data analysis in lane change situation has been usually dealt with ego vehicle information such as longitudinal acceleration, yaw rate, and steering angle. For this reason, developing safety index according to surrounding vehicle information based on human driving data is needed. In this research, driving data is collected from perception module using LIDAR, radar and RT-GPS sensors. By analyzing human driving pattern in lane change maneuver, safety index that considers both ego vehicle and surrounding vehicle state by using relative velocity and longitudinal clearance has been designed.

교육종단연구 분석을 위한 빅데이터 플랫폼 개발 및 적용 (Development and Application of a Big Data Platform for Education Longitudinal Study Analysis)

  • 박정;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.11-27
    • /
    • 2020
  • 본 논문에서는 교육종단연구 데이터를 효과적으로 저장·처리·분석하기 위한 데이터 플랫폼을 개발하고, 이를 서울교육종단연구(SELS)에 적용하여 유용성을 확인한다. 플랫폼은 데이터 전처리부와 데이터 분석부로 구성된다. 데이터 전처리부에서는 1) 마스킹 2) 요인화 3) 정규화·이산화 4) 데이터 유도 5) 데이터 웨어하우징 과정을 통해 교육종단연구 데이터 웨어하우스를 생성하게 된다. 데이터 분석부는 OLAP과 데이터 마이닝(DM)으로 구성된다. 먼저, OLAP에서는 측정값 선정, 스키마 설계를 거쳐 OLAP을 수행하게 된다. 이후 DM에서는 변수 선택, 연구모형 선택, 데이터 수정, 인수튜닝, 모형학습, 모형평가 및 해석단계를 거친다. 본 플랫폼에서 전처리 과정을 거쳐 생성된 데이터 웨어하우스는 다양한 연구자들에 의해 공유될 수 있고, 지속적인 연구결과 데이터 셋의 축적이 가능하므로 후속 연구자들은 추가적인 분석을 수월하게 수행할 수 있게 된다. 또한, 정책입안자들도 SELS 데이터 웨어하우스에 직접 접근하여 다차원 분석을 통해 온라인으로 분석할 수 있어 과학적인 의사결정이 가능하게 된다. 본 연구에서는 개발된 플랫폼의 유용성을 입증하기 위해 SELS 데이터를 플랫폼 상에서 구축하고 수학 학업성취도를 측정값으로 선정하여 OLAP 및 DM을 수행하였으며, 측정값에 영향을 주는 다양한 요인을 데이터 마이닝 기법을 사용하여 분석하였다. 이를 통해 데이터 기반 교육정책 시사점을 빠르고 효과적으로 도출할 수 있었다.

베이지안 다변량 선형 모형을 이용한 청소년 패널 데이터 분석 (KCYP data analysis using Bayesian multivariate linear model)

  • 이인선;이근백
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.703-724
    • /
    • 2022
  • 다변량 경시적 자료 분석은 반복 측정된 자료에 존재하는 상관관계를 올바르게 추정하면서 자료를 분석해야 한다. 경시적 연구에서는 다변량 경시적 자료가 주로 생성되지만, 기존 통계적 모형은 대부분 단변량으로 분석되어 다변량 경시적 자료에 존재하는 복잡한 상관관계를 제대로 설명하지 못하게 된다. 따라서 본 논문에서는 복잡한 상관관계를 설명하기 위해 공분산 행렬을 모형화하는 다양한 방법에 대해 고찰한다. 그 중 수정된 콜레스키 분해, 수정된 콜레스키 블록분해와 초구분해를 살펴본다. 그리고 일반화 자기회귀모수 행렬이 가지는 희박성 문제를 해결하기 위해 베이지안 방법을 이용하여 청소년 패널 데이터를 분석한다. 청소년 패널 데이터는 다변량 경시적 자료이며, 반응 변수로는 학교 적응도, 학업 성취도, 휴대전화 의존도를 고려한다. 자기 상관 구조와 혁신 표준 편차 구조를 달리 가정하여 여러 모형을 비교한다. 가장 적합한 모형에 대해 학교 적응도와 학업 성취도에 대해 모든 설명 변수가 유의미하며, 휴대전화 의존도가 반응 변수일 때 사교육 시간을 제외한 모든 설명 변수가 유의미한 것으로 나타난다.