• 제목/요약/키워드: regression spline

검색결과 68건 처리시간 0.025초

함수형 선형모형에서의 B-스플라인에 기초한 검정 (Classical testing based on B-splines in functional linear models)

  • 손지훈;이은령
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.607-618
    • /
    • 2019
  • 현대 과학기술의 발전으로 인해 함수 형태의 자료(functional data)는 기상학, 생물의학과 다양한 분야에서 발생하고 있으며 이러한 자료를 분석하는 것은 새롭고 흥미로운 통계과제라 할 수 있다. 스칼라 반응변수를 가진 함수형 선형회귀 모형(functional linear regression models with scalar response)은 널리 사용되는 함수형 자료 분석기법 중의 하나라 할 수 있고 이 회귀 모형에서 함수형 자료 (설명변수) 가 스칼라 반응변수에 영향력을 미치는지 검정하는 것은 중요한 문제라 할 수 있다. 최근, Kong 등은 함수형 주성분분석(functional principle component analysis)에 의한 차원 축소, 즉, 함수형 주성분분석 결과 얻어지는 고유함수(eigenfunctions)를 활용한 검정방법을 제안했다. 하지만, 그 고유함수들은 검정문제에서 관심사인 함수형 설명변수와 스칼라 반응변수의 연관성이 아니라 함수형 설명변수의 변동만을 고려하기 때문에 회귀문제에 사용하기에 일반적으로 적합한 기저가 아니다. 게다가, 자료로부터 추정하여야 하기 때문에 이 불필요한 추정오차가 검정 절차 성능에 포함될 가능성이 있다. 이러한 단점을 피하기 위해 본 논문에서는 기존의 고유기저함수가 아닌 고정기저(fixed basis)인 B-스플라인(B-splines) 함수를 활용한 검정 방법을 제안한고 모의실험을 통해 검정방법이 잘 작동한다는 것을 보여준다. 또한, 제안한 검정 방법은 B-스플라인의 국소화 성질 때문에 때론 효율적이고 직관적인 결과를 제공하는데 이를 모의실험과 실증자료 분석을 통해 보여줄 것이다.

경시적 자료의 주의력 결핍 과잉행동 장애를 종점으로 한 납의 벤치마크 용량 하한 도출 (Derivation of a benchmark dose lower bound of lead for attention deficit hyperactivity disorder using a longitudinal data set)

  • 이주형;김시연;하미나;권호장;김병수
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1295-1309
    • /
    • 2016
  • 본 연구의 목적은 아동 건강에 미치는 환경의 영향을 평가하기 위하여 우리나라 환경부에서 구축한 경시적 자료인 CHEER 자료를 바탕으로 납의 벤치마크 용량 하한(BMDL)을 도출하여 Kim 등 (2014)의 결과를 재현하는 것이다. 본 연구에서는 CHEER 자료의 2005년 동집단을 사용하였는데, 벌점화 선형 스플라인을 이용한 변환공식으로 2005년 동집단의 ADHD 평가 척도를 통일하고, 경시적 자료의 특성을 반영한 두 개의 선형혼합모형을 구축하였다. 이후 구축된 모형을 바탕으로 혈중 납 농도의 BMDL을 도출하였다. 이 과정에서 Kim 등 (2014)에서 발견한 ADHD 점수의 평균으로의 회귀 현상이 재확인되었고, 2005년 동집단과 2006년 동집단의 분포 상의 특징적 차이가 발견되었다. 결과적으로 이 차이를 감안했을 때, Kim 등 (2014)과 일치적인 결과를 얻을 수 있었다.

비선형 모델을 이용한 결측 대체 방법 비교 (A comparison of imputation methods using nonlinear models)

  • 김혜인;송주원
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.543-559
    • /
    • 2019
  • 자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체 방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.

Optimization of cost and mechanical properties of concrete with admixtures using MARS and PSO

  • Benemaran, Reza Sarkhani;Esmaeili-Falak, Mahzad
    • Computers and Concrete
    • /
    • 제26권4호
    • /
    • pp.309-316
    • /
    • 2020
  • The application of multi-variable adaptive regression spline (MARS) in predicting he long-term compressive strength of a concrete with various admixtures has been investigated in this study. The compressive strength of concrete specimens, which were made based on 24 different mix designs using various mineral and chemical admixtures in different curing ages have been obtained. First, The values of fly ash (FA), micro-silica (MS), water-reducing admixture (WRA), coarse and fine aggregates, cement, water, age of samples and compressive strength were defined as inputs to the model, and MARS analysis was used to model the compressive strength of concrete and to evaluate the most important parameters affecting the estimation of compressive strength of the concrete. Next, the proposed equation by the MARS method using particle swarm optimization (PSO) algorithm has been optimized to have more efficient equation from the economical point of view. The proposed model in this study predicted the compressive strength of the concrete with various admixtures with a correlation coefficient of R=0.958 rather than the measured compressive strengths within the laboratory. The final model reduced the production cost and provided compressive strength by reducing the WRA and increasing the FA and curing days, simultaneously. It was also found that due to the use of the liquid membrane-forming compounds (LMFC) for its lower cost than water spraying method (SWM) and also for the longer operating time of the LMFC having positive mechanical effects on the final concrete, the final product had lower cost and better mechanical properties.

Analysis of the Effects of Job Policy Measures in Korea: Do the job policy measures impact the marriage and fertility of the youth in Korea?

  • Kang, Chang Ick;Lim, Kyung Eun;Kim, Junghak
    • Asian Journal for Public Opinion Research
    • /
    • 제10권3호
    • /
    • pp.200-229
    • /
    • 2022
  • The purpose of this study is to analyze the effects of youth job policy measures, set forth in Korea's 2016-2020 Third Basic Plan for Low Fertility and Aging Society (December 2015), on marriage and fertility among young people. Based on the results, we provide theoretical explanations for the findings and suggest policy alternatives to overcome the low fertility phenomenon in Korea. Previous studies have shown that employment is an important factor for marriage among youth, and a job policy could increase marriage and fertility rates. To test this assumption, we performed an exact matching between Statistics Korea's Employee-Enterprise Linkage DB and the Newlyweds DB from 2011 to 2019, in order to identify all young people aged 15-34. Then, linear spline regression analysis was used to examine the impact of the youth job policy on marriage and fertility. Comparing the period before the implementation of the employment policy (2011-2015) and after (2016-2019), the fertility rate increased as the number of young people looking for work increased. In addition, it was found that these impacts were greater after the implementation of the measures (2016-2019) than before (2011-2015). It is interesting to note that job growth among young people did not lead to an increase in marriage. However, the number of births significantly increased when young people who occupy jobs got married, which seems to be related to the delay in marriage among young people who are employed. Survey results about the intentions to marry and views on fertility are utilized for the explanation of the study results.

토양수분 위성자료의 공간상세화에 관한 연구 (A Study on Spatial Downscaling of Satellite-based Soil Moisture Data)

  • 신대윤;이양원;박문성
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.414-414
    • /
    • 2017
  • 토양수분은 지면환경에서 일어나는 수문 및 에너지 순환을 이해하는 데 있어 중요한 기상인자이다. 토양수분 현장관측은 땅속에 매설된 센서에 의해 상당히 정확하게 이루어지만, 관측점 수가 충분치 않아 공간적 연속성을 확보하지 못하는 어려움이 존재한다. 이에 광역적 및 연속적 관측이 가능한 마이크로파 위성센서가 토양수분 정보 획득을 위한 보조수단으로서 그 중요성이 부각되고 있다. 마이크로파 위성센서는 구름 등 기상조건의 제약을 받지 않으며, 1978년 이래 현재까지 여러 위성에 의해 25 km 및 10 km 해상도의 전지구 토양수분자료가 생산되어 왔다. 마이크로파 센서를 이용한 토양수분자료는 동일지점에 대하여 하루 2회 정도 산출되므로 적절한 시간분해능을 가지지만, 공간해상도가 최고 10 km로서 지역규모의 수문분석에 적용하기에는 충분치 않다. 이러한 토양수분자료의 공간해상도 문제 해결을 위하여 다양한 지면환경요소를 활용한 통계적 다운스케일링이 대안으로 제시되었다. 최근의 선행연구들은 대부분 방정식을 이용한 결합모형을 통해 통계적 다운스케일링을 수행하였는데, 회귀식과 같은 선형결합뿐 아니라 신경망이나 기계학습 등의 비선형결합에서도, 불가피하게 발생할 수밖에 없는 잔차(residual)로 인하여 다운스케일링 전후의 공간분포 패턴이 달라져버리는 문제를 안고 있었다. 회귀분석에 잔차의 공간내삽을 결합시킨 회귀크리깅(regression kriging)은 잔차보정을 통해 이러한 문제를 해결함으로써 다운스케일링 전후의 공간분포 일관성을 보장하는 기법이다. 이 연구에서는 회귀크리깅을 이용하여 일자별 AMSR2(Advanced Microwave Scanning Radiometer 2) 토양수분 자료를 10 km에서 1 km 해상도로 다운스케일링하고, 다운스케일링 전후의 자료패턴 일관성을 평가한다. 지면온도(LST), 지면온도상승률(RR), 식생온도건조지수(TVDI)는 일자별로 DB를 구축하였고, 식생지수(NDVI), 수분지수(NDWI), 지면알베도(SA)는 8일 간격으로 DB를 구축하였다. 이러한 8일 간격의 자료를 일자별로 변환하기 위하여 큐빅스플라인(cubic spline)을 이용하여 시계열내삽을 수행하였다. 또한 상이한 공간해상도의 자료는 최근린법을 이용하여 다운스케일링 목표해상도인 1 km에 맞도록 변환하였다. 우선 저해상도 스케일에서 추정치를 산출하기 위해서는 저해상도 픽셀별로 이에 해당하는 복수의 고해상도 픽셀을 평균화하여 대응시켜야 하며, 이를 통해 6개의 설명변수(LST, RR, TVDI, NDVI, NDWI, SA)와 AMSR2 토양수분을 반응변수로 하는 다중회귀식을 도출하였다. 이식을 고해상도 스케일의 설명변수들에 적용하면 고해상도 토양수분 추정치가 산출되는데, 이때 추정치와 원자료의 차이에 해당하는 잔차에 대한 보정이 필요하다. 저해상도 스케일로 존재하는 잔차를 크리깅 공간내삽을 통해 고해상도로 변환한 후 이를 고해상도 추정치에 부가해주는 방식으로 잔차보정이 이루어짐으로써, 다운스케일링 전후의 자료패턴 일관성이 유지되는(r>0.95) 공간상세화된 토양수분 자료를 생산할 수 있다.

  • PDF

Effect Modification of Kidney Function on the Non-linear Association Between Serum Calcium Levels and Cardiovascular Mortality in Korean Adults

  • Jung-Ho Yang;Sun-Seog Kweon;Young-Hoon Lee;Seong-Woo Choi;So-Yeon Ryu;Hae-Sung Nam;Hye-Yeon Kim;Min-Ho Shin
    • Journal of Preventive Medicine and Public Health
    • /
    • 제56권3호
    • /
    • pp.282-290
    • /
    • 2023
  • Objectives: This study aimed to evaluate the potential interaction between kidney function and the non-linear association between serum calcium levels and cardiovascular disease (CVD) mortality. Methods: This study included 8927 participants enrolled in the Dong-gu Study. Albumin-corrected calcium levels were used and categorized into 6 percentile categories: <2.5th, 2.5-25.0th, 25.0-50.0th, 50.0-75.0th, 75.0-97.5th, and >97.5th. Restricted cubic spline analysis was used to examine the non-linear association between calcium levels and CVD mortality. Cox proportional hazard regression was used to estimate hazard ratios (HRs) for CVD mortality according to serum calcium categories. All survival analyses were stratified by the estimated glomerular filtration rate. Results: Over a follow-up period of 11.9±2.8 years, 1757 participants died, of whom 219 died from CVD. A U-shaped association between serum calcium and CVD mortality was found, and the association was more evident in the low kidney function group. Compared to the 25.0-50.0th percentile group for serum calcium levels, both low and high serum calcium tended to be associated with CVD mortality (<2.5th: HR, 6.23; 95% confidence interval [CI], 1.16 to 33.56; >97.5th: HR, 2.56; 95% CI, 0.76 to 8.66) in the low kidney function group. In the normal kidney function group, a similar association was found between serum calcium levels and CVD mortality (<2.5th: HR, 1.37; 95% CI, 0.58 to 3.27; >97.5th: HR, 1.65; 95% CI, 0.70 to 3.93). Conclusions: We found a non-linear association between serum calcium levels and CVD mortality, suggesting that calcium dyshomeostasis may contribute to CVD mortality, and kidney function may modify the association.

GIS 기법을 이용한 지형적 특성에 따른 월악산 소나무 연륜생장의 이질성 규명 (Analysis of Heterogeneous Tree-Ring Growths of Pinus densiflora with Various Topographical Characteristics in Mt. Worak Using GIS)

  • 서정욱;김재수;박원규
    • The Korean Journal of Ecology
    • /
    • 제23권1호
    • /
    • pp.25-32
    • /
    • 2000
  • 소나무 직경생장과 기후인자(월 평균기온과 총강수량)와의 관계를 지형적 특성에 따라 분석하기 위하여 월악산국립공원에서 선정한 20개의 임분에서 각각 10여 본의 임목에 대한 연륜을 측정하였다. 각 연륜계열들은 크로스데이팅 한 후, 임령과 임분동태에 따른 임목생장 추세를 제거하기 위하여 표준화함으로써 임분별 연륜연대기를 작성하였다. 연륜의 생장경향을 이용한 집락분석의 결과 20개 임분을 4개의 집락으로 분류할 수 있었다. 집락 Ⅰ 의 사면 방향은 북쪽이었으나, 다른 집락들은 대부분 남족과 남서쪽이었다. 고도는 집락Ⅰ(1개 임분), 집락Ⅱ(10개 임분), 집락Ⅲ(2개 임분)이 305∼580 m이었으나, 집락Ⅳ(7개 임분)는 다른 집락들보다 높은 450~870 m이었다 이중 집락Ⅱ는 다른 집락보다 토심이 얕은 급경사의 암석지에 위치하였다. 지형에 따른 기후인자들과 연륜생장과의 관계를 분석하기 위해 반응함수를 집락별로 실시하였다. 집락Ⅰ은 북사면의 다소 중습한 지역에 위치하여 다른 집락보다 기후인자의 영향을 많이 받지 않았다. 집락 Ⅱ는 강수가 임목생장을 제한하는 주요인으로 나타났는데, 이는 집락 Ⅱ가 낮은 고도에 위치하면서 토심이 얕은 급경사의 암석지에 위치하여 수분에 대한 임목생장의 민감도가 증가한 것이라 생각된다. 집락Ⅲ과 집락Ⅳ는 집락Ⅱ에 비하여 임목생장 개시 이전의 겨울과 이른봄의 기온이 보다 중요한 인자로 나타났다. 이런 결과는 고도 상승에 따른 기온 감소(집락Ⅳ)나 계곡부의 미소지형적 특성에 따른 온도 저하(집락Ⅲ)로 발생되는 결과라 생각된다. 이상의 결과는 GIS를 이용하여 수치화 하여 연륜과 지형이 갖는 시-공간적 정보들을 동시에 분석한 결과이다.

  • PDF