• 제목/요약/키워드: Statistical regression model

검색결과 1,759건 처리시간 0.028초

위성 자료를 이용한 지표면 흡수단파복사 산출 알고리즘들의 비교 분석 (Comparative Analysis of Algorithm for Calculation of Absorbed Shortwave Radiation at Surface Using Satellite Date)

  • 박혜인;이규태;조일성;김부요
    • 대한원격탐사학회지
    • /
    • 제34권6_1호
    • /
    • pp.925-939
    • /
    • 2018
  • 지표면 흡수단파복사(Absorbed Shortwave Radiation, ASR)는 대기와 육지 및 해양 사이의 에너지 수지 분석을 위한 필수 요소이다. 이 연구에서는 천리안위성 2A호(GEO-KOMPSAT-2A; GK-2A)에 적용하기 위하여 복사 모델과 지표면 알베도 자료를 이용하여 지표면 흡수단파복사를 산출(GWNU 방법)하였고, 그 결과는 기준 자료로 선정한 CERES (Clouds and the Earth's Radiant Energy System) 위성 센서 및 지상 관측 자료와 비교하였다. 또한 이 연구 결과(GWNU 방법)는 미국 정지궤도위성 GOES-R의 ABI (Advanced Baseline Imager)에 의한 물리적 및 통계적 방법 그리고 Li et al.(1993) 및 Kim and Jeong (2016)의 회귀 방정식 방법들과 비교하였으며, 그 결과 GWNU 방법에 의하여 계산된 지표면 흡수단파복사는 다른 방법들에 의한 값보다 정확 하였다. 그러나 GWNU 방법을 활용하여 지표면 흡수단파복사를 산출할 때 계산 시간과 지표면 알베도 자료의 정확성 문제가 발생될 경우 위에 제시된 경험적 방법들이 GWNU 방법과 함께 사용되어야 할 것이다.

가계동향조사 지출부문 시계열 연계 방안에 관한 연구 (A study on time series linkage in the Household Income and Expenditure Survey)

  • 김시현;성병찬;최영근;여인권
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.553-568
    • /
    • 2022
  • 가계동향조사는 가구에 대한 가계수지 실태를 파악하여 국민 소득·소비 수준과 그 변화의 측정 및 분석 등을 목적으로 하는 통계청의 대표적인 조사이다. 최근 여러 기관들에서 2017년과 2018년의 가계동향 지출부문에서 발생한 시계열 단절에 대한 문제를 인식하고, 이 기간에 대한 시계열 연계를 위한 관련 연구를 진행하고 있다. 본 연구에서는 2016년까지의 가계동향 조사 시계열 특성을 파악하고, 이를 반영하여 2017년과 2018년의 지출액에 대한 시계열을 연계하는 예측값을 도출한다. 본 연구에서는 각 지출 항목들의 시계열적 특성을 골고루 반영하는 동시에 특정 예측 모형의 영향을 줄이기 위하여 총 8개의 회귀모형, 시계열모형, 머신러닝 기법을 합성하여 사용하였다. 특히 본 연구의 주목할 만한 특징은, Top-down 또는 Bottom-up 방식이 아닌, 정보의 손실없이 가계동향조사의 계층 구조를 반영할 수 있는 optimal combination 기법을 사용하여 예측력을 향상시켰다는 점이다. 2017년부터 2019년 자료에 대한 가계동향 지출 부문의 연계 분석 결과, 본 연구가 제안하는 연계 방식이 시계열 단절성 회복 및 예측력 향상에 기여하며, 또한 optimal combination 기법에 의한 계층 조정 후의 예측값이 조사자료에 보다 근접한 결과를 보여줌을 확인하였다.

도로표지에 대한 고령운전자의 인간공학적 특성과 적정 안내지명 개수에 대한 연구 (Older Drivers' Characteristics and Optimal Number of Guide Names on Road Signs)

  • 노관섭;이종학;김종민
    • 대한토목학회논문집
    • /
    • 제28권2D호
    • /
    • pp.235-242
    • /
    • 2008
  • 고령인구의 운전참여 비율이 급증하는 시점에서 시력 및 운전판단 능력이 떨어지는 고령운전자가 안전하게 운행할 수 있도록 하기 위해서는 고령운전자를 위한 도로교통환경의 정비가 무엇보다 중요하다. 도로교통 안전시설물 중에서 가장 먼저 생각할 수 있는 것은 도로표지로, 고령운전자가 도로표지를 잘 알아볼 수 있도록 설치할 필요가 있다. 본 연구는 고령운전자가 도로표지판의 지명개수에 대해서 어떻게 반응하는지, 또한 연령대별로 어느 정도 차이가 나는지를 실험하기 위해서 다양한 연령층(20대~70대)을 확보하여 실험을 수행하였다. 이때 사용된 장비는 표지판의 내용을 완벽하게 주시했는지를 알 수 있는 안구운동분석기와 도로현실을 최대한 반영한 가상 도로주행시뮬레이터를 사용하였다. 연구내용은 고령운전자에 대한 속도변화, 판독소요시간 분석, 오독률 분석을 실시하였다. 그 결과 각 구간에서 연령대별 판독과정에 따른 속도변화를 살펴보면, 전체적으로 연령이 높을수록 속도는 낮은 경향을 나타냈다. 연령대별 평균 판독소요시간 분석에서 회귀분석을 실시한 결과, 비표준화계수를 살펴보면 연령이 증가할수록 판독소요시간이 0.106초씩 증가하였다. 그리고 Logistic Model을 이용하여 연령별 지명개수에 따른 오독률을 분석한 결과, 5% 미만의 오독률을 고려하였을 때 고령자의 경우에는 지명개수가 4개 이하가 가장 바람직한 것으로 나타났다. 본 연구는 도로교통환경에서 보호받아야할 고령자에게 도로표지판의 적정 지명개수를 제시함으로써 도로교통안전에 도움이 될 것으로 본다. 또한 향후 각종 도로교통표지 설계시 안전성을 제고하는 기법 개발에 활용 및 기여할 것이다.

한국 프로배구 연맹의 경기 예측 및 영향요인 분석 (Matching prediction on Korean professional volleyball league)

  • 김희숙;이나경;이지윤;송종우
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.323-338
    • /
    • 2024
  • 본 연구는 한국 프로배구 리그를 체계적으로 분석하고 대표적인 머신러닝 분류 방법을 활용하여 경기 결과를 예측하고자 한다. 이를 위해 2012/2013 시즌부터 2022/2023 시즌까지의 남자 프로배구와 여자 프로배구 리그 경기 데이터를 수집하였으며, 이 데이터는 경기 세부 내용을 상세하게 포함하고 있다. 데이터는 각 경기를 두 팀으로 분리한 경우와 홈팀을 기준으로 상대팀과의 성과 차이로 데이터를 가공한 경우로 두 가지 다른 데이터 구조를 모델에 적용했다. 이를 통해 남자 프로배구와 여자 프로배구 각각에 대해 총 4개의 예측 모형을 구축했다. 경기 종료 전에는 모형에서 사용하는 세부 변수 값들을 알 수 없기 때문에, 오늘 경기 직전까지의 3~4 경기의 결과를 전처리하여 이를 변수로 사용했다. 본 연구에서는 Decision Tree, Logistic Regression, Bagging, Random Forest, Xgboost, Adaboost, Light GBM 같은 다양한 머신러닝 기법을 분류에 활용하여, Random Forest를 사용한 모델이 가장 우수한 예측 성능을 보였다. 최종 선택한 모형에 대해 변수 중요도 그림과 부분 의존도 그림을 확인한 결과 성별과 데이터 구조에 따라 중요한 변수들이 다른 것으로 나타났지만, 공통적으로 세트 성공 수, 블로킹 득점, 범실 개수가 가장 중요한 변수임을 알 수 있었다. 본 승패 예측 모델은 사후적 예측이 아닌 경기 종료 전 사전 예측이 가능한 모형이라는 점에서 차별성을 가지며, 우리의 분석이 한국 프로배구 팀들에게 전략적 추론이 될 수 있을 것이라 기대한다.

한우 도체형질의 유전능력평가를 위한 통계모형 탐색 (Research of Statistical Model for Genetic Evaluation of Hanwoo Carcass Traits)

  • 구양모;김시동;김정일;송치은;이기환;정용호;이재윤;장현기;박병호;최태정;조광현;이승수;이정규;김효선
    • Journal of Animal Science and Technology
    • /
    • 제53권4호
    • /
    • pp.283-288
    • /
    • 2011
  • 2006년부터 2009년까지 축산물품질평가원에서 등급 판정된 도체성적이 있는 개체와 한국종축개량협회에 등록이 확인된 231,382 두의 자료를 이용하여 각 도체형질의 자료구조 분석 등을 살펴보고, 각 요인별로 도체형질에 어떠한 영향을 주는 지에 대한 환경효과 등을 분석하고, 변수선택법 등을 이용하여 향후 유전능력평가에서 사용 가능한 통계모형 찾아내고자 실시하였다. 한우 암, 수, 거세를 포함한 전체집단에서 출하체중, 도체율, 등 지방두께, 근내지방도에서 정규분포를 보이고 있었고, 다른 형질은 정규분포에 근접함을 확인할 수 있었다. 각 요인에 대한 분산분석에서는 한우 도체형질에 대하여 성별, 출생년도-계절, 도축년도-계절, 출생지역, 도축일령의 모두 고도의 유의성(p<0.01)이 인정되었다. 변수선택법을 이용한 모형적합도 검정에서는 출하체중, 도체중, 도체율, 배최장근단면적은 다섯 가지 환경효과를 선택하는 것이 최적이었고, 등지방두께와 근내지방도는 네 가지 환경효과를 고려하는 것이 최적이었지만, 다형질 분석으로 한 번에 분석을 하기 위해서는 다섯 가지 환경효과를 함께 고려하는 것이 적합하다고 사료된다.

생육모의에 의한 북한지방 시ㆍ군별 벼 재배기후 예비분석 (Agroclimatology of North Korea for Paddy Rice Cultivation: Preliminary Results from a Simulation Experiment)

  • 윤진일;이광회
    • 한국농림기상학회지
    • /
    • 제2권2호
    • /
    • pp.47-61
    • /
    • 2000
  • 북한 시ㆍ군별 벼 생육모의결과를 토대로 벼 재배 적합성 여부를 판정하였다. 생육모의에 필요한 시ㆍ군 별 일 기상자료는 지형기후학적 공간내삽기법을 근거로 한 3단계 과정을 통해 생산하였다. 우선 기온의 경우 51개 남북한 표준관측소의 14년간(1981~1994) 월평균값을 관측지점 위도, 해발고도, 해안거리, 경사도, 개방도 등 지리지형변수에 회귀시켜 얻은 통계모형(RMSE=0.4~1.6$^{\circ}C$)을 북한전역에 적용시켜 1 km$\times$1 km수평 격자점 단위로 월별 평균값을 추정하였다. 강수량의 경우 상대적으로 자료가 풍부한 남한의 지형-강수 관계를 도출하여 이를 북한지방에 적용한 윤 (2000)의 방법에 의해 월별 강수량 분포도를 작성하였다. 일사량의 경우 남한 19개 관측소의 14년간(1984~1997) 월 평균 수평면 전천일사량 관측값의 추정식([일사량, MJ m$^{-2}$ day$^{-1}$)=0.344+0.4756[대기외 일사량]+0.0299[남쪽 개방도]-1.307[운량]-0.01[상대습도], 결정계수 0.92, RMS error 0.95)에 의해 북한 지방 27개 지점의 일사량 자료를 복원하였다. 이를 거리역산가중법으로 공간내삽하여 북한전역의 월별 일사량 분포도를 작성하였다. 두 번째 단계에서는 얻어진 1 km$\times$1km 격자점 기후값을 183개 북한 시ㆍ군별로 공간평균값을 취했다. 마지막으로 시ㆍ군 단위 월별 기후값을 이용하여 통계적인 방법 (Pickering et al., 1994)에 의해 30년간의 일별 기상자료를 생성하였다. 북한의 대표적인 벼 품종 생육조사자료를 토대로 CERES-rice 모형의 유전적 모수를 조정하고, 준비된 기상자료를 입력시켜 183개 시ㆍ군별 벼의 생육을 30년치씩 모의하였다. 생육모의결과 중 성숙기와 수량 관련 특성을 점수화 하여 각 시ㆍ군의 벼 재배용 농업기후학적 잠재력을 정량적으로 표현하였다.

  • PDF

시기별 기상값 활용 피복재배 감자 상서수량 예측 (Estimating the Yield of Marketable Potato of Mulch Culture using Climatic Elements)

  • 이안수;최성진;전신재;맹진희;김종환;김인종
    • 한국작물학회지
    • /
    • 제61권1호
    • /
    • pp.70-77
    • /
    • 2016
  • 피복재배 수미감자를 대상으로 7개 연도에 전국 9개소에서 수행되었던 35개 지역적응시험 성적과 해당지역의 시기별 기상요소들간 상관도를 검정한 결과, 감자의 상서율은 지상부 생육기보다는 괴경 비대기의 기상영향을 더 많이 받는 것으로 나타났는데, 특히 수확전 50~41일과 수확전 20일간의 일조시간, 수확전 10일간의 5 mm이상 강우일수의 영향을 크게 받는 것으로 나타났다. 감자의 상서수량에 영향을 미치는 기상요인은 파종후 20일간의 강수량, 파종후 11~20일의 상대습도, 수확전 20일부터의 강수량, 수확전 50~41일 및 20일전부터의 일조시간, 그리고 수확전 10일간의 5 mm 이상 강수일수 등이었다. 2차 회귀에서 상서수량과 상관이 나타난 각각의 기상값을 이용하여 계산한 수량예측치들($Y_i=aX_i{^2}+bX_i+c$)과 상서수량(Y)간에 선형회귀분석을 통하여 4개의 상서수량 예측모형을 만들었고 그중에서 4개의 기상요소가 활용되었고, 수량예측력이 가장 높을 것으로 보이는 모형 4를 선택하였다. 여기에 각 기상요소별 수량예측치 모델식들($aX_i{^2}+bX_i+c$)을 대입하여 얻은 최종 수량예측모형은 아래와 같았다. $$Y=-336^{\ast}DR_-10^2+854^{\ast}DR_-10-0.422^{\ast}Prec_-9^{2}\\+43.3^{\ast}Prec_-9-0.0414^{\ast}RH_-2^2+46.2^{\ast}RH_-2\\-0.0102^{\ast}Prec_-2^2-7.00^{\ast}Prec_-2-10039$$ 이 모형은 잔차평균제곱이 작고 F값이 높으며 결정계수는 0.693으로 높게 나타나 감자상서수량의 예측력이 높을 것으로 판단된다.

심층신경망 모형을 이용한 서울시 도시공원 및 녹지공간의 열섬저감효과 분석 (Analysis of Urban Heat Island (UHI) Alleviating Effect of Urban Parks and Green Space in Seoul Using Deep Neural Network (DNN) Model)

  • 김병찬;강재우;박찬;김현진
    • 한국조경학회지
    • /
    • 제48권4호
    • /
    • pp.19-28
    • /
    • 2020
  • 도시화로 인한 도시열섬현상(Urban Heat Island)이 심화되면서 도시차원의 열 관리가 중요한 이슈로 다뤄지고, 도시열섬현완화 방안으로 녹지사업과 환경정책이 시행되고 있고, 도시공원 및 녹지와 열의 관계를 분석하는 다수의 연구가 수행되었다. 하지만 열이라는 특성은 다수의 요인이 복합적으로 얽혀있어 선형적 상관관계를 통한 해석에 한계가 있다. 본 연구는 변수요인들이 다양하고 데이터의 양이 방대하여 기존의 통계분석방식으로는 분석하기 어려운 분야에서 강점을 갖는 심층신경망 모형 방법론을 사용하여 여름철 서울지역의 공원 및 녹지의 열섬저감효과를 평가하는 것을 목표로 연구를 진행하였다. 이를 위해서 Landsat 8 인공위성영상을 활용하여 동시간의 광역적인 데이터를 취득하였고, ArcGis 10.7을 이용하여 서울시를 30m×30m 그리드로 격자화하여, 각 격자에 열섬저감을 측정할 수 있는 환경변수를 구축하였다. Python 3.7과 Keras를 이용하여 심층신경망 모형을 생성하여 지표면 온도와 변수 간의 관계를 분석하였다. 분석 결과, 인공신경망 모형은 높은 설명력을 가지는 것을 확인하였다. 또한 일반적인 연구 결과와 마찬가지로 인접 녹지와의 거리가 가까울수록, 공원면적이 커질수록, 공원의 식생활력도가 높을수록 지표면 온도가 낮아짐을 확인하였다. 식생활력도에 의한 냉각효과가 많이 있는 것을 확인하였고, 일부 선행연구에서 녹지에 인접할수록 0.3℃ ~ 2.3℃ 저감될 수 있는 특성이 나타나고, 공원의 크기가 크면 2℃~3℃ 저감효과가 나타난다는 결과를 보이고 있는데, 본 연구결과와 비교해 보면 도출된 효과가 과대평가되었을 가능성을 확인하였다. 본 연구의 결과는 향후 도시열섬현상 완화를 위해 새로운 도시녹지를 조성시 효과적인 녹지 구성을 위한 정보로 활용될 수 있다.

중증 손상 기전의 안정된 환자에서 중증도 예측 인자들에 대한 다변량 분석 (Multivariate Analysis of Predictive Factors for the Severity in Stable Patients with Severe Injury Mechanism)

  • 이재영;이창재;이형주;정태녕;김의중;최성욱;김옥준;조윤경
    • Journal of Trauma and Injury
    • /
    • 제25권2호
    • /
    • pp.49-56
    • /
    • 2012
  • Purpose: For determining the prognosis of critically injured patients, transporting patients to medical facilities capable of providing proper assessment and management, running rapid assessment and making rapid decisions, and providing aggressive resuscitation is vital. Considering the high mortality and morbidity rates in critically injured patients, various studies have been conducted in efforts to reduce those rates. However, studies related to diagnostic factors for predicting severity in critically injured patients are still lacking. Furthermore, patients showing stable vital signs and alert mental status, who are injured via a severe trauma mechanism, may be at a risk of not receiving rapid assessment and management. Thus, this study investigates diagnostic factors, including physical examination and laboratory results, that may help predict severity in trauma patients injured via a severe trauma mechanism, but showing stable vital signs. Methods: From March 2010 to December 2011, all trauma patients who fit into a diagnostic category that activated a major trauma team in CHA Bundang Medical Center were analyzed retrospectively. The retrospective analysis was based on prospective medical records completed at the time of arrival in the emergency department and on sequential laboratory test results. PASW statistics 18(SPSS Inc., Chicago, IL, USA) was used for the statistical analysis. Patients with relatively stable vital signs and alert mental status were selected based on a revised trauma score of more than 7 points. The final diagnosis of major trauma was made based on an injury severity score of greater than 16 points. Diagnostic variables include systolic blood pressure and respiratory rate, glasgow coma scale, initial result from focused abdominal sonography for trauma, and laboratory results from blood tests and urine analyses. To confirm the true significance of the measured values, we applied the Kolmogorov-Smirnov one sample test and the Shapiro-Wilk test. When significance was confirmed, the Student's t-test was used for comparison; when significance was not confirmed, the Mann-Whitney u-test was used. The results of focused abdominal sonography for trauma (FAST) and factors of urine analysis were analyzed using the Chi-square test or Fisher's exact test. Variables with statistical significance were selected as prognostics factors, and they were analyzed using a multivariate logistics regression model. Results: A total of 269 patients activated the major trauma team. Excluding 91 patients who scored a revised trauma score of less than 7 points, 178 patients were subdivided by injury severity score to determine the final major trauma patients. Twenty-one(21) patients from 106 major trauma patients and 9 patients from 72 minor trauma patients were also excluded due to missing medical records or untested blood and urine analysis. The investigated variables with p-values less than 0.05 include the glasgow coma scale, respiratory rate, white blood cell count (WBC), serum AST and ALT, serum creatinine, blood in spot urine, and protein in spot urine. These variables could, thus, be prognostic factors in major trauma patients. A multivariate logistics regression analysis on those 8 variables showed the respiratory rate (p=0.034), WBC (p=0.005) and blood in spot urine (p=0.041) to be independent prognostic factors for predicting the clinical course of major trauma patients. Conclusion: In trauma patients injured via a severe trauma mechanism, but showing stable vital signs and alert mental status, the respiratory rate, WBC count and blood in the urine can be used as predictable factors for severity. Using those laboratory results, rapid assessment of major trauma patients may shorten the time to diagnosis and the time for management.

데이터마이닝을 활용한 사랑의 형태에 따른 연인관계 몰입수준 및 관계 지속여부 예측 (Prediction of commitment and persistence in heterosexual involvements according to the styles of loving using a datamining technique)

  • 박윤주
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.69-85
    • /
    • 2016
  • 연인과의 성공적인 관계형성은 인생의 만족감을 결정짓는 핵심적인 요소 중 하나이다. 기존에 심리학 분야에서는 성공적인 연인관계에 영향을 미치는 요인들에 대한 다양한 연구가 수행되어 왔으나, 주로 통계적인 분석기법에 기반하고 있기 때문에 복잡한 비선형의 관계를 분석하고, 특징을 추출하는 데에는 한계가 있었다. 이에, 본 연구는, 기존의 통계적인 분석 기법과 더불어, 데이터마이닝의 의사결정나무 분석기법을 활용하여 사랑의 형태에 따른 연인관계의 몰입(commitment) 수준과 관계지속 여부를 분석하였다. 특히, 기존 연구에서 도출된 주요 변인들 이외에 사랑의 여섯 가지 형태인 에로스(eros), 루두스(ludus), 스트로게(storge), 매니아(mania), 프래그마(pragma) 그리고 아가페(agape)를 추가적으로 고려하여, 이들이 연인관계에서 서로에 대한 몰입수준 및 연인관계 지속여부에 어떠한 영향을 미치는지 분석하고, 예측하는 모형을 수립하였다. 본 연구에는 실제 남녀커플 105쌍, 총 210명에 대한 데이터가 활용되었다. 본 연구결과 연인관계 몰입수준 및 관계 지속여부의 영향요인으로, 기존에 심리학 분야에서 제시된 변수들 이외에, 에로스, 아가페, 프래그마 등이 유의한 영향을 미친다는 것을 확인하였다. 특히, 남성은 아가페적 사랑의 형태가 몰입에 중요한 영향을 미치는 반면, 여성은 에로스적 사랑의 형태가 더욱 중요한 영향을 미치는 것으로 나타났다. 또한, 연인관계 지속여부에는 남성의 나르시시즘, 만족, 투자 및 매니아적 성향이 영향을 주고 있는 것으로 나타난 반면, 여성의 경우, 여성이 남성을 매니아적으로 사랑하는 정도만이 영향을 주고 있어, 남성이 관계의 지속 또는 결별에 더욱 결정적인 영향을 미치고 있는 것을 알 수 있었다. 이러한 연구는 데이터마이닝의 적용분야를 심리학 영역으로 확장한 융합연구로, 연인관계에 대한 새로운 분석을 시도하였다는 점에서 의의가 있으며, 조화로운 연인관계를 형성하는데 실질적인 시사점을 제공할 수 있을 것으로 기대된다.