• 제목/요약/키워드: Multivariate statistical models

검색결과 128건 처리시간 0.028초

풍기 지역 지하수의 수리지구화학 및 환경동위원소 특성 연구 (Hydrogeochemical and Environmental Isotope Study of Groundwaters in the Pungki Area)

  • 윤성택;채기탁;고용권;김상렬;최병영;이병호;김성용
    • 대한지하수환경학회지
    • /
    • 제5권4호
    • /
    • pp.177-191
    • /
    • 1998
  • 경북 풍기읍 일대의 선캠브리아기 편마암 지역에 부존하는 지하수계의 수리지구화학.수리지질학적 특성을 규명하기 위하여, 지표수, 천층 지하수(심도<70 m) 및 심층 지하수(심도 500~810 m)를 대상으로 수리화학, 다변량 통계, 열역학, 환경 동위원소(삼중수소, 산소-수소, 탄소, 황) 및 질량 보존 모델링을 포함한 종합적인 연구를 수행하였다. 천층 지하수의 수질은 Ca, Mg, SO$_4$및 NO$_3$의 함량이 높은 'Ca-HCO$_3$' 유형으로 특징되는 반면, 심층 지하수는 Na, Ba, Li, H$_2$S, F 및 Cl의 함량이 높고 방해석에 대해 포화 상태를 보이는 'Na-HCO$_3$' 유형으로 특징된다. 본 지역 자연수의 수질은 크게 두 유형, 즉 1) 지표수 및 천층 지하수와 2) 심층 지하수 및 일부천층 지하수로 대분되며, 앞의 유형은 계절적인 조성 변화를 나타낸다. 다변량 통계 분석 결과, 심층 지하수의 수질을 지배하는 세 개의 요인이 도출되었다. 이들 요인은 총 86%의 설명력을 가지는데, 1) 사장석의 용해와 방해석의 침전, 2) 황산염의 환원, 3) 수산화 광물(특히 운모류)의 산성 가수 분해 반응으로 요약될 수 있다. 열역학적 해석 결과와 결합한 질량 보존 모델링을 통하여, 심층 지하수의 수질 특성을 지배하는 수/암 반응을 적절히 설명해 주는 네 개의 모델을 제시하였다. 각 모델은 사장석, 고령토 및 운모류 용해와 방해석, 일라이트, 로몬타이트, 녹니석 및 스멕타이트의 침전을 보여준다. 산소 및 수소 동위원소 연구 결과, 심층 지하수의 경우는 먼 거리의 고지대(소백산 일대)에서 충진된 강우로부터 기원한 후 광역적인 심층 순환을 하면서 상당한 정도의 수/암 반응을 수반한 반면, 천층 지하수는 근처의 저지대에서 충진되었음을 알 수 있다. 삼중수소 자료에 따르면, 심층 지하수(0.2 TU)의 충진 연령은 핵실험 이전인 반면, 천층 지하수(5.66~7.79 TU)는 핵실험 이후였다. 용존 황산염의 황동위원소 조성 분석을 통하여, 본 지역의 심층 지하수에서 특징적으로 높은 함량을 보이는 황화수소(최대 3.9mg/l) 는 황산염의 환원에 기인함을 밝혔다. 또한, 용존 탄산염의 탄소 동위원소비는 토양 이산화탄소에 의한 탄산염 광물의 용해(천층 지하수의 경우), 또는 방해석의 재침전(심층 지하수의 경우)에 의해 조절되고 있음을 확인하였다. 본 지역에 부존하는 지하수의 기원과 유동 및 화학적 진화를 종합적으로 보여주는 모델을 제시한다.

  • PDF

불완전한 반복측정 자료의 보정방법 (Methods for Handling Incomplete Repeated Measures Data)

  • 우해봉;윤인진
    • 한국조사연구학회지:조사연구
    • /
    • 제9권2호
    • /
    • pp.1-27
    • /
    • 2008
  • 사회조사 자료를 활용한 통계분석에 있어서 불완전 자료의 문제는 거의 모든 연구자들이 경험하는 하나의 보편적인 문제이다. 불완전 자료의 문제는 특히 패널조사와 같은 종단적 자료를 활용한 연구에 있어서 중요한 이슈가 된다. 본 연구의 목적은 최근까지 이루어진 불완전 자료에 대한 보정방범을 소개하는 것이다. 특히, 본 연구는 패널자괴에서 발생한 불완전 자료의 처리에 대한 관심이 부족한 점을 고려하여 최근까지 이루어진 보정방법들을 반복측정 패널자료 분석에 적용하는데 초점을 맞춘다. 첫째, 본 연구는 불완전 자료에 대한 적절하지 못한 사후처리는 분석결과에 있어서 유의미한 차이로 이어 수 있음을 시사한다. 특히, 분석결과는 반복측정 자료를 사용하는 연구의 경우 불완전 자료의 발생은 궤적의 초기값보다는 시간의 경과에 따른 궤적의 변화를 적절히 추정하는데 문제를 가질 수 있음을 시사하고 있다. 둘째, 분석결과는 완전제거법이나 평균대체법이 EM, FIML, MICE 방법들에 비해 불완전 자료의 처리효과가 상대적으로 떨어짐을 보여준다. 특히, 완전제거법이나 평균대체법과 같은 방법에 비해 최대우도법이나 다중대체법이 갖는 상대적 우위는 MCAR 가정에 비해 보다 현실적인 가정이라고 할 수 있는 MAR 조건하에서 크게 나타난다. 본 연구의 분석결과는 또한 비록 결측치의 발생기제가 MNAR 상황이라고 하더라도 연구자가 결측치의 발생과 관련된 변수들을 보정과정에서 적절하게 활용하면 편의의 상당부분을 감소시킬 수 있음을 시사한다.

  • PDF

경제활동인구조사 자료를 위한 다중대체 방식 연구 (A study on multiple imputation modeling for Korean EAPS)

  • 박민정;배윤종;김정연
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.685-696
    • /
    • 2021
  • 경제활동인구조사는 고용 관련 통계를 생성하는 국가조사로서, 국민의 경활상태(취업/실업/비경활)를 파악하는 것이 주요 목적이다. 정확한 통계를 내기 위해 무응답률을 낮추는 것이 중요하고, 이미 발생한 무응답을 보완하기 위한 방법으로 무응답 대체가 가능하다. 경제활동인구조사는 응답 방식이 순차적 흐름을 따라가기 때문에 구조적인 무응답이 존재한다. 또한 전체 가구원내 무응답 항목이 하나라도 있으면 해당 가족 구성원 전체를 무응답 처리하기에 최종 자료에는 항목 무응답이 아닌 단위 무응답만 존재한다는 특징이 있다. 본 연구에서는 구조적 무응답 이해 및 연계자료를 통한 과거 자료의 활용 등을 통해 기존의 방법보다 효과적인 무응답 대체 모형을 제시하고자 한다. 대체 모형의 성능을 일치도/비일치도를 기반으로 평가한다. 이를 위해, 2019년 11월 경제활동인구조사 자료를 기반으로 모의실험을 실시한다. 총 59,996명의 응답자 중 일부를 랜덤하게 선택한 뒤, 경활상태를 판정하는데 결정적인 설명변수 6개와 경활상태를 무응답 처리한다. 기존 무응답 대체 모형에서 사용하였던 설명 변수 이외에 산업변수와 종사상지위 변수를 추가함으로써 모형을 개선한다. 이는 과거자료의 연계 및 활용을 가정한 것으로, 기존의 모형모다 성능이 향상되는 것을 확인한다. 또한, 경활상태별 무응답자 수에 대한 다양한 시나리오를 고려한다.

Forecasting the flap: predictors for pediatric lower extremity trauma reconstruction

  • Fallah, Kasra N.;Konty, Logan A.;Anderson, Brady J.;Cepeda, Alfredo Jr.;Lamaris, Grigorios A.;Nguyen, Phuong D.;Greives, Matthew R.
    • Archives of Plastic Surgery
    • /
    • 제49권1호
    • /
    • pp.91-98
    • /
    • 2022
  • Background Predicting the need for post-traumatic reconstruction of lower extremity injuries remains a challenge. Due to the larger volume of cases in adults than in children, the majority of the medical literature has focused on adult lower extremity reconstruction. This study evaluates predictive risk factors associated with the need for free flap reconstruction in pediatric patients following lower extremity trauma. Methods An IRB-approved retrospective chart analysis over a 5-year period (January 1, 2012 to December 31, 2017) was performed, including all pediatric patients (<18 years old) diagnosed with one or more lower extremity wounds. Patient demographics, trauma information, and operative information were reviewed. The statistical analysis consisted of univariate and multivariate regression models to identify predictor variables associated with free flap reconstruction. Results In total, 1,821 patients were identified who fit our search criteria, of whom 41 patients (2.25%) required free flap reconstruction, 65 patients (3.57%) required local flap reconstruction, and 19 patients (1.04%) required skin graft reconstruction. We determined that older age (odds ratio [OR], 1.134; P =0.002), all-terrain vehicle accidents (OR, 6.698; P<0.001), and trauma team activation (OR, 2.443; P=0.034) were associated with the need for free flap reconstruction following lower extremity trauma in our pediatric population. Conclusions Our study demonstrates a higher likelihood of free flap reconstruction in older pediatric patients, those involved in all-terrain vehicle accidents, and cases involving activation of the trauma team. This information can be implemented to help develop an early risk calculator that defines the need for complex lower extremity reconstruction in the pediatric population.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

요크셔종의 번식형질에 대한 유전모수 추정 (Estimation of Genetic Parameters for Reproductive Traits in Yorkshire)

  • 송광림;김병우;노승희;선두원;김효선;이득환;전진태;이정규
    • 농업생명과학연구
    • /
    • 제44권5호
    • /
    • pp.55-64
    • /
    • 2010
  • 본 연구는 2001년부터 2005년까지의 요크셔종 모돈 분만기록 4,989복의 번식성적 자료를 근거로 요크셔 모돈의 번식형질에 대한 유전모수 추정시 년도-계절, 산차, 교배웅돈을 교정효과로 포함하였으며, 영구환경효과 포함여부에 따른 두 개의 혼합모형을 설정하여 번식형질에 대한 환경효과 및 유전모수 추정을 실시하였다. 연구의 결과는 다음과 같다. 요크셔종의 초교배일령, 경산돈의 발정재귀일령 및 포유기간이 번식형질에 미치는 효과를 추정한 결과 경산돈의 번식형질에 있어 사산두수, 미라두수, 기타두수를 제외한 번식형질에서는 계절의 요인을 제외하고는 년도, 산차, 발정재귀일령, 포유기간에 대해 각 요인별로 유의적으로 차이를 나타내었다 (p<0.05). 총산자수와 포유두수 사이의 표현형상관과 유전상관은 고도의 정의 상관을 나타내었으며 유전상관이 표현형상관보다 높은 결과를 나타내었다. 번식형질에 대한 유전력의 경우 영구환경 효과를 고려하지 않은 유전력 및 영구환경 효과를 고려한 유전력은 각각 총산자수에서 0.240과 0.076, 포유두수에서 0.187과 0.096으로 추정되어 영구환경 효과를 고려한 유전력이 영구환경 효과를 고려하지 않은 유전력 보다 매우 낮게 추정되었다. 이상의 결과로 보아 유전모수 추정시 영구환경 효과를 고려한 모델식을 적용한다면 육종가의 정확도를 높일 수 있을 것으로 사료된다.

요크셔종의 산육형질에 대한 유전모수 추정 (Estimation of Genetic Parameters for Growth Traits in Yorkshire)

  • 송광림;김병우;노승희;선두원;김효선;이득환;전진태;이정규
    • 농업생명과학연구
    • /
    • 제44권3호
    • /
    • pp.41-52
    • /
    • 2010
  • 본 연구는 1999년부터 2005년까지 K GGP 종돈장에서 농장검정된 Yorkshire종 16,202두의 산육형질자료 를 근거로 다변량 통계모옇을 이용한 산육형질에 대한 유전모수를 추정 하고자 실시하였다. 조사된 모든 산육형질에 대해 성, 출생년도, 출생계절, 산차 및 생시체중의 효과는 고도의 유의성(p<0.01)을 나타내었다. 산육형질에 대한 생시체중 그룹의 효과는 생시 체중이 높은 그룹일수록 일당증체량 및 정육율은 높아지는 반면, 90 kg 도달일령, 등지방 두께 및 등심단면적은 결과치가 낮아지는 경향을 보였다. 생시체중이 높은 그룹이 복 평균개체중과 복 총체중이 높은 경향을 보였다. 산육형질에 대한 유전력의 경우 복의 효과를 고려하지 않은 유전력 보다 10~30%까지 낮게 추정되었다. 복의 효과를 고려하지 않은 유전력 및 복의 효과를 고려한 유전력 결과는 각각 일당증체량이 0.468, 0.328, 90 kg 도달일령이 0.474, 0.326, 등지방 두께가 0.452, 0.396, 등심단면적이 0.240, 0.200, 정육율의 경우 0.458, 0.380로 추정되었다. 따라서 최근 연구문헌의 자료 및 유전모수추정치 결과를 종합하여 볼 때 정확한 유전모수 추정을 위해 분석시 복의 효과를 고려한 모델식을 적용하여 육종가의 정확도를 높여야 할 것으로 사료된다.

산지사면(山地斜面)의 붕괴위험도(崩壞危險度) 예측(豫測)모델의 개발(開發) 및 실용화(實用化) 방안(方案) (Studies on Development of Prediction Model of Landslide Hazard and Its Utilization)

  • 마호섭
    • 한국산림과학회지
    • /
    • 제83권2호
    • /
    • pp.175-190
    • /
    • 1994
  • 산지사면붕괴(山地斜面崩壞)에 의(依)한 피해(被害)를 예방(豫防) 또는 극소화(極小化)하기 위(爲)하여 산사태(山沙汰)가 자주 발생(發生)하는 지역(地域)을 중심(中心)으로 각(各) 조사(調査) 단위사면(單位斜面)에 대(對)하여 산지사면붕괴(山地斜面崩壞)에 영향(影響)하리라고 예상(豫想)되는 12개(個) 환경요인(環境要因)을 현지조사(現地調査)하고 붕괴(崩壞)와 환경인자(環境因子)와의 관계(關係)를 수량화(數量化) 이론(理論)에 의(依)한 방법(方法)으로 분석(分析)하여 산사태발생(山沙汰發生)의 위험도(危險度)를 평가(評價)할 수 있는 예측(豫測)모델을 도출(導出)하였으며, 또한 이를 기초(基礎)로 하여 위험도(危險度)를 각(各) 급별(級別)로 구분(區分)하고 예지(豫知)모델을 검토(檢討)하였던 바 그 결과(結果)을 요약(要約)하면 다음과 같다. 산지붕괴발생면적(山地崩壞發生面積)에 영향(影響)을 주는 인자(因子)는 강우(降雨), 령급(齡級), 표고(標高), 토성(土性), 경사(傾斜), 사면위치(斜面位置), 임상(林相), 곡차수(谷次數), 종단사면형(縱斷斜面形), 모암(母岩), 토심(土深), 방위(方位)의 순(順)이었으며, 편상관계수(偏相關係數)에 의(依)한 인자(因子)는 령급(令級), 강우(降雨), 토성(土性), 모암(母岩), 경사(傾斜), 사면위치(斜面位置), 표고(標高), 종단사면형(縱斷斜面形), 곡차수(谷次數), 임상(林相), 토심(土深), 방위(方位)의 순(順)으로 나타났다. 또한 산지붕괴발생빈도(山地崩壞發生頻度)에 의(依)한 인자(因子)의 순위(順位)는 령급(令級), 표고(標高), 토성(土性), 경사도(傾斜度), 식생(植生), 강우(降雨), 종단사면(縱斷斜面), 곡차수(谷次數), 모암(母岩), 토심(土深)이었으며 사면위치(斜面位置) 및 방위(方位)는 기여도(寄與度)가 낮게 나타났다. 산지사면붕괴위험(山地斜面崩壞危險) 예지(豫知)를 위(爲)하여 붕괴발생면적(崩壞發生面積)에 의(依)한 예측(豫測)모델에서 위험도(危險度) 예측점수표(豫測點數表)를 작성(作成)할 수 있었으며, 점수합계(點數合計)가 9.1636이면 붕괴발생위험(崩壞發生危險)이 높은 것으로 평가(評價)되었으며 산지(山地) 사면붕괴(斜面崩壞)가 발생(發生)한 사면(斜面)과 발생(發生)하지 않은 사면(斜面)에 의(依)한 예측(豫測)모델에서 우사면(雨斜面)에 대(對)한 사면판별(斜面判別) 구분치(區分値)는 -0.02였고, 그 적중율(適中率)은 73%로 높았다. 또한 판별구분치(判別區分値)를 기준(基準)으로 한 산지사면붕괴발생(山地斜面崩壞發生) 위험도별(危險度別) 점수(點數)는 A급(級)은 0.3132 이상(以上)이었고, B급(級)은 0.3132~-0.1051, C급(級)은 -0.1050~-0.4195, D급(級)은 -0.4195 이하(以下)였다. 그리고 산지사면붕괴발생(山地斜面崩壞發生)의 예지(豫知)는 판별구분치(判別區分値)를 기준(基準)으로 위험도(危險度)을 A, B, C, D의 4등급(等級)으로 구분(區分)할 수 있었으며, 총(總) 300개(個) 사면(斜面) 중(中) A급사면(級斜面) 68개(個), B급사면(級斜面) 115개(個), C급사면(級斜面) 65개, D급사면(級斜面) 52개(個)였다. 위험도(危險度) A, B급(級)에서의 산사태발생(山沙汰發生)은 150개(個) 붕괴지(崩壞地) 중 125개(個)로서 약(約) 83.3%의 높은 적중율(適中率)을 보여 예측(豫測)모델로서 응용(應用) 가능성(可能性)이 높게 나타났다. 따라서 이러한 예지방법(豫知方法)에 의(依)하여 선정(選定)한 위험(危險)한 지역(地域)에 대(對)하여 산지재해위험도(山地災害危險度) 지도(地圖)를 작성(作成)하여 토지이용(土地利用) 계획(計劃) 및 재해위험지(災害危險地) 선정기준(選定基準)의 행정지표(行政指標)로서 활용(活用)할 수 있을 것이다. 또한 산지재해(山地災害)에 대(對)한 종합(綜合) 대책(對策)에 유용(有用)하게 활용(活用)함으로써 막대(莫大)한 재산(財産) 피해(被害)와 인명(人命) 손실(損失)을 사전(事前)에 방지(防止)할 수 있을 것이다.

  • PDF