• 제목/요약/키워드: 가중치회귀모형

검색결과 59건 처리시간 0.034초

다중회귀분석을 이용한 AHP/DEA-AR 항만효율성 측정결과의 실증적 검증소고 (A Brief Empirical Verification Using Multiple Regression Analysis on the Measurement Results of Seaport Efficiency of AHP/DEA-AR)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제32권4호
    • /
    • pp.73-87
    • /
    • 2016
  • 본 논문에서는 동북아시아 24개 컨테이너항만들의 4년간 자료(2009년-2012년)를 이용하여 5개의 투입요소(겐트리 크레인 수, 선석 수, 총 선석길이, 터미널면적, 평균수심), 2개의 산출요소(컨테이너화물처리량, 직기항 선사수)를 이용하여 항만효율성 측정 시 AR가중치를 부여하는 방법(다중회귀분석방법과 AHP방법)을 실증적으로 검증하였다. 즉, AHP/DEA-AR분석 결과에 대해서, 다중회귀분석방법으로 AR을 결정하고 항만들의 효율성을 측정한 후에 항만들 간의 순위를 이용하여 윌콕슨부호순위검정과 Mann-Whitney 윌콕슨 순위 합 검정방법으로 그 결과를 비교분석하여 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 측정한 순위를 근거로 윌콕슨부호순위검정을 실시한 결과 P값(유의확율)이 유의수준 0.05보다 훨씬 더 크게 나타났으므로, 귀무가설 Ho는 채택하였다. 즉, AHP/DEA-AR모형에 의한 효율성 순위와 다중회귀분석에서 도출된 AR을 이용한 효율성분석에 의한 순위에는 차이가 없는 것으로 나타났다. Mann-Whitney 윌콕슨 순위 합 검정도 동일한 결과를 보였다. 둘째, 평균적으로 보았을 때, 윌콕슨 부호순위검정에서 P값(유의확율)이 평균 0.845 수준에서 양 모형의 효율성 수치에 의한 순위가 서로 일치함을 보여 주었으며, Mann-Whitney 윌콕슨 순위 합 검정의 평균유의확율은 0.963으로 더 높게 나타났다. 셋째, 전체자료를 한꺼번에 고려하여 측정한 경우에는 윌콕슨부호순위검정에서 상대적으로 유의확율이 크게 낮아(0.845->0.694)졌으며, Mann-Whitney 윌콕슨 순위 합 검정도 낮아(0.963->0.925)졌다. 본 논문의 정책적인 함의는 항만운영자들이나 항만정책의 입안가들이 항만들에 대한 효율성을 측정할 때, 본 논문에서 제시한 AR가중치를 적용한 방법을 도입하여 시행함으로써 보다 정확한 항만효율성을 측정할 수 있어야만 한다는 점이다. 또한 더욱 확장시켜서 AHP법과 다중회귀분석방법을 접목한 방법을 도입하여 측정해야만 한다는 점이다. 항만투자금액을 결정할 때, 그러한 측정결과도 참고한다면 효과적인 항만관리 및 정책이 시행될 수 있을 것으로 확신한다. 본 논문의 한계는 퍼지분석법, 비방사적 DEA분석을 도입하지 못했으며, 그리고 AHP법과 다중회귀분석방법을 혼합한 측정결과를 제시하지 못했다는 점이다. 차후연구에서 다루고자 한다.

능형회귀에서의 로버스트한 k의 선택 방법 (Robust selection rules of k in ridge regression)

  • 임용빈
    • 응용통계연구
    • /
    • 제6권2호
    • /
    • pp.371-381
    • /
    • 1993
  • 표준화된 중회귀모형에서 다중공선성(multicollinearity)이 존재할 때, 공선성(collinearity)의 영향을 완화하기 위해서 능형회귀가 사용된다. 반응변수의 예측을 위한 기준으로서 반응변 수의 예측치의 평균제곱합(MSE)을 설명변수의 관심영역 R에서 적분한(IMSE) $J_w(k)$ 기 준이 Lim, Choi & Park(1980)에 의해 소개되었다. $C_k$기준이 설명변수의 관심영역 R상 에서의 가중치 함수인 w(x)가 각각의 자료점에서 등확률 1/n을 갖는 경우의 IMSE 기준인 $J_n(k)$ 기준과 동치라는 관계를 이용함으로 $C_k$ 기준에 대해서 Myers(1986)에 의해 주어진 k의 선택방법 보다 더 합리적이라 기대되는 k의 선택방법이 제시되었다. 다음으로 관심이 있는 모든 기준들에 대해서 상대적으로 효율이 좋은 능형회귀추정량 $\beta(k)$를 선택하기 위해서, 관심이 있는 기준들 간의 가장 나쁜 효율을 최대화한다는 의미에서 MiniMax 원칙을 채택하여 관심이 있는 기준들에 대해서 로버스트한 k의 선택방법을 제시 하였다.

  • PDF

투자용 기술평가모형 개발사례 연구 (A Case Study on the Development of Technology Rating Model for Investment)

  • 홍재범;배도용;심기준;황유진;김성태
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2993-3002
    • /
    • 2018
  • 본 연구는 투자용 기술평가등급모형 개발에 대한 사례연구이다. 투자용 기술평가등급모형은 기술금융의 지원대상을 융자에서 투자로 확대하기 위하여 금융위원회와 산업통상자원부가 협업으로 추진한 프로젝트이다. 실제개발은 기술보증기금과 산업기술진흥원이 진행한 것으로 기술형 투자펀드를 운영하기 위하여 사전에 TCB가 운영할 표준모형을 개발한 것이다. 투자용 기술평가모형은 고성장기업을 예측하는 것을 목표로 개발하였다. 모형은 통계모형과 전문가모형으로 구성하고 이를 종합하여 등급을 산출하는 구조로 구성하였다. 여기서 통계모형은 예측에 유의한 변수를 파악하여 이를 로짓회귀분석을 활용하여 모형화하였다. 전문가모형은 전문가들의 의견을 수렴하여 각 평가항목의 가중치를 파악하여 모형을 설정하였다. 전문가는 벤처기업 투자를 하는 벤처캐피탈리스트와 모형을 운영할 TCB의 심사역의 의견을 종합하였다. 모형의 등급체계는 10등급으로 구성하여 제시하였다. 그 모형의 등급별 분포는 기보의 KTRS 등급별 분포와 일치하도록 하였다. 흥미로운 것은 기술성과 시장성 을 중시하고 있다는 것이다. 여신을 위한 기술평가등급모형에서는 경영자역량이나 사업성을 중시하고 있는 것과는 상당한 차이가 있는 것이다.

도시공원 면적이 유아 행복감에 미치는 영향에 대한 인과관계 연구 (Causal effect of urban parks on children's happiness)

  • 권나연;김찬민
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.63-83
    • /
    • 2023
  • 기존의 많은 연구에서 도시공원을 비롯한 녹지와 유아 행복감 간에 유의미한 상관관계를 도출했다. 또한 이를 통해 간접적으로 도시공원의 면적/근접성이 유아기의 행복감 증진에 효과가 있을 것이라 유추하였다. 하지만 관찰된 자료를 통한 인과효과 추정은 교란 변수의 적절한 조정을 필요로하고, 이런 관점에서 도시공원의 면적과 유아 행복감의 인과관계는 명확히 밝혀지지 않았다고 할 수 있다. 본 연구에서는 한국아동패널 자료를 이용하여 도시공원의 면적이 유아 행복감에 미치는 영향에 대한 인과효과를 추정하였다. 교란 변수를 조정하기 위한 방법으로 회귀 모형을 이용한 조정(regression adjustment), 가중치 기법(weighting), 그리고 매칭(matching) 등을 이용하였고, 각 방법들의 중요 개념을 분석 결과에 앞서 기술하였다. 교란 변수의 선택에 있어서 유향 비순환 그래프(directed acyclic graph)를 사용하였다. 분석 결과, 기존의 상관관계를 이용한 결론과는 다르게 도시공원의 면적과 유아 행복감 간에는 유의미한 인과효과가 존재하지 않았다.

Receiver Operating Characteristic 분석법을 이용한 업무관련성 근골격계질환 설문지 개발 (Development of Work-related Musculoskeletal Disorder Questionnaire Using Receiver Operating Characteristic Analysis)

  • 권호장;주영수;조수헌;강대희;성주헌;최성우;최재욱;김재영;김돈규;김재용
    • Journal of Preventive Medicine and Public Health
    • /
    • 제32권3호
    • /
    • pp.361-373
    • /
    • 1999
  • ROC곡선의 AUC는 측전도구의 기준 타당도를 나타내는 가장 일반화된 지표다. 본 연구는 ROC분석법을 이용하여 현행의 근로자건강진단에서 업무관련성 근골격계 질환의 고위험군을 변별하는 표준 설문지를 개발하고자 하였다. 컴퓨터를 이용하는 선박 설계업 종사자 89명, 전화번호 안내원 113명, 일반 직업 여성 79명, 주부 89명 등 총 370명의 일차 연구대상군에 대한 재활의 학과 전문의의 최종 진단결과를 기준으로 1996년에 개발된 '근로자의 신체 증상에 관한 설문지'의 응답결과를 비교하였다. 근골격계 질환과의 관련성이 높은 문항조합을 선정하고 문항별 가중치를 산출하기 위해 로짓회귀분석, 상관분석 등을 실시하였으며, 문항조합 및 가중치 산출방법이 서로 다른 4가지 설문모형에 따른 AUC를 비교 하였다. 또한, 국내 모 자동차조립공장 근로자 225명의 설문결과와 산업의학 전문의의 진단결과 자료를 이용하여 4가지 설문모형의 AUC 재현도를 확인하였다. 분석 결과, 통계적으로 유의 한 차이는 없었으나 문항수를 줄여도 문항별 응답수준별 가중치를 부여하면 AUC가 일관되게 증가함을 확인하였다. 증상문항 4개와 신체부위문항 7개를 통합한 11개 문항에 가중치를 부여하는 모형이 변별력, 재현도, 편의성 측면에서 우수한 것으로 나타나, 이를 기준으로 새로운 업무관련성 근골격계 질환 설문지를 설계할 수 있었다. 문항수가 적으면서도 타당도는 높은 설문지를 개발하고, 상대적인 비교평가에 쓰일 수 있는 정량적 가중치를 제시한 것이 본 연구의 주요성과라 할 수 있다. 본 연구는 전문의 사이의 진단기준 차이를 고려하지 못한 점, 다양한 인구집단에 적용할만한 절대적인 참고치를 제시하지 못한 점 등에서 한계가 있다. 그러나, '측정 도구의 정량적 타당도 검증을 통한 질병 감시용 도구 개발'이라는 본 연구의 기본 취지 및 접근방법은 향후 조직적인 질병 예방활동에 활용될 여지가 있을 것이다.

  • PDF

비용효율적 지능형 침입탐지시스템 구현을 위한 유전자 알고리즘 기반 통합 모형 (An Integrated Model based on Genetic Algorithms for Implementing Cost-Effective Intelligent Intrusion Detection Systems)

  • 이현욱;김지훈;안현철
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.125-141
    • /
    • 2012
  • 본 연구는 최근 그 중요성이 한층 높아지고 있는 침입탐지시스템(IDS, Intrusion Detection System)의 침입탐지모형을 개선하기 위한 방안으로 유전자 알고리즘에 기반한 새로운 통합모형을 제시한다. 본 연구의 제안모형은 서로 상호보완적 관계에 있는 이분류 모형인 로지스틱 회귀분석(LOGIT, Logistic Regression), 의사결정나무(DT, Decision Tree), 인공신경망 (ANN, Artificial Neural Network), 그리고 SVM(Support Vector Machine)의 예측결과에 적절한 가중치를 부여해 최종 예측결과를 산출하도록 하였는데, 이 때 최적 가중치의 탐색을 위한 방법으로는 유전자 알고리즘을 사용한다. 아울러, 본 연구에서는 1차적으로 오탐지율을 최소화하는 최적의 모형을 산출한 뒤, 이어 비대칭 오류비용 개념을 반영해 오탐지로 인해 발생할 수 있는 전체 비용을 최소화할 수 있는 최적 임계치를 탐색, 최종적으로 가장 비용 효율적인 침입탐지모형을 도출하고자 하였다. 본 연구에서는 제안모형의 우수성을 확인하기 위해, 국내 한 공공기관의 보안센서로부터 수집된 로그 데이터를 바탕으로 실증 분석을 수행하였다. 그 결과, 본 연구에서 제안한 유전자 알고리즘 기반 통합모형이 인공신경망이나 SVM만으로 구성된 단일모형에 비해 학습용과 검증용 데이터셋 모두에서 더 우수한 탐지율을 보임을 확인할 수 있었다. 비대칭 오류비용을 고려한 전체 비용의 관점에서도 단일모형으로 된 비교모형에 비해 본 연구의 제안모형이 더 낮은 비용을 나타냄을 확인할 수 있었다. 이렇게 실증적으로 그 효과가 검증된 본 연구의 제안 모형은 앞으로 보다 지능화된 침입탐지시스템을 개발하는데 유용하게 활용될 수 있을 것으로 기대된다.

격자자료분석을 위한 이웃정보시스템의 비교 (Comparison of Neighborhood Information Systems for Lattice Data Analysis)

  • 이강석;신기일
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.387-397
    • /
    • 2008
  • 최근 공간통계를 이용한 많은 연구가 진행되고 있고 공간통계학을 접목한 소지역 추정(small area estimation) 방법이 좋은 결과를 주고 있는 것으로 알려져 있다 소지역 추정에 사용되는 격자자료(lattice data) 분석에서 이웃정보를 정의하는 것은 자료 분석의 성패를 결정짓는 매우 중요한 부분이다. 그러나 기존에 사용된 대부분의 이웃정보시스템은 경계선을 공유할 때 이웃으로 정하는 방법을 사용하고 있다. 이에 본 논문에서는 경계선 공유를 이용한 이웃정보시스템 뿐 아니라 다른 여러 이웃정보시스템을 구하는 방법을 설명하고 2001년 경제활동자료를 이용하여 이 시스템들을 비교하였다

분포형 CN 기반 토지피복별 유출가중치를 이용한 오염부하량 능형회귀모형 개발 (Development of Ridge Regression Model of Pollutant Load Using Runoff Weighted Value Based on Distributed Curve-Number)

  • 송철민;김진수
    • 한국농공학회논문집
    • /
    • 제60권1호
    • /
    • pp.111-120
    • /
    • 2018
  • The purpose of this study was to develop a ridge regression (RR) model to estimate BOD and TP load using runoff weighted value. The concept of runoff weighted value, based on distributed curve-number (CN), was introduced to reflect the impact of land covers on runoff. The estimated runoff depths by distributed CN were closer to the observed values than those by area weighted mean CN. The RR is a technique used when the data suffers from multicollinearity. The RR model was developed for five flow duration intervals with the independent variables of daily runoff discharge of seven land covers and dependent variables of daily pollutant load. The RR model was applied to Heuk river watershed, a subwatershed of the Han river watershed. The variance inflation factors of the RR model decreased to the value less than 10. The RR model showed a good performance with Nash-Sutcliffe efficiency (NSE) of 0.73 and 0.87, and Pearson correlation coefficient of 0.88 and 0.93 for BOD and TP, respectively. The results suggest that the methods used in the study can be applied to estimate pollutant load of different land cover watersheds using limited data.

회귀모형과 AHP의 가중치에 대한 비교 연구: 대학생의 학교 만족도를 대상으로 (Comparison of Importance Weights for Regression Model and AHP: A Case of Students' Satisfaction with University)

  • 박종훈
    • 산업경영시스템학회지
    • /
    • 제45권4호
    • /
    • pp.118-126
    • /
    • 2022
  • This study attempts a comparison between AHP(Analytic Hierarchy Process) in which the importance weight is structured by individual subjective values and regression model with importance weight based on statistical theory in determining the importance weight of casual model. The casual model is designed by for students' satisfaction with university, and SERVQUAL modeling methodology is applied to derive factors affecting students' satisfaction with university. By comparison of importance weights for regression model and AHP, the following characteristics are observed. 1) the lower the degree of satisfaction of the factor, the higher the importance weight of AHP, 2) the importance weight of AHP has tendency to decrease as the standard deviation(or p-value) increases. degree of decreases. the second sampling is conducted to double-check the above observations. This study empirically checks that the importance weight of AHP has a relationship with the mean and standard deviation(or p-value) of independence variables, but can not reveal how exactly the relationship is. Further research is needed to clarify the relationship with long-term perspective.

호우 위험도 평가를 이용한 피해예측 (Damage Prediction Using Heavy Rain Risk Assessment)

  • 김종성;최창현;이종소;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.154-154
    • /
    • 2017
  • 전 세계적인 기후변동과 기후변화의 영향으로 대규모 인명 및 재산피해를 유발하는 자연재난의 빈도와 강도가 증가하고 있다. 이렇게 변화하는 상황에서 효율적인 대책을 수립하기 위해서는 재해에 노출된 특성을 지역적 특성과 함께 고려하여 지역별로 재해에 위험한 정도를 평가하는 것이 선행되어지고, 재난 피해 발생전에 피해 지역 및 범위를 예측하는 것이 필요하다고 판단된다. 따라서 본 연구에서는 국내 자연재난 피해의 65% 이상을 차지하는 호우피해를 대상으로 PSR(Pressure-State-Response) 구조를 이용하여 호우피해위험지수(Heavy rain Damage Risk Index, HDRI)를 제안하여 호우 위험도를 평가하고자하였다. 또한 도출된 지역별 위험등급에 따른 호우피해 예측함수를 개발하여 재해발생 전에 개략적인 피해의 범위를 예측하고자 하였다. 먼저 지역별 호우 위험도 평가를 위해 압력지표, 현상지표, 대책지표를 구축하고, 주성분분석을 이용하여 평가지표를 결정하였다. 결정된 평가지표를 동일한 가중치를 부여하여 호우피해위험지수를 도출하였다. 분석결과, 경기도 31개 지자체 중에서 가장 안전한 1등급인 지자체는 15개의 지자체로 나타났으며, 2등급인 지자체는 7개, 3등급인 지자체는 9개로 분류되었다. 지자체별 호우 위험도 등급에 따라서 재해기간별 총강우량, 재해일수, 선행강우량(1~5일), 지속시간별 최대강우량(1~24시간) 등의 자료를 설명변수로 구축하였고, 다중회귀모형과 주성분분석을 활용하여 예측함수를 개발하였다. 등급별 호우피해 예측함수는 N-RMSE가 12~18%로 호우피해를 적절하게 예측하는 것으로 평가되었다. 본 연구를 통해 지자체별 호우피해위험도 등급을 파악 할 수 있으며, 평가된 호우피해위험도 등급별로 호우피해 예측함수 개발을 통해 사전에 호우피해 발생 및 규모를 파악할 수 있게 되었다. 따라서 본 연구의 결과는 각 지자체 및 관련 부처에서 효과적인 방재체계를 수립하는데 있어 기초자료로 활용될 수 있을 것으로 판단된다.

  • PDF