• Title/Summary/Keyword: 중회귀분석모형

Search Result 844, Processing Time 0.03 seconds

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • Jung, Yoon;Hwang, Seok-Hae
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA: multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 둥이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation )알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉충의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • Jung, Yoon;Hwang, Seok-Hae
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA:multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 등이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적 요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation)알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉층의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.

  • PDF

A Study on Regionalization of Parameters of Continuous Rainfall-Runoff Model (연속 강우-유출모형의 매개변수 지역화에 관한 연구)

  • Jeong, Ga-In;Kim, Tae-Jeong;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.182-182
    • /
    • 2015
  • 우리나라에서는 강우관측시스템의 지역적 불균형으로 상대적으로 소규모 저수지의 경우 미계측유역의 특성을 가지며, 신뢰성 있는 강우량, 유출량, 증발량 자료가 매우 부족한 실정이다. 다목적댐 유역과 같은 계측유역의 경우 상류유역의 유입량 자료의 확보가 용이하지만 대부분의 유역의 경우 계측장비가 부족하여 신뢰성이 확보된 유입량 자료를 얻는데 많은 어려움이 있다. 본 연구에서는 미계측유역의 유입량 산정을 위하여 계측유역을 대상으로 강우-유출 모형의 매개변수를 산정하였으며, 산정된 매개변수를 유역특성인자와의 상관성을 토대로 다중선형회귀분석기법(multiple linear regression, MLR)을 적용하여 지역화(regionalization)를 위한 회귀식을 도출하였다. 이를 위해 양질의 유량자료가 확보된 K-water 17개 댐 유역을 대상으로 매개변수를 산정하였으며 이 중 2개의 댐 유역을 미계측유역으로 간주하여 개발된 모형을 검증하였다. 대부분의 통계 지표에서 우수한 모의능력을 확인하였으며, 본 연구를 통하여 개발된 지역화 기법을 미계측유역에 활용한다면 보다 정량적이고 효율적인 수자원 계획이 가능할 것으로 판단된다. 향후 연구로는 불확실성을 고려한 Bayesian GLM 모형을 이용한 지역화기법을 개발하여 매개변수의 불확실성까지 고려할 수 있는 방안을 모색하고자 한다.

  • PDF

A Study on Applying Shrinkage Method in Generalized Additive Model (일반화가법모형에서 축소방법의 적용연구)

  • Ki, Seung-Do;Kang, Kee-Hoon
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.1
    • /
    • pp.207-218
    • /
    • 2010
  • Generalized additive model(GAM) is the statistical model that resolves most of the problems existing in the traditional linear regression model. However, overfitting phenomenon can be aroused without applying any method to reduce the number of independent variables. Therefore, variable selection methods in generalized additive model are needed. Recently, Lasso related methods are popular for variable selection in regression analysis. In this research, we consider Group Lasso and Elastic net models for variable selection in GAM and propose an algorithm for finding solutions. We compare the proposed methods via Monte Carlo simulation and applying auto insurance data in the fiscal year 2005. lt is shown that the proposed methods result in the better performance.

자료포락분석을 활용한 신약개발 분야 국가연구개발사업의 효율성 분석

  • Eom, Ik-Cheon;Baek, Cheol-U;Hong, Se-Ho
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2015.11a
    • /
    • pp.430-443
    • /
    • 2015
  • 신약개발은 국민의 건강권과 직결되며 국가 차원의 제약산업 육성을 위해 매우 중요하다. 그동안 신약개발 분야와 관련하여 다양한 연구가 수행되었지만, 신약개발 분야의 국가연구개발사업에 대한 효율성 분석은 매우 부족한 실정이다. 특히 R&D 분야는 연구개발시차, 일출효과(spill-over effect) 등으로 인해 투입과 산출의 일정한 방향성과 등비율적인 증감을 가정하는 CCR 모형이 적합하지 않다. 또한 가변규모수익을 가정하는 BCC 모형도 여유분(slack)으로 인해 의사결정단위간의 명확한 우선순위 도출이 어려운 한계점이 있다. 최근에는 R&D 분야의 특수성을 고려해서 자료포락분석 모형 중 RAM(Range Adjusted Measure) 모형을 활용한 분석방법이 제시되고 있다. RAM 모형은 가변규모수익 가정 하에 투입지향이나 산출지향처럼 방향성에 대한 사전적인 가정 없이 비효율성을 최대한 제거하는 방향으로 효율성을 측정하므로 R&D 분야의 효율성 분석에 적합하다. 특히 RAM 모형은 매우 강건한 단조성을 인해 의사결정단위 간 명확한 순위 구분도 용이하다. 따라서 본 연구에서는 자료포락분석 모형 중 RAM 모형과 토빗 회귀분석이 결합된 2단계 접근법을 활용해서 범부처전기신약개발사업을 중심으로 신약개발 분야의 국가연구개발사업들에 대한 효율성을 분석하고 주요 시사점들을 논의하였다.

  • PDF

GSSHA 지하수 모의를 위한 대수층 깊이 공간 분포 기법 연구

  • Jea-Whan Shin;Tae-Hee Yoon;Young-Seok Lee;Suk-Hwan Jang
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.522-522
    • /
    • 2023
  • 지하수 시스템의 방출은 저지대 강에서 건조기에 흐르는 하천 유지유량의 원천이 된다. 수자원 분야에서 분포형 모형이 도입되며 수문 분석의 고도화가 이루어지고 있는 오늘날에도, 아직 대수층 깊이 등 지하수관련 매개변수에 대한 연구는 미진한 실정이다. 본 연구는 분포형 모형의 지하수 관련 매개변수 중 지형자료에 해당하는 대수층 깊이의 물리적인 분포형태를 예측하고, 지하수 모의결과를 검토하여 해당 기법의 적용성을 확인하였다. 본 연구에서는 북측의 미계측 유역을 포함한 소양강 유역을 연구대상 지역으로 설정하였고, 정밀한 분포형 모형인 GSSHA(Gridded Surface Hydrologic Analysis)를 활용하였다. 대수층 깊이 추정 방법은 크게 세가지 시나리오로 구분하여 모의를 진행하였다. 유역의 지하수 데이터를 통해 도출된 대수층깊이 등분포(시나리오1), 지표 고도와 대수층 깊이의 선형 반비례 관계를 가정한 선형 회귀식(시나리오2), 동일한 가정을 두고 Log차원에서 회귀식을 적용한 경우(시나리오 3). 위 3가지 시나리오를 통해 산정된 유출량과, 지하수 수위 등을 소양강댐 유입량 자료 및 유역 내 6개 지하수 관측소를 대상으로 결과를 비교하여 적용성을 확인하였다. 시나리오별 유출량 모의 오차평가 결과, 관측 첨두 유량을 가장 잘 반영하고 있는 기법은 일반적으로 선행 연구에서 많이 활용하고 있는 등분포형 기법으로 분석되었으며, 과소·과대 모의된 정도를 나타내는 지표와 모형의 효율성을 나타내는 지표는 선형 회귀분석 기법이 가장 우수한 결과로 분석되었다. 따라서, 대수층 깊이를 등분포하여 모의하던 기존 방식에 비해 지면고도-대수층깊이 간의 반비례 관계를 적용하는 방식이 지하수 모의에 있어서 보다 합리적일 것으로 판단된다. 향후 임의의 인자와 대수층 깊이간의 정밀한 회귀관계를 도출한다면 더욱 합리적이고 신뢰성 높은 결과를 얻을 수 있을것으로 기대된다. 또한 유역 단위의 지하수 모의가 정밀하게 이루어진다면 최근 많은 관심이 집중되는 하천 유지유량과 건기 유출 등의 연구 분야에도 많은 기여를 할 수 있을 것으로 기대된다.

  • PDF

Predicting a Queue Length Using a Deep Learning Model at Signalized Intersections (딥러닝 모형을 이용한 신호교차로 대기행렬길이 예측)

  • Na, Da-Hyuk;Lee, Sang-Soo;Cho, Keun-Min;Kim, Ho-Yeon
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.20 no.6
    • /
    • pp.26-36
    • /
    • 2021
  • In this study, a deep learning model for predicting the queue length was developed using the information collected from the image detector. Then, a multiple regression analysis model, a statistical technique, was derived and compared using two indices of mean absolute error(MAE) and root mean square error(RMSE). From the results of multiple regression analysis, time, day of the week, occupancy, and bus traffic were found to be statistically significant variables. Occupancy showed the most strong impact on the queue length among the variables. For the optimal deep learning model, 4 hidden layers and 6 lookback were determined, and MAE and RMSE were 6.34 and 8.99. As a result of evaluating the two models, the MAE of the multiple regression model and the deep learning model were 13.65 and 6.44, respectively, and the RMSE were 19.10 and 9.11, respectively. The deep learning model reduced the MAE by 52.8% and the RMSE by 52.3% compared to the multiple regression model.

Prediction of movie audience numbers using hybrid model combining GLS and Bass models (GLS와 Bass 모형을 결합한 하이브리드 모형을 이용한 영화 관객 수 예측)

  • Kim, Bokyung;Lim, Changwon
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.4
    • /
    • pp.447-461
    • /
    • 2018
  • Domestic film industry sales are increasing every year. Theaters are the primary sales channels for movies and the number of audiences using the theater affects additional selling rights. Therefore, the number of audiences using the theater is an important factor directly linked to movie industry sales. In this paper we consider a hybrid model that combines a multiple linear regression model and the Bass model to predict the audience numbers for a specific day. By combining the two models, the predictive value of the regression analysis was corrected to that of the Bass model. In the analysis, three films with different release dates were used. All subset regression method is used to generate all possible combinations and 5-fold cross validation to estimate the model 5 times. In this case, the predicted value is obtained from the model with the smallest root mean square error and then combined with the predicted value of the Bass model to obtain the final predicted value. With the existence of past data, it was confirmed that the weight of the Bass model increases and the compensation is added to the predicted value.

A comparison study of Bayesian high-dimensional linear regression models (베이지안 고차원 선형 회귀분석에서의 비교연구)

  • Shin, Ju-Won;Lee, Kyoungjae
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.3
    • /
    • pp.491-505
    • /
    • 2021
  • We consider linear regression models in high-dimensional settings (p ≫ n) and compare various classes of priors. The spike and slab prior is one of the most widely used priors for Bayesian regression models, but its model space is vast, resulting in a bad performance in finite samples. As an alternative, various continuous shrinkage priors, including the horseshoe prior and its variants, have been proposed. Although each of the above priors has been investigated separately, exhaustive comparative studies of their performance have been conducted very rarely. In this study, we compare the spike and slab prior, the horseshoe prior and its variants in various simulation settings. The performance of each method is demonstrated in terms of the regression coefficient estimation and variable selection. Finally, some remarks and suggestions are given based on comprehensive simulation studies.

Analysis of statistical models for ozone concentrations at the Paju city in Korea (경기도 파주시 오존농도의 통계모형 연구)

  • Lee, Hoon-Ja
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.6
    • /
    • pp.1085-1092
    • /
    • 2009
  • The ozone data is one of the important environmental data for measurement of the atmospheric condition of the country. In this article, the Autoregressive Error (ARE) model and Neural Networks (NN) model have been considered for analyzing the ozone data at the northern part of the Gyeonggi-Do, Paju monitoring site in Korea. In the both ARE model and NN model, seven meteorological variables and four pollution variables are used as the explanatory variables for the ozone data set. The seven meteorological variables are daily maximum temperature, wind speed, relative humidity, rainfall, dew point temperature, steam pressure, and amount of cloud. The four air pollution explanatory variables are Sulfur dioxide ($SO_2$), Nitrogen dioxide ($NO_2$), Cobalt (CO), and Promethium 10 (PM10). The result showed that the NN model is generally better suited for describing the ozone concentration than the ARE model. However, the ARE model will be expected also good when we add the explanatory variables in the model.

  • PDF