• Title/Summary/Keyword: 입력변수선정기법

Search Result 82, Processing Time 0.038 seconds

Mutual Information Technique for Selecting Input Variables of RDAPS (RDAPS 입력자료 선정을 위한 Mutual Information기법 적용)

  • Han, Kwang-Hee;Ryu, Yong-Jun;Kim, Tae-Soon;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1141-1144
    • /
    • 2009
  • 인공신경망(artificial neural network) 기법은 인간의 두뇌 신경세포의 활동을 모형화한 것으로 오랜 시간동안 발전해 왔으며 여러 분야에서 활용되고 있고 수문분야에서도 인공신경망을 이용한 연구가 활발히 진행되어 왔다. RDAPS와 같은 단기수치예보 자료는 강우의 유무 판단과 같은 정성적인 분석에서 비교적 정확도가 높지만 정확한 강우량의 추정과 같은 정량적인 부분에서는 정확도가 매우 낮으므로 인공신경망 기법과 같은 후처리 기법을 통해서 정확도를 높이게 된다. 인공신경망 기법을 수행할 때, 가장 중요한 것은 입력변수선택(input variable selection)으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 주게 된다. 본 연구에서는 mutual information을 입력 변수 선택 기법으로 채택하여, 인공신경망의 입력변수 선정의 정확도를 알아보고자 한다. Mutual information은 주어진 자료의 엔트로피값을 이용하여 변수들 간의 독립과 종속의 관계를 나타내는 기법으로서, MI값은 '0'에서 '1'의 값을 가지며 '0'에 가까울수록 변수들 간의 관계가 독립적이고 '1'에 가까울수록 종속적인 관계를 나타낸다. 인공신경망의 입력변수선정에 대한 mutual information의 정확도를 알아보기 위해, 기존 입력변수선택 기법과 mutual information을 이용했을 경우의 인공신경망의 처리능력, 정확도를 비교 검토하였다.

  • PDF

Using GA based Input Selection Method for Artificial Neural Network Modeling Application to Bankruptcy Prediction (유전자 알고리즘을 활용한 인공신경망 모형 최적입력변수의 선정: 부도예측 모형을 중심으로)

  • 홍승현;신경식
    • Journal of Intelligence and Information Systems
    • /
    • v.9 no.1
    • /
    • pp.227-249
    • /
    • 2003
  • Prediction of corporate failure using past financial data is a well-documented topic. Early studies of bankruptcy prediction used statistical techniques such as multiple discriminant analysis, logit and probit. Recently, however, numerous studies have demonstrated that artificial intelligence such as neural networks can be an alternative methodology for classification problems to which traditional statistical methods have long been applied. In building neural network model, the selection of independent and dependent variables should be approached with great care and should be treated as model construction process. Irrespective of the efficiency of a teaming procedure in terms of convergence, generalization and stability, the ultimate performance of the estimator will depend on the relevance of the selected input variables and the quality of the data used. Approaches developed in statistical methods such as correlation analysis and stepwise selection method are often very useful. These methods, however, may not be the optimal ones for the development of neural network model. In this paper, we propose a genetic algorithms approach to find an optimal or near optimal input variables fur neural network modeling. The proposed approach is demonstrated by applications to bankruptcy prediction modeling. Our experimental results show that this approach increases overall classification accuracy rate significantly.

  • PDF

Selection of Input Nodes in Artificial Neural Network for Bankruptcy Prediction by Integrated Link Weight Analysis (통합 연결강도모형에 의한 부도예측용 인공신경망 모형 입력노드 선정에 관한 연구)

  • 이웅규
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2001.06a
    • /
    • pp.359-368
    • /
    • 2001
  • 본 연구에서는 부도예측용 인공신경망의 입력노드 선정을 위한 휴리스틱으로 연결강도분석 접근법을 제안한다. 연결강도분석은 학습이 끝난 인공신경망에서 입력노드와 은닉노드와 연결된 가중치의 절대값 즉, 연결강도를 분석하여 입력변수를 선정하는 접근법으로, 본 연구에서는 약체연결뉴론제거법, 강체연결뉴론선택법 그리고 이 두 기법을 통합한 통합 연결강도 모형을 제안하여 각각 의사결정 트리 및 다변량판별분석에 의해 선정된 입력변수를 이용한 인공신경망 모형과 예측율을 비교한다. 실험 결과 본 연구에서 제안하고 있는 방법론이 의사결정트리나 다다변량판별분석 기법 보다 높은 예측율을 보여 주었다. 특히 두 기법의 통합연결강도 모형의 경우에는 다른 단일 기법보다 높은 예측율을 보이고 있다.

  • PDF

Input Variables Selection of Artificial Neural Network Using Mutual Information (상호정보량 기법을 적용한 인공신경망 입력자료의 선정)

  • Han, Kwang-Hee;Ryu, Yong-Jun;Kim, Tae-Soon;Heo, Jun-Haeng
    • Journal of Korea Water Resources Association
    • /
    • v.43 no.1
    • /
    • pp.81-94
    • /
    • 2010
  • Input variable selection is one of the various techniques for improving the performance of artificial neural network. In this study, mutual information is applied for input variable selection technique instead of correlation coefficient that is widely used. Among 152 variables of RDAPS (Regional Data Assimilation and Prediction System) output results, input variables for artificial neural network are chosen by computing mutual information between rainfall records and RDAPS' variables. At first the rainfall forecast variable of RDAPS result, namely APCP, is included as input variable and the other input variables are selected according to the rank of mutual information and correlation coefficient. The input variables using mutual information are usually those variables about wind velocity such as D300, U925, etc. Several statistical error estimates show that the result from mutual information is generally more accurate than those from the previous research and correlation coefficient. In addition, the artificial neural network using input variables computed by mutual information can effectively reduce the relative errors corresponding to the high rainfall events.

Selection of Input Nodes in Artificial Neural Network for Bankruptcy Prediction by Link Weight Analysis Approach (연결강도분석접근법에 의한 부도예측용 인공신경망 모형의 입력노드 선정에 관한 연구)

  • 이응규;손동우
    • Journal of Intelligence and Information Systems
    • /
    • v.7 no.2
    • /
    • pp.19-33
    • /
    • 2001
  • Link weight analysis approach is suggested as a heuristic for selection of input nodes in artificial neural network for bankruptcy prediction. That is to analyze each input node\\\\`s link weight-absolute value of link weight between an input node and a hidden node in a well-trained neural network model. Prediction accuracy of three methods in this approach, -weak-linked-neurons elimination method, strong-linked-neurons selection method and integrated link weight model-is compared with that of decision tree and multivariate discrimination analysis. In result, the methods suggested in this study show higher accuracy than decision tree and multivariate discrimination analysis. Especially an integrated model has much higher accuracy than any individual models.

  • PDF

Three-dimensional Sensitivity Analysis of Dynamic Agricultural Nonpoint Source Assessment Tool (DANSAT) (동적 농업 비점오염 평가모델 (DANSAT)의 3차원 민감도 분석)

  • Cho, Jae-Pil;Hwang, Sye-Woon;Saied, Mostaghimi
    • Journal of The Korean Society of Agricultural Engineers
    • /
    • v.51 no.1
    • /
    • pp.41-52
    • /
    • 2009
  • 새로 개발된 모형에 대한 민감도 분석은 입력변수의 선정 및 보정을 위한 필요한 지침을 제공하기 위해 수행되어야 할 필수적인 과정이다. 동적 농업비점오염 평가모델 (dynamic agricultural nonpoint source assessment tool, DANSAT)은 농업 최적관리기법(BMP)의 지표 및 지하수에 대한 영향을 평가하기 위해 개발된 3차원 모델이다. 본 연구의 목적은 서로 다른 토층 및 유역내 위치에서 입력변수의 변화에 따른 지표 및 지하관련 출력들의 반응을 토대로 DANSAT의 일반적인 민감도 분석을 수행하는 것이다. 선정된 입력변수들의 변화에 따른 세가지의 지표관련 출력 (유출량, 유사량, 유출수중 농약 부하량) 및 두가지의 지하관련 출력 (지하수로의 유입 유량 및 지하수로의 농약 유입량)의 반응이 고려되었다. 민감한 입력변수들은 하나의 격자만을 이용한 예비 민감도 분석을 통하여 선정되었는데, 대체로 토양 관련 인자들이 지표 및 지하에서 양적/질적으로 민감하게 작용하는 것으로 나타났다. 예비민감도 분석을 통해 선정된 토양입력변수들의 서로 다른 토층에서의 변화에 따른 모형 출력들의 반응을 고려한 수직적 민감도 분석결과, 지표관련 출력들의 경우 지표 부근의 상층 토양의 인자가, 지하관련 출력들의 경우 하부 토층의 인자가 각각 민감하게 작용하는 것으로 평가되었다. 유역내에서 입력변수들의 공간적 위치의 변화에 따른 반응을 고려하는 수평적 민감도 분석결과, 유역 경계의 주변보다 하천 주변에서의 입력변수 변화가 모형의 지표 및 지하관련 출력들에 민감한 것으로 나타났다. 본 연구 결과는 BMP의 지표 및 지하의 수문/수질에 미치는 영향을 평가하기 위해 개발된 DANSAT 모형의 입력변수 선정 및 보정에 유용한 자료로 활용될 것으로 기대된다.

Genetic Algorithm-Based Feature Selection Scheme for Short-Term Load Forecasting (단기 전력수요 예측을 위한 유전 알고리즘 기반의 특징 선택 기법)

  • Park, Sungwoo;Moon, Jihoon;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.813-816
    • /
    • 2019
  • 최근 에너지 부족 문제 및 환경 문제의 해결수단으로 스마트 그리드가 많은 주목을 받고 있다. 스마트 그리드 기술은 에너지를 효율적으로 사용하는 데 도움을 주며, 이를 위해서는 더욱 정확한 전력수요 예측이 필요하다. 다양한 기계학습 기법 기반의 전력수요 예측 모델은 좋은 예측 성능을 보이지만 입력 변수의 개수가 증가할수록 처리해야 하는 데이터의 양이 기하급수적으로 증가한다는 단점이 존재한다. 또한, 불필요한 데이터를 입력 변수로 선정할 경우에는 모델의 정확도가 저하될 수도 있다. 이러한 문제를 해결하기 위해 다양한 특징 선택 기법들이 제안되었지만, 기존의 특징 선택 기법은 모델의 성능을 고려하지 않았기 때문에 실제 적용 시 오히려 모델의 성능이 저하될 수도 있다. 이에 본 논문은 유전 알고리즘을 기반으로 한 특징 선택 기법을 제안한다. 유전 알고리즘을 통해 각 모델에 맞는 최적의 입력 변수를 선택함으로써 빠른 학습 속도와 높은 정확도를 기대할 수 있다.

Weak-linked Neurons Elimination Method based Neural Network Models for Bankruptcy Prediction (약체연결뉴런 제거법에 의한 부도예측용 인공신경망 모형에 관한 연구)

  • 손동우;이웅규
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 2000.05a
    • /
    • pp.115-121
    • /
    • 2000
  • 본 연구는 인공신경망 모형에서 최적 입력 변수를 선정하기 위하여 새로운 선처리 기법인 약체연결뉴런 제거법을 제안하고 그 예측력의 우월성을 순수 인공신경망과 의사결정트리로 선처리한 인공신경망 모델과 각각 비교했으며, 그 결과를 보면 본 연구에서 제안하고 있는 약체연결뉴런 제거법에 의해 입력변수 선정과정을 거친 모델의 성과가 순수 인공신경망이나 의사결정트리로 선처리한 인공신경망 모델에 비해 예측적중율이 우수한 것으로 나타났다.

  • PDF

Optimal Network Selection Method for Artificial Neural Network Downscaling Method (인공신경망 Downscaling모형에 있어서 최적신경망구조 선택기법)

  • Kang, Boo-Sik;Ryu, Seung-Yeop;Moon, Su-Jin
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1605-1609
    • /
    • 2010
  • CGCM3.1 SRES B1 시나리오의 2D 변수들을 입력값으로 인공신경망 모형을 이용한 스케일 상세화기법으로 강부식(2009)은 소양강댐 유역의 월 누적강수 경향분석을 실시하였다. 원시 GCM 시나리오를 스케일 상세화 시키기 위한 기법의 하나로 인공신경망 모형을 사용할 수 있는데, 이 경우 GCM에서 모의되는 강수플럭스, 해면기압, 지표면 근처에서의 일 평균온도, 지표면 근처에서의 일평균온도, 지표면으로부터 발생하는 잠열플럭스 등과 같은 22개의 변수를 잠재적인 예측인자로 사용하여 신경망을 구성하게 된다. 입력변수세트의 구성은 인공신경망의 계산 효율을 좌우하는 중요한 요소라 할 수 있다. 본 연구에서는 변수의 물리적 특성을 고려하여 순차적인 변수선택을 통한 신경망 입력변수 세트를 구성하고 입력세트 간의 학습성과 비교를 통하여, 최적 입력변수 선정 및 신경망의 학습효과를 높일 수 있는 방법에 대해 연구하였다. 물리적 상관성이 높다고 판단되는 GCM_Prec, huss, ps를 입력변수로 하여 순차적인 케이스를 학습해본 결과 huss와 ps를 입력변수로 하는 케이스에 대해서 적은 오차와 높은 상관성을 보였다, 또한, 신경망의 학습 효과를 높이기 위해 홍수기와 비홍수기로 구분하여 학습한 결과 홍수기와 비홍수기로 구분하여 신경망을 구성하였을 경우가 향상된 모의값을 나타내었다. 기후변화모의자료는 CCCma(Canadian Center for Climate Modeling and Analysis)에서 제공되는 CGCM3.1/T63 20C3M 시나리오를 사용하였으며, 관측값으로는 AWS에서 제공된 일 누적강수를 사용하였다. 인공신경망의 학습기간은 1997년부터 2000년이며, 검증기간은 2001년부터 2004년으로 구성하였다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • Jung, Yoon;Hwang, Seok-Hae
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA: multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 둥이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation )알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉충의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.

  • PDF