• 제목/요약/키워드: 입력변수선정기법

검색결과 83건 처리시간 0.03초

RDAPS 입력자료 선정을 위한 Mutual Information기법 적용 (Mutual Information Technique for Selecting Input Variables of RDAPS)

  • 한광희;류용준;김태순;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1141-1144
    • /
    • 2009
  • 인공신경망(artificial neural network) 기법은 인간의 두뇌 신경세포의 활동을 모형화한 것으로 오랜 시간동안 발전해 왔으며 여러 분야에서 활용되고 있고 수문분야에서도 인공신경망을 이용한 연구가 활발히 진행되어 왔다. RDAPS와 같은 단기수치예보 자료는 강우의 유무 판단과 같은 정성적인 분석에서 비교적 정확도가 높지만 정확한 강우량의 추정과 같은 정량적인 부분에서는 정확도가 매우 낮으므로 인공신경망 기법과 같은 후처리 기법을 통해서 정확도를 높이게 된다. 인공신경망 기법을 수행할 때, 가장 중요한 것은 입력변수선택(input variable selection)으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 주게 된다. 본 연구에서는 mutual information을 입력 변수 선택 기법으로 채택하여, 인공신경망의 입력변수 선정의 정확도를 알아보고자 한다. Mutual information은 주어진 자료의 엔트로피값을 이용하여 변수들 간의 독립과 종속의 관계를 나타내는 기법으로서, MI값은 '0'에서 '1'의 값을 가지며 '0'에 가까울수록 변수들 간의 관계가 독립적이고 '1'에 가까울수록 종속적인 관계를 나타낸다. 인공신경망의 입력변수선정에 대한 mutual information의 정확도를 알아보기 위해, 기존 입력변수선택 기법과 mutual information을 이용했을 경우의 인공신경망의 처리능력, 정확도를 비교 검토하였다.

  • PDF

유전자 알고리즘을 활용한 인공신경망 모형 최적입력변수의 선정: 부도예측 모형을 중심으로 (Using GA based Input Selection Method for Artificial Neural Network Modeling Application to Bankruptcy Prediction)

  • 홍승현;신경식
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.227-249
    • /
    • 2003
  • 부도예측모형의 구축은 은행 등 금융기관이 신용평가시스템 혹은 심사역 의사결정지원시스템을 구축하는데 중요한 기반이 된다. 많은 선행연구들에서는 기업의 부도예측을 위하여 전통적으로 다변량 판별분석이나 로짓분석과 같은 통계기법이 많이 사용되었으나, 최근에는 많은 연구들에 의해 그 우수성이 보고되고 있는 인공신경망, 귀납적 학습방법 등 인공지능 기법이 부도예측분야에 많이 응용되고 있다. 일반적으로 인공신경망 기법을 응용한 부도예측모형에서는 기업의 재무정보 및 비재무 정보를 입력변수로 주고 기업의 부도여부를 출력변수로 설정하여 학습을 통해 이들의 관계를 추출하고 있다. 그러므로 입력변수의 선정은 모형의 정확도에 커다란 영향을 미치며, 입력변수가 잘못 선정된 경우 예측 정확도는 현저히 낮아진다. 그러나 최적의 입력변수군을 선정하는 문제는 매우 어려운 과제 중 하나로, 선행 연구들에서는 주로 전문가의 의견을 반영하거나, 문헌을 통해 도출, 혹은 통계적 기법을 활용하여 입력변수를 선정하는 것이 일반적이었다. 본 연구에서는 많은 선행 연구에서 모형구축에의 한계점으로 명시하고 있는 입력변수 선정의 문제에 대해 유전자 알고리즘을 이용한 최적화를 통하여 입력 변수군을 도출하는 방법론을 제시하였고, 이 방법론이 다른 통계기법이나 전문가에 의한 변수 선택 방법론에 비해 우수함을 인공신경망 모형에 적용한 결과를 비교함으로 보여 주었으며, 이들간의 예측력의 차이가 유의함을 통계적 검증하였다. 모형의 실험을 위하여 총 528개사의 재무정보를 활용하였는데, 이는 1995년부터 1997년까지 3년간 부도가 발생한 일반법인 제조업체 중 외감법인 이상 264개사와 동수의 건전기업의 재무 데이터로 구성하였다. 기업이 도산에 이르기까지 많은 변인들이 다양하게 작용하게 된다. 그러나 이러한 변인들을 모두 모형에 적용하는 것은 비효율적이며, 인공신경망 모형에서 과다 입력변수를 사용하는 경우 수렴과 일반화 모두에 바람직하지 않은 결과가 나타난다. 따라서 적절한 입력변수군의 선택은 인공신경망 모형의 효율성과 성능을 향상시키게 되고, 이는 부도 예측율의 향상으로 이어질 수 있다. 이에 인공신경망 모형을 위한 최적의 입력변수군을 선정하고자 한 본 연구는 결국 기업의 부도 예측율을 높이기 위한 방법론을 제시했다는 점에 그 의의가 있다.

  • PDF

통합 연결강도모형에 의한 부도예측용 인공신경망 모형 입력노드 선정에 관한 연구 (Selection of Input Nodes in Artificial Neural Network for Bankruptcy Prediction by Integrated Link Weight Analysis)

  • 이웅규
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.359-368
    • /
    • 2001
  • 본 연구에서는 부도예측용 인공신경망의 입력노드 선정을 위한 휴리스틱으로 연결강도분석 접근법을 제안한다. 연결강도분석은 학습이 끝난 인공신경망에서 입력노드와 은닉노드와 연결된 가중치의 절대값 즉, 연결강도를 분석하여 입력변수를 선정하는 접근법으로, 본 연구에서는 약체연결뉴론제거법, 강체연결뉴론선택법 그리고 이 두 기법을 통합한 통합 연결강도 모형을 제안하여 각각 의사결정 트리 및 다변량판별분석에 의해 선정된 입력변수를 이용한 인공신경망 모형과 예측율을 비교한다. 실험 결과 본 연구에서 제안하고 있는 방법론이 의사결정트리나 다다변량판별분석 기법 보다 높은 예측율을 보여 주었다. 특히 두 기법의 통합연결강도 모형의 경우에는 다른 단일 기법보다 높은 예측율을 보이고 있다.

  • PDF

상호정보량 기법을 적용한 인공신경망 입력자료의 선정 (Input Variables Selection of Artificial Neural Network Using Mutual Information)

  • 한광희;류용준;김태순;허준행
    • 한국수자원학회논문집
    • /
    • 제43권1호
    • /
    • pp.81-94
    • /
    • 2010
  • 본 연구는 인공신경망의 성능을 향상시키기 위한 여러 가지 방법들 중의 하나인 입력변수 선정기법에 관한 연구로서, 일반적으로 널리 사용되고 있는 상관계수를 이용한 입력변수 선정기법 외에 상호정보량을 활용한 방법을 적용하여 인공신경망의 성능을 향상시키고자 하였다. 대상자료는 기상청에서 제공하는 RDAPS자료의 152개 출력값으로 지상강우량의 예측값인 APCP를 포함하고 있으며, 강우관측값간의 상호정보량을 구해 가장 영향력이 큰 변수를 입력변수로 사용하였다. 기존연구결과, 그리고 상관계수만을 이용해서 입력변수를 선정한 결과와 비교해볼 때, 상호정보량을 적용한 경우 입력변수는 주로 바람과 관련된 변수들이 선정되었으며, 평균제곱근오차, 평균제곱근상대오차, 그룹별로 구분한 경우의 절대오차, 그리고 구간별로 구분한 경우의 상대오차를 비교한 경과 상호정보량을 이용한 입력변수 선정방법의 정확도가 전반적으로 높은 것으로 나타났으며, 특히 강우량이 상대적으로 큰 경우의 오차를 많이 감소시킬 수 있는 것으로 나타났다.

연결강도분석접근법에 의한 부도예측용 인공신경망 모형의 입력노드 선정에 관한 연구 (Selection of Input Nodes in Artificial Neural Network for Bankruptcy Prediction by Link Weight Analysis Approach)

  • 이응규;손동우
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.19-33
    • /
    • 2001
  • 본 연구에서는 부도예측용 인공신경망의 입력노드 선정을 위한 휴리스틱으로 연결강도분석접근법을 제안한다. 연결강도분석은 학습이 끝난 인공신경망에서 입력노드와 은닉노드를 연결하는 연결가중치의 절대값 즉, 연결강도를 분석하여 입력변수를 선정하는 접근법으로, 선정기준에 따라 약체연결뉴론제거법과 강체연결뉴론선택법을 들 수 있다. 본 연구에서는 약체연결뉴론제거법, 강체연결뉴론선택법 그리고 이 두 기법을 통합한 통합 연결강도 모형을 제안하여 각각 의사결정트리 및 다변량판별분석에 의해 선정된 입력변수를 이용한 인공신경망 모형과 예측율을 비교한다. 실험 결과 본 연구에서 제안하고 있는 방법론이 의사결정트리나 다변량판별분석 기법보다 높은 예측율을 보여주었다. 특히 두 기법의 통합연결강도 모형의 경우에는 다른 단일 기법보다 높은 예측율을 보이고 있다.

  • PDF

동적 농업 비점오염 평가모델 (DANSAT)의 3차원 민감도 분석 (Three-dimensional Sensitivity Analysis of Dynamic Agricultural Nonpoint Source Assessment Tool (DANSAT))

  • 조재필;황세운;모스타기미사이드
    • 한국농공학회논문집
    • /
    • 제51권1호
    • /
    • pp.41-52
    • /
    • 2009
  • 새로 개발된 모형에 대한 민감도 분석은 입력변수의 선정 및 보정을 위한 필요한 지침을 제공하기 위해 수행되어야 할 필수적인 과정이다. 동적 농업비점오염 평가모델 (dynamic agricultural nonpoint source assessment tool, DANSAT)은 농업 최적관리기법(BMP)의 지표 및 지하수에 대한 영향을 평가하기 위해 개발된 3차원 모델이다. 본 연구의 목적은 서로 다른 토층 및 유역내 위치에서 입력변수의 변화에 따른 지표 및 지하관련 출력들의 반응을 토대로 DANSAT의 일반적인 민감도 분석을 수행하는 것이다. 선정된 입력변수들의 변화에 따른 세가지의 지표관련 출력 (유출량, 유사량, 유출수중 농약 부하량) 및 두가지의 지하관련 출력 (지하수로의 유입 유량 및 지하수로의 농약 유입량)의 반응이 고려되었다. 민감한 입력변수들은 하나의 격자만을 이용한 예비 민감도 분석을 통하여 선정되었는데, 대체로 토양 관련 인자들이 지표 및 지하에서 양적/질적으로 민감하게 작용하는 것으로 나타났다. 예비민감도 분석을 통해 선정된 토양입력변수들의 서로 다른 토층에서의 변화에 따른 모형 출력들의 반응을 고려한 수직적 민감도 분석결과, 지표관련 출력들의 경우 지표 부근의 상층 토양의 인자가, 지하관련 출력들의 경우 하부 토층의 인자가 각각 민감하게 작용하는 것으로 평가되었다. 유역내에서 입력변수들의 공간적 위치의 변화에 따른 반응을 고려하는 수평적 민감도 분석결과, 유역 경계의 주변보다 하천 주변에서의 입력변수 변화가 모형의 지표 및 지하관련 출력들에 민감한 것으로 나타났다. 본 연구 결과는 BMP의 지표 및 지하의 수문/수질에 미치는 영향을 평가하기 위해 개발된 DANSAT 모형의 입력변수 선정 및 보정에 유용한 자료로 활용될 것으로 기대된다.

단기 전력수요 예측을 위한 유전 알고리즘 기반의 특징 선택 기법 (Genetic Algorithm-Based Feature Selection Scheme for Short-Term Load Forecasting)

  • 박성우;문지훈;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.813-816
    • /
    • 2019
  • 최근 에너지 부족 문제 및 환경 문제의 해결수단으로 스마트 그리드가 많은 주목을 받고 있다. 스마트 그리드 기술은 에너지를 효율적으로 사용하는 데 도움을 주며, 이를 위해서는 더욱 정확한 전력수요 예측이 필요하다. 다양한 기계학습 기법 기반의 전력수요 예측 모델은 좋은 예측 성능을 보이지만 입력 변수의 개수가 증가할수록 처리해야 하는 데이터의 양이 기하급수적으로 증가한다는 단점이 존재한다. 또한, 불필요한 데이터를 입력 변수로 선정할 경우에는 모델의 정확도가 저하될 수도 있다. 이러한 문제를 해결하기 위해 다양한 특징 선택 기법들이 제안되었지만, 기존의 특징 선택 기법은 모델의 성능을 고려하지 않았기 때문에 실제 적용 시 오히려 모델의 성능이 저하될 수도 있다. 이에 본 논문은 유전 알고리즘을 기반으로 한 특징 선택 기법을 제안한다. 유전 알고리즘을 통해 각 모델에 맞는 최적의 입력 변수를 선택함으로써 빠른 학습 속도와 높은 정확도를 기대할 수 있다.

약체연결뉴런 제거법에 의한 부도예측용 인공신경망 모형에 관한 연구 (Weak-linked Neurons Elimination Method based Neural Network Models for Bankruptcy Prediction)

  • 손동우;이웅규
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2000년도 춘계학술대회
    • /
    • pp.115-121
    • /
    • 2000
  • 본 연구는 인공신경망 모형에서 최적 입력 변수를 선정하기 위하여 새로운 선처리 기법인 약체연결뉴런 제거법을 제안하고 그 예측력의 우월성을 순수 인공신경망과 의사결정트리로 선처리한 인공신경망 모델과 각각 비교했으며, 그 결과를 보면 본 연구에서 제안하고 있는 약체연결뉴런 제거법에 의해 입력변수 선정과정을 거친 모델의 성과가 순수 인공신경망이나 의사결정트리로 선처리한 인공신경망 모델에 비해 예측적중율이 우수한 것으로 나타났다.

  • PDF

인공신경망 Downscaling모형에 있어서 최적신경망구조 선택기법 (Optimal Network Selection Method for Artificial Neural Network Downscaling Method)

  • 강부식;류승엽;문수진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1605-1609
    • /
    • 2010
  • CGCM3.1 SRES B1 시나리오의 2D 변수들을 입력값으로 인공신경망 모형을 이용한 스케일 상세화기법으로 강부식(2009)은 소양강댐 유역의 월 누적강수 경향분석을 실시하였다. 원시 GCM 시나리오를 스케일 상세화 시키기 위한 기법의 하나로 인공신경망 모형을 사용할 수 있는데, 이 경우 GCM에서 모의되는 강수플럭스, 해면기압, 지표면 근처에서의 일 평균온도, 지표면 근처에서의 일평균온도, 지표면으로부터 발생하는 잠열플럭스 등과 같은 22개의 변수를 잠재적인 예측인자로 사용하여 신경망을 구성하게 된다. 입력변수세트의 구성은 인공신경망의 계산 효율을 좌우하는 중요한 요소라 할 수 있다. 본 연구에서는 변수의 물리적 특성을 고려하여 순차적인 변수선택을 통한 신경망 입력변수 세트를 구성하고 입력세트 간의 학습성과 비교를 통하여, 최적 입력변수 선정 및 신경망의 학습효과를 높일 수 있는 방법에 대해 연구하였다. 물리적 상관성이 높다고 판단되는 GCM_Prec, huss, ps를 입력변수로 하여 순차적인 케이스를 학습해본 결과 huss와 ps를 입력변수로 하는 케이스에 대해서 적은 오차와 높은 상관성을 보였다, 또한, 신경망의 학습 효과를 높이기 위해 홍수기와 비홍수기로 구분하여 학습한 결과 홍수기와 비홍수기로 구분하여 신경망을 구성하였을 경우가 향상된 모의값을 나타내었다. 기후변화모의자료는 CCCma(Canadian Center for Climate Modeling and Analysis)에서 제공되는 CGCM3.1/T63 20C3M 시나리오를 사용하였으며, 관측값으로는 AWS에서 제공된 일 누적강수를 사용하였다. 인공신경망의 학습기간은 1997년부터 2000년이며, 검증기간은 2001년부터 2004년으로 구성하였다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • 정윤;황석해
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA: multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 둥이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation )알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉충의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.

  • PDF