• Title/Summary/Keyword: 입력변수선택

Search Result 189, Processing Time 0.031 seconds

Enhanced Self-Generation Supervised Learning Alrorithm Using ARTI and Delta-Bar-Delta Method (ART1과 Delta-Bar-Delta 방법을 이용한 개선된 자가 생성 지도 학습 알고리즘)

  • 백인호;김태경;김광백
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.09b
    • /
    • pp.71-75
    • /
    • 2003
  • 오류 역전파 학습 알고리즘을 이용하여 영상 인식에 적용 할 경우에는 은닉층의 노드 수를 경험적으로 설정하므로, 학습시간과 지역최소화 및 정체현상이 발생한다. 그리고 ARTI 알고리즘은 입력 패턴과 저장 패턴간의 측정 방법인 유사성 검증 방법과 경계 변수의 설정에 따라 인식률이 좌우된다. 경계 변수의 값이 크면 입력 패턴과 저장 패턴사이에 약간의 차이만 있어도 새로운 카테고리(Category)로 분류하고, 반대로 경계 변수의 값이 적으면 입력 패턴과 저장 패턴 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 패턴들을 대략적으로 분류한다. 따라서 ART1 알고리즘을 영상 인식에 적용하기 위해서는 경계 변수를 경험적으로 설정하므로 인식률에 부정적인 영향을 갖는 문제점이 있다. 따라서 본 논문에서는 개선된 ART1 알고리즘과 지도 학습 방법을 결합하여 신경망의 은닉층 노드를 동적으로 변화시키는 자가 생성지도 학습 알고리즘을 제안한다. 제안된 신경망에서 입력층과 은닉층의 학습 구조에는 ART1 알고리즘을 개선하여 적용하고, 은닉층과 출력층의 학습 구조에는 은닉층에서 승자로 선택된 노드와 출력층 노드와 연결된 가중치만을 조정하고 Delta-Bar-Delta 알고리즘을 적용한다. 제안된 방법의 학습 성능을 분석하기 위하여 학생증 영상에서 추출한 학번 패턴 분류에 적용한 결과, 기존의 신경망 학습 알고리즘보다 학습 성능이 개선됨을 확인하였다.

  • PDF

Optimization of OPKDDs using Genetic Algorithms (유전자 알고리즘을 이용한 OPKFDD의 최적화)

  • Jeong, Mi-Gyeong;Sin, Yun-Jeong;Lee, Gwi-Sang;Jang, Jun-Yeong;Bae, Yeong-Hwan;Jo, Han-Jin
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.27 no.12
    • /
    • pp.941-950
    • /
    • 2000
  • OPKFDD(Ordered Pseudo-Kronecker Functional Decision Diagram)는 각 노드에서 다양한 확장방법(decomposition)을 취할 수 있는 Ordered-DD(Decision Diagram)의 한 종류로서 각 노드마다 Shannon, positive Davio, negative Davio 확장중의 하나를 사용하도록 하며 다른 종류의 DD와 비교해서 작은 수의 노드로 함수를 표현할 수 있다. 그러나 각 노드마다 각기 다른 확장 방법을 선택할 수 있는 특징 때문에 입력 노드에 대한 확장 방법과 입력 변수 순서의 결정에 의해서 OPKFDD의 크기가 좌우되며 최소의 노드 수를 갖는 OPKFDD의 구성은 매우 어려운 문제로 알려져 있다. 즉, OPKFDD에서의 입력변수와 각 노드의 확장 방법을 병행해서 최적의 해를 구하기 위해서는 η개의 입력변수에 대해서 η!.3$^2$$^n$$^{-1}$의 경우의 수를 고려해야 한다. 따라서 본 논문에서는 주어진 불리안 함수를 OPKFDD의 최적화 표현을 위해 노드 수를 기준으로 하여 입력변수 순서와 각 노드의 확장 방법을 함께 고려하는 혼용 유전자 알고리즘을 제안하며 최소의 노드 수를 갖는 OPKFDD를 생성하기 위해서 다양한 파라미터 값에 따른 실험결과를 제시한다.

  • PDF

The Credit Information Feature Selection Method in Default Rate Prediction Model for Individual Businesses (개인사업자 부도율 예측 모델에서 신용정보 특성 선택 방법)

  • Hong, Dongsuk;Baek, Hanjong;Shin, Hyunjoon
    • Journal of the Korea Society for Simulation
    • /
    • v.30 no.1
    • /
    • pp.75-85
    • /
    • 2021
  • In this paper, we present a deep neural network-based prediction model that processes and analyzes the corporate credit and personal credit information of individual business owners as a new method to predict the default rate of individual business more accurately. In modeling research in various fields, feature selection techniques have been actively studied as a method for improving performance, especially in predictive models including many features. In this paper, after statistical verification of macroeconomic indicators (macro variables) and credit information (micro variables), which are input variables used in the default rate prediction model, additionally, through the credit information feature selection method, the final feature set that improves prediction performance was identified. The proposed credit information feature selection method as an iterative & hybrid method that combines the filter-based and wrapper-based method builds submodels, constructs subsets by extracting important variables of the maximum performance submodels, and determines the final feature set through prediction performance analysis of the subset and the subset combined set.

Categorical Variable Selection in Naïve Bayes Classification (단순 베이즈 분류에서의 범주형 변수의 선택)

  • Kim, Min-Sun;Choi, Hosik;Park, Changyi
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.3
    • /
    • pp.407-415
    • /
    • 2015
  • $Na{\ddot{i}}ve$ Bayes Classification is based on input variables that are a conditionally independent given output variable. The $Na{\ddot{i}}ve$ Bayes assumption is unrealistic but simplifies the problem of high dimensional joint probability estimation into a series of univariate probability estimations. Thus $Na{\ddot{i}}ve$ Bayes classier is often adopted in the analysis of massive data sets such as in spam e-mail filtering and recommendation systems. In this paper, we propose a variable selection method based on ${\chi}^2$ statistic on input and output variables. The proposed method retains the simplicity of $Na{\ddot{i}}ve$ Bayes classier in terms of data processing and computation; however, it can select relevant variables. It is expected that our method can be useful in classification problems for ultra-high dimensional or big data such as the classification of diseases based on single nucleotide polymorphisms(SNPs).

Hierarchically penalized support vector machine for the classication of imbalanced data with grouped variables (그룹변수를 포함하는 불균형 자료의 분류분석을 위한 서포트 벡터 머신)

  • Kim, Eunkyung;Jhun, Myoungshic;Bang, Sungwan
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.5
    • /
    • pp.961-975
    • /
    • 2016
  • The hierarchically penalized support vector machine (H-SVM) has been developed to perform simultaneous classification and input variable selection when input variables are naturally grouped or generated by factors. However, the H-SVM may suffer from estimation inefficiency because it applies the same amount of shrinkage to each variable without assessing its relative importance. In addition, when analyzing imbalanced data with uneven class sizes, the classification accuracy of the H-SVM may drop significantly in predicting minority class because its classifiers are undesirably biased toward the majority class. To remedy such problems, we propose the weighted adaptive H-SVM (WAH-SVM) method, which uses a adaptive tuning parameters to improve the performance of variable selection and the weights to differentiate the misclassification of data points between classes. Numerical results are presented to demonstrate the competitive performance of the proposed WAH-SVM over existing SVM methods.

Selection of Input Nodes in Artificial Neural Network for Bankruptcy Prediction by Integrated Link Weight Analysis (통합 연결강도모형에 의한 부도예측용 인공신경망 모형 입력노드 선정에 관한 연구)

  • 이웅규
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2001.06a
    • /
    • pp.359-368
    • /
    • 2001
  • 본 연구에서는 부도예측용 인공신경망의 입력노드 선정을 위한 휴리스틱으로 연결강도분석 접근법을 제안한다. 연결강도분석은 학습이 끝난 인공신경망에서 입력노드와 은닉노드와 연결된 가중치의 절대값 즉, 연결강도를 분석하여 입력변수를 선정하는 접근법으로, 본 연구에서는 약체연결뉴론제거법, 강체연결뉴론선택법 그리고 이 두 기법을 통합한 통합 연결강도 모형을 제안하여 각각 의사결정 트리 및 다변량판별분석에 의해 선정된 입력변수를 이용한 인공신경망 모형과 예측율을 비교한다. 실험 결과 본 연구에서 제안하고 있는 방법론이 의사결정트리나 다다변량판별분석 기법 보다 높은 예측율을 보여 주었다. 특히 두 기법의 통합연결강도 모형의 경우에는 다른 단일 기법보다 높은 예측율을 보이고 있다.

  • PDF

Optimal Identification of Data Granules-based Fuzzy Set Fuzzy Model (데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정)

  • Park Keon-Jun;Kim Wan-Su;Oh Sung-Kwun;Kim Hyun-Ki
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.317-320
    • /
    • 2005
  • 본 논문은 비선형 시스템의 퍼지모델을 설계하기 위해 데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정을 제안한다. 퍼지모델은 주로 경험적 방법에 의해 추출되기 때문에 보다 구체적이고 체계적인 방법에 의한 동정 및 최적화 될 필요성이 요구된다. HCM 클러스터링을 통한 데이터 입자는 입력 변수의 개별적인 퍼지 규칙을 형성하고, 퍼지 공간 분할 및 삼각형 멤버쉽 함수의 초기 정점을 정의한다. 또한, 데이터 입자의 중심을 이용하여 후반부의 구조를 결정한다. 초기 퍼지 모델을 동정하기 위해 유전자 알고리즘을 이용하여 입력 변수의 수, 선택될 입력 변수, 멤버쉽 함수의 수, 그리고 후반부 형태를 결정한다. 데이터 입자에 의한 전반부 멤버쉽 파라미터는 유전자 알고리즘을 이용하여 최적으로 동정한다 제안된 모델을 평가하기 위해 수치적인 예를 사용한다.

  • PDF

Application of Cluster Analysis using Mutual Information (상호정보량 기법을 이용한 군집분석의 적용성 연구)

  • Jung, Young-Hun;Kim, Wan-Su;Jeong, Chang-Sam;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.414-414
    • /
    • 2011
  • 우리나라 뿐만 아니라 전 세계적으로 기후변화로 인한 집중호우, 폭설 등이 빈번하게 일어나고 있으며 수공구조물 설계에 필요한 확률강우량도 증가하고 있다. 확률강우량을 산정하는 빈도해석의 경우 지점빈도해석의 문제점을 보완한 지역빈도해석에 대한 연구가 꾸준히 진행되고 있다. 지역빈도해석을 적용하기 위해서는 수문학적 동질성을 가지는 지역 구분이 무엇보다 중요하다. 군집 분석은 개체들이 지니고 있는 다양한 속성의 유사성을 동질적인 집단으로 군집화하는 방법을 말한다. 군집분석의 기본원리는 분석하고자 하는 여러 특성등을 유사성(similaruty) 거리(distance)로 환산하고 거리가 상대적으로 가까운 개체들을 동질적으로 군집화하는 것이다. 군집분석을 적용하기 위해서는 기상학적 인자와 지형학적 인자를 이용하여 군집분석을 실시한다. 군집분석을 실시할 때 가장 중요한 것은 입력변수의 선택으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 준다. 상호정보량(Mutual Information, MI) 기법은 두 무작위 변수간의 관련성을 측정하는 방법이며 (Cover and Tomas, 2006), 두 변수간의 독립성 구조에 관한 가정이 없고 데이터 변형이나 잡음(noise)에 대한 영향이 적어 다른 기법보다 신뢰도가 높다고 알려져 있다(Peng et al., 2005). 본 연구에서는 상호정보량 기법을 이용하여 군집된 지점들의 종속성과 독립성의 관계를 정량적으로 산정하여 비교하고자 한다.

  • PDF

Auto-Estimation Module of GRM Model Parameters Using PEST (PEST를 이용한 GRM 모형의 매개변수 자동추정 모듈)

  • Choi, Yun Seok;Kim, Gil Ho;Kim, Kyung Tak;Noh, Seong Jin
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.431-431
    • /
    • 2015
  • 일반적으로 유량을 계산하는 수문모형은 강우에서부터 유출에 이르는 수문현상을 해석하는 방법에 따라 하나 이상의 매개변수가 이용된다. 이러한 수문모형의 보정은 계산된 유량과 관측 유량을 비교하고, 계산된 유량이 관측유량을 잘 재현할 수 있도록 모형의 매개변수를 반복적으로 수정하는 과정을 통해서 이루어진다. 수문모형의 매개변수는 수문학적으로 의미가 있는 값을 가지며, 매개변수를 수정하기 위해서는 대상 매개변수가 모형내에서 수문학적으로 어떠한 의미를 가지에 대한 이해가 필요하다. 또한 하나의 매개변수는 다른 매개변수와 함께 복합적으로 유량계산에 작용하므로, 다수의 매개변수를 함께 추정하여 최적 계산결과를 도출하는 과정은 일반적으로 전문성과 함께 많은 시간이 소요된다. 본 연구에서는 범용 매개변수 추정모형인 PEST와 GRM 모형을 연계하여 GRM 모형의 매개 변수를 자동으로 추정할 수 있는 모듈을 개발하였다. 개발된 모듈에서는 GRM 모형의 보정을 위한 PEST 모형의 입력파일을 자동으로 생성하고, PEST 혹은 병렬 PEST를 실행할 수 있다. 사용자는 GRM 모형의 추정대상 매개변수 선택, 관측자료 설정, 자동으로 생성된 PEST 입력파일을 확인 및 수정하며, 병렬 PEST를 실행할 경우에는 slave PEST 개수 등을 설정한다. 본 연구에서 개발된 모듈은 OpenGIS인 MapWindow GIS의 Plug-in으로 개발된 GRM(MW-GRM)에서 메뉴로 제공되며, GUI를 통해서 편리하게 활용될 수 있다. 본 연구에서는 물리적 분포형 모형인 GRM의 보정시 다수의 매개변수를 편리하게 추정할 수 있는 방안을 마련하였다. 본 연구의 결과는 강우-유출 해석 분야에서 GRM 모형이 좀 더 쉽게 활용되는 데 기여할 수 있을 것이다.

  • PDF

An Enhanced Fuzzy ART Algorithm for Effective Image Recognition (효과적인 영상 인식을 위한 개선된 퍼지 ART 알고리즘)

  • Kim, Kwang-Baek;Park, Choong-Shik
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.06a
    • /
    • pp.262-267
    • /
    • 2007
  • 퍼지 ART 알고리즘에서 경계 변수는 패턴들을 클러스터링하는데 있어서 반지름 값이 되며 임의의 패턴과 저장된 패턴과의 불일치(mismatch) 허용도를 결정한다. 이 경계 변수가 크면 입력 벡터와 기대 벡터 사이에 약간의 차이가 있어도 새로운 카테고리(category)로 분류하게 된다. 반대로 경계 변수가 작으면 입력 벡터와 기대 벡터 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 벡터들을 대략적으로 분류한다. 따라서 영상 인식에 적용하기 위해서는 경험적으로 경계 변수를 설정해야 단점이 있다. 그리고 연결 가중치를 조정하는 과정에서 학습률의 설정에 따라 저장된 패턴들의 정보들이 손실되는 경우가 발생하여 인식율을 저하시킨다. 본 논문에서는 퍼지 ART 알고리즘의 문제점을 개선하기 위하여 퍼지 논리 접속 연산자를 이용하여 경계 변수를 동적으로 조정하고 저장 패턴들과 학습 패턴간의 실제적인 왜곡 정도를 충분히 고려하여 승자 노드로 선택된 빈도수를 학습률로 설정하여 가중치 조정에 적용한 개선된 퍼지 ART 알고리즘을 제안하였다. 제안된 방법의 성능을 확인하기 위해서 실제 영문 명함에서 추출한 영문자들을 대상으로 실험한 결과, 기존의 ART1과 ART2 알고리즘이나 퍼지 ART 알고리즘보다 클러스터의 수가 적게 생성되었고 인식 성능도 기존의 방법들보다 우수한 성능이 있음을 확인하였다.

  • PDF