• 제목/요약/키워드: 입력변수선택

검색결과 189건 처리시간 0.033초

ART1과 Delta-Bar-Delta 방법을 이용한 개선된 자가 생성 지도 학습 알고리즘 (Enhanced Self-Generation Supervised Learning Alrorithm Using ARTI and Delta-Bar-Delta Method)

  • 백인호;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.71-75
    • /
    • 2003
  • 오류 역전파 학습 알고리즘을 이용하여 영상 인식에 적용 할 경우에는 은닉층의 노드 수를 경험적으로 설정하므로, 학습시간과 지역최소화 및 정체현상이 발생한다. 그리고 ARTI 알고리즘은 입력 패턴과 저장 패턴간의 측정 방법인 유사성 검증 방법과 경계 변수의 설정에 따라 인식률이 좌우된다. 경계 변수의 값이 크면 입력 패턴과 저장 패턴사이에 약간의 차이만 있어도 새로운 카테고리(Category)로 분류하고, 반대로 경계 변수의 값이 적으면 입력 패턴과 저장 패턴 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 패턴들을 대략적으로 분류한다. 따라서 ART1 알고리즘을 영상 인식에 적용하기 위해서는 경계 변수를 경험적으로 설정하므로 인식률에 부정적인 영향을 갖는 문제점이 있다. 따라서 본 논문에서는 개선된 ART1 알고리즘과 지도 학습 방법을 결합하여 신경망의 은닉층 노드를 동적으로 변화시키는 자가 생성지도 학습 알고리즘을 제안한다. 제안된 신경망에서 입력층과 은닉층의 학습 구조에는 ART1 알고리즘을 개선하여 적용하고, 은닉층과 출력층의 학습 구조에는 은닉층에서 승자로 선택된 노드와 출력층 노드와 연결된 가중치만을 조정하고 Delta-Bar-Delta 알고리즘을 적용한다. 제안된 방법의 학습 성능을 분석하기 위하여 학생증 영상에서 추출한 학번 패턴 분류에 적용한 결과, 기존의 신경망 학습 알고리즘보다 학습 성능이 개선됨을 확인하였다.

  • PDF

유전자 알고리즘을 이용한 OPKFDD의 최적화 (Optimization of OPKDDs using Genetic Algorithms)

  • 정미경;신윤정;이귀상;장준영;배영환;조한진
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권12호
    • /
    • pp.941-950
    • /
    • 2000
  • OPKFDD(Ordered Pseudo-Kronecker Functional Decision Diagram)는 각 노드에서 다양한 확장방법(decomposition)을 취할 수 있는 Ordered-DD(Decision Diagram)의 한 종류로서 각 노드마다 Shannon, positive Davio, negative Davio 확장중의 하나를 사용하도록 하며 다른 종류의 DD와 비교해서 작은 수의 노드로 함수를 표현할 수 있다. 그러나 각 노드마다 각기 다른 확장 방법을 선택할 수 있는 특징 때문에 입력 노드에 대한 확장 방법과 입력 변수 순서의 결정에 의해서 OPKFDD의 크기가 좌우되며 최소의 노드 수를 갖는 OPKFDD의 구성은 매우 어려운 문제로 알려져 있다. 즉, OPKFDD에서의 입력변수와 각 노드의 확장 방법을 병행해서 최적의 해를 구하기 위해서는 η개의 입력변수에 대해서 η!.3$^2$$^n$$^{-1}$의 경우의 수를 고려해야 한다. 따라서 본 논문에서는 주어진 불리안 함수를 OPKFDD의 최적화 표현을 위해 노드 수를 기준으로 하여 입력변수 순서와 각 노드의 확장 방법을 함께 고려하는 혼용 유전자 알고리즘을 제안하며 최소의 노드 수를 갖는 OPKFDD를 생성하기 위해서 다양한 파라미터 값에 따른 실험결과를 제시한다.

  • PDF

개인사업자 부도율 예측 모델에서 신용정보 특성 선택 방법 (The Credit Information Feature Selection Method in Default Rate Prediction Model for Individual Businesses)

  • 홍동숙;백한종;신현준
    • 한국시뮬레이션학회논문지
    • /
    • 제30권1호
    • /
    • pp.75-85
    • /
    • 2021
  • 본 논문에서는 개인사업자 부도율을 보다 정확하게 예측하기 위한 새로운 방법으로 개인사업자의 기업 신용 및 개인 신용정보를 가공, 분석하여 입력 특성으로 활용하는 심층 신경망기반 예측 모델을 제시한다. 다양한 분야의 모델링 연구에서 특성 선택 기법은 특히 많은 특성을 포함하는 예측 모델에서 성능 개선을 위한 방법으로 활발히 연구되어 왔다. 본 논문에서는 부도율 예측 모델에 이용된 입력 변수인 거시경제지표(거시변수)와 신용정보(미시변수)에 대한 통계적 검증 이후 추가적으로 신용정보 특성 선택 방법을 통해 예측 성능을 개선하는 특성 집합을 확인할 수 있다. 제안하는 신용정보 특성 선택 방법은 통계적 검증을 수행하는 필터방법과 다수 래퍼를 결합 사용하는 반복적·하이브리드 방법으로, 서브 모델들을 구축하고 최대 성능 모델의 중요 변수를 추출하여 부분집합을 구성 한 후 부분집합과 그 결합셋에 대한 예측 성능 분석을 통해 최종 특성 집합을 결정한다.

단순 베이즈 분류에서의 범주형 변수의 선택 (Categorical Variable Selection in Naïve Bayes Classification)

  • 김민선;최호식;박창이
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.407-415
    • /
    • 2015
  • 단순 베이즈 분류($Na{\ddot{i}}ve$ Bayes classification)는 출력변수가 주어졌을 때 입력변수들이 조건부 독립이라는 가정에 기반한다. 단순 베이즈 가정은 비현실적이지만 고차원의 확률 추정 문제를 일련의 일차원 확률 추정 문제로 단순화 시킨다는 장점이 있으며, 특히 스팸 메일 필터링, 추천 시스템(recommendation system) 등 방대한 데이터를 다루는 분야야에서 흔히 사용된다. 본 논문에서는 입력변수와 출력변수간의 카이제곱 통계량에 기반한 변수선택법을 제안한다. 이 방법은 단순 베이즈 분류의 장점인 데이터 처리 및 계산의 단순성을 유지하면서도 설명력이 있는 변수를 선택할 수 있으며 SNP(single nucleotide polymorphism)에 의한 질병의 분류 등의 초고차원 혹은 빅데이터에서 유용할 것으로 기대된다.

그룹변수를 포함하는 불균형 자료의 분류분석을 위한 서포트 벡터 머신 (Hierarchically penalized support vector machine for the classication of imbalanced data with grouped variables)

  • 김은경;전명식;방성완
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.961-975
    • /
    • 2016
  • H-SVM은 입력변수들이 그룹화 되어 있는 경우 분류함수의 추정에서 그룹 및 그룹 내의 변수선택을 동시에 할 수 있는 방법론이다. 그러나 H-SVM은 입력변수들의 중요도에 상관없이 모든 변수들을 동일하게 축소 추정하기 때문에 추정의 효율성이 감소될 수 있다. 또한, 집단별 개체수가 상이한 불균형 자료의 분류분석에서는 분류함수가 편향되어 추정되므로 소수집단의 예측력이 하락할 수 있다. 이러한 문제점들을 보완하기 위해 본 논문에서는 적응적 조율모수를 사용하여 변수선택의 성능을 개선하고 집단별 오분류 비용을 차등적으로 부여하는 WAH-SVM을 제안하였다. 또한, 모의실험과 실제자료 분석을 통하여 제안한 모형과 기존 방법론들의 성능 비교하였으며, 제안한 모형의 유용성과 활용 가능성 확인하였다.

통합 연결강도모형에 의한 부도예측용 인공신경망 모형 입력노드 선정에 관한 연구 (Selection of Input Nodes in Artificial Neural Network for Bankruptcy Prediction by Integrated Link Weight Analysis)

  • 이웅규
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.359-368
    • /
    • 2001
  • 본 연구에서는 부도예측용 인공신경망의 입력노드 선정을 위한 휴리스틱으로 연결강도분석 접근법을 제안한다. 연결강도분석은 학습이 끝난 인공신경망에서 입력노드와 은닉노드와 연결된 가중치의 절대값 즉, 연결강도를 분석하여 입력변수를 선정하는 접근법으로, 본 연구에서는 약체연결뉴론제거법, 강체연결뉴론선택법 그리고 이 두 기법을 통합한 통합 연결강도 모형을 제안하여 각각 의사결정 트리 및 다변량판별분석에 의해 선정된 입력변수를 이용한 인공신경망 모형과 예측율을 비교한다. 실험 결과 본 연구에서 제안하고 있는 방법론이 의사결정트리나 다다변량판별분석 기법 보다 높은 예측율을 보여 주었다. 특히 두 기법의 통합연결강도 모형의 경우에는 다른 단일 기법보다 높은 예측율을 보이고 있다.

  • PDF

데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정 (Optimal Identification of Data Granules-based Fuzzy Set Fuzzy Model)

  • 박건준;김완수;오성권;김현기
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.317-320
    • /
    • 2005
  • 본 논문은 비선형 시스템의 퍼지모델을 설계하기 위해 데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정을 제안한다. 퍼지모델은 주로 경험적 방법에 의해 추출되기 때문에 보다 구체적이고 체계적인 방법에 의한 동정 및 최적화 될 필요성이 요구된다. HCM 클러스터링을 통한 데이터 입자는 입력 변수의 개별적인 퍼지 규칙을 형성하고, 퍼지 공간 분할 및 삼각형 멤버쉽 함수의 초기 정점을 정의한다. 또한, 데이터 입자의 중심을 이용하여 후반부의 구조를 결정한다. 초기 퍼지 모델을 동정하기 위해 유전자 알고리즘을 이용하여 입력 변수의 수, 선택될 입력 변수, 멤버쉽 함수의 수, 그리고 후반부 형태를 결정한다. 데이터 입자에 의한 전반부 멤버쉽 파라미터는 유전자 알고리즘을 이용하여 최적으로 동정한다 제안된 모델을 평가하기 위해 수치적인 예를 사용한다.

  • PDF

상호정보량 기법을 이용한 군집분석의 적용성 연구 (Application of Cluster Analysis using Mutual Information)

  • 정영훈;김완수;정창삼;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.414-414
    • /
    • 2011
  • 우리나라 뿐만 아니라 전 세계적으로 기후변화로 인한 집중호우, 폭설 등이 빈번하게 일어나고 있으며 수공구조물 설계에 필요한 확률강우량도 증가하고 있다. 확률강우량을 산정하는 빈도해석의 경우 지점빈도해석의 문제점을 보완한 지역빈도해석에 대한 연구가 꾸준히 진행되고 있다. 지역빈도해석을 적용하기 위해서는 수문학적 동질성을 가지는 지역 구분이 무엇보다 중요하다. 군집 분석은 개체들이 지니고 있는 다양한 속성의 유사성을 동질적인 집단으로 군집화하는 방법을 말한다. 군집분석의 기본원리는 분석하고자 하는 여러 특성등을 유사성(similaruty) 거리(distance)로 환산하고 거리가 상대적으로 가까운 개체들을 동질적으로 군집화하는 것이다. 군집분석을 적용하기 위해서는 기상학적 인자와 지형학적 인자를 이용하여 군집분석을 실시한다. 군집분석을 실시할 때 가장 중요한 것은 입력변수의 선택으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 준다. 상호정보량(Mutual Information, MI) 기법은 두 무작위 변수간의 관련성을 측정하는 방법이며 (Cover and Tomas, 2006), 두 변수간의 독립성 구조에 관한 가정이 없고 데이터 변형이나 잡음(noise)에 대한 영향이 적어 다른 기법보다 신뢰도가 높다고 알려져 있다(Peng et al., 2005). 본 연구에서는 상호정보량 기법을 이용하여 군집된 지점들의 종속성과 독립성의 관계를 정량적으로 산정하여 비교하고자 한다.

  • PDF

PEST를 이용한 GRM 모형의 매개변수 자동추정 모듈 (Auto-Estimation Module of GRM Model Parameters Using PEST)

  • 최윤석;김길호;김경탁;노성진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.431-431
    • /
    • 2015
  • 일반적으로 유량을 계산하는 수문모형은 강우에서부터 유출에 이르는 수문현상을 해석하는 방법에 따라 하나 이상의 매개변수가 이용된다. 이러한 수문모형의 보정은 계산된 유량과 관측 유량을 비교하고, 계산된 유량이 관측유량을 잘 재현할 수 있도록 모형의 매개변수를 반복적으로 수정하는 과정을 통해서 이루어진다. 수문모형의 매개변수는 수문학적으로 의미가 있는 값을 가지며, 매개변수를 수정하기 위해서는 대상 매개변수가 모형내에서 수문학적으로 어떠한 의미를 가지에 대한 이해가 필요하다. 또한 하나의 매개변수는 다른 매개변수와 함께 복합적으로 유량계산에 작용하므로, 다수의 매개변수를 함께 추정하여 최적 계산결과를 도출하는 과정은 일반적으로 전문성과 함께 많은 시간이 소요된다. 본 연구에서는 범용 매개변수 추정모형인 PEST와 GRM 모형을 연계하여 GRM 모형의 매개 변수를 자동으로 추정할 수 있는 모듈을 개발하였다. 개발된 모듈에서는 GRM 모형의 보정을 위한 PEST 모형의 입력파일을 자동으로 생성하고, PEST 혹은 병렬 PEST를 실행할 수 있다. 사용자는 GRM 모형의 추정대상 매개변수 선택, 관측자료 설정, 자동으로 생성된 PEST 입력파일을 확인 및 수정하며, 병렬 PEST를 실행할 경우에는 slave PEST 개수 등을 설정한다. 본 연구에서 개발된 모듈은 OpenGIS인 MapWindow GIS의 Plug-in으로 개발된 GRM(MW-GRM)에서 메뉴로 제공되며, GUI를 통해서 편리하게 활용될 수 있다. 본 연구에서는 물리적 분포형 모형인 GRM의 보정시 다수의 매개변수를 편리하게 추정할 수 있는 방안을 마련하였다. 본 연구의 결과는 강우-유출 해석 분야에서 GRM 모형이 좀 더 쉽게 활용되는 데 기여할 수 있을 것이다.

  • PDF

효과적인 영상 인식을 위한 개선된 퍼지 ART 알고리즘 (An Enhanced Fuzzy ART Algorithm for Effective Image Recognition)

  • 김광백;박충식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.262-267
    • /
    • 2007
  • 퍼지 ART 알고리즘에서 경계 변수는 패턴들을 클러스터링하는데 있어서 반지름 값이 되며 임의의 패턴과 저장된 패턴과의 불일치(mismatch) 허용도를 결정한다. 이 경계 변수가 크면 입력 벡터와 기대 벡터 사이에 약간의 차이가 있어도 새로운 카테고리(category)로 분류하게 된다. 반대로 경계 변수가 작으면 입력 벡터와 기대 벡터 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 벡터들을 대략적으로 분류한다. 따라서 영상 인식에 적용하기 위해서는 경험적으로 경계 변수를 설정해야 단점이 있다. 그리고 연결 가중치를 조정하는 과정에서 학습률의 설정에 따라 저장된 패턴들의 정보들이 손실되는 경우가 발생하여 인식율을 저하시킨다. 본 논문에서는 퍼지 ART 알고리즘의 문제점을 개선하기 위하여 퍼지 논리 접속 연산자를 이용하여 경계 변수를 동적으로 조정하고 저장 패턴들과 학습 패턴간의 실제적인 왜곡 정도를 충분히 고려하여 승자 노드로 선택된 빈도수를 학습률로 설정하여 가중치 조정에 적용한 개선된 퍼지 ART 알고리즘을 제안하였다. 제안된 방법의 성능을 확인하기 위해서 실제 영문 명함에서 추출한 영문자들을 대상으로 실험한 결과, 기존의 ART1과 ART2 알고리즘이나 퍼지 ART 알고리즘보다 클러스터의 수가 적게 생성되었고 인식 성능도 기존의 방법들보다 우수한 성능이 있음을 확인하였다.

  • PDF