• 제목/요약/키워드: Generalization Error

검색결과 110건 처리시간 0.022초

HCM 클러스터링에 의한 다중 퍼지-뉴럴 네트워크 동정과 유전자 알고리즘을 이용한 이의 최적화 (Multi-FNN Identification by Means of HCM Clustering and ITs Optimization Using Genetic Algorithms)

  • 오성권;박호성
    • 한국지능시스템학회논문지
    • /
    • 제10권5호
    • /
    • pp.487-496
    • /
    • 2000
  • 본 논문에서는, HCM 클러스러팅 방법과 유전자 알고리즘을 이용하여 다중 FNN 모델을 동정하고 최적화 한다. 제안된 다중 FNN은 Yamakawa의 FNN을 기본으로 하며, 퍼지 추론 방법으로 간략 추론을, 학습으로는 오류 역전파 알고리즘을 사용한다. 다중 FNN 모델의 구조와 파라미터를 동정하기 위해 HCM 클러스터링과 유전자 알고리즘을 사용한다. 여기서, 시스템 모델링을 위해 데이터 전처리 기능을 수행하는 HCM클러스터링 방법은 I/O 프로세서 공정 데이터를 이용하여 입출력 공간분할에 의한 다중 FNN 구조를 결정하기 위해 사용된다. 또한 유전자 알고리즘을 사용하여 멤버쉽함수의 정점, 학습율, 모멘텀 계수와 같은 다중 FNN 모델의 파라미터들을 동조한다. 모델의 근사화와 일반화 능력 사이에 합히적 균형을 얻기 위해 하중계수를 가진 합성 성능지수를 사용한다. 이 합성 성능지수는 근사화 및 예측 능력사이의 상호 균형과 의존성을 고려한 하중계수를 가진 합성 목적함수를 의미한다. 데이터 개수, 비선형성의 정도에 의존하는 이 합성 목적함수의 하중계수의 선택, 조절을 통하여 최적의 다중 FNN 모델을 설계하는 것이 유용하고 효과적임을 보인다. 제안된 모델의 성능 평가를 위하여 가스로 공정의 시계열 데이터와 비선형 함수의 수치 데이터를 사용한다.

  • PDF

갈로이 선형 궤환 레지스터의 일반화 (Generalization of Galois Linear Feedback Register)

  • 박창수;조경언
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.1-8
    • /
    • 2006
  • 본 논문은 의사난수발생기로 사용할 수 있는 산술 시프트 레지스터(ASR, Arithmetic Shift Register)를 제안한다. 산술 시프트 레지스터는 $GF(2^n)$상에서 0이 아닌 초기 값에 0 또는 1이 아닌 임의의 수 D를 곱하는 수열로 정의한다. 그리고 이를 본 논문에서는 ASR-D로 표현한다. $GF(2^n)$상에서 $'D^k=1'$ 되는 t가 $'t=2^n-1'$로 유일하게 되는 비복원다항식이 ASR-D의 특성다항식이며, ASR-D의 주기는 $'2^n-1'$로 최대주기를 가진다 갈로이 선형 궤환 시프트 레지스터는 $ASR-2^{-1}$에 해당한다. 그러므로 제안하는 산술 시프트 레지스터는 갈로이 선형 제환 시프트 레지스터를 일반화한 것이다. $GF(2^n)$상의 ASR-D의 선형복잡도는 $'n{\leq}LC{\leq}\frac{n^2+n}{2}'$으로 종래의 선형 궤환 시프트 레지스터와 비교하여 안정도가 높다. 제안한 산술 시프트 레지스터의 소프트웨어 구현은 종래의 선형 제환 시프트 레지스터에 비하여 효율적이며, 하드웨어 복잡도는 동일하다. 제안한 산술 시프트 레지스터는 종래의 선형 제환 시프트 레지스터와 같이 암호, 오류수정부호, 몬테카를로 적분, 데이터통신 등 여러 분야에서 폭 넓게 사용될 수 있다.

가상 데이터와 융합 분류기에 기반한 얼굴인식 (Face Recognition based on Hybrid Classifiers with Virtual Samples)

  • 류연식;오세영
    • 전자공학회논문지CI
    • /
    • 제40권1호
    • /
    • pp.19-29
    • /
    • 2003
  • 본 논문은 인위적으로 생성된 가상 학습 데이터와 융합 분류기를 이용한 얼굴인식 알고리즘을 제안한다. 특징공간에서의 최근접 특징 선택 방법과 연결주의 모델에 기반한 서로 다른 형태의 분류기를 융합하여 통합효과를 얻도록 하였다. 두 분류기는 모두 학습 데이터의 공간적인 분포에 따라 생성된 가상 학습데이터를 이용하여 학습되고 이용된다. 첫째로, 특징 공간에서의 각 정보(Angular Infnrmation) 를 이용하는 최근접특징각(the Nearest Feature Angle : NFA)을 이용하여 저장된 학습데이터와 가장 근접한 것을 찾고, 둘째로, 질의(Query) 얼굴 특징 정보를 정면얼굴 영상의 특징정보로 투영하여 얻은 정보에 기반한 분류기의 결과를 이용한다. 정면영상 특징정보로의 투영은 다층 신경망을 이용하여 정면 회상망(Frontal Recall Network)을 구현하였고, 이것을 여러 개 묶어 앙상블 네트웍으로 구성한 Ensemble 회상망(Ensemble Recall Network)을 사용하여 일반화 성능을 향상시켰다. 끝으로, 각 분류기의 결과에 따라 융합 분류기가 최종 결과를 선택하도록 하였다. 제안된 알고리즘을 6 종류의 서고 다른 학습/시험데이터 군에 적용하여 평균 96.33%의 인식률을 얻었다. 이것은 특징라인에 기반한 방법(the Nearest Feature Line) 평균 에러율의 61.2% 이며, 단일 분류기를 사용한 경우 보다 안정된 견과를 얻고 있다.

유전 알고리즘 - 서포트 벡터 회귀를 활용한 공동주택 공사비 예측에 관한 연구 (A Study on Estimating Construction Cost of Apartment Housing Projects Using Genetic Algorithm-Support Vector Regression)

  • 남군;최재웅;최혜미;김주형
    • 한국건설관리학회논문집
    • /
    • 제15권4호
    • /
    • pp.68-76
    • /
    • 2014
  • 건축 프로젝트에서 초기단계에서의 정확한 공사비 예측은 성공적인 프로젝트의 중요한 요소이다. 기존의 연구에서 공사비를 예측하기 위한 방법으로 통계학적인 방법이 활용되었다. 통계학적 방법 중 서포트 벡터 회기분석은 비용예측 분야에서 뛰어난 일반화 능력으로 많은 주목을 받고 있다. 하지만 서포트 회귀분석은 조정해야 할 파라미터가 단순함에도 불구하고 최적의 파라미터를 결정하는 방법은 시행착오적인 방법을 적용해야 하는 문제점이 있었다. 따라서 최적의 파라미터를 보다 효율적으로 결정하기 위해 본 연구에서는 유전 알고리즘을 적용하고, 이를 통해 서포트 벡터 회귀를 효율적으로 활용한 공사비 예측이 가능 할 것이다. 본 연구의 목적은 유전 알고리즘과 서포트 벡터 회귀를 활용하여 공동주택의 프로젝트 초기 기획단계의 공사비 예측모델을 구축하는 것이다. 유전 알고리즘을 통해 최적의 파라미터를 찾아내고, 이를 서포트 벡터 회귀모델에 적용시켜 공사비를 예측하였다.

역전파 학습 알고리즘을 이용한 콘크리트와 부착된 FRP 판의 부착강도 모델 개발 (Development of Bond Strength Model for FRP Plates Using Back-Propagation Algorithm)

  • 박도경
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제10권2호
    • /
    • pp.133-144
    • /
    • 2006
  • FRP 판은 외부 부착된 보강 판의 효과적인 부착강도의 증진으로 실질적으로 부착강도에 대한 많은 연구가 수행되어왔다. 선행연구자들은 이러한 부착강도를 알아보기 위하여 다양한 변수를 설정하여 실험을 통하여 FRP 판의 부착강도를 규명하였다. 그러나, 이러한 부착강도를 알아보기 위한 실험은 장비구축의 비용과 시간 소비가 많이 되고 수행하기 어렵기 때문에 국한적으로 수행되고 있다. 본 연구는 선행연구자들의 부착실험 데이터를 다양한 신경망 모형과 알고리즘을 적용하여 최적의 인공신경망 모형을 개발하는데 그 목적이 있다. 인공신경망 모형의 출력층은 부착강도, 입력층은 FRP 판의 두께, 폭, 부착 길이, 탄성계수, 인장강도와 콘크리트의 압축강도, 인장강도, 폭을 변수로 선정하여 학습을 수행하였다. 개발된 인공신경망 모형은 역전파 학습 알고리즘을 적용하였으며, 오차는 0.001범위에 수렴되도록 학습을 하였다. 또한, 일반화 과정은 Bayesian 기법을 도입함으로써 보다 일반화된 방법으로 과대적합의 문제를 해소하였다. 개발된 모형의 검증은 학습에 이용되지 않은 다른 선행연구자들의 부착강도 결과 값과 비교함으로서 실시하였다.

멀티태스크 러닝 심층신경망을 이용한 화자인증에서의 나이 정보 활용 (Utilization of age information for speaker verification using multi-task learning deep neural networks)

  • 김주호;허희수;정지원;심혜진;김승빈;유하진
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.593-600
    • /
    • 2019
  • 화자 간 음색의 유사성은 화자 인증 시스템의 성능을 하락 시킬 수 있는 요인이다. 본 논문은 화자 인증 시스템의 일반화 성능을 향상시키기 위해, 심층신경망에 멀티태스크 러닝 기법을 적용시켜 발화자의 화자 정보와 나이 정보를 함께 학습 시키는 기법을 제안한다. 멀티태스크 러닝 기법은 은닉층들이 하나의 태스크에 과적합 되지 않도록 하여 심층신경망의 일반화 성능을 향상시킨다고 알려져 있다. 하지만 심층신경망을 멀티태스크 러닝 기법으로 학습시키는 과정에서, 나이 정보에 대한 학습이 효율적으로 수행되지 않는 것을 실험적으로 확인하였다. 이와 같은 현상을 방지하기 위해, 본 논문에서는 심층신경망의 학습 과정 중 화자 식별과 나이 추정 목적 함수의 가중치를 동적으로 변경 하는 기법을 제안한다. 동일 오류율을 기준으로 RSR2015 평가 데이터세트에 대해 화자 인증 성능을 평가한 결과 나이 정보를 활용하지 않은 화자 인증 시스템의 경우 6.91 %, 나이 정보를 활용한 화자 인증 시스템의 경우 6.77 %, 나이 정보를 활용한 화자 인증 시스템에 가중치 변경 기법을 적용한 경우 4.73 %의 오류율을 확인하였다.

순환 아키텍쳐 및 하이퍼파라미터 최적화를 이용한 데이터 기반 군사 동작 판별 알고리즘 (A Data-driven Classifier for Motion Detection of Soldiers on the Battlefield using Recurrent Architectures and Hyperparameter Optimization)

  • 김준호;채건주;박재민;박경원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.107-119
    • /
    • 2023
  • 군인의 동작 및 운동 상태를 인식하는 기술은 웨어러블 테크놀로지와 인공지능의 결합으로 최근 대두되어 병력 관리의 패러다임을 바꿀 기술로 주목받고 있다. 이때 훈련 상황에서의 평가 및 솔루션 제공, 전투 상황에서의 효율적 모니터링 기능을 의도한대로 제공하기 위해서는 상태 판별의 정확도가 매우 높은 수준으로 유지되어야만 한다. 하지만 입력 데이터가 시계열 또는 시퀀스로 주어지는 경우, 기존의 피드포워드 신경망으로는 분류 성능을 극대화하는데 한계가 발생한다. 전장에서의 군사 동작 인식을 위해 다뤄지는 인간의 행동양식 데이터(3축 가속도 및 3축 각속도)는 시의존적 특성의 분석이 요구되기 때문에, 본 논문은 순환 신경망인 LSTM(Long-short Term Memory) 네트워크를 활용하여 취득 데이터의 이동 양상 및 순서 의존성을 파악하고 여덟 가지의 대표적 군사 동작(Sitting, Standing, Walking, Running, Ascending, Descending, Low Crawl, High Crawl)을 분류하는 고성능 인공지능 모델을 제안한다. 이때, 학습 조건 및 모델 변수는 그 정확도에 결정적인 영향을 끼치지만 인간의 수동적 조정이 필요해 비용 비효율적이고 최적의 값을 보장하지 못한다. 본 논문은 기계 스스로 일반화 성능이 극대화된 조건들을 취득할 수 있도록 베이지안 최적화를 활용해 하이퍼파라미터를 최적화한다. 그 결과, 최종 아키텍쳐는 학습 가능한 파라미터의 개수가 유사한 기존의 인공 신경망과 비교해서 오차율이 62.56% 감소할 수 있었으며, 최종적으로 98.39%의 정확도로 군사 동작 인식 기능을 구현할 수 있었다.

유전자 알고리즘을 이용한 분류자 앙상블의 최적 선택 (Optimal Selection of Classifier Ensemble Using Genetic Algorithms)

  • 김명종
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.99-112
    • /
    • 2010
  • 앙상블 학습은 분류 및 예측 알고리즘의 성과개선을 위하여 제안된 기계학습 기법이다. 그러나 앙상블 학습은 기저 분류자의 다양성이 부족한 경우 다중공선성 문제로 인하여 성과개선 효과가 미약하고 심지어는 성과가 악화될 수 있다는 문제점이 제기되었다. 본 연구에서는 기저 분류자의 다양성을 확보하고 앙상블 학습의 성과개선 효과를 제고하기 위하여 유전자 알고리즘 기반의 범위 최적화 기법을 제안하고자 한다. 본 연구에서 제안된 최적화 기법을 기업 부실예측 인공신경망 앙상블에 적용한 결과 기저 분류자의 다양성이 확보되고 인공신경망 앙상블의 성과가 유의적으로 개선되었음을 보여주었다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.