• 제목/요약/키워드: 과적합

검색결과 133건 처리시간 0.03초

BP알고리즘과 SVM을 이용한 심전도 신호의 패턴 분류 (Pattern Classification for Biomedical Signal using BP Algorithm and SVM)

  • 김만선;이상용
    • 한국지능시스템학회논문지
    • /
    • 제14권1호
    • /
    • pp.82-87
    • /
    • 2004
  • 심전도 데이터는 심장의 전기적인 신호의 다양한 파형으로 이루어지며, 이와 같은 파형을 분석하고 분류하기 위하여 데이터마이닝 기법을 이용할 수 있다. 심전도신호를 분류하기 위한 기존의 연구들은 왜곡된 특징추출과 과적합 등 문제점을 가지고 있다. 본 연구에서는 이와 같은 문제점들을 해결하기 위하여 BP 알고리즘과 SVM을 이용하여 심전도 신호를 분류해 보았다 그 결과 SVM이 신경망에서 발생하는 과적합을 효과적으로 방지하고, 유일한 전역해를 보장함으로써, 일반화 성능에서 우수함을 보이고 있다는 사실을 확인하였다.

문법 오류 교정을 위한 적대적 학습 방법 (Adversarial Training for Grammatical Error Correction)

  • 권순철;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.446-449
    • /
    • 2020
  • 최근 성공적인 문법 오류 교정 연구들에는 복잡한 인공신경망 모델이 사용되고 있다. 그러나 이러한 모델을 훈련할 수 있는 공개 데이터는 필요에 비해 부족하여 과적합 문제를 일으킨다. 이 논문에서는 적대적 훈련 방법을 적용해 문법 오류 교정 분야의 과적합 문제를 해결하는 방법을 탐색한다. 모델의 비용을 증가시키는 경사를 이용한 fast gradient sign method(FGSM)와, 인공신경망을 이용해 모델의 비용을 증가시키기 위한 변동을 학습하는 learned perturbation method(LPM)가 실험되었다. 실험 결과, LPM은 모델 훈련에 효과가 없었으나, FGSM은 적대적 훈련을 사용하지 않은 모델보다 높은 F0.5 성능을 보이는 것이 확인되었다.

  • PDF

자율주행 트랙터 환경에서 쓰러진 사람에 대한 데이터 증강 (Dataset Augmentation on Fallen Person Objects in a Autonomous Driving Tractor Environment)

  • 백화평;안한세;채희성;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.553-556
    • /
    • 2023
  • 데이터 증강은 데이터 불균형 문제를 해결하기 위해 일반화 성능을 향상시킨다. 이는 과적합 문제를 해결하고 정확도를 높이는 데 도움을 준다. 과적합을 해결하기 위해서 본 논문에서는 분할 마스크 라벨링을 자동화하여 효율성을 높이고, RoI를 활용한 분할 Copy-Paste 데이터 증강 기법을 제안한다. 본 논문의 제안 방법을 적용한 결과 YOLOv8 모델에서 기존의 분할, 박스 Copy-Paste 데이터 증강 기법과 비교해서 쓰러진 사람 객체에 대한 정확도가 10.2% 증가함으로써 제안한 방법이 일반화 성능을 높이는 데 효과가 있음을 확인하였다.

샘플 군집화를 이용한 개선된 아다부스트 알고리즘 (An Improved AdaBoost Algorithm by Clustering Samples)

  • 백열민;김중근;김회율
    • 방송공학회논문지
    • /
    • 제18권4호
    • /
    • pp.643-646
    • /
    • 2013
  • 본 논문에서는 아다부스트의 과적합 문제를 해결하기 위해 샘플 군집화를 이용한 개선된 아다부스트 알고리즘을 제안한다. 아다부스트는 다양한 객체 검출 방법에서 좋은 성능을 보이는 방법으로 알려져 있지만 훈련 샘플에 노이즈가 존재하는 경우 과적합 현상이 발생하는 문제가 있다. 이를 해결하기 위해 제안하는 방법은 우선 훈련 샘플의 긍정 샘플을 k-평균 군집화 알고리즘을 이용하여 K개의 군집으로 나눈다. 이후 아다부스트의 약분류기 훈련 시 K개의 군집 중 훈련 오차를 최소화하는 하나의 군집만을 선택하여 사용한다. 이로써, 제안하는 방법은 매 회 반복되는 약분류기의 훈련 시 훈련 샘플들이 과분할 되는 것과 노이즈 샘플이 훈련에 사용되는 것을 방지함으로써 기존 아다부스트의 과적합 현상을 효과적으로 줄여준다. 실험 결과, 제안하는 방법은 다양한 실제 데이터셋에서 기존의 부스팅 기반 방법들에 비해 더 나은 분류 성능 및 일반화 성능을 보여주었다.

하이브리드 드롭아웃 (Hybrid dropout)

  • 박종선;이명규
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.899-908
    • /
    • 2019
  • 수 많은 모수들을 가지고 있는 방대한 심층신경망은 매우 강력한 기계학습 방법이지만 모형의 과도한 융통성으로 인하여 과적합문제를 내포하고 있다. 드롭아웃 방법은 크기가 큰 신경망의 과적합 문제를 해결하는 다양한 방법들 중 하나이며 매우 효과적인 방법으로 알려져 있다. 드롭아웃 방법은 훈련과정에서 각각의 표본에 다른 모형을 적용하는데 이들 모형은 입력과 은닉층의 노드들을 무작위로 제거한 모형들 중에 임의로 선택된다. 본 연구에서는 임의로 선택된 모형에 둘 이상의 표본을 적용하여 모형의 가중치들에 대한 추정치의 안정성을 높이는 하이브리드 드롭아웃 방법을 제시하였다. 실제 자료를 이용한 시뮬레이션 결과 노드의 선택확률과 모형의 적합에 사용되는 표본의 수를 적절하게 선택하여 기존의 방법에 비하여 추정치의 변동성이 감소시킬 수 있었으며 동시에 검증자료에 대한 최저오차도 줄일 수 있음을 보였다.

얼굴 표정인식을 위한 2D-DCT 특징추출 방법 (Feature Extraction Method of 2D-DCT for Facial Expression Recognition)

  • 김동주;이상헌;손명규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권3호
    • /
    • pp.135-138
    • /
    • 2014
  • 본 논문에서는 2D-DCT와 EHMM 알고리즘을 이용하여 과적합에 강인한 얼굴 표정인식 방법을 고안하였다. 특히, 본 논문에서는 2D-DCT 특징추출을 위한 윈도우 크기를 크게 설정하여 EHMM의 관측벡터를 추출함으로써, 표정인식 성능 향상을 도모하였다. 제안 방법의 성능평가는 공인 CK 데이터베이스와 JAFFE 데이터베이스를 이용하여 수행되었고, 실험 결과로부터 특징추출 윈도우의 크기가 커질수록 표정 인식률이 향상됨을 확인하였다. 또한, CK 데이터베이스를 이용하여 표정 모델을 생성하고 JAFFE 데이터베이스 전체 샘플을 테스트한 결과, 제안 방법은 87.79%의 높은 인식률을 보였으며, 기존의 히스토그램 특징 기반의 표정인식 접근법보다 46.01~50.05%의 향상된 인식률을 보였다.

베이지안 진화 학습 알고리즘을 사용한 시계열 예측 (Times Series Prediction by Using Bayesian Evolutionary Algorithms)

  • 조동연;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.247-249
    • /
    • 2000
  • 본 논문에서는 대개 잡음이 포함되어 있고 불규칙적인 특성을 갖고 있는 시계열 자료에 대해 신경 트리 모델을 사용하여 시계열 예측 문제를 해결하고자 한다. 주어진 시계열 자료에 적합한 구조와 가중치를 갖는 신경트리를 찾기 위해 베이지안 진화 알고리즘을 적용한 결과, 자료의 개수가 적어 과적합될 우려가 있는 경우 제안된 방법은 모델의 복잡도가 커지는 것을 억제하고 일반화 성능이 급격하게 나빠지지 않는다는 것을 확인하였다.

  • PDF

CDBSMOTE : 클래스와 밀도기반의 합성 소수 오버샘플링 기술 (CDBSMOTE : Class and Density Based Synthetic Minority Oversampling Technique)

  • 배경환;이경현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.629-632
    • /
    • 2021
  • 머신러닝의 성능 저하에 크게 영향을 미치는 데이터 불균형은 데이터를 증강하거나 제거하여 해결할 수 있다. 본 논문에서는 지도학습에서 쓰이는 정답 데이터를 기반으로 새로운 데이터 증강기법인 CDBSMOTE을 제안한다. CDBSMOTE을 사용하면 임의의 값을 사용하지 않고, 기존의 데이터 증강기법의 문제점이었던 과적합을 최소화하며 지도학습 데이터를 효과적으로 증강시킬 수 있다.

전처리를 통한 페트병 이미지 분류모델 성능 개선 (Improving PET Bottle Image Classification Model Performance via Preprocessing)

  • 이동현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.473-474
    • /
    • 2023
  • 잘못된 분리수거는 다른 재활용 폐기물의 재활용을 제한한다. 본 논문에서는 올바른 분리수거를 위해 페트병 라벨 유무 분류 모델을 구현했다. 초기 모델의 낮은 성능을 개선하기 위해 이미지 데이터의 노이즈를 줄이는 편집을 거치고 데이터 증강을 적용하였으며, 모델 개선 작업을 진행하여 과적합을 피하면서 더 나은 성능을 도출했다. 최종 모델은 초기 모델보다 비교적 우수한 성능을 보였으나, 실제 활용 면에서는 낮은 성능을 나타냈다. 이는 학습 데이터의 질과 데이터양의 부족에서 나타난 결과로 볼 수 있다.

저수지 유입량 예측을 위한 신경망 모형의 특성 연구 (A Study on Characteristics of Neural Network Model for Reservoir Inflow Forecasting)

  • 김재형;윤용남
    • 한국방재학회 논문집
    • /
    • 제2권4호
    • /
    • pp.123-129
    • /
    • 2002
  • 본 연구에서는 3층 신경망 모형에 의해 충주호의 유입량을 예측한 결과들을 이용하여 신경망 모형의 저수지 유입량 예측 특성을 분석하였다. 신경망 모형의 적절한 입력층 및 은닉층 뉴런 개수, 학습회수를 제시하였으며, 학습 첨두유량 크기가 예측된 첨두유량보다 작을 경우 예측 값이 과소평가되는 특징을 확인하였다. 또한 뉴런 개수, 학습회수가 과다할 경우 발생 가능한 과적합 현상을 확인하였으며, 정확한 예측을 위해 필요한 최소 학습자료 기간도 제시하였다. 결과적으로 충주호의 경우 $8{\sim}10$개의 뉴런 개수 및 $1500{\sim}3000$회의 학습회수를 이용한 신경망 모형이 적합한 것으로, 학습자료 기간 수는 최소한 600개 이상의 자료를 적용하여야 정확한 예측이 가능한 것으로 결과되었다.