• 제목/요약/키워드: Overfitting 문제

검색결과 69건 처리시간 0.022초

변분 베이지안 방법을 이용한 점집합의 오차제거 (Point Set Denoising Using a Variational Bayesian Method)

  • 윤민철;;이승용
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권5호
    • /
    • pp.527-531
    • /
    • 2008
  • 스캐너를 이용해 스캔한 데이타는 오차를 포함하고 있으며, 이러한 오차는 통계적인 성질을 갖는 경우가 많다. 이러한 이유에서 통계적인 방법은 오차 처리를 위해 매우 효과적인 방법이며, 최근 많은 연구가 이루어지고 있다. 이러한 통계적인 방법 중 대표적인 방법인 점 추정 방법은 데이타의 여러 성질을 나타내지 못하고 단지 확률이 최대가 되는 부분의 성질만을 나타내는 한계가 있으며, 이러한 한계로 인하여 오버피팅 문제가 발생하게 된다. 이러한 한계를 극복하고 오버피팅 문제를 해결하기 위해서 본 논문에서는 변분 베이지안 방법을 이용한다. 점집합의 오차를 제거하기 위해 지역적 근사곡면을 사용하고, 높이함수를 이용해서 근사곡면을 나타낸다. 변분 베이지안 방법을 사용하여 오차가 제거된 근사곡면을 구하고, 주어진 점들을 근사곡면으로 매핑하여 오차를 제거한다. 제시된 방법은 계량적 실험과 실제 스캔된 자료를 이용한 실험을 통하여 검증된다.

하이브리드 드롭아웃 (Hybrid dropout)

  • 박종선;이명규
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.899-908
    • /
    • 2019
  • 수 많은 모수들을 가지고 있는 방대한 심층신경망은 매우 강력한 기계학습 방법이지만 모형의 과도한 융통성으로 인하여 과적합문제를 내포하고 있다. 드롭아웃 방법은 크기가 큰 신경망의 과적합 문제를 해결하는 다양한 방법들 중 하나이며 매우 효과적인 방법으로 알려져 있다. 드롭아웃 방법은 훈련과정에서 각각의 표본에 다른 모형을 적용하는데 이들 모형은 입력과 은닉층의 노드들을 무작위로 제거한 모형들 중에 임의로 선택된다. 본 연구에서는 임의로 선택된 모형에 둘 이상의 표본을 적용하여 모형의 가중치들에 대한 추정치의 안정성을 높이는 하이브리드 드롭아웃 방법을 제시하였다. 실제 자료를 이용한 시뮬레이션 결과 노드의 선택확률과 모형의 적합에 사용되는 표본의 수를 적절하게 선택하여 기존의 방법에 비하여 추정치의 변동성이 감소시킬 수 있었으며 동시에 검증자료에 대한 최저오차도 줄일 수 있음을 보였다.

딥러닝 기반 CCTV 화재 감지 시스템 (Deep Learning Based CCTV Fire Detection System)

  • 임지현;박현호;이원재;김성현;이용태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.139-141
    • /
    • 2017
  • 화재는 다른 재난보다 확산 속도가 빠르기 때문에 신속하고 정확한 감지와 지속적인 감시가 요구된다. 최근, 신속하고 정확한 화재 감지를 위해, CCTV(Closed-Circuit TeleVision)으로 획득한 이미지를 기계학습(Machine Learning)을 이용해 화재 발생 여부를 감지하는 화재 감지 시스템이 주목받고 있다. 본 논문에서는 기계학습의 기술 중 정확도가 가장 높은 딥러닝(Deep Learning)기반의 CCTV 화재 감지 시스템을 제안한다. 본 논문의 시스템은 딥러닝 기술 적용뿐만이 아니라, CCTV 이미지 전처리 과정을 보완함으로써 딥러닝에서의 미지 데이터(unseen data)의 낮은 분류 정확도 문제인 과적합(overfitting)문제를 해결하였다. 본 논문의 시스템은 약 80,000 개의 CCTV 이미지 데이터를 학습하여, 90% 이상의 화재 이미지 분류 정확도의 성능을 보여주었다.

  • PDF

불균형 블랙박스 동영상 데이터에서 충돌 상황의 다중 분류를 위한 손실 함수 비교 (Comparison of Loss Function for Multi-Class Classification of Collision Events in Imbalanced Black-Box Video Data)

  • 이의상;한석민
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.49-54
    • /
    • 2024
  • 데이터 불균형은 분류 문제에서 흔히 마주치는 문제로, 데이터셋 내의 클래스간 샘플 수의 현저한 차이에서 기인한다. 이러한 데이터 불균형은 일반적으로 분류 모델에서 과적합, 과소적합, 성능 지표의 오해 등의 문제를 야기한다. 이를 해결하기 위한 방법으로는 Resampling, Augmentation, 규제 기법, 손실 함수 조정 등이 있다. 본 논문에서는 손실 함수 조정에 대해 다루며 특히, 불균형 문제를 가진 Multi-Class 블랙박스 동영상 데이터에서 여러 구성의 손실 함수(Cross Entropy, Balanced Cross Entropy, 두 가지 Focal Loss 설정: 𝛼 = 1 및 𝛼 = Balanced, Asymmetric Loss)의 성능을 I3D, R3D_18 모델을 활용하여 비교하였다.

병원 외래환자수의 예측을 위한 시계열 데이터처리 딥러닝 시스템 (Time Series Data Processing Deep Learning system for Prediction of Hospital Outpatient Number)

  • 조준모
    • 한국전자통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.313-318
    • /
    • 2021
  • 딥러닝 기술의 도래로 인하여 수많은 산업과 일반적인 응용에 적용됨으로써 우리의 생활에 큰 영향을 발휘하고 있다. 특정한 분야의 문제를 해결하기 위해서는 그 문제에 적합한 딥러닝 모델을 작성해야 한다. 근래에는 COVID-19 사태로 인하여 다양한 문제들을 딥러닝으로 해결하고자 하는 사례들이 늘고 있다. 이러한 일환으로 본 논문에서는 갑자기 급증할 수 있는 병원의 외래환자들을 미리 예측을 위한 시계열의 딥러닝 모델을 제시하고자 한다. 제시하는 딥러닝 모델은 주피터 노트북에서 케라스로 작성하였다. 예측결과는 실제 데이터와 그래프로 비교하며 유효성 데이터를 활용하여 과소적합과 과대적합의 여부를 손실률로 분석할 수 있도록 하였다.

Conditional Expectation을 이용한 영상의 노출 보정 (Image Exposure Compensation Based on Conditional Expectation)

  • 김동식;이수연
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.121-132
    • /
    • 2005
  • 사진기에서 고품질의 영상을 획득하기 위해서는 적절히 노출 시간을 조절하게 되는데 이로 인해 각각 독립적으로 얻어진 영상들의 노출 시간은 서로 달라진다. 이는 여러 영상의 열을 정렬하는 과정 등에서 부정확한 결과를 초래할 수 있으므로 영상들의 노출 시간을 동일하게 맞추어 줄 필요가 있다. 그런데, 노출 시간을 알지 못하는 경우에는, 하나의 영상을 기준으로 다른 영상들의 상대적 노출 시간을 추정하고 보정하는 알고리즘에 대한 연구가 필요하다. 본 논문에서는, 사진기의 모델 함수를 고려할 필요 없는, 최소 오류 개념에서 최적의 예측기인 conditional expectation을 사용하여 노출 보정을 시도하였다. 나아가서, 불규칙한 노출 또는 히스토그램 특성을 위한 적응 노출 보정 기법을 제안하였다. 이때 blocking artifact 및 overfitting 등의 문제를 완화시키기 위한 인접의 화소를 사용하는 기법을 도입하였다. 디지털 사진기 및 투과전자현미경을 통하여 얻어진 실제 영상을 사용한 모의실험을 통하여 성공적인 노출 보정 수행을 확인할 수 있었다.

R-CORE를 통한 베이지안 망 구조 학습의 탐색 공간 분석 (Search Space Analysis of R-CORE Method for Bayesian Network Structure Learning and Its Effectiveness on Structural Quality)

  • 정성원;이도헌;이광형
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.572-578
    • /
    • 2008
  • 본 논문에서는 대규모 베이지안 망 구조 학습을 위해 제안되었던 R-CORE 방법의 탐색 공간의 크기에 대한 개략적인 분석과 실제 문제에 적용하였을 경우의 효과에 대한 실험적 결과를 제시한다. R-CORE 방법은 베이지안 망 구조 학습의 탐색 공간을 축소하기 위해 제안된 확률변수들의 재귀적 군집화와 오더 제한 방법이다. 알려진 벤치마크 베이지안 망을 이용한 분석을 통해, 제안되었던 R-CORE 방법이 worst case에는 기존의 방법과 유사한 탐색 공간을 가지나 평균적으로 기존방법보다 훨씬 적은 탐색 공간만을 고려한다는 것을 보인다. 또한 평균적으로 훨씬 적은 탐색 공간만을 고려하는 결과, 구조 탐색에서 기존 방법에 비해 상대적으로 적은 overfitting이 일어남을 실험적으로 보인다.

경계변수 값의 동적인 변경을 이용한 점층적 클러스터링 알고리즘 (Incremental Clustering Algorithm by Modulating Vigilance Parameter Dynamically)

  • 신광철;한상용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1072-1079
    • /
    • 2003
  • 본 논문은 점층적으로 대규모 문서 분류를 할 수 있는 새로운 클러스터링 알고리즘에 대한 것으로, 고차원의 대규모 문서 집합에 대한 클러스터링을 수행하는 spherical k-means (SKM) 알고리즘과 점층적인 방식으로 클러스터링을 수행하는 퍼지(fuzzy) ART(adaptive resonance theory) 신경망의 특징을 이용하였다. 즉, SKM의 벡터 공간 모델과 개념벡터를 토대로 퍼지 ART의 경계변수의 개념을 결합한 것이다. 제시하는 알고리즘은 점층적 클러스터링의 지원과 함께 최적의 클러스터 수를 자동으로 결정할 뿐 아니라 이상치(outlier)와 노이즈(noise)에 의한 overfitting의 문제도 해결하였다. 또한 생성된 클러스터들의 질을 평가할 수 있는 응집도를 측정하는 목적 함수의 값에 있어서도 CLASSIC3 데이타 집합으로 실험한 결과 기존의 SKM에 비해 평균 8.04%의 향상된 응집도를 나타냈다.

정규화 및 항등사상이 활성함수 성능에 미치는 영향 (The Effect of regularization and identity mapping on the performance of activation functions)

  • 류서현;윤재복
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.75-80
    • /
    • 2017
  • 본 논문에서는 딥러닝에서 활용되는 정규화(regularization) 및 항등사상(identity mapping)이 활성함수(activation function) 성능에 미치는 영향에 대해 설명한다. 딥러닝에서 활성함수는 비선형 변환을 위해 사용된다. 초기에는 sigmoid 함수가 사용되었으며, 기울기가 사라지는 기존의 활성함수의 문제점을 극복하기 위해 ReLU(Rectified Linear Unit), LReLU(Leaky ReLU), PReLU(Parametric ReLU), ELU(Exponetial Linear Unit)이 개발되었다. 활성함수와의 연구와는 별도로 과적합(Overfitting)문제를 해결하기 위해, Dropout, 배치 정규화(Batch normalization) 등의 정규화 방법들이 개발되었다. 추가적으로 과적합을 피하기 위해, 일반적으로 기계학습 분야에서 사용되는 data augmentation 기법이 활용된다. 딥러닝 구조의 측면에서는 기존에 단순히 컨볼루션(Convolution) 층을 쌓아올리는 구조에서 항등사상을 추가하여 순방향, 역방향의 신호흐름을 개선한 residual network가 개발되었다. 위에서 언급된 활성함수들은 각기 서로 다른 특성을 가지고 있으나, 새로운 정규화 및 딥러닝 구조 연구에서는 가장 많이 사용되는 ReLU에 대해서만 검증되었다. 따라서 본 논문에서는 정규화 및 항등사상에 따른 활성함수의 성능에 대해 실험적으로 분석하였다. 분석을 통해, 정규화 및 항등사상 유무에 따른 활성함수 성능의 경향을 제시하였으며, 이는 활성함수 선택을 위한 교차검증 횟수를 줄일 수 있을 것이다.

작은 dataset에 대한 효율적인 CNN 학습방법 연구 (A study of efficient learning methods of CNN for small dataset)

  • 나성원;배효철;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.243-244
    • /
    • 2017
  • 최근 이미지 처리 및 인식 문제를 해결하는데 많이 사용되고 있는 CNN(Convolution Neural Network)를 이용하여 작은 dataset에서 Overfitting을 감소시키며 학습 할 수 있는 방법인 Dropout과 이미지를 왜곡하여 data를 늘리는 방법을 사용하여 보다 효율적으로 학습할 수 있는 방법을 연구 하였다. Batch별 처리속도를 기준으로 두 네트워크의 구조를 다르게 구현하여 비슷한 처리 시간을 수행하게 되도록 실험환경을 만들고 진행 하였다. Tensorflow로 네트워크를 구성하였고. Dataset은 Cifar_10을 사용 한다. 실험결과에 의하면 dropout의 경우 더 빨리 정확도가 향상되지만 이미지 왜곡을 사용하는 경우 저 높은 정확도로 수렴하였다.

  • PDF