• 제목/요약/키워드: Generalization Performance

검색결과 320건 처리시간 0.024초

데이터 증가를 통한 선형 모델의 일반화 성능 개량 (중심극한정리를 기반으로) (Improvement of generalization of linear model through data augmentation based on Central Limit Theorem)

  • 황두환
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.19-31
    • /
    • 2022
  • 기계학습 모델 구축 간 트레이닝 데이터를 활용하며, 훈련 간 사용되지 않은 테스트 데이터를 활용하여 모델의 정확도와 일반화 성능을 판단한다. 일반화 성능이 낮은 모델의 경우 새롭게 받아들이게 되는 데이터에 대한 예측 정확도가 현저히 감소하게 되며 이러한 현상을 두고 모델이 과적합 되었다고 한다. 본 연구는 중심극한정리를 기반으로 데이터를 생성 및 기존의 훈련용 데이터와 결합하여 새로운 훈련용 데이터를 구성하고 데이터의 정규성을 증가시킴과 동시에 이를 활용하여 모델의 일반화 성능을 증가시키는 방법에 대한 것이다. 이를 위해 중심극한정리의 성질을 활용해 데이터의 각 특성별로 표본평균 및 표준편차를 활용하여 데이터를 생성하였고, 새로운 훈련용 데이터의 정규성 증가 정도를 파악하기 위하여 Kolmogorov-Smirnov 정규성 검정을 진행한 결과, 새로운 훈련용 데이터가 기존의 데이터에 비해 정규성이 증가하였음을 확인할 수 있었다. 일반화 성능은 훈련용 데이터와 테스트용 데이터에 대한 예측 정확도의 차이를 통해 측정하였다. 새롭게 생성된 데이터를 K-Nearest Neighbors(KNN), Logistic Regression, Linear Discriminant Analysis(LDA)에 적용하여 훈련시키고 일반화 성능 증가정도를 파악한 결과, 비모수(non-parametric) 기법인 KNN과 모델 구성 간 정규성을 가정으로 갖는 LDA의 경우에 대하여 일반화 성능이 향상되었음을 확인할 수 있었다.

패턴의 유형에 따른 학생들의 일반화 방법 조사 - 초등학교 6학년 학생들을 중심으로 - (Examining the Students' Generalization Method in Relation with the Forms of Pattern - Focused on the 6th Grade Students -)

  • 이명기;나귀수
    • 대한수학교육학회지:학교수학
    • /
    • 제14권3호
    • /
    • pp.357-375
    • /
    • 2012
  • 본 연구는 증가패턴의 유형에 따른 6학년 학생들의 일반화 방법의 특징을 조사하는데에 그 목적이 있다. 본 연구에서는 ax, x+a, ax+c, ax2, ax2+c 유형과 관련된 총 6개의 문항들로 검사지를 구성하였으며, 이 검사지를 활용하여 초등학교 6학년 학생 290명의 일반화 방법을 조사하였다. 본 연구의 결과로서 대수적 일반화와 관련하여 학생들은 ax유형에서 가장 높은 대수적 일반화 수행 정도를 나타냈고, 그 다음으로는 ax2, x+a, ax+c, ax2+c의 순서로 낮은 수행 정도를 나타냈다. 또한 학생들의 일반화 수행 정도는 동일한 패턴 유형이라고 하더라도 패턴의 맥락에 따라 큰 차이가 나는 것으로 확인되었는 바, 학생들의 패턴 일반화 활동을 더욱 풍부하게 하기 위해서는 가능하면 다양한 맥락의 패턴을 학생들에게 제공하는 것이 바람직하다고 할 수 있다.

  • PDF

MARGIN-BASED GENERALIZATION FOR CLASSIFICATIONS WITH INPUT NOISE

  • Choe, Hi Jun;Koh, Hayeong;Lee, Jimin
    • 대한수학회지
    • /
    • 제59권2호
    • /
    • pp.217-233
    • /
    • 2022
  • Although machine learning shows state-of-the-art performance in a variety of fields, it is short a theoretical understanding of how machine learning works. Recently, theoretical approaches are actively being studied, and there are results for one of them, margin and its distribution. In this paper, especially we focused on the role of margin in the perturbations of inputs and parameters. We show a generalization bound for two cases, a linear model for binary classification and neural networks for multi-classification, when the inputs have normal distributed random noises. The additional generalization term caused by random noises is related to margin and exponentially inversely proportional to the noise level for binary classification. And in neural networks, the additional generalization term depends on (input dimension) × (norms of input and weights). For these results, we used the PAC-Bayesian framework. This paper is considering random noises and margin together, and it will be helpful to a better understanding of model sensitivity and the construction of robust generalization.

LR 트리 : 지도 일반화를 지원하는 공간 데이터를 위한 공간 인덱싱 (The LR-Tree : A spatial indexing of spatial data supporting map generalization)

  • 권준희;윤용익
    • 정보처리학회논문지D
    • /
    • 제9D권4호
    • /
    • pp.543-554
    • /
    • 2002
  • 지리정보시스템은 처리 속도의 향상과 비쥬얼라이징의 개선이 필요하다. 이를 위해서는 맵 일반화와 레벨별 상세화 개념이 요구된다. 기존의 공간 인덱싱은 지도 일반화를 지원하지 않거나 지원하더라도 모든 지도 일반화 연산을 제공하지 않는다는 문제점을 가진다. 본 논문에서는 이를 위해 모든 일반화 연산을 지원하는 새로운 인덱스 구조인 LR트리를 제안한다. 또한 LR트리를 검색, 삽입, 삭제하기 위한 알고리즘을 기술하고, 성능 분석을 수행한다. 성능 분석을 통해 제안된 인덱스 구조가 지도 일반화를 지원하는데 있어 다른 공간 인덱싱 기법보다 우수한 성능을 나타냄을 보인다.

Exploring the feasibility of fine-tuning large-scale speech recognition models for domain-specific applications: A case study on Whisper model and KsponSpeech dataset

  • Jungwon Chang;Hosung Nam
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.83-88
    • /
    • 2023
  • This study investigates the fine-tuning of large-scale Automatic Speech Recognition (ASR) models, specifically OpenAI's Whisper model, for domain-specific applications using the KsponSpeech dataset. The primary research questions address the effectiveness of targeted lexical item emphasis during fine-tuning, its impact on domain-specific performance, and whether the fine-tuned model can maintain generalization capabilities across different languages and environments. Experiments were conducted using two fine-tuning datasets: Set A, a small subset emphasizing specific lexical items, and Set B, consisting of the entire KsponSpeech dataset. Results showed that fine-tuning with targeted lexical items increased recognition accuracy and improved domain-specific performance, with generalization capabilities maintained when fine-tuned with a smaller dataset. For noisier environments, a trade-off between specificity and generalization capabilities was observed. This study highlights the potential of fine-tuning using minimal domain-specific data to achieve satisfactory results, emphasizing the importance of balancing specialization and generalization for ASR models. Future research could explore different fine-tuning strategies and novel technologies such as prompting to further enhance large-scale ASR models' domain-specific performance.

딥러닝 기반 Deraining 기법 비교 및 연구 동향 (Deep Learning-based Deraining: Performance Comparison and Trends)

  • 조민지;박예인;조유빈;강석주
    • 대한임베디드공학회논문지
    • /
    • 제16권5호
    • /
    • pp.225-232
    • /
    • 2021
  • Deraining is one of the image restoration tasks and should consider a tradeoff between local details and broad contextual information while recovering images. Current studies adopt an attention mechanism which has been actively researched in natural language processing to deal with both global and local features. This paper classifies existing deraining methods and provides comparative analysis and performance comparison by using several datasets in terms of generalization.

지도 일반화를 지원하는 계층화된 공간 색인 기법 (Leveled Spatial Indexing Technique supporting Map Generalization)

  • 이기정;황보택근;양영규
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권2호
    • /
    • pp.15-22
    • /
    • 2004
  • 핸드폰의 화면 크기 때문에 핸드폰에서의 지도 서비스는 문제점을 가지고 있다. 핸드폰과 같은 작은 화면에서 효율적으로 지도 데이터를 표현하기 위해서는 첫째, 지도 일반화를 이용하여 상세한 지도 데이터를 간략하게 만드는 과정이 필요하며, 둘째, 간략화된 데이터를 계층화하여 사용자의 확대 축소 명령을 빠르게 수행할 수 있어야 한다. 그러나, 기존의 연구들은 일부의 지도 일반화만 지원하거나 실시간으로 처리하지 못하는 문제점들을 가지고 있다. 본 논문에서 제안하는 LMG-tree는 계층화된 하나의 색인 트리를 사용함으로 저장 공간의 효율성을 가지고 있으며, 지도 일반화를 지원하여 실시간 지도 서비스가 가능하도록 하였다.

  • PDF

저주파 필터 특성을 갖는 다층 구조 신경망을 이용한 시계열 데이터 예측 (Time Series Prediction Using a Multi-layer Neural Network with Low Pass Filter Characteristics)

  • Min-Ho Lee
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제21권1호
    • /
    • pp.66-70
    • /
    • 1997
  • In this paper a new learning algorithm for curvature smoothing and improved generalization for multi-layer neural networks is proposed. To enhance the generalization ability a constraint term of hidden neuron activations is added to the conventional output error, which gives the curvature smoothing characteristics to multi-layer neural networks. When the total cost consisted of the output error and hidden error is minimized by gradient-descent methods, the additional descent term gives not only the Hebbian learning but also the synaptic weight decay. Therefore it incorporates error back-propagation, Hebbian, and weight decay, and additional computational requirements to the standard error back-propagation is negligible. From the computer simulation of the time series prediction with Santafe competition data it is shown that the proposed learning algorithm gives much better generalization performance.

  • PDF

다층 퍼셉트론에서 구조인자 제어 영향의 비교 (Comparison of Factors for Controlling Effects in MLP Networks)

  • 윤여창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.537-542
    • /
    • 2004
  • 다층 퍼셉트론(Multi-Layer Perceptron, MLP) 구조는 그의 비선형 적합능력으로 인하여 매우 다양한 실제 문제에 적용되고 있다. 그러나 일반화된 MLP 구조의 적합능력은 은닉노드의 개수. 초기 가중 값 그리고 학습 회수 또는 학습 오차와 같은 구조인자(factor)들에 크게 영향을 받는다. 만약 이들 구조인자가 부적절하게 선택되면 일반화된 MLP 구조의 적합능력이 매우 왜곡될 수 있다. 따라서 MLP구조에 영향을 주는 인자들의 결합 영향을 살펴보는 것은 중요한 문제이다. 이 논문에서는 제어상자(controller box)를 통한 학습결과와 더불어 MLP구조를 일반화할 때 영향을 줄 수 있는 신경망의 일반적인 구조인자 들을 실증적으로 살펴보고 이들의 상대효과를 비교한다.

퍼지추론 기반 대표 키워드 추출방법의 성능 평가 (Performance Evaluation of the Extractiojn Method of Representative Keywords by Fuzzy Inference)

  • 노순억;김병만;오상엽;이현아
    • 한국산업정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.28-37
    • /
    • 2005
  • 본 논문은 퍼지 추론을 이용하여 소수문서로부터 대표 용어들을 추출하고 가중치를 부여하는 기존 방법의 유용성을 평가하고자 GIS (Generalized Instance Set) 알고리즘에 이를 적용시켜 그 성능을 평가하여 보았다. GIS 는 학습 문서 집합에 대한 일반화 (generalization) 과정을 통해 문서 그룹들을 형성하고 이 그룹의 대표 문서 (generalized instance)를 생성한 후 k- 알고리즘을 적용하는 방법이다. 본 논문에서는 바로 이 일반화 과정의 한 방법으로 퍼지 추론을 이용한 방법을 사용하였다. 상대적 성능 평가를 위하여 이 일반화(generalization) 과정에 Rocchio와 Widrow-Hoff 방법도 적용시켜 문서 분류 성능을 비교하였다. 실험 결과, 긍정적 문서만을 고려할 경우는 좋은 성능을 보이지만 부정적 문서를 같이 고려할 경우는 성능이 상대적으로 좋지 않음을 확인 할 수 있었다.

  • PDF