• Title/Summary/Keyword: Pseudo labeling

Search Result 28, Processing Time 0.028 seconds

Active Learning with Pseudo Labeling for Robust Object Detection (강건한 객체탐지 구축을 위해 Pseudo Labeling 을 활용한 Active Learning)

  • ChaeYoon Kim;Sangmin Lee
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.712-715
    • /
    • 2023
  • 딥러닝 기술의 발전은 고품질의 대규모 데이터에 크게 의존한다. 그러나, 데이터의 품질과 일관성을 유지하는 것은 상당한 비용과 시간이 소요된다. 이러한 문제를 해결하기 위해 최근 연구에서 최소한의 비용으로 최대의 성능을 추구하는 액티브 러닝(active learning) 기법이 주목받고 있는데, 액티브 러닝은 모델 관점에서 불확실성(uncertainty)이 높은 데이터들을 샘플링 하는데 중점을 둔다. 하지만, 레이블 생성에 있어서 여전히 많은 시간적, 자원적 비용이 불가피한 점을 고려할 때 보완이 불가피 하다. 본 논문에서는 의사-라벨링(pseudo labeling)을 활용한 준지도학습(semi-supervised learning) 방식과 학습 손실을 동시에 사용하여 모델의 불확실성(uncertainty)을 측정하는 방법론을 제안한다. 제안 방식은 레이블의 신뢰도(confidence)와 학습 손실의 최적화를 통해 비용 효율적인 데이터 레이블 생성 방식을 제안한다. 특히, 레이블 데이터의 품질(quality) 및 일관성(consistency) 측면에서 딥러닝 모델의 정확도 성능을 높임과 동시에 적은 데이터만으로도 효과적인 학습이 가능할 수 있는 메커니즘을 제안한다.

A study on the weakly-supervised deep learning algorithm for active sonar target recognition based on pseudo labeling using convolutional recurrent neural network model (합성곱 순환 신경망 모델을 이용한 의사 레이블링 기법 기반 능동소나 표적 식별 약지도 딥러닝 알고리즘 연구)

  • Yena You;Wonnyoung Lee;Seokjin Lee
    • The Journal of the Acoustical Society of Korea
    • /
    • v.43 no.5
    • /
    • pp.502-510
    • /
    • 2024
  • In this paper, we proposed the weakly-supervised deep learning algorithm for active sonar target recognition based on pseudo labeling using Conventional Recurrent Neural Network (CRNN) model widely used for acoustic signal processing because it can effectively utilize small and unbalanced active sonar data. Active sonar simulation data assuming two different SNRs and clutter environments were used in the training and testing process, and spectrogram obtained by applying Short Time Fourier Transform (STFT) to the simulation data was used as a feature factor for algorithm training. The algorithm proposed in this paper was evaluated based on the target and nontarget F1-score using test data independent of training data. As a result, it was confirmed that the CRNN model showed significant performance not only in typical acoustic signal processing but also active sonar target recognition. Also, pseudo-labeling helps to improve the performance of the active sonar target recognition algorithm used the CRNN model.

Wafer Map Defect Pattern Classification with Progressive Pseudo-Labeling Balancing (점진적 데이터 평준화를 이용한 반도체 웨이퍼 영상 내 결함 패턴 분류)

  • Do, Jeonghyeok;Kim, Munchurl
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.248-251
    • /
    • 2020
  • 전 반도체 제조 및 검사 공정 과정을 자동화하는 스마트 팩토리의 실현에 있어 제품 검수를 위한 검사 장비는 필수적이다. 하지만 딥 러닝 모델 학습을 위한 데이터 처리 과정에서 엔지니어가 전체 웨이퍼 영상에 대하여 결함 항목 라벨을 매칭하는 것은 현실적으로 불가능하기 때문에 소량의 라벨 (labeled) 데이터와 나머지 라벨이 없는 (unlabeled) 데이터를 적절히 활용해야 한다. 또한, 웨이퍼 영상에서 결함이 발생하는 빈도가 결함 종류별로 크게 차이가 나기 때문에 빈도가 적은 (minor) 결함은 잡음처럼 취급되어 올바른 분류가 되지 않는다. 본 논문에서는 소량의 라벨 데이터와 대량의 라벨이 없는 데이터를 동시에 활용하면서 결함 사이의 발생 빈도 불균등 문제를 해결하는 점진적 데이터 평준화 (progressive pseudo-labeling balancer)를 제안한다. 점진적 데이터 평준화를 이용해 분류 네트워크를 학습시키는 경우, 기존의 테스트 정확도인 71.19%에서 6.07%-p 상승한 77.26%로 약 40%의 라벨 데이터가 추가된 것과 같은 성능을 보였다.

  • PDF

Research on supplementing unlabeled data through pseudo-labeling. (의사 레이블링을 통한 레이블이 없는 데이터 보완 연구)

  • Min-Hee Yoo;Heon-Chang Yu
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.410-413
    • /
    • 2023
  • 레이블링 작업은 데이터 분석 시 필요한 사전 작업중 하나이다. 모든 데이터들에 대해 레이블링 작업은 시간/인적 자원을 필요로 하기에, 해당 작업을 보완할 방법이 존재한다면 요구되는 리소스를 줄여 효율성을 크게 향상시킬 수 있다. 본 논문에서는 통신회사에서 적재된 데이터 셋에 대하여 레이블이 없는 데이터(Unlabeled-data)에 대해 의사 레이블링(Pseudo-labeling), SMOTE 를 통한 데이터 증강을 활용하여 기존에 활용되지 못한 데이터를 추가하여 모델에 학습시킨다. 실험을 통해 의사 레이블을 통한 모델 학습 방법이 기존 도메인 지식의 레이블 방법보다 효율적이고 성능이 우수함을 확인하였다.

Optimized patch feature extraction using CNN for emotion recognition (감정 인식을 위해 CNN을 사용한 최적화된 패치 특징 추출)

  • Irfan Haider;Aera kim;Guee-Sang Lee;Soo-Hyung Kim
    • Annual Conference of KIPS
    • /
    • 2023.05a
    • /
    • pp.510-512
    • /
    • 2023
  • In order to enhance a model's capability for detecting facial expressions, this research suggests a pipeline that makes use of the GradCAM component. The patching module and the pseudo-labeling module make up the pipeline. The patching component takes the original face image and divides it into four equal parts. These parts are then each input into a 2Dconvolutional layer to produce a feature vector. Each picture segment is assigned a weight token using GradCAM in the pseudo-labeling module, and this token is then merged with the feature vector using principal component analysis. A convolutional neural network based on transfer learning technique is then utilized to extract the deep features. This technique applied on a public dataset MMI and achieved a validation accuracy of 96.06% which is showing the effectiveness of our method.

The effects of labeling gap and susceptibility artifacts in pCASL perfusion MRI (pCASL 관류 영상에서 표지 간격과 자화감수성 인공물이 영상에 미치는 영향)

  • Kim, Seong-Hu
    • Journal of the Korean Society of Radiology
    • /
    • v.9 no.4
    • /
    • pp.213-217
    • /
    • 2015
  • To report problems found in a patient who has implemented stent implantation and then conducted a perfusion MRI using ASL(Arterial Spin Labeling), in order to suggest a solution to them. The perfusion MRI was conducted, using pCASL among ASL methods. Data from pCASL(Pseudo Continuous Arterial Spin Labeling) was acquired together with the structural image simply by changing position(labeling gap 15 mm, 170 mm) of the labeling pulse to avoid stent. Data was processed through the ASLtbx. When perfusion MRI was acquired using pCASL, it showed that the position of the conventional labeling pulse (labeling gap 24 mm) was overlapped with that of stent, which made signal intensity in right brain tissue appear as if it were void. When the labeling pulse was positioned (labeling gap 15 mm) to avoid stent, high signal intensity images were acquired. In labeling pulse (labeling gap 170 mm), the signal intensity was more reduced due to relaxation before labeled blood arrived at the imaging slice. pCASL can be stably repeated measurements because it does not use a contrast agent. And it should be selected with the appropriate image acquisition parameters for the high quality image.

Edge-based range image segmentation method using pseudo reflectance images (의사 밝기 영상을 이용한 에지 기반형 거리 영상 분할)

  • 송호근;김태은;최종수
    • Journal of the Korean Institute of Telematics and Electronics B
    • /
    • v.33B no.4
    • /
    • pp.111-123
    • /
    • 1996
  • In this paper, a new edge-based segmentation algorithm for range image using pseudo reflectance images (PRIs) is proposed. A model of pseudo reflectance which is useful in analyzing three dimensional scene and objects is introduced and then three PRIs are generated by the model. For generating three PRIs, bels and jain's differential window operator is selected and three different light source directions are determined. Three edge images are extracted from each PRI and a fused (logical ORing) edge image is constructed for the benefit of enhanced edge formation. The final segmentation results of the proposed algoritm are obtained after the processing of thinning, labeling and correcting erroeneous regions with the fused edge image. The good performance of edge detection and segmentation is confirmed via computer simulation with synthetic and real range images.

  • PDF

The Analysis of Semi-supervised Learning Technique of Deep Learning-based Classification Model (딥러닝 기반 분류 모델의 준 지도 학습 기법 분석)

  • Park, Jae Hyeon;Cho, Sung In
    • Journal of Broadcast Engineering
    • /
    • v.26 no.1
    • /
    • pp.79-87
    • /
    • 2021
  • In this paper, we analysis the semi-supervised learning (SSL), which is adopted in order to train a deep learning-based classification model using the small number of labeled data. The conventional SSL techniques can be categorized into consistency regularization, entropy-based, and pseudo labeling. First, we describe the algorithm of each SSL technique. In the experimental results, we evaluate the classification accuracy of each SSL technique varying the number of labeled data. Finally, based on the experimental results, we describe the limitations of SSL technique, and suggest the research direction to improve the classification performance of SSL.

Constructing Korean Dialogue Natural Inference Dataset through Pseudo Labeling (Pseudo Labeling을 통한 한국어 대화 추론 데이터셋 구축)

  • Young-Jun Lee;Chae-Gyun Lim;Yunsu Choi;Ji-Hui Lm;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.205-209
    • /
    • 2022
  • 페르소나 대화 시스템이 상대방의 개인화된 정보에 일관된 응답을 생성하는 것은 상당히 중요하며, 이를 해결하기 위해 최근에 많은 연구들이 활발히 이루어지고 있다. 그 중, PersonaChat 데이터셋에 대해 수반/중립/모순 관계를 라벨링한 DialoguNLI 데이터셋이 제안되었으며, 일관성 측정, 페르소나 속성 추론 태스크 등 여러 분야에 활용되고 있다. 그러나, 공개적으로 이용가능한 한국어로 된 대화 추론 데이터셋은 없다. 본 연구에서는 한국어로 번역된 페르소나 대화 데이터셋과 한국어 자연어 추론 데이터셋에 학습된 모델을 이용하여 한국어 대화 추론 데이터셋(KorDialogueNLI)를 구축한다. 또한, 사전학습된 언어모델을 학습하여 한국어 대화 추론 모델 베이스라인도 구축한다. 실험을 통해 정확도 및 F1 점수 평가 지표에서 KLUE-RoBERTa 모델을 미세조정(fine-tuning)시킨 모델이 가장 높은 성능을 달성하였다. 코드 및 데이터셋은 https://github.com/passing2961/KorDialogueNLI에 공개한다.

  • PDF

Arterial Spin Labeling Magnetic Resonance Imaging in Healthy Adults: Mathematical Model Fitting to Assess Age-Related Perfusion Pattern

  • Ying Hu;Rongbo Liu;Fabao Gao
    • Korean Journal of Radiology
    • /
    • v.22 no.7
    • /
    • pp.1194-1202
    • /
    • 2021
  • Objective: To investigate the age-dependent changes in regional cerebral blood flow (CBF) in healthy adults by fitting mathematical models to imaging data. Materials and Methods: In this prospective study, 90 healthy adults underwent pseudo-continuous arterial spin labeling imaging of the brain. Regional CBF values were extracted from the arterial spin labeling images of each subject. Multivariable regression with the Akaike information criterion, link test, and F test (Ramsey's regression equation specification error test) was performed for 7 models in every brain region to determine the best mathematical model for fitting the relationship between CBF and age. Results: Of all 87 brain regions, 68 brain regions were best fitted by cubic models, 9 brain regions were best fitted by quadratic models, and 10 brain regions were best fitted by linear models. In most brain regions (global gray matter and the other 65 brain regions), CBF decreased nonlinearly with aging, and the rate of CBF reduction decreased with aging, gradually approaching 0 after approximately 60. CBF in some regions of the frontal, parietal, and occipital lobes increased nonlinearly with aging before age 30, approximately, and decreased nonlinearly with aging for the rest of life. Conclusion: In adults, the age-related perfusion patterns in most brain regions were best fitted by the cubic models, and age-dependent CBF changes were nonlinear.