• 제목/요약/키워드: Mean Teacher 모델

검색결과 14건 처리시간 0.022초

차분 특징을 이용한 평균-교사 모델의 음향 이벤트 검출 성능 향상 (Performance Improvement of Mean-Teacher Models in Audio Event Detection Using Derivative Features)

  • 곽진열;정용주
    • 한국전자통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.401-406
    • /
    • 2021
  • 최근 들어, 음향 이벤트 검출을 위하여 CRNN(: Convolutional Recurrent Neural Network) 구조에 기반 한 평균-교사 모델이 대표적으로 사용되고 있다. 평균-교사 모델은 두 개의 병렬 형태의 CRNN을 가진 구조이며, 이들의 출력들의 일치성을 학습 기준으로 사용함으로서 약-전사 레이블(label)과 비-전사 레이블 음향 데이터에 대해서도 효과적인 학습이 가능하다. 본 연구에서는 최신의 평균-교사 모델에 로그-멜 스펙트럼에 대한 차분 특징을 추가적으로 사용함으로서 보다 나은 성능을 이루고자 하였다. DCASE 2018/2019 Challenge Task 4용 학습 및 테스트 데이터를 이용한 음향 이벤트 검출 실험에서 제안된 차분특징을 이용한 평균-교사모델은 기존의 방식에 비해서 최대 8.1%의 상대적 ER(: Error Rate)의 향상을 얻을 수 있었다.

Utilizing Mean Teacher Semi-Supervised Learning for Robust Pothole Image Classification

  • Inki Kim;Beomjun Kim;Jeonghwan Gwak
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.17-28
    • /
    • 2023
  • 포장도로에서 발생하는 포트홀은 고속 주행 차량에 치명적인 영향을 미치며, 사망사고를 유발할 수 있는 도로상의 장애물이다. 이를 방지하기 위해 일반적으로는 작업자가 직접 포트홀을 탐지하는 방식을 사용해왔으나, 이는 작업자의 안전 문제와 예측하기 어려운 범주에서 발생하는 모든 포트홀을 인력으로 탐지하는 것이 비효율적이기 때문에 한계가 있다. 또한, 도로 환경과 관련된 지반 환경이 포트홀 생성에 영향을 미치기 때문에, 완벽한 포트홀 방지는 어렵다. 데이터셋 구축을 위해서는 전문가의 지도하에 라벨링 작업이 필요하지만, 이는 매우 시간과 비용이 많이 필요하다. 따라서, 본 논문에서는 Mean Teacher 기법을 사용하여 라벨링된 데이터의 샘플 수가 적더라도 지도학습보다 더욱 강인한 포트홀 이미지 분류 성능을 보여준다. 이러한 결과는 성능지표와 GradCAM을 통해 입증되었으며, 준지도학습을 사용할 때 15개의 사전 학습된 CNN 모델이 평균 90.41%의 정확도를 달성하며, 지도학습과 비교하여 2%에서 9%의 차이로 강인한 성능을 나타내는 것을 확인하였다.

음향 이벤트 검출을 위한 DenseNet-Recurrent Neural Network 학습 방법에 관한 연구 (A study on training DenseNet-Recurrent Neural Network for sound event detection)

  • 차현진;박상욱
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.395-401
    • /
    • 2023
  • 음향 이벤트 검출(Sound Event Detection, SED)은 음향 신호에서 관심 있는 음향의 종류와 발생 구간을 검출하는 기술로, 음향 감시 시스템 및 모니터링 시스템 등 다양한 분야에서 활용되고 있다. 최근 음향 신호 분석에 관한 국제 경연 대회(Detection and Classification of Acoustic Scenes and Events, DCASE) Task 4를 통해 다양한 방법이 소개되고 있다. 본 연구는 다양한 영역에서 성능 향상을 이끌고 있는 Dense Convolutional Networks(DenseNet)을 음향 이벤트 검출에 적용하기 위해 설계 변수에 따른 성능 변화를 비교 및 분석한다. 실험에서는 DenseNet with Bottleneck and Compression(DenseNet-BC)와 순환신경망(Recurrent Neural Network, RNN)의 한 종류인 양방향 게이트 순환 유닛(Bidirectional Gated Recurrent Unit, Bi-GRU)을 결합한 DenseRNN 모델을 설계하고, 평균 교사 모델(Mean Teacher Model)을 통해 모델을 학습한다. DCASE task4의 성능 평가 기준에 따라 이벤트 기반 f-score를 바탕으로 설계 변수에 따른 DenseRNN의 성능 변화를 분석한다. 실험 결과에서 DenseRNN의 복잡도가 높을수록 성능이 향상되지만 일정 수준에 도달하면 유사한 성능을 보임을 확인할 수 있다. 또한, 학습과정에서 중도탈락을 적용하지 않는 경우, 모델이 효과적으로 학습됨을 확인할 수 있다.

평균-교사 합성곱 순환 신경망 모델을 이용한 약지도 음향 이벤트 검출 시스템의 성능 분석 (Performance analysis of weakly-supervised sound event detection system based on the mean-teacher convolutional recurrent neural network model)

  • 이석진
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.139-147
    • /
    • 2021
  • 본 논문은 데이터의 일부만 레이블링이 되어있는 약지도 학습을 기반으로 하는 음향 이벤트 검출 시스템을 소개 및 구현하고, 시뮬레이션을 통해 각 파라미터가 성능에 미치는 영향을 분석하였다. 음향 이벤트 검출 시스템은 음향 신호 내에 존재하는 이벤트의 종류, 시작/종료 시점을 추정하는 시스템으로, 이를 학습시키기 위해서는 음향 이벤트 신호와 그 종류, 시작/종료 시점에 대한 모든 정보가 제공되어야 한다. 하지만 이를 모두 표기하여 학습데이터를 만드는 것은 매우 큰 비용이 들어가며, 특히 시작/종료 시점을 정확히 표기하는 것은 매우 어렵다. 따라서 본 논문에서 다루는 약지도 학습 문제에서는 이벤트의 종류와 시작/종료 시점이 모두 표기된 "강하게 표기된 데이터"와, 이벤트의 종류만 표기된 "약하게 표기된 데이터", 그리고 아무런 표기가 되어 있지 않은 "미표기 데이터"를 이용하여 음향 이벤트 검출 시스템을 학습시킨다. 최근 이러한 문제에서는 평균-교사 모델을 이용한 음향 이벤트 검출 시스템의 성능이 우수하며, 따라서 널리 사용되고 있다. 다만, 평균-교사 모델은 많은 파라미터를 가지고 있고, 이는 성능에 영향을 다소 미칠 수 있으므로 신중하게 선택되어야 한다. 본 논문에서는 DCASE 2020 Task 4의 데이터를 이용하여 특징 값의 종류, 이동 평균 파라미터, 일관성 비용함수의 가중치, 램프-업 길이, 그리고 최대 학습율 등 5가지의 값에 대해 성능 분석을 진행하였으며, 각 파라미터에 대한 영향 및 최적 값에 대해 고찰하였다.

균열 탐지의 의미론적 분할을 위한 Mean Teacher 학습 구조 최적화 (Mean Teacher Learning Structure Optimization for Semantic Segmentation of Crack Detection)

  • 심승보
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제27권5호
    • /
    • pp.113-119
    • /
    • 2023
  • 인프라 구조물은 대부분 경제 성장기에 완공되었다. 이러한 인프라 구조물은 최근 들어 공용연수가 점차 증가하고 있어 노후 구조물의 비중이 점차 증가하고 있다. 이러한 노후 구조물은 설계 당시의 기능과 성능이 저하될 수 있고 안전사고로까지 이어질 수 있다. 이를 예방하기 위해서는 정확한 점검과 적절한 보수가 필수적이다. 이를 위해서는 우선 미세한 균열까지 정확히 탐지할 수 있도록 컴퓨터 비전과 딥러닝 기술에 수요가 증가하고 있다. 하지만 딥러닝 알고리즘은 다수의 학습 데이터가 있어야 한다. 특히 영상 내 균열의 위치를 표시한 라벨 영상은 필수적이다. 이러한 라벨 영상을 다수 확보하기 위해서는 많은 노동력과 시간이 필요한 실정이다. 이러한 비용을 절감하고 탐지 정확도를 높이기 위해서 본 연구에서는 mean teacher 방식의 학습 구조를 제안하였다. 이 학습 구조는 900장의 라벨 영상 데이터 세트와 3000장의 비라벨 영상 데이터 세트로 훈련되었다. 학습된 균열 탐지 신경망 모델은 300여장의 실험용 데이터 세트를 통해 평가되었고 탐지 정확도는 89.23%의 mean intersection over union과 89.12%의 F1 score를 기록하였다. 이 설험을 통해 지도학습과 비교하여 탐지 성능이 향상된 것을 확인하였다. 향후에 이러한 방법은 라벨 영상을 확보하는데 필요한 비용을 절감하는데 활용될 것으로 기대한다.

복부 CT 영상에서 신장 로컬 가이드 맵을 활용한 평균-교사 모델 기반의 준지도학습을 통한 신장 종양 분할 (Kidney Tumor Segmentation through Semi-supervised Learning Based on Mean Teacher Using Kidney Local Guided Map in Abdominal CT Images)

  • 정희영;김현진;홍헬렌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권5호
    • /
    • pp.21-30
    • /
    • 2023
  • 부분신장절제술 전 수술 계획을 세우기 위해서는 신장 종양의 위치, 형태 및 수술 시 안전 마진 파악이 중요하므로 신장 종양을 정확히 분할하는 것이 필요하다. 그러나 신장 종양은 환자마다 위치 및 크기가 다양하며 소장과 비장 같은 주변 장기와 형태와 밝기값이 유사하여 신장 종양을 분할하는 것에 어려움이 있다. 본 논문에서는 레이블이 있는 데이터와 없는 데이터를 함께 사용하는 준지도학습 방법 중 하나인 평균-교사모델을 활용하여 신장의 여러 위치에서 발생하는 작은 크기의 신장 종양을 분할하기 위해 신장 위치 정보를 가지는 신장 로컬 가이드 맵을 이용해 신장 종양에 집중하는 평균-교사 네트워크를 제안하고, 신장 종양의 크기에 따른 성능을 분석한다. 실험 결과, 제안 방법은 신장 주변에 존재하는 종양의 위치를 찾기 위해 신장 로컬 가이드 맵을 사용하여 신장의 국소 정보를 고려함으로써 75.24%의 F1-score를 보였다. 특히 분할이 어려운 작은 크기의 종양에 대한 과소분할을 개선하였으며 nnU-Net보다 적은 양의 레이블 데이터를 사용하여도 13.9% 높은 F1-score를 보였다.

로봇 활용 SW 교육에서 보조 교사 유무에 따른 컴퓨팅사고력, 로봇에 대한 태도의 차이 (The Difference of Computational Thinking and Attitudes toward Robots according to Assistant Teacher in SW Education Using Robot)

  • 노지예
    • 정보교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.307-316
    • /
    • 2018
  • 본 연구는 초등학교에서 로봇 활용 SW 교육을 실시하여 학생들의 CT, 로봇에 대한 태도에 미치는 효과를 알아보고 보조 교사 유무에 따른 차이를 알아보고자 하였다. 이를 위해 서울의 A 청소년수련관의 로봇 활용 SW 교육에 참여한 초등학생 29명을 실험집단과 통제집단으로 나누고, 로봇 활용 SW 교육을 실시하였으며, 수집된 자료는 대응 표본 t검정, 공분산분석을 통해 평균의 차이를 분석하였다. 연구 결과, 로봇 활용 SW 교육을 실시한 후 학생들의 CT와 로봇에 대한 태도가 유의하게 향상되었으나, 통제집단의 CT는 유의하게 향상되지 않았다. 또한 보조 교사 유무에 따른 사후 CT의 차이는 유의하였으며, 로봇에 대한 태도의 차이는 유의하지 않은 것으로 나타났다. 본 연구는 로봇 활용 SW 교육의 효과를 검증하고, 보조 교사 유무에 따라 차이가 있는지 규명하여 로봇 활용 SW 교육에 대한 이해를 확장시켰다는 점에서 연구의 의의를 찾을 수 있다.

에이전트를 활용한 웹 기반 단계별 원격 교육 시스템의 설계 (Design of By-stages Distance Education System Based on Web Using Agent)

  • 이현희;황부현
    • 컴퓨터교육학회논문지
    • /
    • 제3권1호
    • /
    • pp.127-134
    • /
    • 2000
  • 최첨단 정보통신 기술의 급속한 발전과 구성주의 학습 이론을 기반으로 등장한 원격 교육에서는 학습자가 자신의 학습 과정을 주관함으로써 자신에게 필요한 지식과 기술을 습득하는 자기주도적 학습이 이루어진다. 그러나 웹 기반 원격 교육이나 구성주의에서 학습자 중심적, 주도적 학습을 강조 했을 때 그것이 곧 교사로부터의 해방이나 자유방임적 교육을 의미하는 것은 아니다. 따라서 본 논문에서는 교사 에이전트를 활용하여 학습자를 다양한 수준별로 지도할 수 있는 원격 교육 시스템 모델을 제안하고자 한다. 제안하는 모델에서 교사 에이전트는 학습자 정보를 바탕으로 학습자 개개인의 학습 수준에 맞는 학습 모델을 생성하고 평가에 의해 학업 성취 정도를 파악하여 다음 단계로의 학습 진행 여부를 제어한다. 이를 통하여 웹기반 원격 교육이 제공하는 학습 자원이 아무 목적없이 정보 검색 자체로 활용되는 문제점을 해결하고 진정한 학습자 중심의 교육을 실현할 수 있는 기반을 마련할 수 있다.

  • PDF

얼굴 영상 기반의 심박수 추정을 위한 딥러닝 모델의 경량화 기법 (Lightweight Deep Learning Model for Heart Rate Estimation from Facial Videos)

  • 황규태;박명근;이상준
    • 대한임베디드공학회논문지
    • /
    • 제18권2호
    • /
    • pp.51-58
    • /
    • 2023
  • This paper proposes a deep learning method for estimating the heart rate from facial videos. Our proposed method estimates remote photoplethysmography (rPPG) signals to predict the heart rate. Although there have been proposed several methods for estimating rPPG signals, most previous methods can not be utilized in low-power single board computers due to their computational complexity. To address this problem, we construct a lightweight student model and employ a knowledge distillation technique to reduce the performance degradation of a deeper network model. The teacher model consists of 795k parameters, whereas the student model only contains 24k parameters, and therefore, the inference time was reduced with the factor of 10. By distilling the knowledge of the intermediate feature maps of the teacher model, we improved the accuracy of the student model for estimating the heart rate. Experiments were conducted on the UBFC-rPPG dataset to demonstrate the effectiveness of the proposed method. Moreover, we collected our own dataset to verify the accuracy and processing time of the proposed method on a real-world dataset. Experimental results on a NVIDIA Jetson Nano board demonstrate that our proposed method can infer the heart rate in real time with the mean absolute error of 2.5183 bpm.

잡음 학생 모델 기반의 자가 학습을 활용한 음향 사건 검지 (Sound event detection model using self-training based on noisy student model)

  • 김남균;박창수;김홍국;허진욱;임정은
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.479-487
    • /
    • 2021
  • 본 논문에서는 잡음 학생 모델 기반의 자가 학습을 활용한 음향 사건 검지 기법을 제안한다. 제안된 음향 사건 검지 모델은 두 단계로 구성된다. 첫 번째 단계에서는 잔차 합성곱 순환 신경망(Residual Convolutional Recurrent Neural Network, RCRNN)을 훈련하여 레이블이 지정되지 않은 비표기 데이터셋의 레이블 예측에 활용한다. 두 번째 단계에서는 세 가지 잡음 종류를 적용한 잡음 학생 모델을 자가학습 기법으로 반복하여 학습한다. 여기서 잡음 학생 모델은 SpecAugment, Mixup, 시간-주파수 이동을 활용한 특징 잡음, 드롭아웃을 활용한 모델 잡음, 그리고 semi-supervised loss function을 적용한 레이블 잡음을 활용하여 학습된다. 제안된 음향 사건 검지 모델의 성능은 Detection and Classification of Acoustic Scenes and Events(DCASE) 2020 Challenge Task 4의 validation set으로 평가하였다. DCASE 2020 챌린지 데이터셋의 baseline 및 최상위 랭크된 모델과 이벤트 단위 F1 점수 성능을 비교한 결과, 제안된 음향 사건 검지 모델이 단일 모델과 앙상블 모델에서 최상위 모델 대비 F1 점수를 각각 4.6 %와 3.4 % 향상시켰다.