• 제목/요약/키워드: Transfer of learning

검색결과 736건 처리시간 0.025초

음성감정인식 성능 향상을 위한 트랜스포머 기반 전이학습 및 다중작업학습 (Transformer-based transfer learning and multi-task learning for improving the performance of speech emotion recognition)

  • 박순찬;김형순
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.515-522
    • /
    • 2021
  • 음성감정인식을 위한 훈련 데이터는 감정 레이블링의 어려움으로 인해 충분히 확보하기 어렵다. 본 논문에서는 음성감정인식의 성능 개선을 위해 트랜스포머 기반 모델에 대규모 음성인식용 훈련 데이터를 통한 전이학습을 적용한다. 또한 음성인식과의 다중작업학습을 통해 별도의 디코딩 없이 문맥 정보를 활용하는 방법을 제안한다. IEMOCAP 데이터 셋을 이용한 음성감정인식 실험을 통해, 가중정확도 70.6 % 및 비가중정확도 71.6 %를 달성하여, 제안된 방법이 음성감정인식 성능 향상에 효과가 있음을 보여준다.

전이학습 기반 콘크리트의 다양한 결함 분류에 관한 연구 (A study on the classification of various defects in concrete based on transfer learning)

  • 윤영근;오태근
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.569-574
    • /
    • 2023
  • 콘크리트 구조물의 적절한 유지관리를 위해서 다양한 결함에 대해 사전에 파악하고 유지관리하는 것이 필요하다. 현재 방법으로는 규모가 큰 사회기반시설물의 점검 시 효율성, 안전성, 신뢰성에 문제가 있어 새로운 점검 방식의 도입이 필요하다. 최근에는 영상에 대한 딥러닝 기술이 발달함에 따라 콘크리트 결함 분류 연구가 활발히 진행되고 있다. 하지만, 균열 외에 오염과 박락 등에 대한 연구는 제한적이다. 본 연구에서는 사전에 학습된 딥러닝 모델에 대한 전이학습을 통한 다양한 콘크리트 결함 유형 분류 모델을 개발하고, 정확도를 저하시키는 요인을 도출 및 향후 발전 방향을 제시하였다. 이는 향후 콘크리트 유지관리 분야에서 활용도가 높을 것으로 예상된다.

데이터 증강을 통한 기계학습 능력 개선 방법 연구 (Study on the Improvement of Machine Learning Ability through Data Augmentation)

  • 김태우;신광성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.346-347
    • /
    • 2021
  • 기계학습을 위한 패턴인식을 위해서는 학습데이터의 양이 많을수록 그 성능이 향상된다. 하지만 일상에서 검출해내야하는 패턴의 종류 및 정보가 항상 많은 양의 학습데이터를 확보할 수는 없다. 따라서 일반적인 기계학습을 위해 적은데이터셋을 의미있게 부풀릴 필요가 있다. 본 연구에서는 기계학습을 수행할 수 있도록 데이터를 증강시키는 기법에 관해 연구한다. 적은데이터셋을 이용하여 기계학습을 수행하는 대표적인 방법이 전이학습(transfer learning) 기법이다. 전이학습은 범용데이터셋으로 기본적인 학습을 수행한 후 목표데이터셋을 최종 단계에 대입함으로써 결과를 얻어내는 방법이다. 본 연구에서는 ImageNet과 같은 범용데이터셋으로 학습시킨 학습모델을 증강된 데이터를 이용하여 특징추출셋으로 사용하여 원하는 패턴에 대한 검출을 수행한다.

  • PDF

결과에 대한 지식의 상대적 빈도와 지연간격 유형이 운동학습에 미치는 영향 비교 (A Study Comparing the Effects of Types of Relative Frequency and Delay Internal of Knowledge of Results on Motor Learning)

  • 김대균;차승규;김범규;안수경;김종만
    • 한국전문물리치료학회지
    • /
    • 제4권1호
    • /
    • pp.48-62
    • /
    • 1997
  • Several studies have evaluated the effects of types of relative frequency and delay interval of knowledge of results(KR) on motor skill learning independently. The purpose of this study was to determine more effective types of KR relative frequency and KR delay interval for motor learning. Forty-six healthy subjects (15 female, 31 male) with no previous experience with this experiment participated. The subjects ranged in age from 20 to 29 years (mean=23.9, SD=0.474). All subjects were assigned to one of four groups: a high-instant group, a high-delay group, a low-instant group, and a low-delay group. During the acquisition phase, subjects practiced movements to a target (400 mm) with either a high (83%) or low (33%) KR relative frequency, and with either an instantaneous or delayed (after 8s) KR. Four groups were evaluated on retention (after 3min and 24hr) and transfer (450 mm) tests. The major findings were as follows: (1) there were no between-group differences in acquisition and short-term retention (p>0.05, (2) a low (33%) KR relative frequency during practice was as effective for learning as measured by both long-tenn retention and transfer tests, compared with high (83%) KR practice conditions (p<0.05), (3) delayed (8s) KR enhanced learning as measured by both long-term retention and transfer tests, compared with instantaneous KR practice conditions (p<0.05), and (4) there were no interactions between KR relative frequency and KR delay interval during acquisition, retention, and transfer phases. The results suggest that relatively less frequent and delayed KR are more effective types for motor learning than more frequent and instantaneous KR.

  • PDF

Generalized Asymmetrical Bidirectional Associative Memory for Human Skill Transfer

  • T.D. Eom;Lee, J. J.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.482-482
    • /
    • 2000
  • The essential requirements of neural network for human skill transfer are fast convergence, high storage capacity, and strong noise immunity. Bidirectional associative memory(BAM) suffering from low storage capacity and abundance of spurious memories is rarely used for skill transfer application though it has fast and wide association characteristics for visual data. This paper suggests generalization of classical BAM structure and new learning algorithm which uses supervised learning to guarantee perfect recall starting with correlation matrix. The generalization is validated to accelerate convergence speed, to increase storage capacity, to lessen spurious memories, to enhance noise immunity, and to enable multiple association using simulation work.

  • PDF

전수 학습을 이용한 도로교통표지 데이터 분류 효율성 향상 연구 (Research on the Efficiency of Classification of Traffic Signs Using Transfer Learning)

  • 김준석;홍일영
    • 한국측량학회지
    • /
    • 제37권3호
    • /
    • pp.119-127
    • /
    • 2019
  • 본 연구에서는 1/1,000 수치지형도 및 정밀도로지도 제작에 있어서 도로 레이어를 구성하고 있는 교통안전표지 및 도로표지의 제작 공정에 있어서 딥러닝의 적용방안을 탐색하였다. 딥러닝의 이미지 분류에서 활용하는 전수학습을 이용하여 취득한 영상에 대한 학습자료 구축을 통해 도로 표지정보의 자동분류를 수행하였다. 분석결과 주의, 규제, 지시, 보조는 촬영된 이미지의 품질 및 형태 등 여러 가지 요소에 의해 정확도가 불규칙하게 나타났지만, 안내표지의 경우는 정확도가 97% 이상으로 높게 나타났다. 수치지도제작에 있어 전수학습을 이용한 이미지 자동분류 방식은 교통안전표지를 포함한 다양한 레이어들에 대한 자료 취득과 분류에 있어서 활용이 증가할 것으로 기대한다.

EfficientNet의 전이학습을 통한 아스팔트 바인더의 레올로지적 특성 예측 (Prediction of Rheological Properties of Asphalt Binders Through Transfer Learning of EfficientNet)

  • 지봉준
    • 한국건설순환자원학회논문집
    • /
    • 제9권3호
    • /
    • pp.348-355
    • /
    • 2021
  • 도로 포장에 널리 사용되는 아스팔트는 도로가 노출되는 환경에 따라 요구되는 물리적 특성이 상이하다. 이에 따라 첨가제의 배합에 따라 아스팔트가 어떤 물리적 특성을 나타내는지 평가하고 도로의 교통, 기후 환경에 맞추어 적절한 배합을 선택하는 것이 아스팔트 도로의 수명을 확보하기 위해 필수적이다. 아스팔트의 다양한 물리적 특성 중 소성변형에 대한 저항성을 측정하기 위해서는 Dynamic shear rheometer(DSR) 테스트를 주로 사용한다. 하지만 DSR 테스트는 실험 세팅에 따라 결과가 상이하고 특정 온도 범위 내에만 측정이 가능한 단점이 있다. 따라서 본 연구에서는 DSR 테스트의 단점을 극복하고자, Atomic force microscopy로부터 수집된 이미지를 학습하여 레올로지적 특성을 예측하고자 했다. 딥러닝 아키텍처 중 하나인 EfficientNet을 통해 이미지를 학습하였고 딥러닝 모델의 한계인 많은 데이터를 요구한다는 점을 극복하기 위해 전이학습을 이용하여 학습을 진행하였다. 학습된 모델은 이종의 첨가제를 사용하였음에도 높은 정확도로 아스팔트 바인더의 레올로지적 특성을 예측하였다. 특히, 전이학습을 사용하지 않았을 때와 비교하여 빠르게 학습이 가능했다.

Deep Learning-based Pes Planus Classification Model Using Transfer Learning

  • Kim, Yeonho;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.21-28
    • /
    • 2021
  • 본 연구는 기존 편평발 측정을 위해 사용되던 다양한 방법의 한계를 보완할 수 있는 새로운 측정 방법으로 전이학습을 적용한 딥러닝 기반 편평발 분류 방법론을 제안한다. 편평발 88장, 정상발 88장으로 이루어진 총 176장의 이미지 데이터를 활용하여, 적은 데이터로도 우수한 예측 모델을 생성할 수 있는 데이터 증폭 기술과 사전학습 모델인 VGG16 구조를 활용하는 전이학습 기술을 적용하여 제안 모델의 학습을 진행하였다. 제안 모델의 우수성을 확인하기 위하여 기본 CNN 기반 모델과 제안 방법론의 예측 정확도를 비교하는 실험을 수행하였다. 기본 CNN 모델의 경우 훈련 정확도는 77.27%, 검증 정확도는 61.36%, 그리고 시험 정확도는 59.09%로 나타났으며, 제안 모델의 경우 훈련 정확도는 94.32%, 검증 정확도는 86.36%, 그리고 시험 정확도는 84.09%로 나타나 기본 CNN 모델에 비해 제안 모델의 정확도가 큰 폭으로 향상된 것을 확인하였다.

합리적 가격결정을 위한 전이학습모델기반 아보카도 분류 및 출하 예측 시스템 (Avocado Classification and Shipping Prediction System based on Transfer Learning Model for Rational Pricing)

  • 유성운;박승민
    • 한국전자통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.329-335
    • /
    • 2023
  • 타임지가 선정한 슈퍼푸드이며, 후숙 과일 중 하나인 아보카도는 현지가격과 국내 유통 가격이 크게 차이가 나는 식품 중 하나이다. 이러한 아보카도의 분류과정을 자동화한다면 다양한 분야에서 인건비를 줄여 가격을 낮출 수 있을 것이다. 본 논문에서는 아보카도의 데이터셋을 크롤링을 통하여 제작하고, 딥러닝 기반 전이학습모델을 다수 사용하여, 최적의 분류모델을 만드는 것을 목표로 한다. 실험은 제작한 데이터셋에서 분리한 데이터셋에서 딥러닝 기반 전이학습모델에 직접 대입하고, 해당 모델의 하이퍼 파라미터를 Fine-tuning하며 진행하였다. 제작된 모델은 아보카도의 이미지를 입력하였을 때, 해당 아보카도의 익은 정도를 99% 이상의 정확도로 분류하였으며, 아보카도 생산 및 유통가정의 인력감소 및 정확성을 높일 수 있는 데이터셋 및 알고리즘을 제안한다.

R-FCN과 Transfer Learning 기법을 이용한 영상기반 건설 안전모 자동 탐지 (Image-Based Automatic Detection of Construction Helmets Using R-FCN and Transfer Learning)

  • 박상윤;윤상현;허준
    • 대한토목학회논문집
    • /
    • 제39권3호
    • /
    • pp.399-407
    • /
    • 2019
  • 대한민국에서 건설업은 타 업종들과 비교하여 안전사고의 위험성이 가장 높게 나타난다. 따라서 건설업 내 안전성 향상을 도모하기 위해 여러 연구가 예전부터 진행이 되어 왔고, 본 연구에선 건설현장 영상 데이터를 기반으로 물체 탐지 및 분류 알고리즘을 이용해서 효과적인 안전모 자동탐지 시스템을 구축하여 건설현장 노동자들의 안전성 향상에 기여하고자 한다. 본 연구에서 사용된 알고리즘은 Convolutional Neural Network (CNN) 기반의 물체 탐지 및 분류 알고리즘인 Region-based Fully Convolutional Networks (R-FCN)이고 이를 Transfer Learning 기법을 사용하여 딥러닝을 실시하였다. ImageNet에서 수집한 1089장의 사람과 안전모가 포함된 영상으로 학습을 시행하였고 그 결과, 사람과 안전모의 mean Average Precision (mAP)은 각각 0.86, 0.83로 측정되었다.