• 제목/요약/키워드: Learning and Learning Transfer

검색결과 732건 처리시간 0.021초

음성감정인식 성능 향상을 위한 트랜스포머 기반 전이학습 및 다중작업학습 (Transformer-based transfer learning and multi-task learning for improving the performance of speech emotion recognition)

  • 박순찬;김형순
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.515-522
    • /
    • 2021
  • 음성감정인식을 위한 훈련 데이터는 감정 레이블링의 어려움으로 인해 충분히 확보하기 어렵다. 본 논문에서는 음성감정인식의 성능 개선을 위해 트랜스포머 기반 모델에 대규모 음성인식용 훈련 데이터를 통한 전이학습을 적용한다. 또한 음성인식과의 다중작업학습을 통해 별도의 디코딩 없이 문맥 정보를 활용하는 방법을 제안한다. IEMOCAP 데이터 셋을 이용한 음성감정인식 실험을 통해, 가중정확도 70.6 % 및 비가중정확도 71.6 %를 달성하여, 제안된 방법이 음성감정인식 성능 향상에 효과가 있음을 보여준다.

합리적 가격결정을 위한 전이학습모델기반 아보카도 분류 및 출하 예측 시스템 (Avocado Classification and Shipping Prediction System based on Transfer Learning Model for Rational Pricing)

  • 유성운;박승민
    • 한국전자통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.329-335
    • /
    • 2023
  • 타임지가 선정한 슈퍼푸드이며, 후숙 과일 중 하나인 아보카도는 현지가격과 국내 유통 가격이 크게 차이가 나는 식품 중 하나이다. 이러한 아보카도의 분류과정을 자동화한다면 다양한 분야에서 인건비를 줄여 가격을 낮출 수 있을 것이다. 본 논문에서는 아보카도의 데이터셋을 크롤링을 통하여 제작하고, 딥러닝 기반 전이학습모델을 다수 사용하여, 최적의 분류모델을 만드는 것을 목표로 한다. 실험은 제작한 데이터셋에서 분리한 데이터셋에서 딥러닝 기반 전이학습모델에 직접 대입하고, 해당 모델의 하이퍼 파라미터를 Fine-tuning하며 진행하였다. 제작된 모델은 아보카도의 이미지를 입력하였을 때, 해당 아보카도의 익은 정도를 99% 이상의 정확도로 분류하였으며, 아보카도 생산 및 유통가정의 인력감소 및 정확성을 높일 수 있는 데이터셋 및 알고리즘을 제안한다.

Transfer learning for crack detection in concrete structures: Evaluation of four models

  • Ali Bagheri;Mohammadreza Mosalmanyazdi;Hasanali Mosalmanyazdi
    • Structural Engineering and Mechanics
    • /
    • 제91권2호
    • /
    • pp.163-175
    • /
    • 2024
  • The objective of this research is to improve public safety in civil engineering by recognizing fractures in concrete structures quickly and correctly. The study offers a new crack detection method based on advanced image processing and machine learning techniques, specifically transfer learning with convolutional neural networks (CNNs). Four pre-trained models (VGG16, AlexNet, ResNet18, and DenseNet161) were fine-tuned to detect fractures in concrete surfaces. These models constantly produced accuracy rates greater than 80%, showing their ability to automate fracture identification and potentially reduce structural failure costs. Furthermore, the study expands its scope beyond crack detection to identify concrete health, using a dataset with a wide range of surface defects and anomalies including cracks. Notably, using VGG16, which was chosen as the most effective network architecture from the first phase, the study achieves excellent accuracy in classifying concrete health, demonstrating the model's satisfactorily performance even in more complex scenarios.

EfficientNet의 전이학습을 통한 아스팔트 바인더의 레올로지적 특성 예측 (Prediction of Rheological Properties of Asphalt Binders Through Transfer Learning of EfficientNet)

  • 지봉준
    • 한국건설순환자원학회논문집
    • /
    • 제9권3호
    • /
    • pp.348-355
    • /
    • 2021
  • 도로 포장에 널리 사용되는 아스팔트는 도로가 노출되는 환경에 따라 요구되는 물리적 특성이 상이하다. 이에 따라 첨가제의 배합에 따라 아스팔트가 어떤 물리적 특성을 나타내는지 평가하고 도로의 교통, 기후 환경에 맞추어 적절한 배합을 선택하는 것이 아스팔트 도로의 수명을 확보하기 위해 필수적이다. 아스팔트의 다양한 물리적 특성 중 소성변형에 대한 저항성을 측정하기 위해서는 Dynamic shear rheometer(DSR) 테스트를 주로 사용한다. 하지만 DSR 테스트는 실험 세팅에 따라 결과가 상이하고 특정 온도 범위 내에만 측정이 가능한 단점이 있다. 따라서 본 연구에서는 DSR 테스트의 단점을 극복하고자, Atomic force microscopy로부터 수집된 이미지를 학습하여 레올로지적 특성을 예측하고자 했다. 딥러닝 아키텍처 중 하나인 EfficientNet을 통해 이미지를 학습하였고 딥러닝 모델의 한계인 많은 데이터를 요구한다는 점을 극복하기 위해 전이학습을 이용하여 학습을 진행하였다. 학습된 모델은 이종의 첨가제를 사용하였음에도 높은 정확도로 아스팔트 바인더의 레올로지적 특성을 예측하였다. 특히, 전이학습을 사용하지 않았을 때와 비교하여 빠르게 학습이 가능했다.

Effects of Scaffolding Types and Individual Metacognition Levels on Learning Achievement in Online Collaborative Argumentation

  • HUANG, Yipin;ZHENG, Xiaoli;KIM, Hoisoo
    • Educational Technology International
    • /
    • 제22권2호
    • /
    • pp.311-339
    • /
    • 2021
  • This study examined the effects of scaffolding types (Toulmin's Argument Pattern: TAP or Argumentation Vee Diagram: AVD) and individual metacognition levels (low or high) on students' learning achievement in online collaborative argumentation. A total of 191 Chinese undergraduates took part in this study. They were randomly assigned to either the TAP scaffolding, AVD scaffolding, or no scaffolding condition. They were teamed up in small groups of two or three students to argue with their peers using SNS as the online collaborative argumentation environment. The results revealed that students in the TAP and AVD scaffolding conditions did not gain significantly higher retention or transfer scores than students without scaffolding. However, students in the TAP scaffolding condition significantly outperformed those in the AVD scaffolding condition on transfer scores. Individual metacognition did not significantly affect learning achievement in online collaborative argumentation. Additionally, there was no significant interaction effect between scaffolding types and individual metacognition levels on retention or on transfer. The findings have implications for scaffolding design for online collaborative argumentation and also suggest that more attention should be paid to social metacognition rather than to individual metacognition when students work collaboratively.

전이학습 기반 기계번역 사후교정 모델 검증 (The Verification of the Transfer Learning-based Automatic Post Editing Model)

  • 문현석;박찬준;어수경;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.27-35
    • /
    • 2021
  • 기계번역 사후교정 (Automatic Post Editing, APE)이란 번역 시스템을 통해 생성한 번역문을 교정하는 연구 분야로, 영어-독일어와 같이 학습데이터가 풍부한 언어쌍을 중심으로 연구가 진행되고 있다. 최근 APE 연구는 전이학습 기반 연구가 주로 이루어지는데, 일반적으로 self supervised learning을 통해 생성된 사전학습 언어모델 혹은 번역모델이 주로 활용된다. 기존 연구에서는 번역모델에 전이학습 시킨 APE모델이 뛰어난 성과를 보였으나, 대용량 언어쌍에 대해서만 이루어진 해당 연구를 저 자원 언어쌍에 곧바로 적용하기는 어렵다. 이에 본 연구에서는 언어 혹은 번역모델의 두 가지 전이학습 전략을 대표적인 저 자원 언어쌍인 한국어-영어 APE 연구에 적용하여 심층적인 모델 검증을 진행하였다. 실험결과 저 자원 언어쌍에서도 APE 학습 이전에 번역을 한차례 학습시키는 것이 유의미하게 APE 성능을 향상시킨다는 것을 확인할 수 있었다.

전수 학습을 이용한 도로교통표지 데이터 분류 효율성 향상 연구 (Research on the Efficiency of Classification of Traffic Signs Using Transfer Learning)

  • 김준석;홍일영
    • 한국측량학회지
    • /
    • 제37권3호
    • /
    • pp.119-127
    • /
    • 2019
  • 본 연구에서는 1/1,000 수치지형도 및 정밀도로지도 제작에 있어서 도로 레이어를 구성하고 있는 교통안전표지 및 도로표지의 제작 공정에 있어서 딥러닝의 적용방안을 탐색하였다. 딥러닝의 이미지 분류에서 활용하는 전수학습을 이용하여 취득한 영상에 대한 학습자료 구축을 통해 도로 표지정보의 자동분류를 수행하였다. 분석결과 주의, 규제, 지시, 보조는 촬영된 이미지의 품질 및 형태 등 여러 가지 요소에 의해 정확도가 불규칙하게 나타났지만, 안내표지의 경우는 정확도가 97% 이상으로 높게 나타났다. 수치지도제작에 있어 전수학습을 이용한 이미지 자동분류 방식은 교통안전표지를 포함한 다양한 레이어들에 대한 자료 취득과 분류에 있어서 활용이 증가할 것으로 기대한다.

R-FCN과 Transfer Learning 기법을 이용한 영상기반 건설 안전모 자동 탐지 (Image-Based Automatic Detection of Construction Helmets Using R-FCN and Transfer Learning)

  • 박상윤;윤상현;허준
    • 대한토목학회논문집
    • /
    • 제39권3호
    • /
    • pp.399-407
    • /
    • 2019
  • 대한민국에서 건설업은 타 업종들과 비교하여 안전사고의 위험성이 가장 높게 나타난다. 따라서 건설업 내 안전성 향상을 도모하기 위해 여러 연구가 예전부터 진행이 되어 왔고, 본 연구에선 건설현장 영상 데이터를 기반으로 물체 탐지 및 분류 알고리즘을 이용해서 효과적인 안전모 자동탐지 시스템을 구축하여 건설현장 노동자들의 안전성 향상에 기여하고자 한다. 본 연구에서 사용된 알고리즘은 Convolutional Neural Network (CNN) 기반의 물체 탐지 및 분류 알고리즘인 Region-based Fully Convolutional Networks (R-FCN)이고 이를 Transfer Learning 기법을 사용하여 딥러닝을 실시하였다. ImageNet에서 수집한 1089장의 사람과 안전모가 포함된 영상으로 학습을 시행하였고 그 결과, 사람과 안전모의 mean Average Precision (mAP)은 각각 0.86, 0.83로 측정되었다.

Deep Learning-based Pes Planus Classification Model Using Transfer Learning

  • Kim, Yeonho;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.21-28
    • /
    • 2021
  • 본 연구는 기존 편평발 측정을 위해 사용되던 다양한 방법의 한계를 보완할 수 있는 새로운 측정 방법으로 전이학습을 적용한 딥러닝 기반 편평발 분류 방법론을 제안한다. 편평발 88장, 정상발 88장으로 이루어진 총 176장의 이미지 데이터를 활용하여, 적은 데이터로도 우수한 예측 모델을 생성할 수 있는 데이터 증폭 기술과 사전학습 모델인 VGG16 구조를 활용하는 전이학습 기술을 적용하여 제안 모델의 학습을 진행하였다. 제안 모델의 우수성을 확인하기 위하여 기본 CNN 기반 모델과 제안 방법론의 예측 정확도를 비교하는 실험을 수행하였다. 기본 CNN 모델의 경우 훈련 정확도는 77.27%, 검증 정확도는 61.36%, 그리고 시험 정확도는 59.09%로 나타났으며, 제안 모델의 경우 훈련 정확도는 94.32%, 검증 정확도는 86.36%, 그리고 시험 정확도는 84.09%로 나타나 기본 CNN 모델에 비해 제안 모델의 정확도가 큰 폭으로 향상된 것을 확인하였다.

심층 전이 학습을 이용한 이미지 검색의 문화적 특성 분석 (Analysis of Cultural Context of Image Search with Deep Transfer Learning)

  • Kim, Hyeon-sik;Jeong, Jin-Woo
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.674-677
    • /
    • 2020
  • The cultural background of users utilizing image search engines has a significant impact on the satisfaction of the search results. Therefore, it is important to analyze and understand the cultural context of images for more accurate image search. In this paper, we investigate how the cultural context of images can affect the performance of image classification. To this end, we first collected various types of images (e.g,. food, temple, etc.) with various cultural contexts (e.g., Korea, Japan, etc.) from web search engines. Afterwards, a deep transfer learning approach using VGG19 and MobileNetV2 pre-trained with ImageNet was adopted to learn the cultural features of the collected images. Through various experiments we show the performance of image classification can be differently affected according to the cultural context of images.