• 제목/요약/키워드: hyperparameter

검색결과 125건 처리시간 0.029초

Functional Neural Networks 기반의 자기 지도적 영상 잡음 제거 (Functional Neural Networks for Self-supervised Image Denoising)

  • 장영일;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.4-7
    • /
    • 2022
  • 기존 합성곱 신경망 기반의 잡음 제거 네트워크들은 학습을 위한 noisy-clean 데이터 쌍을 필요로 한다. 하지만 실제 카메라 잡음의 경우, 잡음에 대한 깨끗한 원본 영상을 얻는 것은 불가능하거나 많은 비용이 소모된다. 따라서 이러한 방법을 해결하기 위하여 원본 영상 없이 잡음 영상만으로만 잡음 제거 네트워크를 학습하는 방법들이 제안되어왔다. 그 중 카메라 잡음 영상을 처리하기 위한 대표적인 방법으로 학습과 추론에서 비대칭적인 downsampling을 사용하는 AP-BSN이 제안되었다. 본 논문에서는 Functional neural network를 AP-BSN 알고리즘에 적용하여 다양한 downsampling ratio에 대응되는 하나의 네트워크를 학습하였다. 이를 통해 기존 hyperparameter로 사용되던 downsampling ratio에 대한 결과를 하나의 네트워크에서 분석 및 확인하였다. 또한 해당 파라미터를 조절함으로써 다양한 잡음 제거 후보들을 추출하고 사용자가 원하는 잡음 제거 정도를 조정할 수 있도록 하였다.

  • PDF

앙상블 조합 방법에 따른 주가 예측 성능 비교 (Comparison of Stock Price Forecasting Performance by Ensemble Combination Method)

  • 양현성;박준;소원호;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.524-527
    • /
    • 2022
  • 본 연구에서는 머신러닝(Machine Learning, ML)과 딥러닝(Deep Learning, DL) 모델을 앙상블(Ensemble)하여 어떠한 주가 예측 방법이 우수한지에 대한 연구를 하고자 한다. 연구에 사용된 모델은 하이퍼파라미터(Hyperparameter) 조정을 통하여 최적의 결과를 출력한다. 앙상블 방법은 머신러닝과 딥러닝 모델의 앙상블, 머신러닝 모델의 앙상블, 딥러닝 모델의 앙상블이다. 세 가지 방법으로 얻은 결과를 평균 제곱근 오차(Root Mean Squared Error, RMSE)로 비교 분석하여 최적의 방법을 찾고자 한다. 제안한 방법은 주가 예측 연구의 시간과 비용을 절약하고, 최적 성능 모델 판별에 도움이 될 수 있다고 사료된다.

SG-Drop: Faster Skip-Gram by Dropping Context Words

  • Kim, DongJae;Synn, DoangJoo;Kim, Jong-Kook
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1014-1017
    • /
    • 2020
  • Many natural language processing (NLP) models utilize pre-trained word embeddings to leverage latent information. One of the most successful word embedding model is the Skip-gram (SG). In this paper, we propose a Skipgram drop (SG-Drop) model, which is a variation of the SG model. The SG-Drop model is designed to reduce training time efficiently. Furthermore, the SG-Drop allows controlling training time with its hyperparameter. It could train word embedding faster than reducing training epochs while better preserving the quality.

머신러닝 학습 부산물 추적을 위한 프레임워크 (An Efficient Dynamic Workload Balancing Strategy)

  • 김은진;이영섭;이성진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.41-42
    • /
    • 2020
  • 머신러닝이 보편화되면서 모델 학습을 돕기 위한 머신러닝 및 데이터과학 도구의 수요가 증가하고 있다. 머신 러닝을 사용하는 연구에서는 다양한 파라미터에 대한 실험이 진행되어 많은 학습 부산물이 생성 된다. 하지만 기존의 학습 부산물을 관리하는 프레임워크는 하나의 실험을 진행하는데 모든 경우의 수를 진행해 그 규모가 크다. 본 연구는 기존의 도구가 가지는 규모 문제를 개선하고, 주기적으로 메일을 사용자에게 전송해 실험과정을 보고하는 새로운 도구를 제안한다. 이러한 시스템은 학습과정에서 사용자가 의도한 파라미터의 학습이 진행되는지 추적가능하다.

  • PDF

Automatic COVID-19 Prediction with Optimized Machine Learning Classifiers Using Clinical Inpatient Data

  • Abbas Jafar;Myungho Lee
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.539-541
    • /
    • 2023
  • COVID-19 is a viral pandemic disease that spreads widely all around the world. The only way to identify COVID-19 patients at an early stage is to stop the spread of the virus. Different approaches are used to diagnose, such as RT-PCR, Chest X-rays, and CT images. However, these are time-consuming and require a specialized lab. Therefore, there is a need to develop a time-efficient diagnosis method to detect COVID-19 patients. The proposed machine learning (ML) approach predicts the presence of coronavirus based on clinical symptoms. The clinical dataset is collected from the Israeli Ministry of Health. We used different ML classifiers (i.e., XGB, DT, RF, and NB) to diagnose COVID-19. Later, classifiers are optimized with the Bayesian hyperparameter optimization approach to improve the performance. The optimized RF outperformed the others and achieved an accuracy of 97.62% on the testing data that help the early diagnosis of COVID-19 patients.

블록체인 기반 학습시스템에서, 학습데이터의 효율적 관리를 위한 하이퍼파라미터 관리방법 연구 (A study on hyperparameter management methods for efficient management of learning data in blockchain-based learning systems)

  • 민연아;백영태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.671-672
    • /
    • 2023
  • 블록체인 기술을 통한 정확하고 투명한 데이터관리의 장점을 학습 시스템에 적용하는 사례가 증가하고 있으며 이에 따라 학습자 만족도와 참여율을 높이기 위한 학습데이터의 효율적 관리가 필요하다. 원격학습에서 학습 연계성과 만족도는 학습자의 학습참여율과 학습에서의 만족도에 변할 수 있음을 감안하여 당 변수에서 기인하는 하이퍼파라미터를 조정하여 학습자의 학습패턴과 학습연속성을 높이기 위한 노력을 하였다. 본 논문에서 제안하는 알고리즘을 적용하여 학습자 만족도를 조사한 결과, 적용 전 대비 10% 이상 학습 만족도 및 학습연계 의향률이 높아짐을 확인할 수 있다.

  • PDF

Piece and Conquer Fireworks 알고리즘을 이용한 자율주행 알고리즘 하이퍼파라미터 최적화 기법 (Hyperparameter Optimization of Autonomous Driving exploiting Piece and Conquer Fireworks Algorithm)

  • 김명준;김건우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.365-366
    • /
    • 2023
  • 본 논문은 F1TENTH 와 같은 자율주행 경주 대회를 위한 고전적인 자율주행 알고리즘의 파라미터 최적화에 관한 연구를 다룬다. 고전적인 자율주행 알고리즘은 하이퍼파라미터의 영향을 크게 받고 더 나아가서 하이퍼파라미터의 설정에 따라서 성능의 차이가 크다. 이 하이퍼파라미터를 빠르게 찾기 위하여 Piece and Conquer Fireworks 방법을 제안한다. 결과적으로Random search에 비해서 일반 Fireworks알고리즘은 약8.3배, Piece and Conquer Fireworks알고리즘은 약 28.5배 빠른 성능을 보여준다.

BERT-Based Logits Ensemble Model for Gender Bias and Hate Speech Detection

  • Sanggeon Yun;Seungshik Kang;Hyeokman Kim
    • Journal of Information Processing Systems
    • /
    • 제19권5호
    • /
    • pp.641-651
    • /
    • 2023
  • Malicious hate speech and gender bias comments are common in online communities, causing social problems in our society. Gender bias and hate speech detection has been investigated. However, it is difficult because there are diverse ways to express them in words. To solve this problem, we attempted to detect malicious comments in a Korean hate speech dataset constructed in 2020. We explored bidirectional encoder representations from transformers (BERT)-based deep learning models utilizing hyperparameter tuning, data sampling, and logits ensembles with a label distribution. We evaluated our model in Kaggle competitions for gender bias, general bias, and hate speech detection. For gender bias detection, an F1-score of 0.7711 was achieved using an ensemble of the Soongsil-BERT and KcELECTRA models. The general bias task included the gender bias task, and the ensemble model achieved the best F1-score of 0.7166.

Anomaly Detection System for Solar Power Distribution Panels utilizing Thermal Images

  • Kwang-Seong Shin;Jong-Chan Kim;Seong-Yoon Shin
    • Journal of information and communication convergence engineering
    • /
    • 제22권2호
    • /
    • pp.159-164
    • /
    • 2024
  • This study aimed to develop an advanced anomaly-detection system tailored for solar power distribution panels using thermal imaging cameras to ensure operational stability. It addresses the imperative shift toward digitalized safety management in electrical facilities, transcending the limitations of conventional empirical methodologies. Our proposed system leverages a faster R-CNN-based artificial intelligence model optimized through meticulous hyperparameter tuning to efficiently detect anomalies in distribution panels. Through comprehensive experimentation, we validated the efficacy of the system in accurately identifying anomalies, thereby propelling safety protocols forward during the fourth industrial revolution. This study signifies a significant stride toward fortifying the integrity and resilience of solar power distribution systems, which is pivotal for adapting to emerging technological paradigms and evolving safety standards in the energy sector. These findings offer valuable insights for enhancing the reliability and efficiency of safety management practices and fostering a safer and more sustainable energy landscape.

Experimental investigating and machine learning prediction of GNP concentration on epoxy composites

  • Hatam K. Kadhom;Aseel J. Mohammed
    • Structural Engineering and Mechanics
    • /
    • 제90권4호
    • /
    • pp.403-415
    • /
    • 2024
  • We looked at how the damping qualities of epoxy composites changed when different amounts of graphite nanoplatelets (GNP) were added, from 0% to 6% by weight. A mix of free and forced vibration tests helped us find the key GNP content that makes the damper ability better the most. We also created a Representative Volume Element (RVE) model to guess how the alloys would behave mechanically and checked these models against testing data. An Artificial Neural Network (ANN) was also used to guess how these compounds would react to motion. With proper hyperparameter tweaking, the ANN model showed good correlation (R2=0.98) with actual data, indicating its ability to predict complex material behavior. Combining these methods shows how GNPs impact epoxy composite mechanical properties and how machine learning might improve material design. We show how adding GNPs to epoxy composites may considerably reduce vibration. These materials may be used in industries that value vibration damping.