• 제목/요약/키워드: training data

검색결과 7,432건 처리시간 0.035초

SVM-NNM을 이용한 증발접시 증발량자료의 분해기법 (Disaggregation Approach of the Pan Evaporation using SVM-NNM)

  • 김성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1560-1563
    • /
    • 2010
  • The goal of this research is to apply the neural networks model for the disaggregation of the pan evaporation (PE) data, Republic of Korea. The neural networks model consists of support vector machine neural networks model (SVM-NNM). The disaggregation means that the yearly PE data divides into the monthly PE data. And, for the performances of the neural networks model, it is composed of training and test performances, respectively. The training and test performances consist of the historic, the generated, and the mixed data, respectively. From this research, we evaluate the impact of SVM-NNM for the disaggregation of the nonlinear time series data. We should, furthermore, construct the credible data of the monthly PE from the disaggregation of the yearly PE data, and can suggest the methodology for the irrigation and drainage networks system.

  • PDF

추계학적 신경망 접근법을 이용한 수문학적 시계열의 모형화 (Modeling of Hydrologic Time Series using Stochastic Neural Networks Approach)

  • 김성원;김정헌;박기범
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1346-1349
    • /
    • 2010
  • The goal of this research is to apply the neural networks models for the disaggregation of the pan evaporation (PE) data, Republic of Korea. The neural networks models consist of generalized regression neural networks model (GRNNM) and multilayer perceptron neural networks model (MLP-NNM), respectively. The disaggregation means that the yearly PE data divides into the monthly PE data. And, for the performances of the neural networks models, they are composed of training and test performances, respectively. The training and test performances consist of the historic, the generated, and the mixed data, respectively. From this research, we evaluate the impact of GRNNM and MLP-NNM for the disaggregation of the nonlinear time series data. We should, furthermore, construct the credible data of the monthly PE from the disaggregation of the yearly PE data, and can suggest the methodology for the irrigation and drainage networks system.

  • PDF

빅데이터 양성 교육 교과과정 개선을 위한 회귀분석 기반의 만족도 조사에 관한 연구 (A Study on Satisfaction Survey Based on Regression Analysis to Improve Curriculum for Big Data Education)

  • 최현
    • 한국산업융합학회 논문집
    • /
    • 제22권6호
    • /
    • pp.749-756
    • /
    • 2019
  • Big data is structured and unstructured data that is so difficult to collect, store, and so on due to the huge amount of data. Many institutions, including universities, are building student convergence systems to foster talents for data science and AI convergence, but there is an absolute lack of research on what kind of education is needed and what kind of education is required for students. Therefore, in this paper, after conducting the correlation analysis based on the questionnaire on basic surveys and courses to improve the curriculum by grasping the satisfaction and demands of the participants in the "2019 Big Data Youth Talent Training Course" held at K University, Regression analysis was performed. As a result of the study, the higher the satisfaction level, the satisfaction with class or job connection, and the self-development, the more positive the evaluation of program efficiency.

A Federated Multi-Task Learning Model Based on Adaptive Distributed Data Latent Correlation Analysis

  • Wu, Shengbin;Wang, Yibai
    • Journal of Information Processing Systems
    • /
    • 제17권3호
    • /
    • pp.441-452
    • /
    • 2021
  • Federated learning provides an efficient integrated model for distributed data, allowing the local training of different data. Meanwhile, the goal of multi-task learning is to simultaneously establish models for multiple related tasks, and to obtain the underlying main structure. However, traditional federated multi-task learning models not only have strict requirements for the data distribution, but also demand large amounts of calculation and have slow convergence, which hindered their promotion in many fields. In our work, we apply the rank constraint on weight vectors of the multi-task learning model to adaptively adjust the task's similarity learning, according to the distribution of federal node data. The proposed model has a general framework for solving optimal solutions, which can be used to deal with various data types. Experiments show that our model has achieved the best results in different dataset. Notably, our model can still obtain stable results in datasets with large distribution differences. In addition, compared with traditional federated multi-task learning models, our algorithm is able to converge on a local optimal solution within limited training iterations.

준지도 학습 기반 객체 탐지 모델에서 데이터셋 변화에 따른 성능 변화 (Performance Change accroding to Data Set Size Change in Semi-Supervised Learning based Object Detection)

  • 유승수;황원준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.88-90
    • /
    • 2022
  • Semi Supervised Learning 은 일부의 data 에는 labeling 을 하고 나머지 data 에는 labeling 을 안한채로 학습을 진행하는 방법이다. Object Detection 은 이미지에서 여러개의 객체들의 대한 위치를 여러개의 바운딩 박스로 지정해서 찾는 Computer Vision task 이다. 당연하게도, model training 단계에서 사용되는 data set 의 크기가 크고 객체가 많을 수록 일반적으로 model 의 성능이 좋아 질 것이다. 하지만 실험 환경에 따라 data set 을 잘 확보하지 못하던가, 실험 장치가 데이터 셋을 감당하지 못하는 등의 문제가 발생 할 수 있다. 그렇기에 본 논문에서는 semi supervised learning based object detection model 을 알아보고 data set 의 크기를 조절해가며 modle 을 training 시킨 뒤 data set 의 크기에 따라 성능이 어떻게 변화하는 지를 알아 볼 것이다.

  • PDF

Ka-밴드 구름레이더 자료품질 및 구름통계 기초연구 (Preliminary Analysis of Data Quality and Cloud Statistics from Ka-Band Cloud Radar)

  • 예보영;이규원;권수현;이호우;하종철;김연희
    • 대기
    • /
    • 제25권1호
    • /
    • pp.19-30
    • /
    • 2015
  • The Ka-band cloud radar (KCR) has been operated by the National Institute of Meteorological Research (NIMR) of Korea Meteorological Administration (KMA) at Boseong National Center for Intensive Observation of severe weather since 2013. Evaluation of data quality is an essential process to further analyze cloud information. In this study, we estimate the measurement error and the sampling uncertainty to evaluate data quality. By using vertically pointing data, the statistical uncertainty is obtained by calculating the standard deviation of each radar parameter. The statistical uncertainties decrease as functions of sampling number. The statistical uncertainties of horizontal and vertical reflectivities are identical (0.28 dB). On the other hand, the statistical uncertainties of Doppler velocity (spectrum width) are 2.2 times (1.6 times) larger at the vertical channel. The reflectivity calibration of KCR is also performed using X-band vertically pointing radar (VertiX) and 2-dimensional video disdrometer (2DVD). Since the monitoring of calibration values is useful to evaluate radar condition, the variation of calibration is monitored for five rain events. The average of calibration bias is 10.77 dBZ and standard deviation is 3.69 dB. Finally, the statistical characteristics of cloud properties have been investigated during two months in autumn using calibrated reflectivity. The percentage of clouds is about 26% and 16% on September to October. However, further analyses are required to derive general characteristics of autumn cloud in Korea.

적응형 분광 군집 방법을 이용한 다중 특징 데이터 군집화 (Multiview Data Clustering by using Adaptive Spectral Co-clustering)

  • 손정우;전준기;이상윤;김선중
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.686-691
    • /
    • 2016
  • 본 논문에서는 다수의 특징, 특히 셋 이상의 특징을 가지는 데이터에 대한 분광 군집 방법인 적응형 분광 군집 방법을 소개하고, 적응형 분광 군집 방법의 성능을 시뮬레이션 데이터와 다중 언어 데이터를 이용하여 분석한다. 적응형 분광 군집 방법에서는 특징 간 서로 다른 정보들을 공유하여 데이터를 군집화함으로써 군집 성능을 높인다. 이때, 서로 다른 특징 간의 정보 공유를 효율적으로 하기 위해, 협업학습을 도입했다. 협업 학습에서는 각 특징이 서로 독립이 되도록 가중치를 학습하고, 학습된 가중치에 따라 정보를 전달한다. 이러한 과정을 통해 일반적인 특징 결합이나, 모든 특징 간 독립을 가정한 기존 협업학습 기반의 분광 군집에 비해 정보 공유의 효율성을 높인다. 실험에서는 시뮬레이션 데이터와 다중 언어문서 데이터를 이용하여 성능을 검증하였으며, 반복과정에서의 성능 변화와 정보 전달 결과 변화하는 모습을 제시함으로써 적응형 분광 군집 방법의 유의미한 성능 향상에 대해 분석하였다.

은행 텔레마케팅 예측을 위한 레이블 전파와 협동 학습의 결합 방법 (A Fusion Method of Co-training and Label Propagation for Prediction of Bank Telemarketing)

  • 김아름;조성배
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.686-691
    • /
    • 2017
  • 텔레마케팅은 지식정보화 사회가 되면서 기업 마케팅 활동의 중심축으로 발전하였다. 최근 금융 데이터에 기계학습을 적용하는 연구가 활발하게 진행되고 있으며 좋은 성과를 내고 있다. 하지만 지도학습법이 대부분이어서 많은 양의 클래스가 있는 데이터가 필요하다. 본 논문에서는 텔레마케팅의 목표 고객을 선정하는데 클래스가 없는 금융 데이터에 자동으로 클래스를 부여하는 방법을 제안한다. 준지도 학습법 중 레이블 전파와 의사결정나무 기반의 협동 학습으로 클래스가 없는 데이터를 레이블링한다. 신뢰도가 낮은 데이터를 제거한 후 두 방법이 같은 클래스로 예측한 데이터만 추출한다. 이를 학습 데이터에 추가한 후 의사결정나무를 학습하여 테스트 데이터로 평가한다. 제안하는 방법의 유용성을 입증하기 위해 실제 포르투갈 은행의 텔레마케팅 데이터를 이용하여 실험을 수행하였다. 비교 실험 결과, 정확도가 83.39%로 1.82% 향상되고, 정밀도가 19.37%로 2.67% 향상되었으며, t-검증을 통해 유의미한 성능 향상이 있음을 입증하였다.

클래스 초월구를 이용한 프로토타입 기반 분류 (Prototype-Based Classification Using Class Hyperspheres)

  • 이현종;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권10호
    • /
    • pp.483-488
    • /
    • 2016
  • 본 논문은 최근접 이웃 규칙을 이용한 프로토타입을 이용하는 분류 학습을 제안한다. 훈련 데이터가 대표하는 클래스 영역을 초월구로 분할하는데 최근접 이웃규칙을 적용시키며, 초월구는 동일 클래스 데이터들만 포함시킨다. 초월구의 반지름은 가장 인접한 다른 클래스 데이터와 가장 먼 동일 클래스 데이터의 중간 거리 값으로 결정한다. 그리고 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합을 선택하기 위해 집합 덮개 최적화를 이용한다. 제안하는 선택 방법은 클래스 별 프로토타입을 선택하는 그리디 알고리즘으로 설계되며, 대규모 훈련 데이터에 대한 병렬처리가 가능하다. 분류 예측은 최근접 이웃 규칙을 이용하며, 새로운 훈련 데이터는 프로토타입 집합이다. 실험에서 제안하는 방법은 기 연구된 학습 방법에 비해 일반화 성능이 우수하다.

Influence of abiotic factors on seasonal incidence of pests of tasar Silkworm Antheraea mylitta D.

  • Siddaiah, Aruna A.;Prasad, Rajendra;Rai, Suresh;Dubey, Omprakash;Satpaty, Subrat;Sinha, Ravibhushan;Prsad, Suraj;Sahay, Alok
    • International Journal of Industrial Entomology and Biomaterials
    • /
    • 제29권1호
    • /
    • pp.135-144
    • /
    • 2014
  • Rearing of tropical tasar silkworm, Antheraea mylitta Drury is mainly conducted in outdoor on Terminalia tomentosa W. & A. a nature grown primary host plant available in forest and also on raised primary host plant Terminalia arjuna Bedd. Temperature, relative humidity and rainfall are the main environmental factors for occurrence of pests (parasites and predators) of tasar silkworm during I, II and III crop rearing in the tropical tasar producing zones. The present study was aimed to study the influence of abiotic factors on prevalence of tasar silkworm pests. The study was conducted at different agro-climatic regions viz., Central Tasar Research &Training Institute, Ranchi, Jharkhand, Regional Extension Centre, Katghora, Chattisgarh and Regional Extension Centre, Hatgamaria during 2010-13 covering 3 seed crop and 6 commercial crops. Data on incidence of tropical tasar silkworm endo-parasitoids like Uzi Fly, Blepharipa zebina Walker and Ichneumon fly (Yellow Fly), Xathopimpla pedator, Fabricius and Predators such as Stink bug (Eocanthecona furcellata Wolf), Reduviid bug (Sycanus collaris Fabricius) and Wasp (Vespa orientalis Linnaeus) was recorded Weekly. The meteorological data was collected daily. Data was collected from 4 different agro-climatic zones of tasar growing areas. Analysis of the data revealed a significant negative correlation between abiotic factors and incidence of ichneumon fly and uzi fly. Based on the 3 years data on prevalence of pests region-wise pest calendars and prediction models were developed.