• 제목/요약/키워드: Multilayer Neural Network

검색결과 271건 처리시간 0.035초

앙상블을 이용한 기계학습 기법의 설계: 뜰개 이동경로 예측을 통한 실험적 검증 (Ensemble Design of Machine Learning Technigues: Experimental Verification by Prediction of Drifter Trajectory)

  • 이찬재;김용혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.57-67
    • /
    • 2018
  • 앙상블 기법은 기계학습에서 다수의 알고리즘을 사용하여 더 좋은 성능을 내기 위해 사용하는 방법이다. 본 논문에서는 앙상블 기법에서 많이 사용되는 부스팅과 배깅에 대해 소개를 하고, 서포트벡터 회귀, 방사기저함수 네트워크, 가우시안 프로세스, 다층 퍼셉트론을 이용하여 설계한다. 추가적으로 순환신경망과 MOHID 수치모델을 추가하여 실험을 진행한다. 실험적 검증를 위해 사용하는 뜰개 데이터는 7 개의 지역에서 관측된 683 개의 관측 자료다. 뜰개 관측 자료를 이용하여 6 개의 알고리즘과의 비교를 통해 앙상블 기법의 성능을 검증한다. 검증 방법으로는 평균절대오차를 사용한다. 실험 방법은 배깅, 부스팅, 기계학습을 이용한 앙상블 모델을 이용하여 진행한다. 각 앙상블 모델마다 동일한 가중치를 부여한 방법, 차등한 가중치를 부여한 방법을 이용하여 오류율을 계산한다. 가장 좋은 오류율을 나타낸 방법은 기계학습을 이용한 앙상블 모델로서 6 개의 기계학습의 평균에 비해 61.7%가 개선된 결과를 보였다.

CNN 모델을 이용한 프로그램 코드 변경 예측 (Predicting Program Code Changes Using a CNN Model)

  • 김동관
    • 한국융합학회논문지
    • /
    • 제12권9호
    • /
    • pp.11-19
    • /
    • 2021
  • 소프트웨어 시스템은 생명주기동안 기능 추가, 버그 수정, 새로운 컴퓨팅 환경 수용 등의 다양한 이유로 프로그램 코드 변경이 요구된다. 이러한 코드 수정 과정에서 새로운 오류 발생을 가져올 수 있으므로 프로그램 코드 수정 과정은 새로운 시스템 개발 못지 않게 신중하게 처리되야 한다. 또한, 오픈 소스 프로그램에 대한 재사용이 일반화된 소프트웨어 개발환경에서 오픈 소스 프로그램의 코드 변경 가능성을 예측할 수 있다면, 보다 양질의 프로그램 개발 효과를 기대할 수 있을 것이다. 본 논문은 소스 코드 변경을 예측하는 Convolutional Neural Network (CNN) 기반의 딥러닝 모델을 제안한다. 소스 코드 변경을 예측하는 문제는 딥러닝의 이진 분류 문제이며 레이블된 데이터가 요구되는 지도학습을 사용한다. 코드 예측 모델의 학습 및 시험을 위해 깃허브에서 수집한 Java 소스 코드와 코드 변경 로그를 데이터로 사용한다. 수집된 Java 소스 코드에서 소프트웨어 메트릭스를 계산한 후 제안된 코드 변경 예측 모델의 입력 데이터로 사용한다. 제안된 모델의 성능 평가를 위해 정밀도, 재현율, F1점수, 정확도가 측정되었으며 각각의 평가 지표에 있이서 CNN 모델은 95%, 다층 퍼셉트 기반의 DNN 모델은 92%를 달성했다.

신경망 및 통계 기법 기반의 기계학습을 이용한 유류유출 및 기상 예측 연구 동향 (A Survey on Oil Spill and Weather Forecast Using Machine Learning Based on Neural Networks and Statistical Methods)

  • 김경도;김용혁
    • 한국융합학회논문지
    • /
    • 제8권10호
    • /
    • pp.1-8
    • /
    • 2017
  • 정확한 예측은 미래에 일어날 현상에 대해 효과적으로 준비 혹은 대처 할 수 있게 해준다. 특히, 기상 현상은 인간의 생활과 밀접한 연관이 있으며, 발생할 수 있는 기상 및 재난 예측을 통해 인명, 재산 등의 피해로부터 예방 할 수 있게 해준다. 해상에서 발생할 수 있는 재난 중 하나인 유류유출 사고에 대해 빠르고 효과적으로 대응하기 위해서는 유출유의 이동과 주변 해역의 기상을 정확하게 예측하는 것이 중요하다. 본 논문에서는 분류 및 회귀 예측과 관련된 연구에서 준수한 성능 및 예측 가능성을 보여준 기계학습 기법으로 서포트 벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저함수 네트워크의 총 4 개의 기계학습 기법을 선별하였다. 선별한 기계학습 기법을 이용하여 유류유출의 탐지와 바람, 강우량, 오존 등의 기상 데이터를 예측하는 연구들의 연구 방법과 결과 등을 설명하며 이를 활용한 기계학습 기반 유류유출 예측 모델의 적용 가능성을 제시한다.

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

비선형 특징투영 기법을 이용한 웨이블렛 기반 근전도 패턴인식 (A Wavelet-Based EMG Pattern Recognition with Nonlinear Feature Projection)

  • 추준욱;문인혁
    • 전자공학회논문지SC
    • /
    • 제42권2호
    • /
    • pp.39-48
    • /
    • 2005
  • 본 논문에서는 다기능 근전의수를 제어하기 위해 전완에서 취득한 4 채널의 근전도로부터 9 가지 동작을 인식하는 새로운 방법을 제안한다. 비정상 신호특성을 가진 근전도를 해석하기 위해서 시간-주파수 영역에서 표현되는 특징벡터를 웨이블렛 패킷변환을 통해 추출한다. 높은 차원을 가지는 시간-주파수 특징벡터에 대하여 차원축소와 비선형변환을 수행하기 위해 PCA와 SOFM으로 구성된 특징투영 방법을 제안한다. PCA를 이용한 차원축소는 패턴분류기의 구조를 단순화하고 패턴인식을 위한 계산시간을 단축할 수 있다. SOFM을 이용한 비선형변환은 PCA에 의해 차원이 축소된 특징벡터를 새로운 공간으로 투영함으로써 클래스 분리도를 향상시킨다. 마지막으로 각 동작은 패턴분류기인 다층 신경회로망에 의해 인식된다. 실험 결과로부터 제안한 방법이 높은 인식률을 보임과 동시에 연속적인 패턴인식을 위한 실시간 구현이 가능함을 보인다.

Shear behavior of geotextile-encased gravel columns in silty sand-Experimental and SVM modeling

  • Dinarvand, Reza;Ardakani, Alireza
    • Geomechanics and Engineering
    • /
    • 제28권5호
    • /
    • pp.505-520
    • /
    • 2022
  • In recent years, geotextile-encased gravel columns (usually called stone columns) have become a popular method to increasing soil shear strength, decreasing the settlement, acceleration of the rate of consolidation, reducing the liquefaction potential and increasing the bearing capacity of foundations. The behavior of improved loose base-soil with gravel columns under shear loading and the shear stress-horizontal displacement curves got from large scale direct shear test are of great importance in understanding the performance of this method. In the present study, by performing 36 large-scale direct shear tests on sandy base-soil with different fine-content of zero to 30% in both not improved and improved with gravel columns, the effect of the presence of gravel columns in the loose soils were investigated. The results were used to predict the shear stress-horizontal displacement curve of these samples using support vector machines (SVM). Variables such as the non-plastic fine content of base-soil (FC), the area replacement ratio of the gravel column (Arr), the geotextile encasement and the normal stress on the sample were effective factors in the shear stress-horizontal displacement curve of the samples. The training and testing data of the model showed higher power of SVM compared to multilayer perceptron (MLP) neural network in predicting shear stress-horizontal displacement curve. After ensuring the accuracy of the model evaluation, by introducing different samples to the model, the effect of different variables on the maximum shear stress of the samples was investigated. The results showed that by adding a gravel column and increasing the Arr, the friction angle (ϕ) and cohesion (c) of the samples increase. This increase is less in base-soil with more FC, and in a proportion of the same Arr, with increasing FC, internal friction angle and cohesion decreases.

Fast Spectral Inversion of the Strong Absorption Lines in the Solar Chromosphere Based on a Deep Learning Model

  • Lee, Kyoung-Sun;Chae, Jongchul;Park, Eunsu;Moon, Yong-Jae;Kwak, Hannah;Cho, Kyuhyun
    • 천문학회보
    • /
    • 제46권2호
    • /
    • pp.46.3-47
    • /
    • 2021
  • Recently a multilayer spectral inversion (MLSI) model has been proposed to infer the physical parameters of plasmas in the solar chromosphere. The inversion solves a three-layer radiative transfer model using the strong absorption line profiles, H alpha and Ca II 8542 Å, taken by the Fast Imaging Solar Spectrograph (FISS). The model successfully provides the physical plasma parameters, such as source functions, Doppler velocities, and Doppler widths in the layers of the photosphere to the chromosphere. However, it is quite expensive to apply the MLSI to a huge number of line profiles. For example, the calculating time is an hour to several hours depending on the size of the scan raster. We apply deep neural network (DNN) to the inversion code to reduce the cost of calculating the physical parameters. We train the models using pairs of absorption line profiles from FISS and their 13 physical parameters (source functions, Doppler velocities, Doppler widths in the chromosphere, and the pre-determined parameters for the photosphere) calculated from the spectral inversion code for 49 scan rasters (~2,000,000 dataset) including quiet and active regions. We use fully connected dense layers for training the model. In addition, we utilize a skip connection to avoid a problem of vanishing gradients. We evaluate the model by comparing the pairs of absorption line profiles and their inverted physical parameters from other quiet and active regions. Our result shows that the deep learning model successfully reproduces physical parameter maps of a scan raster observation per second within 15% of mean absolute percentage error and the mean squared error of 0.3 to 0.003 depending on the parameters. Taking this advantage of high performance of the deep learning model, we plan to provide the physical parameter maps from the FISS observations to understand the chromospheric plasma conditions in various solar features.

  • PDF

최적설계 시스템을 이용한 부품에 대한 형상설계 방법론 (Methodology of Shape Design for Component Using Optimal Design System)

  • 이준성;조성규
    • 한국산학기술학회논문지
    • /
    • 제19권1호
    • /
    • pp.672-679
    • /
    • 2018
  • 본 논문은 최적설계 시스템을 이용한 형상설계 방법론에 대해 설명하고 있으며, 일반적으로 3차원 해석은 설계를 위해 반드시 필요하다. 퍼지지식처리 수법과 계산기하학적 기법에 바탕을 둔 자동화된 유한요소 메쉬 생성 기법은 상용화된 유한요소해석코드와 솔리드모델러와 함께 시스템에 결합되어 있다. 또한, 다층형 신경망의 도움과 함께 개발된 시스템은 다차원 설계변수 공간에 존재하는 여러 만족하는 설계해인 디자인윈도우를 얻을 수 있게 해준다. 개발된 최적화 설계 시스템 사용된 부품을 평가하는데 성공적으로 적용하였다. 사이드 하우징 브라켓을 현장에서 사용되어지는 굴삭기의 힘과 유압브레이커의 작용하는 응력을 응력 게이지로 사이드 하우징 브라켓의 크랙 발생부위에 부착하여 최대응력이 얼마나 걸리는지를 측정하였다. 적용하는 대상을 현장에서와 동일한 조건하에서 최대응력이 허용응력보다 같거나 적게 하고, 기존형상 유지, 재질은 SM490, 중량 최소화 안전계수는 3으로 하여, 최대응력 값에 대한 해석을 수행하였다. 구조가 비교적 간단한 36톤용 사이드 하우징 브라켓을 최적화하였지만, 다른 클래스의(톤수 별) 사이드 하우징 브라켓 적용 시 품질향상에 크게 기여하리라 생각된다.

특징집합 IG-MLP 평가 기반의 최적화된 특징선택 방법을 이용한 질환 예측 머신러닝 모델 (Optimized Feature Selection using Feature Subset IG-MLP Evaluation based Machine Learning Model for Disease Prediction)

  • 김경륜;김재권;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제29권1호
    • /
    • pp.11-21
    • /
    • 2020
  • 암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다. 심뇌혈관질환은 예방을 위한 조기증상들의 특징 분석이 어려워 질환예측이 힘들며, 한국인에 적합한 예측 방법이 필요하다. 본 연구의 목적은 심뇌혈관질환 데이터를 이용하여, 특징집합 IG-MLP 평가 기반의 특징선택 방법론을 시뮬레이션 하여 검증하는 것이다. 제안하는 방법은 제4~7기 국민건강영양조사 원시자료를 이용한다. 심뇌혈관질환의 예측에 중요한 특징들을 선별하기 위해, 속성들의 심뇌혈관질환에 대한 정보이득-다층신경망을 이용한 분석을 실시하며, 최종적으로 선별된 특징을 이용한 심뇌혈관질환 예측 모델을 제공한다. 제안하는 방법으로 한국인의 심뇌혈관질환에 관련된 중요한 특징들을 찾을 수 있으며, 최적화된 특징들로 구성된 예측 모델은 한국인에 대해 더욱 정확한 심뇌혈관 예측을 할 수 있다.

Power Ramp Rate를 이용한 풍력 발전량 예측모델 구축 (Building of Prediction Model of Wind Power Generationusing Power Ramp Rate)

  • 황미영;김성호;윤은일;김광득;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.211-218
    • /
    • 2012
  • 전 세계적으로 화석연료의 많이 사용이 증가되고 있으며 이로 인해 온실가스가 배출되어 지구 온난화와 환경오염이 심각해지고 있는 실정이다. 지구의 환경오염을 줄이기 위해서 무공해 청정에너지인 신재생에너지에 대한 관심이 증가되는 추세인데, 그중에서도 풍력발전은 환경오염 물질을 배출하지 않고, 자원량이 무한대이기 때문에 많은 관심을 받고 있다. 하지만, 풍력발전은 전력 생산량이 불규칙한 단점을 갖고 있어 풍력 터빈의 손상과 전력 생산량이 불규칙적인 문제를 야기하여 이러한 문제점을 보완하기 위해 풍력 발전량을 정확하게 예측하는 것이 중요하다. 풍력 발전량을 정확하게 예측하기 위해서 전력 생산량이 급증 또는 급감하는 것을 의미하는 ramp의 특성을 잘 활용해야 한다. 이 논문에서는 예측의 정확도를 높이기 위하여 다계층 신경망을 이용해 예측모델을 구축하였다. 구축된 예측모델은 흔히 사용되는 풍속, 풍향 속성뿐만 아니라 Power Ramp Rate(PRR) 속성까지 사용하였다. 구축된 풍력 발전량 예측모델은 앞서 말한 세 가지 속성을 모두 사용한 경우, 두 속성을 조합하여 사용한 경우 총 4가지 예측모델을 구축하였다. 구축된 4가지 예측모델을 성능평가 한 결과 PRR, 풍속, 풍향의 속성 모두를 사용한 예측모델의 예측 값이 풍력 터빈에서 관측된 관측 값에 가장 근접하였다. 그로 인해 PRR 속성을 사용하면 풍력 발전량의 예측 정확도를 향상 시킬 수 있었다.