• 제목/요약/키워드: Gradient-descent methods

검색결과 73건 처리시간 0.021초

확장칼만필터에 의하여 학습된 다층뉴럴네트워크를 이용한 헬리오스타트 태양추적오차의 모델링 (Modeling of Heliostat Sun Tracking Error Using Multilayered Neural Network Trained by the Extended Kalman Filter)

  • 이상은;박영칠
    • 제어로봇시스템학회논문지
    • /
    • 제16권7호
    • /
    • pp.711-719
    • /
    • 2010
  • Heliostat, as a concentrator reflecting the incident solar energy to the receiver located at the tower, is the most important system in the tower-type solar thermal power plant, since it determines the efficiency and performance of solar thermal plower plant. Thus, a good sun tracking ability as well as its good optical property are required. In this paper, we propose a method to compensate the heliostat sun tracking error. We first model the sun tracking error, which could be measured using BCS (Beam Characterization System), by multilayered neural network. Then the extended Kalman filter was employed to train the neural network. Finally the model is used to compensate the sun tracking errors. Simulated result shows that the method proposed in this paper improve the heliostat sun tracking performance dramatically. It also shows that the training of neural network by the extended Kalman filter provides faster convergence property, more accurate estimation and higher measurement noise rejection ability compared with the other training methods like gradient descent method.

Predicting compressive strength of bended cement concrete with ANNs

  • Gazder, Uneb;Al-Amoudi, Omar Saeed Baghabara;Khan, Saad Muhammad Saad;Maslehuddin, Mohammad
    • Computers and Concrete
    • /
    • 제20권6호
    • /
    • pp.627-634
    • /
    • 2017
  • Predicting the compressive strength of concrete is important to assess the load-carrying capacity of a structure. However, the use of blended cements to accrue the technical, economic and environmental benefits has increased the complexity of prediction models. Artificial Neural Networks (ANNs) have been used for predicting the compressive strength of ordinary Portland cement concrete, i.e., concrete produced without the addition of supplementary cementing materials. In this study, models to predict the compressive strength of blended cement concrete prepared with a natural pozzolan were developed using regression models and single- and 2-phase learning ANNs. Back-propagation (BP), Levenberg-Marquardt (LM) and Conjugate Gradient Descent (CGD) methods were used for training the ANNs. A 2-phase learning algorithm is proposed for the first time in this study for predictive modeling of the compressive strength of blended cement concrete. The output of these predictive models indicates that the use of a 2-phase learning algorithm will provide better results than the linear regression model or the traditional single-phase ANN models.

다중 채널 융합 기법을 이용한 DTV 기반 수동형 레이다의 표적 인식 방법 (Target Recognition Method of DTV-Based Passive Radar Using Multi-Channel Combining Method)

  • 설승환;최영재;최인식
    • 한국전자파학회논문지
    • /
    • 제28권10호
    • /
    • pp.794-801
    • /
    • 2017
  • 본 논문에서는 DTV(Digital Television) 기반의 수동형 레이다와 다중 채널 융합 기법을 이용한 항공기 표적 인식 방법을 제안하였다. DTV에서 송신되는 다수의 채널을 융합하여 표적인식에 필요한 해상도의 HRRP(High Resolution Range Profile)를 획득하였다. HRRP는 AR(Auto Regressive) 기법 또는 제로 패딩 기법을 이용하여 획득하였다. 획득한 HRRP로부터, 경사하강법을 이용한 CLEAN 기법을 통해 산란점을 추출한 후 특성벡터를 생성하였으며, 이를 신경망 구분기에 학습시켜 표적 인식을 수행하였다. 제안된 방법의 성능을 검증하기 위하여 실제 국내에서 운용되고 있는 3개의 송신소(관악산, 용문산, 견월악)의 주파수 대역을 가정하고, 4종의 항공기 실스케일 3D 캐드 모델을 이용하여 제안된 방법과 각 송신소의 단일 채널 주파수를 이용하였을 때의 표적인식 성능을 비교하였다. 시뮬레이션 결과, 제안된 방법이 3개의 송신소 모두에서 각 송신소의 단일 채널 주파수를 이용하였을 때보다 높은 표적 인식 성능을 보였다.

딥러닝 학습에서 최적의 알고리즘과 뉴론수 탐색 (Optimal Algorithm and Number of Neurons in Deep Learning)

  • 장하영;유은경;김혁진
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.389-396
    • /
    • 2022
  • 딥러닝(Deep Learning)은 퍼셉트론을 기반으로 하고 있으며 현재에는 이미지 인식, 음성 인식, 객체 검출 및 약물 개발 등과 같은 다양한 영역에서 사용되고 있다. 이에 따라 학습 알고리즘이 다양하게 제안되었고 신경망을 구성하는 뉴런수도 연구자마다 많은 차이를 보이고 있다. 본 연구는 현재 대표적으로 사용되고 있는 확률적 경사하강법(SGD), 모멘텀법(Momentum), AdaGrad, RMSProp 및 Adam법의 뉴런수에 따른 학습 특성을 분석하였다. 이를 위하여 1개의 입력층, 3개의 은닉층, 1개의 출력층으로 신경망을 구성하였고 활성화함수는 ReLU, 손실 함수는 교차 엔트로피 오차(CEE)를 적용하였고 실험 데이터셋은 MNIST를 사용하였다. 그 결과 뉴런수는 100~300개, 알고리즘은 Adam, 학습횟수(iteraction)는 200회가 딥러닝 학습에서 가장 효율적일 것으로 결론을 내렸다. 이러한 연구는 향후 새로운 학습 데이터가 주어졌을 경우 개발될 알고리즘과 뉴런수의 기준치에 함의를 제공할 것이다.

Depth Scaling Strategy Using a Flexible Damping Factor forFrequency-Domain Elastic Full Waveform Inversion

  • Oh, Ju-Won;Kim, Shin-Woong;Min, Dong-Joo;Moon, Seok-Joon;Hwang, Jong-Ha
    • 한국지구과학회지
    • /
    • 제37권5호
    • /
    • pp.277-285
    • /
    • 2016
  • We introduce a depth scaling strategy to improve the accuracy of frequency-domain elastic full waveform inversion (FWI) using the new pseudo-Hessian matrix for seismic data without low-frequency components. The depth scaling strategy is based on the fact that the damping factor in the Levenberg-Marquardt method controls the energy concentration in the gradient. In other words, a large damping factor makes the Levenberg-Marquardt method similar to the steepest-descent method, by which shallow structures are mainly recovered. With a small damping factor, the Levenberg-Marquardt method becomes similar to the Gauss-Newton methods by which we can resolve deep structures as well as shallow structures. In our depth scaling strategy, a large damping factor is used in the early stage and then decreases automatically with the trend of error as the iteration goes on. With the depth scaling strategy, we can gradually move the parameter-searching region from shallow to deep parts. This flexible damping factor plays a role in retarding the model parameter update for shallow parts and mainly inverting deeper parts in the later stage of inversion. By doing so, we can improve deep parts in inversion results. The depth scaling strategy is applied to synthetic data without lowfrequency components for a modified version of the SEG/EAGE overthrust model. Numerical examples show that the flexible damping factor yields better results than the constant damping factor when reliable low-frequency components are missing.

다중 클래스 데이터를 위한 분류오차 최소화기반 특징추출 기법 (Optimizing Feature Extractioin for Multiclass problems Based on Classification Error)

  • 최의선;이철희
    • 대한전자공학회논문지SP
    • /
    • 제37권2호
    • /
    • pp.39-49
    • /
    • 2000
  • 본 논문에서는 다중 클래스 데이터를 위한 특징 추출 방법을 최적화하는 기법을 제안한다 제안된 특징 추출 기법은 분류 오차에 기반한 방법으로 특징 공간(feature space)을 탐색하여 가우시안 최대우도 분류기 (Gaussian ML Classifier)의 분류오차(classification error)가 최소가 되도록 하는 특징벡터 집합을 구하는 방법이다 제안된 방법은 임의의 초기 특징벡터를 설정한 후 steepest descent 알고리즘을 적용하여 분류오차가 감소하는 방향으로 초기벡터를 갱신시킨다 본 논문에서는 순차탐색 및 전체탐색 두 가지의 방법을 제안하며 순차탐색은 추가로 특징벡터를 구하는 경우 이미 구해진 특징벡터를 포함하여 최소의 분류오차를 얻을 수 있는 특징벡터를 구한다 반면에 전체탐색 방법은 추가의 특징벡터를 구할 경우 새로운 초기 특징벡터 집합을 설정하여 이미 구해진 특징벡터를 포함하는 제약을 받지 않는다. 실험결과 제안된 두 가지 방법은 기존의 특징추출 방법보다 우수한 성능을 보여주고 있다.

  • PDF

학습 데이터가 없는 모델 탈취 방법에 대한 분석 (Analysis of methods for the model extraction without training data)

  • 권현;김용기;이준
    • 융합보안논문지
    • /
    • 제23권5호
    • /
    • pp.57-64
    • /
    • 2023
  • 딥뉴럴네트워크 모델의 취약점으로 모델 탈취 방법이 있다. 이 방법은 대상 모델에 대하여 여러번의 반복된 쿼리를 통해서 유사 모델을 생성하여 대상 모델의 예측값과 동일하게 내는 유사 모델을 생성하는 것이다. 본 연구에서, 학습 데이터가 없이 대상 모델을 탈취하는 방법에 대해서 분석을 하였다. 생성 모델을 이용하여 입력 데이터를 생성하고 대상 모델과 유사 모델의 예측값이 서로 가까워지도록 손실함수를 정의하여 유사 모델을 생성한다. 이 방법에서 대상 모델의 입력 데이터에 대한 각 클래스의 logit(로직) 값을 이용하여 경사하강법으로 유사 모델이 그것과 유사하도록 학습하는 과정을 갖는다. 실험 환경으로 pytorch 머신러닝 라이브러리를 이용하였으며, 데이터셋으로 CIFAR10과 SVHN을 사용하였다. 대상 모델로 ResNet 모델을 이용하였다. 실험 결과로써, 모델 탈취 방법은 CIFAR10에 대해서 86.18%이고 SVHN에 대해서 96.02% 정확도로 대상 모델과 유사한 예측값을 내는 유사 모델을 생성하는 것을 볼 수가 있었다. 추가적으로 모델 탈취 방법에 대한 고려사항와 한계점에 대한 고찰도 분석하였다.

다층 퍼셉트론의 학습 성능 개선을 위한 일반화된 시그모이드 베이시스 함수 (Generalized Sigmidal Basis Function for Improving the Learning Performance fo Multilayer Perceptrons)

  • 박혜영;이관용;이일병;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1261-1269
    • /
    • 1999
  • 다층 퍼셉트론은 다양한 응용 분야에 성공적으로 적용되고 있는 대표적인 신경회로망 모델이다. 그러나 다층 퍼셉트론의 학습에서 나타나는 플라토에 기인한 느린 학습 속도와 지역 극소는 실제 응용문제에 적용함에 있어서 가장 큰 문제로 지적되어왔다. 이 문제를 해결하기 위해 여러 가지 다양한 학습알고리즘들이 개발되어 왔으나, 계산의 비효율성으로 인해 실제 문제에는 적용하기 힘든 예가 많은 등, 현재까지 만족할 만한 해결책은 제시되지 못하고 있다. 본 논문에서는 다층퍼셉트론의 베이시스 함수로 사용되는 시그모이드 함수를 보다 일반화된 형태로 정의하여 사용함으로써 학습에 있어서의 플라토를 완화하고, 지역극소에 빠지는 것을 줄이는 접근방법을 소개한다. 본 방법은 기존의 변형된 가중치 수정식을 사용한 학습 속도 향상의 방법들과는 다른 접근 방법을 택함으로써 기존의 방법들과 함께 사용하는 것이 가능하다는 특징을 갖고 있다. 제안하는 방법의 성능을 확인하기 위하여 간단한 패턴 인식 문제들에의 적용 실험 및 기존의 학습 속도 향상 방법을 함께 사용하여 시계열 예측 문제에 적용한 실험을 수행하였고, 그 결과로부터 제안안 방법의 효율성을 확인할 수 있었다. Abstract A multilayer perceptron is the most well-known neural network model which has been successfully applied to various fields of application. Its slow learning caused by plateau and local minima of gradient descent learning, however, have been pointed as the biggest problems in its practical use. To solve such a problem, a number of researches on learning algorithms have been conducted, but it can be said that none of satisfying solutions have been presented so far because the problems such as computational inefficiency have still been existed in these algorithms. In this paper, we propose a new learning approach to minimize the effect of plateau and reduce the possibility of getting trapped in local minima by generalizing the sigmoidal function which is used as the basis function of a multilayer perceptron. Adapting a new approach that differs from the conventional methods with revised updating equation, the proposed method can be used together with the existing methods to improve the learning performance. We conducted some experiments to test the proposed method on simple problems of pattern recognition and a problem of time series prediction, compared our results with the results of the existing methods, and confirmed that the proposed method is efficient enough to apply to the real problems.

Random Forest 기법을 이용한 도심지 MT 시계열 자료의 차량 잡음 분류 (Classification of Transport Vehicle Noise Events in Magnetotelluric Time Series Data in an Urban area Using Random Forest Techniques)

  • 권형석;류경호;심익현;이춘기;오석훈
    • 지구물리와물리탐사
    • /
    • 제23권4호
    • /
    • pp.230-242
    • /
    • 2020
  • 201 6년 9월에 발생한 경주지진원 구역에 대한 정밀 지질구조 규명을 위해 MT 탐사를 적용하였다. 경주지역의 MT 측정자료는 조사지역 인근의 지하철, 전력선, 공장, 주택, 농경지에서 발생된 전기적 잡음과 철도, 도로에서의 차량잡음 등으로 인해 측정자료 왜곡이 심하게 발생되었다. 이 연구에서는 고속철도 및 고속도로와 인접한 4개소의 MT 탐사자료에 기계학습 기법을 적용하여 차량잡음이 포함된 시계열을 분류하였다. 고속열차 잡음이 포함된 시계열에 대해서는 확률적 경사 하강법, 서포트 벡터 머신과 랜덤 포레스트 3가지의 분류모델을 적용하여 그 결과를 비교하였다. 대형트럭 잡음이 포함된 시계열 자료에 대해서는 Hx 성분, Hy 성분과 Hx & Hy 합성성분 크기에 대한 3가지의 샘플 자료를 준비하였으며 랜덤 포레스트 분류모델을 구성하여 그 성능을 평가하였다. 마지막으로 차량잡음 제거 효과 분석을 위하여 차량잡음 제거 전후의 시계열, 진폭 스펙트럼과 겉보기비저항 곡선을 비교하였으며, 이를 통해 차량잡음이 영향을 미치는 주파수 대역과 차량잡음 제거 시 발생될 수 있는 문제점에 대해 고찰하였다.

기업부도예측을 위한 인공신경망 모형에서의 사례선택기법에 의한 데이터 마이닝 (Data Mining using Instance Selection in Artificial Neural Networks for Bankruptcy Prediction)

  • Kim, Kyoung-jae
    • 지능정보연구
    • /
    • 제10권1호
    • /
    • pp.109-123
    • /
    • 2004
  • 기업부도예측은 재무와 경영의사결정문제에서의 주된 인공신경망 응용분야라 할 수 있다. 일반적으로 인공신경망은 이 분야에서 매우 좋은 성과를 보이는 것으로 알려져 있지만 종종 잡음이 심한 데이터에 대해서는 일관성 있고 예측가능한 성과를 보이지 못하는 경우가 있다. 특히 학습용 자료가 매우 많아서 학습시간과 자료수집비용이 과대한 경우에는 적절한 자료의 축소가 되지 않고는 인공신경망을 학습시키는 것이 불가능한 경우도 있다. 사례선택기법은 자료의 차원을 축약시켜 주며 직접적으로 자료를 축소시켜 주는 방법이다. 사례기반 학습기법에서는 이미 몇 연구가 사례선택기법의 필요성을 주장한 바 있으나 인공신경망 모형에서 사례선택기법의 필요성을 주장한 연구는 거의 없다. 본 연구에서는 기업부도예측을 위한 인공신경망 모형에서 유전자 알고리즘을 이용한 사례선택기법을 제안한다. 본 연구에서 유전자 알고리즘은 다층 인공신경망에서의 계층별 연결강도를 최적화하고, 동시에 학습에 적합한 사례를 선택한다. 유전자 알고리즘에 의해 결정된 계층별 연결강도는 역전파오류 학습기법에서 종종 발생하는 국부 최적해에 수렴하는 현상을 최소화해 줄 것으로 기대되고, 선택된 학습용 사례는 학습시간의 단축과 예측성과를 향상시켜 줄 것으로 기대된다. 본 연구에서는 제안한 모형과 주요 데이터 마이닝 기법들의 성과를 비교 연구한다. 실험결과, 제안된 방법이 인공신경망에서의 사례선택기법으로 유용한 것으로 나타났다.

  • PDF