• 제목/요약/키워드: a neural network with two-hidden layer

검색결과 59건 처리시간 0.034초

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

Analysis of streamflow prediction performance by various deep learning schemes

  • Le, Xuan-Hien;Lee, Giha
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.131-131
    • /
    • 2021
  • Deep learning models, especially those based on long short-term memory (LSTM), have presented their superiority in addressing time series data issues recently. This study aims to comprehensively evaluate the performance of deep learning models that belong to the supervised learning category in streamflow prediction. Therefore, six deep learning models-standard LSTM, standard gated recurrent unit (GRU), stacked LSTM, bidirectional LSTM (BiLSTM), feed-forward neural network (FFNN), and convolutional neural network (CNN) models-were of interest in this study. The Red River system, one of the largest river basins in Vietnam, was adopted as a case study. In addition, deep learning models were designed to forecast flowrate for one- and two-day ahead at Son Tay hydrological station on the Red River using a series of observed flowrate data at seven hydrological stations on three major river branches of the Red River system-Thao River, Da River, and Lo River-as the input data for training, validation, and testing. The comparison results have indicated that the four LSTM-based models exhibit significantly better performance and maintain stability than the FFNN and CNN models. Moreover, LSTM-based models may reach impressive predictions even in the presence of upstream reservoirs and dams. In the case of the stacked LSTM and BiLSTM models, the complexity of these models is not accompanied by performance improvement because their respective performance is not higher than the two standard models (LSTM and GRU). As a result, we realized that in the context of hydrological forecasting problems, simple architectural models such as LSTM and GRU (with one hidden layer) are sufficient to produce highly reliable forecasts while minimizing computation time because of the sequential data nature.

  • PDF

연속적 데이터 처리 심층신경망을 이용한 12 lead 심전도 파라미터의 자동 획득 (Automatic Parameter Acquisition of 12 leads ECG Using Continuous Data Processing Deep Neural Network)

  • 김지운;박성민;최성욱
    • 대한의용생체공학회:의공학회지
    • /
    • 제41권2호
    • /
    • pp.107-119
    • /
    • 2020
  • The deep neural networks (DNN) that can replicate the behavior of the human expert who recognizes the characteristics of ECG waveform have been developed and studied to analyze ECG. However, although the existing DNNs can not provide the explanations for their decisions, those trials have attempted to determine whether patients have certain diseases or not and those decisions could not be accepted because of the absence of relating theoretical basis. In addition, these DNNs required a lot of training data to obtain sufficient accuracy in spite of the difficulty in the acquisition of relating clinical data. In this study, a small-sized continuous data processing DNN (C-DNN) was suggested to determine the simple characteristics of ECG wave that were not required additional explanations about its decisions and the C-DNN can be easily trained with small training data. Although it can analyze small input data that was selected in narrow region on whole ECG, it can continuously scan all ECG data and find important points such as start and end points of P, QRS and T waves within a short time. The star and end points of ECG waves determined by the C-DNNs were compared with the results performed by human experts to estimate the accuracies of the C-DNNs. The C-DNN has 150 inputs, 51 outputs, two hidden layers and one output layer. To find the start and end points, two C-DNNs were trained through deep learning technology and applied to a parameter acquisition algorithms. 12 lead ECG data measured in four patients and obtained through PhysioNet was processed to make training data by human experts. The accuracy of the C-DNNs were evaluated with extra data that were not used at deep learning by comparing the results between C-DNNs and human experts. The averages of the time differences between the C-DNNs and experts were 0.1 msec and 13.5 msec respectively and those standard deviations were 17.6 msec and 15.7 msec. The final step combining the results of C-DNN through the waveforms of 12 leads was successfully determined all 33 waves without error that the time differences of human experts decision were over 20 msec. The reliable decision of the ECG wave's start and end points benefits the acquisition of accurate ECG parameters such as the wave lengths, amplitudes and intervals of P, QRS and T waves.

산란계의 전염성 기관지염을 예측하기 위한 인공신경망 모형의 개발 (Development an Artificial Neural Network to Predict Infectious Bronchitis Virus Infection in Laying Hen Flocks)

  • 박선일;권혁무
    • 한국임상수의학회지
    • /
    • 제23권2호
    • /
    • pp.105-110
    • /
    • 2006
  • 2003년 5월부터 2005년 11월까지 산란계의 전염성기관지염(IB) 예찰 프로그램에 등록한 농장에 대한 역학조사에서 얻은 자료에 근거하여 IB 감염을 확인할 수 있는 모형을 구축하기 위하여 16개의 입력 뉴런, 3 개의 은닉 뉴런, 1개의 출력 뉴런으로 구성된 3층 인공신경망 모형을 개발하였다. 총 86개의 계군 중 77개는 훈련자료에 할당하고 나머지 9개는 검정자료로 무작위로 할당하여 back-propagation algorithm으로 신경망 훈련을 수행하였다. 입력 뉴런은 산란계군의 특성, 사양관리, 계군의 크기 등 16개의 역학조사 항목을 사용하였으며 출력 뉴런은 IB 감염의 유무로 투입하였다. 훈련된 신경망을 검정자료에 적용하여 민감도와 특이도를 산출하였으며 진단의 정확도는 receiver operating characteristic (ROC) 곡선을 사용하여 곡선 밑의 면적(AUC)을 계산하여 평가하였다. 입력 뉴런의 특성과 훈련모수를 변경하면서 다양한 신경망을 구성하였으며 최적의 신경망으로 확인된 IBV_D1 신경망의 경우 훈련자료에 대하여 77건 중 73건을 올바르게 판단하여 94.8%의 정확도를 보였다. 민감도와 특이도는 각각 95.5% (42/44, 95% CI, 84.5-99.4)와 93.9% (31/33, 95% CI, 79.8-99.3)로 나타났다. 훈련된 신경망을 검정자료에 적용하여 ROC 곡선을 작성한 결과 AUC는 전체의 94.8% (SE=0.086, 95% CI 0.592-0.961)를 차지하는 우수한 모형으로 나타났다. ROC 곡선에서 기준을 0.7149 이상으로 판단할 때 진단의 정확도가 88.9%로 가장 높았으며 100%의 민감도를 달성하였다. 이러한 민감도와 특이도에서 44%의 IB 유병률을 가정할 때 IBV_D1 모형은 80%의 양성예측도와 100%의 음성예측도를 보였다. 이러한 소견에 근거할 때 본 연구에서 구축한 신경망 모형은 산란계군에서 IB의 존재를 확인하기 위한 목적에 성공적으로 응용될 수 있을 것으로 판단되었다.

다채널 뇌파의 웨이블릿 계수와 신경망을 이용한 정신분열증의 판별 (Classification of Schizophrenia Using an ANN and Wavelet Coefficients of Multichannel EEG)

  • 정주영;박일용;강병조;조진호;김명남
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권2호
    • /
    • pp.99-106
    • /
    • 2003
  • 본 논문에서는 정신질환 진단을 위하여 뇌파신호를 판별하는 방법을 제안하였다. 정신질환의 한 종류인 정신분열증 환자의 뇌파와 정상인의 뇌파를 분류하기 위하여 제안한 방법에서는 기본적으로 웨이블릿 변환과 인공 신경망을 이용하였다. 뇌파 신호에 웨이블릿 변환을 적용하여 각각 알파. 베타. 세타 그리고 델타파에 해당하는 주파수 대역의 웨이블릿 계수를 구한 다음. 각각의 주파수 대역에 대한 웨이블릿 계수들의 크기 평균 및 분산들을 인공 신경망의 입력 데이터로 이용하였다. 인공 신경망은 2개의 은닉층을 갖는 4층의 피드포워드 회로망 구조를 가지며 학습에는 역전파 학습 알고리듬을 이용하였다. 정신분열증의 판별시스템은 19 채널의 뇌파신호에 대응하는 19개의 인공신경망으로 구성되었고 정상인과 정신분열증 환자에 대하여 각각 100%와 86.67%의 정확도를 보여주었다.

개선된 특징 추출을 이용한 원전SG 세관 결함 패턴 분류에 관한 연구 (A Study on the Classification of Steam Generator Tube Defects Using an Improved Feature Extraction)

  • 조남훈;이향범
    • 비파괴검사학회지
    • /
    • 제29권1호
    • /
    • pp.27-35
    • /
    • 2009
  • 본 논문에서는 개선된 특징추출을 이용한 원자력 발전소 증기발생기 세관의 결함 형태 분류에 대한 연구를 수행한다. 본 논문에서는 4가지 축대칭 결함, 즉 I-In 형태, I-Out 형태, V-In 형태, V-Out 형태 결함을 고려한다. 유한요소법에 기초한 수치해석 프로그램을 이용하여 결함의 폭과 깊이를 변화시켜가면서 400개의 와전류탐상시험(ECT) 신호를 생성하였다. 이와 같이 생성된 ECT 신호로부터 새로운 특징을 제안하였는데, 여기에는 최대 임피던스 값을 갖는 점과 최대 임피던스 값의 1/2의 값을 갖는 점 사이의 위상각과 최대임피던스 값을 갖는 점과 최대 임피던스 값의 10%, 20%, 30%, 40%를 갖는 점사이의 위상각들이 포함된다. 또한, 결함형태를 분류하기 위하여 은닉층이 하나인 다층퍼셉트론을 사용하였다. 컴퓨터 모의실험 연구를 통하여 제안된 방법이 최대오차와 평균제곱오차 측면에서 향상된 결함 분류 성능을 얻는다는 것을 보였다.

A hybrid algorithm for the synthesis of computer-generated holograms

  • Nguyen The Anh;An Jun Won;Choe Jae Gwang;Kim Nam
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2003년도 하계학술발표회
    • /
    • pp.60-61
    • /
    • 2003
  • A new approach to reduce the computation time of genetic algorithm (GA) for making binary phase holograms is described. Synthesized holograms having diffraction efficiency of 75.8% and uniformity of 5.8% are proven in computer simulation and experimentally demonstrated. Recently, computer-generated holograms (CGHs) having high diffraction efficiency and flexibility of design have been widely developed in many applications such as optical information processing, optical computing, optical interconnection, etc. Among proposed optimization methods, GA has become popular due to its capability of reaching nearly global. However, there exits a drawback to consider when we use the genetic algorithm. It is the large amount of computation time to construct desired holograms. One of the major reasons that the GA' s operation may be time intensive results from the expense of computing the cost function that must Fourier transform the parameters encoded on the hologram into the fitness value. In trying to remedy this drawback, Artificial Neural Network (ANN) has been put forward, allowing CGHs to be created easily and quickly (1), but the quality of reconstructed images is not high enough to use in applications of high preciseness. For that, we are in attempt to find a new approach of combiningthe good properties and performance of both the GA and ANN to make CGHs of high diffraction efficiency in a short time. The optimization of CGH using the genetic algorithm is merely a process of iteration, including selection, crossover, and mutation operators [2]. It is worth noting that the evaluation of the cost function with the aim of selecting better holograms plays an important role in the implementation of the GA. However, this evaluation process wastes much time for Fourier transforming the encoded parameters on the hologram into the value to be solved. Depending on the speed of computer, this process can even last up to ten minutes. It will be more effective if instead of merely generating random holograms in the initial process, a set of approximately desired holograms is employed. By doing so, the initial population will contain less trial holograms equivalent to the reduction of the computation time of GA's. Accordingly, a hybrid algorithm that utilizes a trained neural network to initiate the GA's procedure is proposed. Consequently, the initial population contains less random holograms and is compensated by approximately desired holograms. Figure 1 is the flowchart of the hybrid algorithm in comparison with the classical GA. The procedure of synthesizing a hologram on computer is divided into two steps. First the simulation of holograms based on ANN method [1] to acquire approximately desired holograms is carried. With a teaching data set of 9 characters obtained from the classical GA, the number of layer is 3, the number of hidden node is 100, learning rate is 0.3, and momentum is 0.5, the artificial neural network trained enables us to attain the approximately desired holograms, which are fairly good agreement with what we suggested in the theory. The second step, effect of several parameters on the operation of the hybrid algorithm is investigated. In principle, the operation of the hybrid algorithm and GA are the same except the modification of the initial step. Hence, the verified results in Ref [2] of the parameters such as the probability of crossover and mutation, the tournament size, and the crossover block size are remained unchanged, beside of the reduced population size. The reconstructed image of 76.4% diffraction efficiency and 5.4% uniformity is achieved when the population size is 30, the iteration number is 2000, the probability of crossover is 0.75, and the probability of mutation is 0.001. A comparison between the hybrid algorithm and GA in term of diffraction efficiency and computation time is also evaluated as shown in Fig. 2. With a 66.7% reduction in computation time and a 2% increase in diffraction efficiency compared to the GA method, the hybrid algorithm demonstrates its efficient performance. In the optical experiment, the phase holograms were displayed on a programmable phase modulator (model XGA). Figures 3 are pictures of diffracted patterns of the letter "0" from the holograms generated using the hybrid algorithm. Diffraction efficiency of 75.8% and uniformity of 5.8% are measured. We see that the simulation and experiment results are fairly good agreement with each other. In this paper, Genetic Algorithm and Neural Network have been successfully combined in designing CGHs. This method gives a significant reduction in computation time compared to the GA method while still allowing holograms of high diffraction efficiency and uniformity to be achieved. This work was supported by No.mOl-2001-000-00324-0 (2002)) from the Korea Science & Engineering Foundation.

  • PDF

기계학습(machine learning) 기반 터널 영상유고 자동 감지 시스템 개발을 위한 사전검토 연구 (A preliminary study for development of an automatic incident detection system on CCTV in tunnels based on a machine learning algorithm)

  • 신휴성;김동규;임민진;이규범;오영섭
    • 한국터널지하공간학회 논문집
    • /
    • 제19권1호
    • /
    • pp.95-107
    • /
    • 2017
  • 본 논문에서는 제도적으로 운영 중인 터널내 CCTV들로부터 실시간으로 들어오는 영상들을 최신 딥러닝 알고리즘을 이용, 학습시켜 다양한 조건의 터널환경에서 돌발 상황을 감지하고 그 돌발 상황의 종류들을 분류해 내는 시스템 개발을 위한 사전검토 연구를 수행하였다. 사전검토 연구를 위해, 2개의 도로현장의 교통류 CCTV영상 일부를 이용하여 가용한 전통적인 영상처리기법으로 영상내부로 집입하는 차량을 감지하고, 이동경로를 추적하여 일정 시간간격의 이동 차량의 좌표와 시간정보를 추출하고 학습자료를 구성하였다. 각 차량의 이동정보는 차선변경, 정차 등 6가지의 이벤트 정보와 연계된다. 차량 이동정보와 이벤트로 구성된 학습자료는 레질리언스(resilience) 기계학습 알고리즘을 이용하여 학습하였다. 2개의 은닉층을 설정하고, 각 은닉층의 노드수에 대한 9개의 은닉구조 모델을 설정하여 매개변수 연구를 수행하였다. 본 사전검토의 경우에는 첫 번째, 두 번째 은닉층 노드수가 각각 300개와 150개로 설정된 모델이 합리적으로 가장 추론정확도가 높은 것으로 평가되었다. 이로부터 일반화되기 매우 힘든 복잡한 교통류 상황을 기계학습을 이용하여 어떠한 사전 규칙설정 없이도 교통류의 특징들을 정확히 자동으로 감지할 수 있는 가능성을 보였다. 본 시스템은 시스템의 운용을 통해 지속적으로 교통류 영상과 이벤트 정보가 늘어난다면, 자동으로 그 시스템의 인지능력과 정확도가 자동으로 향상되는 효과도 기대할 수 있다.

시간처짐현상을 고려한 장거리구간 통행시간 예측 모형 개발 (Development of a Freeway Travel Time Forecasting Model for Long Distance Section with Due Regard to Time-lag)

  • 이의은;김정현
    • 대한교통학회지
    • /
    • 제20권4호
    • /
    • pp.51-61
    • /
    • 2002
  • 본 연구에서는 운전자 입장에서 원하는 고속도로 다구간의 통행시간을 예측하는 모형을 구축하였다. 현재 지점검지기를 통해 생성되는 예상통행시간 정보는 장거리 통행시 발생되는 시간처짐현상을 반영하지 못하고 있다. 이로 인하여 도로이용자들의 신뢰가 떨어져. 전체적인 ATIS의 효과를 거두지 못하고 있다. 따라서 본 연구에서는 시간처짐 현상과 영업소 지체를 반영한 고속도로 다구간의 통행시간예측을 위하여, 한국도로공사에서 운영중인 검지기의 교통량 자료와 TCS자료를 사용하였다. 또한 실제 시스템에의 적용을 위해 이상치가 섞여 있는 자료를 유지하였다. 예측에 사용된 모형은 3개의 입력유니트와 2개의 출력유니트를 가지는 선행신경망의 형태로 구성하였으며, 학습방법은 역전파법을 이용하였다. 또한 학습속도와 예측력에 영향을 주는 학습계수, 은닉층의 유니트수, 반복 횟수에 따라 12개의 대안을 구성하여 예측결과를 토대로 최적대안을 모형으로 채택하였다. 이러한 본 연구의 자료특성에 의해 원하는 구간까지의 통행시간을 구할 수가 있다.