• 제목/요약/키워드: HyperParameter

검색결과 111건 처리시간 0.03초

LSTM을 이용한 주가예측 모델의 학습방법에 따른 성능분석 (A Performance Analysis by Adjusting Learning Methods in Stock Price Prediction Model Using LSTM)

  • 정종진;김지연
    • 디지털융복합연구
    • /
    • 제18권11호
    • /
    • pp.259-266
    • /
    • 2020
  • 과거 인공지능 분야에서는 지식 기반의 전문가 시스템 및 머신러닝 알고리즘들을 금융 분야에 적용하는 연구가 꾸준하게 수행되어 왔다. 특히 주식에 대한 지식 기반의 시스템 트레이딩은 이제 보편화되었고, 최근에는 대용량 데이터에 기반한 딥러닝 기술을 주가 예측에 적용하기 시작했다. 이중 LSTM은 시계열 데이터에 대한 검증된 모델로서 주가 예측에도 적용되고 있다. 본 논문에서는 주가 예측 모델로서 LSTM을 적용할 때 성능향상을 위해 고려해야 할 복잡한 매개변수 설정과 적용 함수들에 대해 적합한 조합 방법을 제안하도록 한다. 크게 가중치와 바이어스에 대한 초기화 대상과 설정 방법, 과적합을 피하기 위한 정규화 적용 대상과 설정 방법, 활성화 함수 적용 방법, 최적화 알고리즘 선택 등을 제시한다. 이 때 나스닥 상장사들에 대한 대용량 데이터를 바탕으로 각각의 방법들을 적용하여 정확도를 비교하면서 평가한다. 이를 통해 주가 예측을 위한 LSTM 적용 시 최적의 모델링 방법을 실증적인 형태로 제안하여 현실적인 시사점을 갖도록 한다. 향후에는 입력 데이터의 포맷과 길이, 하이퍼파라미터들에 대한 성능평가를 추가 수행하여 주요 설정 항목들의 조합에 대한 일반화 연구를 수행하고자 한다.

고객가치가 고객충성도에 미치는 영향에 관한 연구: 고객만족과 전환장벽을 매개변수로 (A Study on the Impact of Customer Equity on Customer Loyalty in the Korean Retail Industry: Mediation of Customer Satisfaction and Switching Costs)

  • 김순홍
    • 유통과학연구
    • /
    • 제10권11호
    • /
    • pp.79-88
    • /
    • 2012
  • Purpose - The objective of this paper is to suggest that a company's CRM activities have an effect on customer loyalty in the Korean retail industry. Typically, Korean customers use large local marts with convenience in the absence of any other choice. Therefore, this study aims to shed light on the fact that customers do not break away from their preferred retail stores, either owing to their stringent loyalty (the lie loyalty) or difficulty in turning to alternative choices. Research design, data, methodology - By surveying a sample of 200 hyper-markets through a questionnaire, and excluding dubious and missing responses, I obtained 181 samples to be included in the empirical analysis. The survey was conducted for two weeks during October 2011. AMOS and SPSS18 statistical packages were used for conducting statistical analysis for this study. This paper was developed using the concept of customer equity on CRM, which is known to have a positive impact on customer loyalty through the satisfaction and switching-barrier parameters. The hypothesis of this paper is that customer equity is composed of relationship equity, value equity and brand equity, and that the relationship equity variable has positive effects on the value equity and brand equity amongst other types of customer equity. Moreover, customer equity influences customer loyalty through parameters including customer satisfaction and switching costs in the Korean retail industry. Results - According to the results of the analysis, it was confirmed that relationship value had a positive effect (+) on all variables, including the perceived QoS (Quality of Service), store brand images, economic value, and store convenience. It was also confirmed that the assumption that the perceived QoS (Quality of Service), economic value, and store convenience had a positive effect on customer satisfaction was shown to be statistically significant, with a p-value below 0.05. Only the store brand value variable had an effect on the switching-cost variable with respect to the causal sequence of the variables, including the perceived QoS, store brand value, economic value, and store convenience. The remaining variables did not seem to influence the switching-cost variable. On the other hand, another effect showed that customer satisfaction had a statistically significant influence on the switching-costs variable. Moreover, the customer satisfaction and switching-cost variables also had a statistical influence on customer loyalty. Conclusions - The CRM activities had an influence on various variables (including perceived QoS, perceived economic value, store brand value, and store convenience) pertaining to customer values. Customer satisfaction and switching-cost had some effects on customer loyalty as a parameter. This confirms that stringent loyalty exists with respect to customer loyalty in the retail industry. The fact that the variable had such a statistically significant influence on the switching-cost and store brand equity variables means that consumers react to the reputation of a brand, confidence about the store, and quality confidence. The implications of this study in the retail industry should be further extended to devise strategies for customer retention.

  • PDF

딥러닝 기법을 활용한 컨테이너선 운임 예측 모델 (Estimation Model for Freight of Container Ships using Deep Learning Method)

  • 김동균;최정석
    • 해양환경안전학회지
    • /
    • 제27권5호
    • /
    • pp.574-583
    • /
    • 2021
  • 해운 시황을 예측하는 것은 중요한 문제이다. 투자 방식의 결정, 선대 편성 방법, 운임 등을 결정하기 위한 판단 근거가 되며 이는 기업의 이익과 생존에 큰 영향을 미치기 때문이다. 이를 위해 본 연구에서는 기계학습 모델인 장단기 메모리 및 간소화된 장단기 메모리 구조의 Gated Recurrent Units를 활용하여 컨테이너선의 해상운임 예측 모델을 제안한다. 운임 예측 대상은 중국 컨테이너 운임지수(CCFI)이며, 2003년 3월부터 2020년 5월까지의 CCFI 데이터를 학습에 사용하였다. 각 모델에 따라 2020년 6월 이후의 CCFI를 예측한 후 실제 CCFI와 비교, 분석하였다. 실험 모델은 하이퍼 파라메터의 설정에 따라 총 6개의 모델을 설계하였다. 또한 전통적인 분석 방법과의 성능을 비교하기 위해 ARIMA 모델도 실험에 추가하였다. 최적 모델은 두 가지 방법에 따라 선정하였다. 첫 번째 방법으로 각 모델을 10회 반복 실험하여 얻은 RMSE의 평균값이 가장 작은 모델을 선정하는 것이다. 두 번째 방법으로는 모든 실험에서 가장 낮은 RMSE를 기록한 모델을 선정하는 것이다. 실험 결과 전통적 시계열 예측모델인 ARIMA 모델과 비교하여 딥러닝 모델의 정확도를 입증하였으며, 정확한 예측모델을 통해 운임 변동의 위험관리 능력을 제고시키는데 기여했다. 반면 코로나19와 같은 외부 효과에 따른 운임의 급격한 변화상황이 발생한 경우, 예측모델의 정확도가 감소하는 한계점을 나타냈다. 제안된 모델 중 GRU1 모델이 두 가지 평가 방법 모두에서 가장 낮은 RMSE(69.55, 49.35)를 기록하며 최적 모델로 선정되었다.

딥러닝 기반 LSTM 모형을 이용한 감조하천 수위 예측 (Prediction of water level in a tidal river using a deep-learning based LSTM model)

  • 정성호;조효섭;김정엽;이기하
    • 한국수자원학회논문집
    • /
    • 제51권12호
    • /
    • pp.1207-1216
    • /
    • 2018
  • 본 연구는 물리적 수리 수문모형의 적용이 제한적인 감조하천에서의 수위예측을 목적으로 하고 있으며, 이를 위해 한강 잠수교를 대상으로 딥러닝 오픈소스 소프트웨어 라이브러리인 TensorFlow를 활용하여 LSTM 모형을 구성하고 2011년부터 2017년까지의 10분 단위의 잠수교 수위, 팔당댐 방류량과 한강하구 강화대교지점의 예측조위 자료를 이용하여 모형학습(2011~2016) 및 수위예측(2017)을 수행하였다. 모형 매개변수는 민감도 분석을 통해 은닉층의 개수는 6개, 학습속도는 0.01, 학습횟수는 3000번로 결정하였으며, 모형 학습 시 학습정보의 시간적 양을 결정하는 중요한 매개변수인 시퀀스길이는 1시간, 3시간, 6시간으로 변화시키며 모의하였다. 최종적으로 선행시간에 따른 모의 예측능력을 평가하기 위해 LSTM 모형의 예측 선행시간을 6개(1 ~ 24시간)로 구분하여 실측수위와 예측수위와의 비교 분석을 수행한 결과, LSTM 모형의 최적의 성능을 내는 결과는 시퀀스길이를 1시간으로 하였을 때로 분석되었으며, 특히 선행시간 1시간에 대한 예측정확도는 RMSE는 0.065 m, NSE는 0.99로 실측수위에 매우 근접한 예측 결과를 나타내었다. 또한 시퀀스길이에 상관없이 선행시간이 길어질수록 모형의 예측 정확도는 2017년 전기간에 걸쳐 평균적으로 RMSE 0.08 m에서 0.28 m로 오차가 증가하였으며, NSE는 0.99에서 0.74로 감소하였다.

NASNet을 이용한 이미지 시맨틱 분할 성능 개선 (Improved Performance of Image Semantic Segmentation using NASNet)

  • 김형석;류기윤;김래현
    • Korean Chemical Engineering Research
    • /
    • 제57권2호
    • /
    • pp.274-282
    • /
    • 2019
  • 최근 빅데이터 과학은 사회현상 모델링을 통한 예측은 물론 강화학습과 결합하여 산업분야 자동제어까지 응용범위가 확대되고 있다. 이러한 추세 가운데 이미지 영상 데이터 활용연구는 화학, 제조, 농업, 바이오산업 등 다양한 산업분야에서 활발히 진행되고 있다. 본 논문은 신경망 기술을 활용하여 영상 데이터의 시맨틱 분할 성능을 개선하고자, U-Net의 계산효율성을 개선한 DeepU-Net 신경망에 AutoML 강화학습 알고리즘을 구현한 NASNet을 결합하였다. BRATS2015 MRI 데이터을 활용해 성능 검증을 수행하였다. 학습을 수행한 결과 DeepU-Net은 U-Net 신경망 구조보다 계산속도 향상 뿐 아니라 예측 정확도도 동등 이상의 성능이 있음을 확인하였다. 또한 이미지 시맨틱 분할 성능을 개선하기 위해서는 일반적으로 적용하는 드롭아웃 층을 빼고, DeepU-Net에 강화학습을 통해 구한 커널과 필터 수를 신경망의 하이퍼 파라미터로 선정했을 때 DeepU-Net보다 학습정확도는 0.5%, 검증정확도는 0.3% 시맨틱 분할 성능을 개선할 수 있었다. 향후 본 논문에서 시도한 자동화된 신경망을 활용해 MRI 뇌 영상진단은 물론, 열화상 카메라를 통한 이상진단, 비파괴 검사 진단, 화학물질 누출감시, CCTV를 통한 산불감시 등 다양한 분야에 응용될 수 있을 것으로 판단된다.

Opcode와 API의 빈도수와 상관계수를 활용한 Cerber형 랜섬웨어 탐지모델에 관한 연구 (A Study on the Cerber-Type Ransomware Detection Model Using Opcode and API Frequency and Correlation Coefficient)

  • 이계혁;황민채;현동엽;구영인;유동영
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권10호
    • /
    • pp.363-372
    • /
    • 2022
  • 최근 코로나 19 팬더믹 이후 원격근무의 확대와 더불어 랜섬웨어 팬더믹이 심화하고 있다. 현재 안티바이러스 백신 업체들이 랜섬웨어에 대응하고자 노력하고 있지만, 기존의 파일 시그니처 기반 정적 분석은 패킹의 다양화, 난독화, 변종 혹은 신종 랜섬웨어의 등장 앞에 무력화될 수 있다. 이러한 랜섬웨어 탐지를 위한 다양한 연구가 진행되고 있으며, 시그니처 기반 정적 분석의 탐지 방법과 행위기반의 동적 분석을 이용한 탐지 연구가 현재 주된 연구유형이라고 볼 수 있다. 본 논문에서는 단일 분석만을 이용하여 탐지모델에 적용하는 것이 아닌 ".text Section" Opcode와 실제 사용하는 Native API의 빈도수를 추출하고 K-means Clustering 알고리즘, 코사인 유사도, 피어슨 상관계수를 이용하여 선정한 특징정보들 사이의 연관성을 분석하였다. 또한, 타 악성코드 유형 중 웜과 Cerber형 랜섬웨어를 분류, 탐지하는 실험을 통해, 선정한 특징정보가 특정 랜섬웨어(Cerber)를 탐지하는 데 특화된 정보임을 검증하였다. 위와 같은 검증을 통해 최종 선정된 특징정보들을 결합하여 기계학습에 적용하여, 최적화 이후 정확도 93.3% 등의 탐지율을 나타내었다.

TBM 데이터와 머신러닝 기법을 이용한 디스크 커터마모 예측에 관한 연구 (A Study on the Prediction of Disc Cutter Wear Using TBM Data and Machine Learning Algorithm)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제32권6호
    • /
    • pp.502-517
    • /
    • 2022
  • TBM의 활용이 증가하면서 최근 국내외에서 머신러닝 기법으로 TBM 데이터를 분석하여 디스크커터의 교환주기 예측 및 굴진율을 예측하는 연구가 증가하고 있다. 본 연구에서는 굴진 시 획득되는 기계 데이터와 지반 데이터를 기반으로 최근에 다양한 분야에서 널리 사용되고 있는 머신러닝 기법들 중 회귀 모델을 접목하여 슬러리 쉴드 TBM 현장의 디스크 커터 마모 예측을 하였다. 디스크 커터 마모 예측을 위해서 Training과 Test 데이터를 7:3으로 분할하였으며, 최적의 파라미터를 선정을 위해서 분할 교차검증을 포함하는 그리드 서치를 활용하였다. 그 결과, 앙상블 계열의 그레디언트 부스팅 모델이 결정계수가 0.852, 평균 제곱근 오차가 3.111로 좋은 성능을 보여주었고 특히 학습성능과 더불어 학습속도에서 우수한 결과를 보여주었다. 현재 도출된 결과로 볼 때, 슬러리 쉴드 TBM의 기계데이터와 지반정보가 포함된 데이터를 활용한 디스크 커터 마모 예측 모델의 적합성은 높다고 보인다. 추가적으로 지반조건의 다양성과 디스크 마모 측정 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

교통사고 추정방법 비교 연구: 경험적 베이즈 추정치 vs. 관측교통사고건수 (Comparative Study on the Estimation Methods of Traffic Crashes: Empirical Bayes Estimate vs. Observed Crash)

  • 신강원
    • 대한토목학회논문집
    • /
    • 제30권5D호
    • /
    • pp.453-459
    • /
    • 2010
  • 교통안전연구에서 한 지점 (또는 구간)의 기대교통사고건수를 신뢰성 높게 추정하는 것은 매우 중요하다. 기대교통사고건수를 추정하기 위해 현재 국내에서는 주로 관측교통사고건수를 사용하고 있으나 국외에서는 포아송-감마 혼합모형에 기반한 경험적 베이즈 추정치를 활용하고 있는 추세이다. 그간 많은 연구들이 경험적 베이즈 추정치를 이용해 기대교통사고건수 추정 및 교통안전개선사업의 평가를 시도 하였으나 전술한 2가지 추정방법의 추정오차를 비교연구한 문헌은 없는 실정인 바 본 연구는 2가지 추정방법의 추정오차를 모의실험을 통해 비교 분석하여 제시하였다. 모의 발생된 총 3,000,000개 지점의 교통사고 자료를 분석한 결과 기대교통사고건수를 경험적 베이즈 추정방법을 이용해 추정했을 경우 그 추정오차는 관측교통 사고건수만을 이용했을 때 발생하는 추정오차에 비해 항상 작은 것으로 나타나 국내의 교통안전연구 가이드라인에 경험적 베이지안 추정방법의 도입이 필요할 것으로 판단된다. 그러나 사전분포의 불확실성이 높아질수록 두 가지 추정방법의 추정오차의 차이는 감소하는 것으로 나타나, 기대교통사고건수 추정 시 추정된 음이항 모형에 대한 종합적인 검증을 수행한 후 신뢰성 있는 초모수의 추정치를 이용해 경험적 베이지안 방법을 적용하는 것이 바람직하다고 판단된다.

누적 가중치 변화의 시각화를 통한 심층 신경망 분석시스템 (Deep Neural Network Analysis System by Visualizing Accumulated Weight Changes)

  • 양태린;박진호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.85-92
    • /
    • 2023
  • 최근 ChatGPT나 자율주행 자동차 등의 인공지능 분야의 급속한 발전으로 인해 인공지능에 대한 관심이 높아졌다. 그러나 아직 인공지능은 학습 과정에서 알 수 없는 요소가 많이 존재하여 모델을 개선하거나 최적화하기 위해서 필요 이상의 시간과 노력을 들여야 하는 경우가 많다. 따라서, 인공지능 모델의 학습 과정에서 가중치 변화를 명확하게 이해하고 해당 변화를 효과적으로 분석할 수 있는 도구 또는 방법론이 절실하게 요구되고 있다. 본 연구에서는 이러한 점을 해결하기 위해 누적 가중치 변화량을 시각화해주는 시스템을 제안한다. 시스템은 학습의 일정한 기간마다 가중치를 구하고 가중치의 변화를 누적시켜서 누적 가중치로 저장하여 3차원 공간상에 나타내게 된다. 이로 인해 보는 이로 하여금 한눈에 레이어의 구조와 현재의 가중치 변화량이 이해되기 쉽게 구성하였다. 이러한 연구를 통해 인공지능 모델의 학습 과정이 어떻게 진행되는지에 대한 이해와 모델의 성능 향상에 도움이 되는 방향으로 하이퍼 파라미터를 변경할 수 있는 지표를 얻게 되는 등 인공지능 학습 과정의 다양한 측면을 탐구할 수 있을 것이다. 이러한 시도를 통해 아직 미지의 영역으로 여겨지는 인공지능 학습 과정의 일부를 보다 효과적으로 탐색하고 인공지능 모델의 발전과 적용에 기여할 수 있을 것으로 기대된다.

수온 데이터 예측 연구를 위한 통계적 방법과 딥러닝 모델 적용 연구 (Statistical Method and Deep Learning Model for Sea Surface Temperature Prediction)

  • 조문원;최흥배;한명수;정은송;강태순
    • 해양환경안전학회지
    • /
    • 제29권6호
    • /
    • pp.543-551
    • /
    • 2023
  • 기후변화 영향으로 이상고수온, 태풍, 홍수, 가뭄 등 재난 및 안전 관리기술은 지속적으로 고도화를 요구받고 있으며, 특히 해수면 온도는 한반도 주변에서 발생되는 여름철 적조 발생과 동해안 냉수대 출현, 소멸 등에 영향을 신속하게 분석할 수 있는 중요한 인자이다. 따라서, 본 연구에서는 해수면 온도 자료를 해양 이상현상 및 연구에 적극 활용되기 위해 통계적 방법과 딥러닝 알고리즘을 적용하여 예측성능을 평가하였다. 예측에 사용된 해수면 수온자료는 흑산도 조위관측소의 2018년부터 2022년까지 자료이며, 기존 통계적 ARIMA 방법과 Long Short-Term Memory(LSTM), Gated Recurrent Unit(GRU)을 사용하였고, LSTM의 성능을 더욱 향상할 수 있는 Sequence-to-Sequence(s2s) 구조에 Attention 기법을 추가한 Attention Long Short-Term Memory (LSTM)기법을 사용하여 예측 성능 평가를 진행하였다. 평가 결과 Attention LSTM 모델이 타 모델과 비교하여 더 좋은 성능을 보였으며, Hyper parameter 튜닝을 통해 해수면 수온 성능을 개선할 수 있었다.