• Title/Summary/Keyword: 머신러닝 기법

Search Result 514, Processing Time 0.033 seconds

A Study on Machine Learning Based Anti-Analysis Technique Detection Using N-gram Opcode (N-gram Opcode를 활용한 머신러닝 기반의 분석 방지 보호 기법 탐지 방안 연구)

  • Kim, Hee Yeon;Lee, Dong Hoon
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.32 no.2
    • /
    • pp.181-192
    • /
    • 2022
  • The emergence of new malware is incapacitating existing signature-based malware detection techniques., and applying various anti-analysis techniques makes it difficult to analyze. Recent studies related to signature-based malware detection have limitations in that malware creators can easily bypass them. Therefore, in this study, we try to build a machine learning model that can detect and classify the anti-analysis techniques of packers applied to malware, not using the characteristics of the malware itself. In this study, the n-gram opcodes are extracted from the malicious binary to which various anti-analysis techniques of the commercial packers are applied, and the features are extracted by using TF-IDF, and through this, each anti-analysis technique is detected and classified. In this study, real-world malware samples packed using The mida and VMProtect with multiple anti-analysis techniques were trained and tested with 6 machine learning models, and it constructed the optimal model showing 81.25% accuracy for The mida and 95.65% accuracy for VMProtect.

Development of Non-stationary Rainfall Simulation Method using Deep-learning Technique and Bigdata (기상 빅데이터와 딥러닝 기술을 활용한 비정상성 강우량 모의 기법 개발)

  • So, Byung-Jin;Kim, Jang Gyeong;Oh, Tae-Suk;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.185-185
    • /
    • 2020
  • 기후변화의 영향으로 국지적 규모의 홍수, 가뭄 등의 피해 규모가 증가하고 있으며, 복사에너지 변화에 기인한 전지구적 대류활동의 변화는 단발성 피해에 확산되어 특정 지역의 기후 패턴 변화로 이어질 수 있다. 대류활동의 변화는 국가별 물순환의 변화로 이어질 수 있으며, 이로 인한 수자원의 변동성은 국가적 수자원 이용에 있어 중요한 요소로 작용될 수 있다. 수자원의 중요성으로 인해 국제적인 기관들은 전지구적 대류활동에 기인한 물순환 과정을 파악하고자 노력하였으며, 그 일환으로 GCMs (Global climate modeling) 등과 같은 모형이 개발되었고, 위성을 통한 전지구 강우량 측정망을 구축하였다. 위성을 통한 전구 강우량 자료와 GCMs에서 산출된 대류과정과 연관된 기후변량 자료들은 빅데이터로 구축되어 제한 없이 제공되고 있다. 정상성 강우 모의 기법은 데이터에 한정된 패턴을 반영하는 모형들로서 기후변화로 인한 기후 변동성 증가를 반영하는데 한계가 존재한다. 본 연구에서는 기상 빅데이터 자료를 기반으로 한반도의 강우량과 기상학적 특성을 연관할 수 있는 머신러닝의 일종인 딥러닝 방법을 접목시킨 강우 모의 기법을 적용하였다. 본 연구의 모형은 기후변화로 인한 기상학적 패턴의 변화를 딥러닝 기법을 통해 식별하고 식별된 기상학적 특성에 기반한 한반도의 강우량을 모의할 수 있다. 본 모형은 단기 및 장기 예측 모형과 결합하여 불확실성을 고려한 단/장기 강우량 평가에 활용될 수 있을 것으로 기대된다.

  • PDF

A Study on the Optimal Location Selection for Hydrogen Refueling Stations on a Highway using Machine Learning (머신러닝 기반 고속도로 내 수소충전소 최적입지 선정 연구)

  • Jo, Jae-Hyeok;Kim, Sungsu
    • Journal of Cadastre & Land InformatiX
    • /
    • v.51 no.2
    • /
    • pp.83-106
    • /
    • 2021
  • Interests in clean fuels have been soaring because of environmental problems such as air pollution and global warming. Unlike fossil fuels, hydrogen obtains public attention as a eco-friendly energy source because it releases only water when burned. Various policy efforts have been made to establish a hydrogen based transportation network. The station that supplies hydrogen to hydrogen-powered trucks is essential for building the hydrogen based logistics system. Thus, determining the optimal location of refueling stations is an important topic in the network. Although previous studies have mostly applied optimization based methodologies, this paper adopts machine learning to review spatial attributes of candidate locations in selecting the optimal position of the refueling stations. Machine learning shows outstanding performance in various fields. However, it has not yet applied to an optimal location selection problem of hydrogen refueling stations. Therefore, several machine learning models are applied and compared in performance by setting variables relevant to the location of highway rest areas and random points on a highway. The results show that Random Forest model is superior in terms of F1-score. We believe that this work can be a starting point to utilize machine learning based methods as the preliminary review for the optimal sites of the stations before the optimization applies.

A Study on Prediction of EPB shield TBM Advance Rate using Machine Learning Technique and TBM Construction Information (머신러닝 기법과 TBM 시공정보를 활용한 토압식 쉴드TBM 굴진율 예측 연구)

  • Kang, Tae-Ho;Choi, Soon-Wook;Lee, Chulho;Chang, Soo-Ho
    • Tunnel and Underground Space
    • /
    • v.30 no.6
    • /
    • pp.540-550
    • /
    • 2020
  • Machine learning has been actively used in the field of automation due to the development and establishment of AI technology. The important thing in utilizing machine learning is that appropriate algorithms exist depending on data characteristics, and it is needed to analysis the datasets for applying machine learning techniques. In this study, advance rate is predicted using geotechnical and machine data of TBM tunnel section passing through the soil ground below the stream. Although there were no problems of application of statistical technology in the linear regression model, the coefficient of determination was 0.76. While, the ensemble model and support vector machine showed the predicted performance of 0.88 or higher. it is indicating that the model suitable for predicting advance rate of the EPB Shield TBM was the support vector machine in the analyzed dataset. As a result, it is judged that the suitability of the prediction model using data including mechanical data and ground information is high. In addition, research is needed to increase the diversity of ground conditions and the amount of data.

머신 러닝을 통한 단백질의 자유 에너지 예측

  • Lee, Gwang-Jung;Ham, Si-Hyeon
    • Proceeding of EDISON Challenge
    • /
    • 2017.03a
    • /
    • pp.95-99
    • /
    • 2017
  • Protein contact map은 단백질 삼차구조에 대한 정보를 이차원의 이미지로 표현하는 방법의 하나로, 비교적 간략하지만 단백질 구조에 대한 핵심적 정보를 함축하고 있다. 이러한 단백질 구조를 바탕으로 단백질의 internal energy, solvation free energy, free energy 와 같은 열역학 함수를 도출할 수 있다. 본 연구에서는 이미지 인식에 대한 머신러닝 기법을 사용하여 단백질 구조를 함축하는 단백질의 contact map으로부터 단백질의 열역학적 함수를 예측하는 연구를 진행하였다. 단백질의 main-chain 간의 contact map, side-chain 간의 contact map, main-chain과 side-chain 간의 contact map 들로부터 단백질의 여러 가지 열역학적 함수를 예측하고자 했으며 최종적으로 Convolution Neural Network (CNN) 기법을 사용하여 단백질의 free energy를 ~18 kcal/mol의 범위에서 예측 가능함을 보였다. 본 연구를 바탕으로 단백질의 contact map과 열역학 함수 사이의 상관관계가 있으며, 머신러닝 기법을 사용하여 단백질 contact map으로부터 열역학적 함수를 예측하는 것이 가능함을 보였다.

  • PDF

Bias-correction of near-real-time multi-satellite precipitation products using machine learning (머신러닝 기반 준실시간 다중 위성 강수 자료 보정)

  • Sungho Jung;Xuan-Hien Le;Van-Giang Nguyen;Giha Lee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.280-280
    • /
    • 2023
  • 강수의 정확한 시·공간적 추정은 홍수 대응, 가뭄 관리, 수자원 계획 등 수문학적 모델링의 핵심 기술이다. 우주 기술의 발전으로 전지구 강수량 측정 프로젝트(Global Precipitation Measurement, GPM)가 시작됨에 따라 위성의 여러 센서를 이용하여 다양한 고해상도 강수량 자료가 생산되고 있으며, 기후변화로 인한 수재해의 빈도가 증가함에 따라 준실시간(Near-Real-Time) 위성 강수 자료의 활용성 및 중요성이 높아지고 있다. 하지만 준실시간 위성 강수 자료의 경우 빠른 지연시간(latency) 확보를 위해 관측 이후 최소한의 보정을 거쳐 제공되므로 상대적으로 강수 추정치의 불확실성이 높다. 이에 따라 본 연구에서는 앙상블 머신러닝 기반 수집된 위성 강수 자료들을 관측 자료와 병합하여 보정된 준실시간 강수량 자료를 생성하고자 한다. 모형의 입력에는 시단위 3가지 준실시간 위성 강수 자료(GSMaP_NRT, IMERG_Early, PERSIANN_CCS)와 방재기상관측 (AWS)의 온도, 습도, 강수량 지점 자료를 활용하였다. 지점 강수 자료의 경우 결측치를 고려하여 475개 관측소를 선정하였으며, 공간성을 고려한 랜덤 샘플링으로 375개소(약 80%)는 훈련 자료, 나머지 100개소(약 20%)는 검증 자료로 분리하였다. 모형의 정량적 평가 지표로는 KGE, MAE, RMSE이 사용되었으며, 정성적 평가 지표로 강수 분할표에 따라 POD, SR, BS 그리고 CSI를 사용하였다. 머신러닝 모형은 개별 원시 위성 강수 자료 및 IDW 기법보다 높은 정확도로 강수량을 추정하였으며 공간적으로 안정적인 결과를 나타내었다. 다만, 최대 강수량에서는 다소 과소추정되므로 이는 강수와 관련된 입력 변수의 개수 업데이트로 해결할 수 있을 것으로 판단된다. 따라서 불확실성이 높은 개별 준실시간 위성 자료들을 관측 자료와 병합하여 보정된 최적 강수 자료를 생성하는 머신러닝 기법은 돌발성 수재해에 실시간으로 대응 가능하며 홍수 예보에 신뢰도 높은 정량적인 강수량 추정치를 제공할 수 있다.

  • PDF

Analysis of Algae Occurrence Characteristics According to Multifunctional Weir Structures in the Nakdong River (낙동강 보 구조물에 따른 조류발생 특성 분석)

  • Jo Bu Geon;Lee Sang Ung;Young Do Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.147-147
    • /
    • 2023
  • 낙동강은 4대강 사업을 통한 다기능 보 건설로 하천 환경에 변화가 일어났다. 하천 수심이 증가하고 유속이 느려지는 정체성 수역 특성을 나타내고 있다. 이는 남조류 발생에 영향을 주며 남조류가 분비하는 독성물질 또한 수생태계와 인체에 유해하며 남조류 발생에 따른 다양한 원인인자들이 있다. 이러한 남조류 발생 특성을 정량적으로 규명하기 위하여 최근 조류 관리에 있어 데이터 마이닝 및 머신러닝 기법을 적용한 연구가 이루어지고 있다. 머신러닝에서는 학습자료 선정에 따라 예측 결과가 다르게 나타나며 이는 발생원인이 복잡한 남조류에 있어 중요한 부분이라 볼 수 있다. 낙동강의 다기능보는 하나의 유체에 직렬형으로 8개의 다기능보가 위치하고 있다. 8개의 보로 나누어져있는 하천은 각 구간별로 보의 수리학적 특성, 유역 특성이 다르다. 따라서 구간별 조류 발생 특성이 다르게 나타난다. 본 연구에서는 구간별 특성을 분류하고 조류 발생에 영향을 미치는 주요 인자들을 분석하고자 한다. 조류 발생에 있어 낙동강 8개 보 지점에 대하여 복잡한 남조류 발생 주요 영향인자 분석과 더불어 머신러닝 기법을 이용하여 영향인자에 따른 남조류 발생조건을 정량적으로 분석하였다. 수질 인자뿐만이 아닌 수리학적 인자를 고려하여 수리학적 체적시간이 다른 각 보에서의 조류발생 특성을 분석하고자 하였다. 또한 학습인자에 따라 남조류 예측에 대한 정확도 향상이 가능한지를 확인하고 이를 통해 정체성 하천에서의 남조류 발생 특성에 대해 연구하고자 하였으며 이를 통해 낙동강 남조류 발생 및 관리에 있어 선제적 관리에 활용하고자 한다.

  • PDF

Analysis of algal spatial distribution characteristics using hyperspectral images and machine learning in upstream reach of Baekje weir (초분광영상과 머신러닝을 이용한 백제보 상류구간 조류 공간분포 특성분석)

  • Jang, Wonjin;Kim, Jinuk;Chung, Jeehun;Park, Yongeun;Kim, Seongjoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.89-89
    • /
    • 2021
  • 부영양화된 호수나 유속이 느린 하천에서 발생하는 녹조의 과도한 발생은 하천 생태계 훼손, 동식물의 건강, 담수의 오염 등 환경 사회 경제적으로 큰 피해를 준다. 현재 수질 측정망은 정해진 지점에서 Chlorophyll-a(Chl-a), Phycocyanin(PC)을 대표농도로 산정하고 조류경보에 활용하고 있으나, 일주일에 한번씩 샘플링을 통해 Chl-a 및 PC를 측정하여 시공간적인 신뢰성의 문제가 제기될 수 있다. 본 연구에서는 기존 점단위 조류 모니터링의 한계점을 개선하기 위해 초분광영상 자료를 머신러닝 기법에 적용하여 Chl-a 및 PC 산정 알고리즘을 개발하였다. 이를 위해 Chl-a와 PC의 최대 흡수, 반사 파장대, 주요 물 흡수 파장대 자료를 조합하여 9개의 파장비를 구축하였으며, 기존 연구에서 활용한 머신러닝 기법인 Partial Least Square, Random Forest, Gradient Boosting, Support Vector Machine, K-Nearest Neighbor, Artificial Neural Network를 검토하여 최적 모델을 선정하였다. 학습된 머신러닝의 성능을 R2, NSE, RMSE 목적함수를 이용해 평가하였으며, 그 결과 ANN이 각각 PC 0.801, 0.755, 11.774 mg/m3, Chl-a 0.733, 0.622, 8.736 mg/m3로 가장 우수한 성능을 보였다. 최적화 된 ANN 모델을 백제보 상류 2016-2017년 항공 초분광영상에 적용하여 시공간에 따른 조류 분포변화를 평가하고자 한다.

  • PDF

The Automated System for Location Visiting Preference Prediction with Personality Factors (사람 성격 요소에 따른 위치 방문 선호도 예측의 자동화 시스템)

  • Song, Ha Yoon;Jung, Ji Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.935-938
    • /
    • 2021
  • 데이터 베이스에 저장된 사용자의 위치, 성격정보를 자동으로 받아서 머신러닝으로 회귀분석하여 방문 장소에 대한 선호도를 예측한다. 사람의 성격 요소로는 BFF 와 다른 기본 요소들을 사용하였다. 이를 위하여 자동화된 시스템을 구성하였고 위치 방문 선호도를 예측하기 위한 머신러닝 기법으로는 앙상블기법을 사용하였다. 예측 결과는 장소 카테고리별로 방문 선호도가 나타나고 이를 사용자 별로 나누어 저장할 예정이다. 데이터의 양이 많아지면서 나타나는 문제들을 해결하여 향후 연구에 도움이 될 것이다.

A Study on the Factors Influencing a Company's Selection of Machine Learning: From the Perspective of Expanded Algorithm Selection Problem (기업의 머신러닝 선정에 영향을 미치는 요인 연구: 확장된 알고리즘 선택 문제의 관점으로)

  • Yi, Youngsoo;Kwon, Min Soo;Kwon, Ohbyung
    • The Journal of Society for e-Business Studies
    • /
    • v.27 no.2
    • /
    • pp.37-64
    • /
    • 2022
  • As the social acceptance of artificial intelligence increases, the number of cases of applying machine learning methods to companies is also increasing. Technical factors such as accuracy and interpretability have been the main criteria for selecting machine learning methods. However, the success of implementing machine learning also affects management factors such as IT departments, operation departments, leadership, and organizational culture. Unfortunately, there are few integrated studies that understand the success factors of machine learning selection in which technical and management factors are considered together. Therefore, the purpose of this paper is to propose and empirically analyze a technology-management integrated model that combines task-tech fit, IS Success Model theory, and John Rice's algorithm selection process model to understand machine learning selection within the company. As a result of a survey of 240 companies that implemented machine learning, it was found that the higher the algorithm quality and data quality, the higher the algorithm-problem fit was perceived. It was also verified that algorithm-problem fit had a significant impact on the organization's innovation and productivity. In addition, it was confirmed that outsourcing and management support had a positive impact on the quality of the machine learning system and organizational cultural factors such as data-driven management and motivation. Data-driven management and motivation were highly perceived in companies' performance.