• Title/Summary/Keyword: 머신러닝 기법

Search Result 486, Processing Time 0.035 seconds

머신러닝 기법을 활용한 낙동강 하구 염분농도 예측 (Nakdong River Estuary Salinity Prediction Using Machine Learning Methods)

  • 이호준;조민규;천세진;한정규
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.31-38
    • /
    • 2022
  • 하천의 염분 변화를 신속히 예측하는 것은 염분 침투로 인한 농업, 생태계의 피해를 예측하고 재해 방지 대책을 수립하기 위해서 중요한 작업이다. 머신러닝 기법은 물리 기반 수리 모델에 비해 계산량이 훨씬 적기 때문에, 비교적 짧은 시간에 염분농도를 예측 가능하여 물리 기반 수리 모델의 보완 기법으로 연구되고 있다. 해외에서는 머신러닝 기법 기반 염분 예측 연구들이 활발히 연구되고 있으나, 대한민국의 공공데이터에 머신러닝 기법을 적용한 연구는 충분치 않다. 낙동강 하구의 환경 정보에 관한 공공데이터와 함께, 본 연구는 여러 종류의 머신러닝 기법의 염분농도에 대한 예측 성능을 측정하였다. 실험 결과에서, 결정 트리 기반의 LightGBM 알고리즘은 평균 RMSE 0.37의 예측 정확도와 타 알고리즘 대비 2-20배 빠른 학습 속도를 보여주었다. 따라서 국내 하천의 염분농도 예측에도 머신러닝 기법을 적용할 수 있다고 판단된다.

머신러닝을 위한 불균형 데이터 처리 방법 : 샘플링을 위주로 (Handling Method of Imbalance Data for Machine Learning : Focused on Sampling)

  • 이규남;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제19권11호
    • /
    • pp.567-577
    • /
    • 2019
  • 최근 학계, 산업계 등에서 접하는 기존의 문제를 머신러닝을 통해 해결하려는 시도가 증가하고 있다. 이에 따라 이탈, 사기탐지, 장애탐지 등 일반적이지 않은 상황을 머신러닝으로 해결하기 위한 다양한 연구가 이어지고 있다. 대부분의 일반적이지 않은 환경에서는 데이터가 불균형하게 분포하며, 이러한 불균형한 데이터는 머신러닝의 수행과정에서 오류를 야기하므로 이를 해결하기 위한 불균형 데이터 처리 기법이 필요하다. 본 논문에서는 머신러닝을 위한 불균형 데이터 처리 방법을 제안한다. 제안하는 방법은 샘플링 방법을 중심으로 다수 클래스(Major Class)의 모집단 분포를 효율적으로 추출하도록 검증하여 머신 러닝을 위한 불균형 데이터 문제를 해결한다. 본 논문에서는 성능평가를 통해 제안하는 기법이 기존 기법에 비해 성능이 우수함을 보인다.

딥러닝을 이용한 대설피해액 예측 및 개선방안 제안 (Predicting Snow Damage and Suggesting Improvement Plans Using Deep Learning)

  • 이형주;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.485-485
    • /
    • 2021
  • 최근 세계적인 기상이변으로 자연재해의 발생빈도 증가는 물론 이로 인한 피해가 점차 다양화 및 대형화되어 가고 있는 추세이다. 재난으로 인한 피해는 발생지역 피해뿐만 아니라 국가 경제 전반에 큰 영향을 미치는 특징이 있다. 우리나라의 자연재해 중 대설은 다른 자연재해에 비해 발생빈도는 낮지만 광역적인 피해를 유발하며, 피해 면적에 비해 피해액 규모가 크다. 또한 현재에는 강원권이 가장 취약한 것으로 취약성 분석 결과에서 보여주지만, 미래에는 강원권, 충청권, 호남권을 연결하는 축으로 취약지역이 확대될 것으로 전망된다. 본 연구에서는 현재 사회 전반에서 다양하게 활용되고 있는 머신러닝 기법을 이용하여 우리나라 대설피해액을 예측하는 대설피해 예측모형을 개발하고자 하였다. 머신러닝 기법으로는 랜덤포레스트, 서포트 벡터 머신, 인공신경망 기법을 이용하였고, 모형에 사용한 변수는 기상관측자료, 사회·경제적 요소 등을 활용하여 모형을 개발하였다. 결과적으로 기존연구에서 다중회귀모형을 이용하여 개발된 예측모형과 본 연구에서 3개의 머신러닝 기법으로 개발된 예측모형의 예측력을 비교 분석하였고, 예측력이 가장 높은 모형을 제시하였다. 본 연구결과를 활용하여 모형의 개선 및 데이터 품질 개선이 이루어진다면 향후 대설피해에 대한 개략적인 대비가 가능할 것으로 기대된다.

  • PDF

머신러닝 기법을 통한 우리나라 가뭄 영향 발생 가능성 평가 (Assessing likelihood of drought impact occurrence in South korea through machine learning)

  • 서정호;김연주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.77-77
    • /
    • 2021
  • 가뭄은 사회·경제적으로 매우 큰 피해를 주는 자연재해이며, 그 시작과 발생 지역을 정확하게 예측하는 데 어려운 문제가 있다. 이에 수문 분야에서는 가뭄에 영향을 미치는 수문·기상인자들을 이용하여 다양한 가뭄지수를 개발하였고 이를 활용하여 가뭄 현상을 모니터링하고 예측 및 전망하는데 다양한 노력을 기울이고 있다. 하지만 가뭄지수들은 실제 가뭄이 어떠한 형태로 발생하는지 파악하기에 많은 한계점을 가지고 있다. 이에 최근 들어 미국과 유럽에서는 실제 농업, 환경, 에너지 등과 같은 다양한 분야에 걸쳐 가뭄 피해로 인해 생기는 가뭄 영향을 보다 체계적이고 상세한 데이터 인벤토리로 구축하고 가뭄지수와의 상관관계, 회귀분석과 같은 연구를 통해 가뭄 영향 예측을 시도하고 있다. 따라서 본 연구에서는 보고서, 데이터베이스, 웹 크롤링(Web-Crawling)을 통한 뉴스 기사 등과 같은 자료를 수집하여 국내 가뭄 영향 인벤토리를 구축하였다. 또한 수문 분야에 널리 사용되고 있는 가뭄지수인 표준 강수 증발산량지수 SPEI(Standardized Precipitation-Evapotranspiration Index)를 기반으로 지역에 따른 가뭄 영향을 예측하기 위해 최근 로지스틱 회귀모형, Random forest, Support vector machine, XGBoost 등의 다양한 머신러닝 기법을 적용하였다. 각 모형의 성능을 Receiver Operating Characteristic(ROC) 곡선을 통해 평가하여 가뭄 영향 예측에 적절한 머신러닝 기법을 제시하였다. 본 연구 결과를 통해 텍스트 기반의 가뭄 영향 자료와 머신러닝 기법을 통한 가뭄 영향 예측 방법론은 가뭄 재난 관리에 유용한 정보를 제공할 수 있다.

  • PDF

머신러닝 기법을 활용한 교량데이터 설계 시 슬래브두께 예측에 관한 연구 (A Study on the Use of Machine Learning Models in Bridge on Slab Thickness Prediction)

  • 홍철승;김효관;이세희
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.325-330
    • /
    • 2023
  • 본 논문은 머신러닝을 활용하여 교량 데이터 설계 시 기존 엔지니어의 구조해석결과 또는 경험 및 주관에 따라 슬래브 두께를 예측하여 왔던 프로세스를 머신러닝 기법을 적용하여 디지털 기반 의사결정이 가능하도록 제시한다. 본 연구에서는 슬래브 두께 선정을 구조해석 외에 머신러닝 기법을 활용하여 엔지니어에게 가이드 값을 제공하게 함으로써 신뢰성 있는 설계 환경을 구축하고자 한다. 교량 데이터 중 가장 많은 비중을 차지하고 있는 거더교를 기준으로 상부구조물 중 슬래브 두께를 예측하기 위한 예측모델 프로세스를 정의 하였다. 각 프로세스 별 예측 값을 산출하기 위하여 다양한 머신러닝 모델 (Linear Regress, Decision Tree, Random Forest, Muliti-layer Perceptron)을 프로세스별 경합하여 최적의 모델을 도출하였다. 본 연구를 통해 기존 구조해석을 통해서만 슬래브 두께 예측을 하였던 영역에 머신러닝 기법의 적용 가능성을 확인하였으며 정확도 또한 95.4%를 도출하였다, 향후 프로세스 확장 및 데이터를 지속 확보하여 예측모델 정확도를 향상시킨다면 공사 환경에 머신러닝 모델이 지속 활용될 수 있을 것으로 기대된다.

다중 댐 유역에 대한 강우예측모델 개발을 위한 전이학습 기법의 적용 (Application of transfer learning to develop radar-based rainfall prediction model with GAN(Generative Adversarial Network) for multiple dam domains)

  • 최수연;김연주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.61-61
    • /
    • 2022
  • 최근 머신러닝 기술의 발달에 따라 이를 활용한 레이더 자료기반 강우예측기법이 활발히 개발되고 있다. 기존 머신러닝을 이용한 강우예측모델 개발 관련 연구는 주로 한 지역에 대해 수행되며, 데이터 기반으로 훈련되는 머신러닝 기법의 특성상 개발된 모델이 훈련된 지역에 대해서만 좋은 성능을 보인다는 한계점이 존재한다. 이러한 한계점을 해결하기 위해 사전 훈련된 모델을 이용하여 새로운 데이터에 대해 모델을 훈련하는 전이학습 기법 (transfer learning)을 적용하여 여러 유역에 대한 강우예측모델을 개발하고자 하였다. 본 연구에서는 사전 훈련된 강우예측 모델로 생성적 적대 신경망 기반 기법(Generative Adversarial Network, GAN)을 이용한 미래 강우예측모델을 사용하였다. 해당 모델은 기상청에서 제공된 2014년~2017년 여름의 레이더 이미지 자료를 이용하여 초단기, 단기 강우예측을 수행하도록 학습시켰으며, 2018년 레이더 이미지 자료를 이용한 단기강우예측 모의에서 좋은 성능을 보였다. 본 연구에서는 훈련된 모델을 이용해 새로운 댐 유역(안동댐, 충주댐)에 대한 강우예측모델을 개발하기 위해 여러 전이학습 기법을 적용하고, 그 결과를 비교하였다. 결과를 통해 새로운 데이터로 처음부터 훈련시킨 모델보다 전이학습 기법을 사용하였을 때 좋은 성능을 보이는 것을 확인하였으며, 이를 통해 여러 댐 유역에 대한 모델 개발 시 전이학습 기법이 효율적으로 적용될 수 있음을 확인하였다.

  • PDF

통계분석 기법과 머신러닝 기법의 비교분석을 통한 건물의 지진취약도 공간분석 (A Spatial Analysis of Seismic Vulnerability of Buildings Using Statistical and Machine Learning Techniques Comparative Analysis)

  • 김성훈;김상빈;김대현
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.159-165
    • /
    • 2023
  • 최근 지진 발생 빈도가 증가하고 있는 반면 국내 지진 대응 체계는 취약한 현실에서, 본 연구의 목적은 통계분석 기법과 머신러닝 기법을 활용한 공간분석을 통해 건물의 지진취약도를 비교분석 하는 것이다. 통계분석 기법을 활용한 결과, 최적화척도법을 활용해 개발된 모델의 예측정확도는 약 87%로 도출되었다. 머신러닝 기법을 활용한 결과, 분석된 4가지 방법 중, Random Forest의 정확도가 Train Set의 경우 94%, Test Set의 경우 76.7%로 가장 높아, 최종적으로 Random Forest가 선정되었다. 따라서, 예측정확도는 통계분석 기법이 약 87%, 머신러닝 기법이 76.7%로, 통계분석 기법의 예측정확도가 더 높은 것으로 분석되었다. 최종 결과로, 건물의 지진취약도는 분석된 건물데이터 총 22,296개 중, 1,627(0.1%)개의 건물데이터는 통계분석 기법 사용 시 더 위험하다고 도출되었고, 10,146(49%)개의 건물데이터는 동일하게 도출되었으며, 나머지 10,523(50%)개의 건물데이터는 머신러닝 기법 사용 시 더 위험하게 도출되었다. 기존 통계분석 기법에 첨단 머신러닝 기법활용결과가 추가로 비교검토 됨으로써 공간분석 의사결정에 있어서, 좀더 신뢰도가 높은 지진대응책 마련에 도움이 되길 기대한다.

효과적인 필기체 인식을 위한 인공지능 알고리즘 (Artificial Intelligence Algorithms for Identification of Handwriting)

  • 김승주;이재영;한종기
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.151-153
    • /
    • 2016
  • 최근 스마트폰, PC, 태블릿 같은 전자기기들이 발전하면서 기계를 통해 소통하는 시대가 왔다. 기계와 소통하기 위해 우리가 사용하는 문자를 인식하는 것은 중요한 일이다. 이런 전자기기들이 문자, 영상인식을 해야 할 필요성이 더욱 증가함에 따라 머신러닝의 중요성이 대두되었다. 머신러닝은 컴퓨터의 학습을 위해 알고리즘과 기술을 개발하는 분야를 말한다. 머신러닝의 기법과 관련된 알고리즘의 종류는 수없이 많다. 그 중에서도 Neural Network는 사람의 뇌 신경구조를 토대로 착안하여 네트워크를 만들고 이를 학습에 이용한 머신러닝 기법이다. 이런 인공지능 알고리즘인 Neural Network 구조를 바탕으로 특징을 추출하여 학습을 하는 Convolution Neural Network 기법의 사용이 늘고 있다. 본 논문에서는 Neural Network와 Convolution Neural Network의 알고리즘을 이용한 필기체 인식 실험을 하고 그 내용을 비교하였다.

  • PDF

우리나라 고령층의 경제활동 수준 예측 - 머신러닝 기법과 연계한 예측조합법을 중심으로 - (Prediction on the Economic Activity Level of the Elderly in South Korea - Focusing on Machine Learning Method Combined with Forecast Combination -)

  • 김정우
    • 한국융합학회논문지
    • /
    • 제13권5호
    • /
    • pp.237-247
    • /
    • 2022
  • 본 연구는 급속한 고령화 시대에서 우리나라의 고령층의 경제활동 수준을 다양한 머신러닝 기법으로 정확히 예측하고자 하였다. 고령층의 경제활동 수준과 기존 연구들은 고령층의 삶의 만족도, 사회보장제도 등과 연관된 인과성 검증을 중심으로 이루어진 데 반해, 본 연구는 다양한 머신러닝 기법으로 고령층의 경제활동 수준을 예측하였으며, 특히 예측조합법을 함께 사용함으로써 예측의 안정성을 도모하였다. 60세 이상의 경제활동참가율, 취업률 등을 종속변수로 하고 가구 특성, 소득, 평균임금 등을 설명변수로 설정하여 서로 다른 특성을 지닌 5가지의 머신러닝 기법과 2가지의 예측조합법을 적용하여 예측결과들을 비교하였다. 분석 결과, 종속변수별, 예측구간별로 예측성능이 높은 머신러닝 기법 및 예측조합법은 상이하였으나, 예측의 안정성 측면에서는 예측조합법이 상대적으로 우수한 것으로 나타났다. 이에 따라, 본 연구는 고령층의 경제활동 수준을 정확히 예측하고 예측의 안정성을 도모하여 정책적 관점에서도 실용성을 제고한다고 볼 수 있다.

머신러닝을 이용한 악성코드 분류 (A Malicious Code Classification using Machine Learning)

  • 이길흥;김경신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.257-258
    • /
    • 2017
  • 머신러닝 기법을 다양한 분야에 사용되는 연구가 한창이다. 본 논문에서는 악성 코드의 분류 시스템에 머신러닝 기법을 적용하였다. 악성 코드 파일을 적당한 크기로 이미지화하여 텐서 플로우의 인셉션 V3에 적용하였다. 실험 결과, 이미지의 사이즈 조정과 파라미터 조정을 통해 매우 만족할 만한 수준으로 악성 코드를 잘 분류함을 확인할 수 있었다.