• 제목/요약/키워드: Machine Learning #2

검색결과 1,718건 처리시간 0.03초

랜덤포레스트 회귀모형을 적용한 도시지역에서의 실시간 침수 예측 (Real-time flood prediction applying random forest regression model in urban areas)

  • 김현일;이연수;김병현
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1119-1130
    • /
    • 2021
  • 불안정한 기후와 함께 나타나는 국지적 집중호우로 인한 도시 침수는 끊임없이 발생하고 있으나, 강우량을 포함한 기상정보 현황 또는 예보정보를 활용하여 공간적인 도시홍수 예측정보를 제공할 수 있는 체계는 아직 마련되지 못한 상황이다. 공간적인 홍수정보는 하천의 제방, 도시 하수관거의 통수능, 저류지, 펌프시설과 같은 구조물적 대책에 어려움이 있을 시 발생할 수 있는 최악의 홍수상황을 미리 파악함으로써 피해를 최소화하는데 직접적인 영향을 미칠 수 있다. 이에 본 연구에서는 기상청에서 제공되는 강수량, 도시 유역에 대한 2차원 침수해석 결과, 그리고 기계학습 모형 중 하나인 랜덤포레스트 회귀모형을 활용하여 실시간으로 도시유역에 대한 침수지도를 예측할 수 있는 방법론을 제시하고자 한다. 연구유역은 내수침수가 빈번하게 발생하는 울산시 우정태화지구로 선정하였다. 지속시간 6시간의 총강우량 50 mm, 80 mm 그리고 110 mm 대한 랜덤포레스트 회귀분석 예측 침수면적과 검보정된 2차원 물리모형의 침수해석 결과 비교시 각각 63%, 80%, 그리고 67%의 적합도를 보여주어, 빠른 시간안에 발생하는 도시 침수에 대한 대응, 대피를 위한 기초자료로 활용될 수 있을 것으로 판단된다.

다양한 데이터 전처리 기법 기반 침입탐지 시스템의 이상탐지 정확도 비교 연구 (Comparative Study of Anomaly Detection Accuracy of Intrusion Detection Systems Based on Various Data Preprocessing Techniques)

  • 박경선;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.449-456
    • /
    • 2021
  • 침입 탐지 시스템(IDS: Intrusion Detection System)은 보안을 침해하는 이상 행위를 탐지하는 기술로서 비정상적인 조작을 탐지하고 시스템 공격을 방지한다. 기존의 침입탐지 시스템은 트래픽 패턴을 통계 기반으로 분석하여 설계하였다. 그러나 급속도로 성장하는 기술에 의해 현대의 시스템은 다양한 트래픽을 생성하기 때문에 기존의 방법은 한계점이 명확해졌다. 이런 한계점을 극복하기 위해 다양한 기계학습 기법을 적용한 침입탐지 방법의 연구가 활발히 진행되고 있다. 본 논문에서는 다양한 네트워크 환경의 트래픽을 시뮬레이션 장비에서 생성한 NGIDS-DS(Next Generation IDS Dataset)를 이용하여 이상(Anomaly) 탐지 정확도를 높일 수 있는 데이터 전처리 기법에 관한 비교 연구를 진행하였다. 데이터 전처리로 패딩(Padding)과 슬라이딩 윈도우(Sliding Window)를 사용하였고, 정상 데이터 비율과 이상 데이터 비율의 불균형 문제를 해결하기 위해 AAE(Adversarial Auto-Encoder)를 적용한 오버샘플링 기법 등을 적용하였다. 또한, 전처리된 시퀀스 데이터의 특징벡터를 추출할 수 있는 Word2Vec 기법 중 Skip-gram을 이용하여 탐지 정확도의 성능 향상을 확인하였다. 비교실험을 위한 모델로는 PCA-SVM과 GRU를 사용하였고, 실험 결과는 슬라이딩 윈도우, Skip-gram, AAE, GRU를 적용하였을 때, 더 좋은 성능을 보였다.

위성 정보를 활용한 도심 지역 기온자료 지도화를 위한 인공신경망 적용 연구 (A study of artificial neural network for in-situ air temperature mapping using satellite data in urban area)

  • 전현호;정재환;조성근;최민하
    • 한국수자원학회논문집
    • /
    • 제55권11호
    • /
    • pp.855-863
    • /
    • 2022
  • 본 연구에서는 서울시 기온 지상관측 자료의 지도화를 위해 Artificial Neural Network (ANN)을 사용하였다. 지도화를 위한 보조자료로는 MODerate resolution Imaging Spectroradiometer (MODIS) 자료를 사용하였다. ANN 모델 설계를 위해 입력자료와 출력자료 간의 산점도 및 통계분석을 수행하였으며, 기온과의 상관성이 비교적 높게 나타나는 입력자료인 지표면온도, Normalized Difference Vegetation Index (NDVI), Enhanced Vegetation Index (EVI)와 시간(위성관측시각, Day of year), 위치(위도, 경도), 데이터 품질(운량)과 관련된 데이터 종류를 분류 및 조합하여 학습을 진행하였다. 기온자료와 상관성이 높은 데이터만으로 학습을 진행하였을 때 상관계수(r)와 Root Mean Squared Error (RMSE)의 평균값이 0.9667, 2.708℃로 우수한 성능을 보였다. 학습에 사용된 데이터의 종류가 추가될수록 더 우수한 학습 결과를 보였으며, 모든 데이터가 활용될 때에는 r과 RMSE의 평균값이 0.9840, 1.883℃로 가장 우수한 성능을 보였다. ANN 모델으로 생성한 서울시 기온 지도에서는 픽셀별 지형적 특성에 적절하게 기온이 산정된 것으로 판단되며, 추후 연구지역 확대 및 위성자료의 다양화를 통해 시단위 및 전국단위 기온 분포 분석 연구가 가능할 것이다.

AI모델을 적용한 군 경계체계 지능화 방안 (A Methodology for Making Military Surveillance System to be Intelligent Applied by AI Model)

  • 한창희;구하림;박복기
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.57-64
    • /
    • 2023
  • 현재 진행되는 고령화 및 인구절벽으로 대표되는 인구구조적 문제는 한국군 경계임무에 심각한 도전이 되고 있다. 본 연구의 목적은 AI모델을 적용해 군 경계체계를 지능화하는 것이다. 본 연구를 통해 제4차 산업혁명과 그 핵심이 되는 인공지능 알고리즘의 의의가 경계근무 상황실 내에서의 단순작업을 기계화하여 작업효율을 극대화하는 것임을 실증한다. 하나의 완성된 시스템으로서 군경계체계를 개발하기 위해, 지능화·자동화된 군(軍) 경계체계라는 목표로부터 필요한 인공지능 기술인 다중 객체 추적(multi-object tracking, MOT) 기술을 선택한다. 또한 체계 사용자의 접근성 및 체계 이용의 효율성을 담보하기 위해서는 데이터 시각화(data visualization)와 사용자 인터페이스(user interface)를 꼽았다. 이 추가 요소를 결합하여 하나의 유기적인 소프트웨어 애플리케이션을 구성한다. CCTV 영상 데이터 수집한 장소는 00부대 제1정문 및 제2정문에 설치된 CCTV 카메라이며, 지통실의 협조 아래 영상 수집을 진행하였다. 실험결과를 통해 경계체계를 지능화·자동화시켜 더 많은 정보를 경계체계 운용인원에게 전달할 수 있음을 보였다. 그러 나 여전히 개발된 소프트웨어 경계체계 역시 한계점이 존재한다. 이를 설명하여 군 경계체계 개발의 향후 방향성을 제시한다.

센서 데이터를 위한 스마트 통합 처리 시스템 연구 (Study of Smart Integration processing Systems for Sensor Data)

  • 지효상;김재성;김리원;김정준;한익주;박정민
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권8호
    • /
    • pp.327-342
    • /
    • 2017
  • 본 논문은 센서 데이터를 수집하고 효과적으로 처리하는 IoT 서비스를 위한 스마트 센서 데이터 통합 처리 시스템을 소개한다. IoT 분야의 발전으로 센서 데이터를 수집하고 이를 네트워크로 송·수신하는 기술을 바탕으로 하는 스마트 홈, 자율주행 자동차 등의 다양한 프로젝트가 진행됨에 따라 센서 데이터를 처리하고 효과적으로 활용하기 위한 자율제어 시스템이 이슈가 되고 있다. 그러나 자율제어 시스템의 모니터링을 위한 센서 데이터 형식은 도메인에 따라 다르기 때문에 각기 다른 다양한 도메인에 자율제어 시스템을 적용하는 스마트 센서 데이터 통합 처리 시스템이 필요하다. 따라서 본 논문은 스마트 센서 데이터 통합 처리 시스템을 소개하고, 이를 적용시켜 창문을 기준으로 내부와 외부의 센서 데이터를 처리하기 위해 1) receiveData, 2) parseData, 3) addToDatabase의 3단계 프로세스를 가지고, 자율제어 시스템에 의하여 쾌적한 실내 환경을 조성하기 위해 환기를 하는 자동 창문 개폐 시스템 'Smart Window'를 제안하고 구현한다. 이를 통해 대기 정보를 수집해 모니터링하며, 저장된 데이터를 토대로 통계 분석 및 더 나은 자율제어 수행을 위한 기계학습을 가능하게 한다.

랜섬웨어 공격탐지를 위한 신뢰성 있는 동적 허니팟 파일 생성 시스템 구현 (Implementation of reliable dynamic honeypot file creation system for ransomware attack detection)

  • 국경완;류연승;신삼범
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.27-36
    • /
    • 2023
  • 최근 몇 년 동안 랜섬웨어 공격이 사회 공학, 스피어피싱, 심지어 기계 학습과 같은 전술을 사용하여 특정 개인이나 조직을 대상으로 하는 공격의 정교함과 더불어 더욱 조직화 되고 전문화되고 있으며 일부는 비즈니스 모델로 운영되고 있다. 이를 효과적으로 대응하기 위해 심각한 피해를 입히기 전에 공격을 감지하고 예방할 수 있는 다양한 연구와 솔루션들이 개발되어 운영되고 있다. 특히, 허니팟은 조기 경고 및 고급 보안 감시 도구 역할 뿐만 아니라, IT 시스템 및 네트워크에 대한 공격 위험을 최소화하는 데 사용할 수 있으나, 랜섬웨어가 미끼파일에 우선적으로 접근하지 않은 경우나, 완전히 우회한 경우에는 효과적인 랜섬웨어 대응이 제한되는 단점이 있다. 본 논문에서는 이러한 허니팟을 사용자 환경에 최적화하여 신뢰성 있는 실시간 동적 허니팟 파일을 생성, 공격자가 허니팟을 우회할 가능성을 최소화함으로써 공격자가 허니팟 파일이라는 것을 인지하지 못하도록 하여 탐지율을 높일 수 있도록 하였다. 이를 위해 동적 허니팟 생성을 위한 기본 데이터수집 모델 등 4개의 모델을 설계하고 (기본 데이터 수집 모델 / 사용자 정의 모델 / 표본 통계모델 / 경험치 축적 모델) 구현하여 유효성을 검증하였다.

포장층 이상구간에서 획득한 열화상 이미지 해석을 위한 CNN 알고리즘의 적용성 평가 (Assessment of Applicability of CNN Algorithm for Interpretation of Thermal Images Acquired in Superficial Defect Inspection Zones)

  • 장병수;김영석;김세원;최현준;윤형구
    • 한국지반공학회논문집
    • /
    • 제39권10호
    • /
    • pp.41-48
    • /
    • 2023
  • 도로 하부에 발생된 이상구간은 사용자의 안전을 위협하고 보수하기 위해서도 많은 사회적 비용이 동반된다. 본 연구에서는 적외선 카메라를 사용하여 이상구간 매질에 따른 온도 분포를 실험적으로 평가하고 이를 머신러닝 기법으로 분석하고자 하였다. 대상 현장은 가로와 세로 및 깊이가 모두 50cm인 정육면체 형태로 설정하였고, 이상구간은 물과 공기로 결정하였다. 실험부지의 상부는 포장층을 모사하기 위해 콘크리트 블록을 설치하였으며, 오후 4시부터 다음날 오후 3시까지 총 23시간 동안 포장층의 온도 분포를 측정하였다. 측정된 값은 이미지 형태로 도출되었으며, 이미지 중간부분에서 측정 온도의 수치를 추출하였다. 최대온도와 최저온도의 차이는 물, 공기, 그리고 원 지반에서 각각 34.8℃, 34.2℃ 그리고 28.6℃로 나타났으며, 이미지 분석 기법인 convolution neural network(CNN) 방법을 활용하여 각 측정 이미지에 해당하는 조건을 분류하였다. 분류를 수행하기 위해서는 res net 101과 squeeze net 네트워크가 이용되었다. res net 101의 분류 정확도는 물, 공기 그리고 원 지반에서 각각 70%, 50% 그리고 80%로 나타났고, squeeze net의 분류 정확도는 60%, 30% 그리고 70%로 나타났다. 해당 연구 결과는 수치데이터로 특징 판단이 어려울 경우 이미지 기반의 CNN 알고리즘을 활용하면 매질 특성 분석이 가능하고 지반내 상태도 예측할 수 있는 방법론을 보여준다.

시멘트풀의 공극분포특성에 기반한 인장강도 예측 CNN 모델 (CNN Model for Prediction of Tensile Strength based on Pore Distribution Characteristics in Cement Paste)

  • 홍성욱;한동석
    • 한국전산구조공학회논문집
    • /
    • 제36권5호
    • /
    • pp.339-346
    • /
    • 2023
  • 미세구조 특성의 불확실성은 재료 특성에 많은 영향을 준다. 시멘트 기반 재료의 공극 분포 특성은 재료의 역학적 특성에 큰 영향을 미치며, 재료에 랜덤하게 분포되어 있는 많은 공극은 재료의 물성 예측을 어렵게 한다. 공극의 특성 분석과 재료 응답 간의 상관관계 규명에 대한 기존 연구는 통계적 관계 분석에 국한되어 있으며, 그 상관관계가 아직 명확히 규명되어 있지 않다. 본 연구에서는 합성곱 신경망(CNN, convolutional neural network)을 활용한 이미지 기반 데이터 접근법을 통해 시멘트 기반 재료의 역학적 응답을 예측하고, 공극분포와 재료 응답의 상관관계를 분석하였다. 머신러닝을 위한 데이터는 고해상도 마이크로-CT 이미지와 시멘트 기반 재료의 물성(인장강도)로 구성하였다. 재료의 메시 구조 특성을 분석하였으며, 재료의 응답은 상장균열모델(phase-field fracture model)에 기반을 둔 2D 직접 인장(direct tension) 유한요소해석 시뮬레이션을 활용하여 평가하였다. 입력 이미지 영역의 기여도를 분석하여 시편에서 재료 응답 예측에 가장 큰 영향을 미치는 영역을 CNN을 통하여 식별하였다. CNN 과정 중 활성 영역과 공극분포를 비교 분석하여 공극분포특성과 재료 응답의 상관관계를 분석하여 제시하였다.

GPT를 활용한 개인정보 처리방침 안전성 검증 기법 (Safety Verification Techniques of Privacy Policy Using GPT)

  • 심혜연;권민서;윤다영;서지영;이일구
    • 정보보호학회논문지
    • /
    • 제34권2호
    • /
    • pp.207-216
    • /
    • 2024
  • 4차 산업혁명으로 인해 빅데이터가 구축됨에 따라 개인 맞춤형 서비스가 급증했다. 이로 인해 온라인 서비스에서 수집하는 개인정보의 양이 늘어났으며, 사용자들의 개인정보 유출 및 프라이버시 침해 우려가 높아졌다. 온라인 서비스 제공자들은 이용자들의 프라이버시 침해 우려를 해소하기 위해 개인정보 처리방침을 제공하고 있으나, 개인정보 처리방침은 길이가 길고 복잡하여 이용자가 직접 위험 항목을 파악하기 어려운 문제로 인해 오남용되는 경우가 많다. 따라서 자동으로 개인정보 처리방침이 안전한지 여부를 검사할 수 있는 방법이 필요하다. 그러나 종래의 블랙리스트 및 기계학습 기반의 개인정보 처리방침 안전성 검증 기법은 확장이 어렵거나 접근성이 낮은 문제가 있다. 본 논문에서는 문제를 해결하기위해 생성형 인공지능인 GPT-3.5 API를 이용한 개인정보 처리방침 안전성 검증 기법을 제안한다. 새로운 환경에서도 분류 작업을 수행할 수 있고, 전문 지식이 없는 일반인이 쉽게 개인정보 처리방침을 검사할 수 있다는 가능성을 보인다. 실험에서는 블랙리스트 기반 개인정보 처리방침과 GPT 기반 개인정보 처리방침이 안전한 문장과 안전하지 않은 문장의 분류를 얼마나 정확하게 하는지와 분류에 소요된 시간을 측정했다. 실험 결과에 따르면, 제안하는 기법은 종래의 블랙리스트 기반 문장 안전성 검증 기법보다 평균적으로 10.34% 높은 정확도를 보였다.

머신러닝 기법을 이용한 약물 분류 방법 연구 (A Study on the Drug Classification Using Machine Learning Techniques)

  • Anmol Kumar Singh;Ayush Kumar;Adya Singh;Akashika Anshum;Pradeep Kumar Mallick
    • 산업과 과학
    • /
    • 제3권2호
    • /
    • pp.8-16
    • /
    • 2024
  • 본 논문에서는 인구통계학적, 생리학적 특성을 기반으로 환자에게 가장 적합한 약물을 예측하는 것을 목표로 하는 약물 분류 시스템을 제시한다. 데이터 세트에는 적절한 약물을 결정하기 위한 목적으로 연령, 성별, 혈압(BP), 콜레스테롤 수치, 나트륨 대 칼륨 비율(Na_to_K)과 같은 속성들이 포함된다. 본 연구에 사용된 모델은 KNN(K-Nearest Neighbors), 로지스틱 회귀 분석 및 Random Forest이다. 하이퍼파라미터를 최적화하기 위해 5겹 교차 검증을 갖춘 GridSearchCV를 활용하였으며, 각 모델은 데이터 세트에서 훈련 및 테스트 되었다. 초매개변수 조정 유무에 관계없이 각 모델의 성능은 정확도, 혼동 행렬, 분류 보고서와 같은 지표를 사용하여 평가되었다. GridSearchCV를 적용하지 않은 모델의 정확도는 0.7, 0.875, 0.975인 반면, GridSearchCV를 적용한 모델의 정확도는 0.75, 1.0, 0.975로 나타났다. GridSearchCV는 로지스틱 회귀 분석을 세 가지 모델 중 약물 분류에 가장 효과적인 모델로 식별했으며, K-Nearest Neighbors가 그 뒤를 이었고 Na_to_K 비율은 결과를 예측하는 데 중요한 특징인 것으로 밝혀졌다.