• 제목/요약/키워드: 피쳐

검색결과 87건 처리시간 0.021초

기상 데이터와 대기 환경 데이터 기반 (초)미세먼지 분석과 예측 (Analysis and Prediction of (Ultra) Air Pollution based on Meteorological Data and Atmospheric Environment Data)

  • 박홍진
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권4호
    • /
    • pp.328-337
    • /
    • 2021
  • 석면, 벤젠과 같이 발암물질 1급인 미세먼지는 각종 질병에 원인이 되고 있다. 초 미세먼지 확산은 코로나 바이러스 확산의 중요한 원인중 하나이다. 본 논문은 2015년부터 2019년까지 서울시 평균 기온, 강수량, 평균 풍속등의 기상 데이터와 SO2, NO2, O3,등의 대기 환경 데이터를 기반으로 미세먼지와 초 미세먼지를 분석하고 예측한다. 계절별과 월별로 미세먼지와 초미세먼지 현황을 파악·분석하며 미세먼지를 예측하기 위해 기계학습 모델 중 선형회귀, SVM, 앙상블 모델을 이용하여 비교 분석하였다. 또한 미세먼지와 초 미세먼지 발생에 영향을 미치는 중요한 피쳐(속성)를 파악한다. 본 논문이 파악한 결과 3월에 가장 (초)미세먼지가 높았고, 8월에서 9월까지 (초)미세먼지가 가장 낮았다. 기상 데이터일 경우 (초)미세먼지에 가장 영향을 미치는 데이터가 평균 기온이며, 기상 데이터와 대기 환경 데이터일 경우 NO2가 (초)미세먼지 발생에 가장 크게 작용하였다.

XAI 기반의 임상의사결정시스템에 관한 연구 (A Study on XAI-based Clinical Decision Support System)

  • 안윤애;조한진
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.13-22
    • /
    • 2021
  • 임상의사결정시스템은 누적된 의료 데이터를 활용하여 머신러닝으로 학습된 AI 모델을 환자의 진단 및 진료 예측에 적용한다. 그러나 기존의 블랙박스 기반의 AI 응용은 시스템이 예측한 결과에 대해 타당한 이유를 제시하지 못하여 설명성이 부족한 한계점이 존재한다. 이와 같은 문제점을 보완하기 위해 이 논문에서는 임상의사결정시스템의 개발 단계에서 설명이 가능한 XAI를 적용하는 시스템 모델을 제안한다. 제안 모델은 기존의 AI모델에 설명성이 가능한 특정 XAI 기술을 추가로 적용시켜 블랙박스의 한계점을 보완할 수 있다. 제안 모델의 적용을 보이기 위해 LIME과 SHAP을 활용한 XAI 적용 사례를 제시한다. 테스트를 통해 데이터들이 모델의 예측 결과에 어떤 영향을 미치는지 다양한 관점에서 설명할 수 있다. 제안된 모델은 사용자에게 구체적인 이유를 제시함으로써 사용자의 신뢰를 높일 수 있는 장점을 가진다. 아울러 XAI의 적극적인 활용을 통해 기존 임상의사결정시스템의 한계를 극복하고 더 나은 진단 및 의사결정 지원을 가능하게 할 것으로 기대한다.

블랙 박스 모델의 출력값을 이용한 AI 모델 종류 추론 공격 (Model Type Inference Attack Using Output of Black-Box AI Model)

  • 안윤수;최대선
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.817-826
    • /
    • 2022
  • AI 기술이 여러 분야에 성공적으로 도입되는 추세이며, 서비스로 환경에 배포된 모델들은 지적 재산권과 데이터를 보호하기 위해 모델의 정보를 노출시키지 않는 블랙 박스 상태로 배포된다. 블랙 박스 환경에서 공격자들은 모델 출력을 이용해 학습에 쓰인 데이터나 파라미터를 훔치려고 한다. 본 논문은 딥러닝 모델을 대상으로 모델 종류에 대한 정보를 추론하는 공격이 없다는 점에서 착안하여, 모델의 구성 레이어 정보를 직접 알아내기 위해 모델의 종류를 추론하는 공격 방법을 제안한다. MNIST 데이터셋으로 학습된 ResNet, VGGNet, AlexNet과 간단한 컨볼루션 신경망 모델까지 네 가지 모델의 그레이 박스 및 블랙 박스 환경에서의 출력값을 이용해 모델의 종류가 추론될 수 있다는 것을 보였다. 또한 본 논문이 제안하는 방식인 대소 관계 피쳐를 딥러닝 모델에 함께 학습시킨 경우 블랙 박스 환경에서 약 83%의 정확도로 모델의 종류를 추론했으며, 그 결과를 통해 공격자에게 확률 벡터가 아닌 제한된 정보만 제공되는 상황에서도 모델 종류가 추론될 수 있음을 보였다.

자산변동 좌표 클러스터링 기반 게임봇 탐지 (Game-bot detection based on Clustering of asset-varied location coordinates)

  • 송현민;김휘강
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1131-1141
    • /
    • 2015
  • 본 논문에서는 MMORPG에서 각 캐릭터의 소지금 증가/감소 이벤트 로그 데이터를 위주로 플레이어의 액션 로그 데이터를 조사하여 게임봇을 탐지하는 기계 학습 기반의 새로운 접근 방법을 제안한다. 게임봇 계정과 일반 계정을 구분하는 주요 피쳐를 추출하기 위해 밀도 기반 군집화 알고리즘의 하나인 DBSCAN (Density Based Spatial Clustering of Application with Noise)를 이용하였다. DBSCAN 알고리즘을 통해 각 플레이어의 소지금 증가/감소 위치 좌표를 클러스터링하고, 그 결과 생성된 클러스터의 수, 코어 포인트의 비율, 멤버 포인트의 비율, 노이즈 포인트의 비율과 같은 공간적 특성을 나타내는 값들을 추출하였다. 해당 피쳐들을 사용하면 게임봇 개발자들이 게임봇 탐지 시스템의 원리를 알더라도 넓은 지역을 돌아다니며 사냥을 하도록 게임봇 프로그램을 제작하는 것은 매우 비효율적이기 때문에 탐지 시스템을 우회하기 어렵게 된다. 결과적으로, 게임봇은 소지금 변동 좌표 데이터로부터 추출한 공간적 특성에서 일반유저와 명확한 차이를 보였다. 예를 들면, DBSCAN 클러스터링 결과 중 노이즈 포인트의 비율에서 게임봇은 5% 이하의 낮은 값을 가지는 반면에 일반 유저들은 대부분 높은 값을 갖는다. 실제 MMORPG의 액션 로그 데이터를 이용한 게임봇 탐지에서, 본 논문에서 제안된 시스템은 높은 탐지율의 우수한 성능을 보였다.

VRIFA: LRBF 커널과 Nomogram을 이용한 예측 및 비선형 SVM 시각화도구 (VRIFA: A Prediction and Nonlinear SVM Visualization Tool using LRBF kernel and Nomogram)

  • 김성철;유환조
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.722-729
    • /
    • 2010
  • 예측 문제를 해결하기 위한 데이타마이닝 기법은 다양한 분야에서 주목받고 있다. 이것에 대한 한 예로 컴퓨터-기반의 질병의 예측 혹은 진단은 CDSS(Clinical Decision support System)에서 가장 중요한 요소이기도 하다. 이러한 예측 문제를 해결하기 위해서 RBF커널 같은 비선형 커널을 사용한 SVM이 가장 널리 사용되고 있는데, 이는 비선형 SVM이 어떠한 다른 분류기법보다 정확한 성능을 보이기 때문이다. 하지만 비선형 SVM을 사용한 경우에는 모델내부를 시각화하는 일이 어려워서 예측결과에 대한 직관적인 이해가 힘들고, 의학 전문가들은 이러한 비선형 SVM의 사용을 기피하고 있는 실정이다. Nomogram은 SVM을 시각화하기 위해 제안된 기법이다. 하지만 이는 선형 SVM의 경우에만 사용이 가능하고. 이 문제를 해결하기 위해서 LRBF 커널이 제안된 바 있다. LRBF 커널은 기존의 RBF 커널을 사용한 SVM과 대등한 결과를 보이면서도 예측결과의 선형적 분석도 가능하게 한다. 본 논문에서는 노모그램(Nomogram)과 LRBF 커널을 사용한 SVM이 통합되어 있는 예측 툴 VRIFA를 제안한다. 이 툴은 사용자와 상호작용하며 비선형 SVM 모델의 내부구조를 데이타의 각 속성별로 보여주는 방법으로 사용자가 예측결과를 직관적으로 이해하도록 도와준다. VRIFA는 Nomogram기반의 피쳐선택(feature selection) 기능도 포함하고 있는데, 이 기능은 예측결과에 부정적인 영향을 끼치거나 중복된 연관성을 보이는 속성을 제거함으로써 모델의 정확도를 높이는 데 기여한다. 그리고 데이터에 포함된 클래스의 비율이 한 쪽으로 치우쳐져 있는 경우에는 ROC 곡선 넓이(AUC)를 예측결과를 평가하기 위한 측도로 사용할 수 있다. 이 툴은 컴퓨터-기반의 질병 예측 혹은 질병의 위험 요소 분석에 대해 연구하는 연구자들에게 유용하게 사용될 것으로 전망하는 바이다.

해양환경 공간분포 패턴 분석을 위한 공간자기상관 적용 연구 - 광양만을 사례 지역으로 - (Application of Spatial Autocorrelation for the Spatial Distribution Pattern Analysis of Marine Environment - Case of Gwangyang Bay -)

  • 최현우;김계현;이철용
    • 한국지리정보학회지
    • /
    • 제10권4호
    • /
    • pp.60-74
    • /
    • 2007
  • 해양환경의 시공간적 분포 패턴을 정량적으로 분석하기 위해 남해 광양만 해양환경 관측 자료를 이용하여 글로벌 및 국지적 공간자기상관 통계를 적용하였다. 연구지역 전체의 해양환경 분포 패턴을 이해하기 위해 Moran's I, General G와 같은 글로벌 공간자기상관 지수를 사용하였으며, 대상 피쳐(feature)와 이웃 피쳐들과의 유사성 정도를 측정하고 hot spot 및 cold spot을 탐지하기 위해 국지적 Moran's I ($I_i$), $G_i{^*}$와 같은 LISA(local indicators of spatial association)를 사용하였고, 공간 군집 패턴의 신뢰성은 Z-score를 통한 통계적 유의성 검증을 수행하였다. 공간 통계 결과를 통해 년 중 해양환경 공간분포 패턴의 변화를 정량적으로 알 수 있었는데, 일반 해양수질, 영양염, 클로로필 및 식물플랑크톤은 여름철에 강한 군집 패턴을 보였다. 글로벌 지수에서 강한 군집 패턴을 보였을 때 속성 값의 공간적인 변화가 심한 음적 $I_i$ 값을 가지는 전선지역이 탐지되었다. 또한, 글로벌 지수에서 임의적 패턴을 보였을 때 국지적 지수인 $G_i{^*}$에서는 좁은 지역에서 hot spot과(또는) cold spot이 탐지되었다. 따라서 글로벌 지수는 연구 지역 전체 군집 패턴의 강도와 시계열적 변화 과정 탐지에, 국지적 지수를 통해서는 hot spot과 cold spot 위치 추적에 유용함을 알 수 있었다. 해양환경 공간분포 패턴과 군집 특성을 정량화는 것은 해양환경을 보다 깊이 이해할 수 있도록 할 뿐 아니라, 패턴의 원인을 찾는데도 중요한 역할을 할 것이다.

  • PDF

전자해도용 GML을 위한 응용 스키마 개발연구 (A Study on the Development of Application Schema for GML based ENC)

  • 오세웅;박종민;조득재;서기열;박상현;서상현
    • 한국항해항만학회지
    • /
    • 제30권8호
    • /
    • pp.623-629
    • /
    • 2006
  • 수로정보의 다양한 사용으로 해양지리정보의 상호운용성에 대한 필요성이 증가됨에 따라 개방형지리정보위원회(OGC)는 지리정보의 상호운용을 위한 표준인 GML을 수립하였다. GML은 지리정보의 모델링, 전송, 저장을 위해 XML 스키마 문법에 따라 작성된 XML 언어로서 피쳐, 참조체계, 지오메트리, 토폴로지, 시간, 측도 등의 지리체계를 설명하기 위한 객체를 포함하고 있다. 한편, S-57은 수로정보 전송을 위한 국제수로기구(IHO)의 표준으로 다양한 수로정보를 위한 표준임에도 불구하고 표준에서 채택하고 있는 구조의 한계로 인해 전자해도(ENC) 제작 목적으로 한정되어 사용되었다. 이를 개선하기 위해 IHO는 신규 표준을 준비하고 있으며 특히, GML은 모델링 및 엔코딩 도구로 사용될 것으로 전망되고 있다. 전자해도는 해상교통에 사용될 수 있는 가장 신뢰성 있는 정보로서 그 가치가 인정되나 전자해도 활용을 위한 GML 개발연구는 진행된 바 없다. 이에 본 연구에서는 전자해도 GML 변환을 위한 기초 연구로서 GML 작성을 위한 응용 스키마 개발기법 및 방안에 대해 연구하였다.