• 제목/요약/키워드: 앙상블 방법

검색결과 296건 처리시간 0.025초

산업제어시스템의 이상 탐지 성능 개선을 위한 데이터 보정 방안 연구 (Research on Data Tuning Methods to Improve the Anomaly Detection Performance of Industrial Control Systems)

  • 전상수;이경호
    • 정보보호학회논문지
    • /
    • 제32권4호
    • /
    • pp.691-708
    • /
    • 2022
  • 머신러닝과 딥러닝의 기술이 보편화되면서 산업제어시스템의 이상(비정상) 탐지 연구에도 적용이 되기 시작하였다. 국내에서는 산업제어시스템의 이상 탐지를 위한 인공지능 연구를 활성화시키기 위하여 HAI 데이터셋을 개발하여 공개하였고, 산업제어시스템 보안위협 탐지 AI 경진대회를 시행하고 있다. 이상 탐지 연구들은 대개 기존의 딥러닝 학습 알고리즘을 변형하거나 다른 알고리즘과 함께 적용하는 앙상블 학습 모델의 방법을 통해 향상된 성능의 학습 모델을 만드는 연구가 대부분 이었다. 본 연구에서는 학습 모델과 데이터 전처리(pre-processing)의 개선을 통한 방법이 아니라, 비정상 데이터를 탐지하여 라벨링 한 결과를 보정하는 후처리(post-processing) 방법으로 이상 탐지의 성능을 개선시키는 연구를 진행하였고, 그 결과 기존 모델의 이상 탐지 성능 대비 약 10%이상의 향상된 결과를 확인하였다.

모바일 앱 악성코드 분석을 위한 학습모델 제안 (Proposal of a Learning Model for Mobile App Malicious Code Analysis)

  • 배세진;최영렬;이정수;백남균
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.455-457
    • /
    • 2021
  • 앱(App) 또는 어플리케이션이라고 부르는 응용 프로그램은 스마트폰이나 스마트TV와 같은 스마트 기기에서 사용되고 있다. 당연하게도 앱에도 악성코드가 있는데, 악성코드의 유무에 따라 정상앱과 악성앱으로 나눌 수 있다. 악성코드는 많고 종류가 다양하기 때문에 사람이 직접 탐지하기 어렵다는 단점이 있어 AI를 활용하여 악성앱을 탐지하는 방안을 제안한다. 기존 방법에서는 악성앱에서 Feature를 추출하여 악성앱을 탐지하는 방법이 대부분이었다. 하지만 종류와 수가 기하급수적으로 늘어 일일이 탐지할 수도 없는 상황이다. 따라서 기존 대부분의 악성앱에서 Feature을 추출하여 악성앱을 탐지하는 방안 외에 두 가지를 더 제안하려 한다. 첫 번째 방안은 기존 악성앱 학습을 하여 악성앱을 탐지하는 방법과 는 반대로 정상앱을 공부하여 Feature를 추출하여 학습한 후 정상에서 거리가 먼, 다시 말해 비정상(악성앱)을 찾는 것이다. 두 번째 제안하는 방안은 기존 방안과 첫 번째로 제안한 방안을 결합한 '앙상블 기법'이다. 이 두 기법은 향후 앱 환경에서 활용될 수 있도록 연구를 진행할 필요가 있다.

  • PDF

차량 번호판 인식을 위한 앙상블 학습기 기반의 최적 특징 선택 방법 (An Ensemble Classifier Based Method to Select Optimal Image Features for License Plate Recognition)

  • 조재호;강동중
    • 전기학회논문지
    • /
    • 제65권1호
    • /
    • pp.142-149
    • /
    • 2016
  • This paper proposes a method to detect LP(License Plate) of vehicles in indoor and outdoor parking lots. In restricted environment, there are many conventional methods for detecting LP. But, it is difficult to detect LP in natural and complex scenes with background clutters because several patterns similar with text or LP always exist in complicated backgrounds. To verify the performance of LP text detection in natural images, we apply MB-LGP feature by combining with ensemble machine learning algorithm in purpose of selecting optimal features of small number in huge pool. The feature selection is performed by adaptive boosting algorithm that shows great performance in minimum false positive detection ratio and in computing time when combined with cascade approach. MSER is used to provide initial text regions of vehicle LP. Throughout the experiment using real images, the proposed method functions robustly extracting LP in natural scene as well as the controlled environment.

하프파워법과 인력가진법에 의한 감쇠율 비교 (Comparison of Damping Ratios by Half Power Bandwidth Method and Synchronized Human Excitation)

  • 윤성원
    • 한국공간구조학회논문집
    • /
    • 제8권2호
    • /
    • pp.95-103
    • /
    • 2008
  • 주파수영역과 시간영역의 두가지 방법을 통하여 감쇠율을 분석하였다. 11층${\sim}$19층 범위의 철근콘크리트 건물에 대하여 주파수 영역에서의 해석을 위한 상시진동과 시간영역에서의 해석을 위한 인력가진을 실시하였다. 하프파워법의 적용성을 검토하기 위하여 1024, 2048, 4096 세가지 앙상블 샘플사이즈에 대하여 분석하였다. 인력가진법에 의한 장변과 단변의 감쇠율은 각각 1.05%${\sim}$1.22%과 1.16%${\sim}$1.50%이다. 하프파워법은 감쇠율을 약간 과대평가할 수 있지만, 계측데이터의 길이를 가능한 길게 하여 bandwidth를 작게 하면 감쇠율 평가의 정밀도를 향상할 수 있었다.

  • PDF

소규모 지역에서의 데이터 통신을 위한 하이브리드 방송시스템에 관한 연구 (A Study on the Hybrid Broadcasting System Using Data Communication in Local Area)

  • 김현식;박용석;이연성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.192-194
    • /
    • 2012
  • 본 논문은 소규모 지역에서의 데이터 통신을 이용한 하이브리드 방송 송출 시스템 및 수신 시스템에 관한 것으로 보다 상세하게는 전시회나 박물관 등 지역적 범위가 제한되는 환경에서 와이파이 등의 근거리 인터넷망을 이용하여 해당 범위 내의 사용자만 신규 서비스를 볼 수 있도록 하는 시스템 및 방법에 관한 연구로, 제안된 하아브리드 방송 서비스 송출 시스템은 방송 데이터 수신부, DMB 전송 프레임 멀티플렉서, DMB 전송 프레임 송출부, 부가 정보 송출부로 구성되며, 방송 데이터 수신부는 신규 서비스에 대한 방송 데이터 및 부가 정보를 수신한다. 또한, 송출 시스템의 DMB 전송 프레임 멀티플렉서는 방송 데이터를 이용하여 신규 서비스 앙상블(Ensemble)을 구성하는 DMB 전송프레임을 생성하며, DMB 전송 프레임 송출부는 생성된 DMB 전송 프레임을 송출하고, 부가 정보 송출부는 수신된 신규 서비스의 부가 정보를 인터넷망을 통해 송출한다. 따라서, 제안된 하이브리드 방송 시스템의 경우, 전시회나 박물관 등 지역적 범위가 제한되는 환경에서 와이파이 등의 근거리 인터넷망을 이용하여 해당 범위 내의 사용자만 신규서비스를 볼 수 있으며, 관람객이 아닌 일반 사용자들 본인의 단말기가 채널스캔을 실행했을 경우, 원하지 않는 행사관련 방송 데이터가 수신 채널 목록에 저장되지 않도록 할 수 있다.

  • PDF

앙상블 모델 기반의 기계 고장 예측 방법 (An Ensemble Model for Machine Failure Prediction)

  • 천강민;양재경
    • 산업경영시스템학회지
    • /
    • 제43권1호
    • /
    • pp.123-131
    • /
    • 2020
  • There have been a lot of studies in the past for the method of predicting the failure of a machine, and recently, a lot of researches and applications have been generated to diagnose the physical condition of the machine and the parts and to calculate the remaining life through various methods. Survival models are also used to predict plant failures based on past anomaly cycles. In particular, special machine that reflect the fluid flow and process characteristics of chemical plants are connected to hundreds or thousands of sensors, so there are not many factors that need to be considered, such as process and material data as well as application of derivative variables. In this paper, the data were preprocessed through time series anomaly detection based on unsupervised learning to predict the abnormalities of these special machine. Next, clustering results reflecting clustering-based data characteristics were applied to produce additional variables, and a learning data set was created based on the history of past facility abnormalities. Finally, the prediction methodology based on the supervised learning algorithm was applied, and the model update was confirmed to improve the accuracy of the prediction of facility failure. Through this, it is expected to improve the efficiency of facility operation by flexibly replacing the maintenance time and parts supply and demand by predicting abnormalities of machine and extracting key factors.

패턴 분류 문제에 확장된 데이터 표현 기법을 적용한 응용 사례 (Application Examples Applying Extended Data Expression Technique to Classification Problems)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.9-15
    • /
    • 2018
  • 확장된 데이터 표현의 주요 목표는 유비쿼터스 환경에서 일반적인 문제에 적합한 데이터 구조를 개발하는 것이다. 이 방법의 가장 큰 특징은 속성 값을 확률로 표현할 수 있다는 것이다. 다음 특성은 훈련 데이터의 각 이벤트가 중요도를 나타내는 가중치 값을 갖도록 한다는 것이다. 데이터 구조가 개발된 후에 이를 학습할 수 있는 알고리즘이 고안된다. 그 동안 이 알고리즘은 여러 분야에서 여러 문제에 적용하여 좋은 결과를 산출해 왔다. 본 논문은 먼저 데이터 표현 기법인 UChoo를 소개하고 이론적인 배경이 되는 규칙 개선 문제를 소개한다. 그리고 규칙 개선, 손실 데이터 처리, BEWS 문제, 앙상블 시스템과 같은 응용 분야의 예를 소개한다.

XAI 기법을 이용한 전자상거래의 고객 구매 행동 이해 (Understanding Customer Purchasing Behavior in E-Commerce using Explainable Artificial Intelligence Techniques)

  • 이재준;정이태;임도현;곽기영;안현철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.387-390
    • /
    • 2021
  • 최근 전자 상거래 시장이 급격한 성장을 이루면서 고객들의 급변하는 니즈를 파악하는 것이 기업들의 수익에 직결되는 요소로 인식되고 있다. 이에 기업들은 고객들의 니즈를 신속하고 정확하게 파악하기 위해, 기축적된 고객 관련 각종 데이터를 활용하려는 시도를 강화하고 있다. 기존 시도들은 주로 구매 행동 예측에 중점을 두었으나 고객 행동의 전후 과정을 해석하는데 있어 어려움이 존재했다. 본 연구에서는 고객이 구매한 상품을 확정 또는 환불하는 행동을 취할 때 해당 행동이 발생하는데 있어 어떤 요소들이 작용하였는지를 파악하고, 어떤 고객이 환불할 지를 예측하는 예측 모형을 새롭게 제시한다. 예측 모형 구현에는 트리 기반 앙상블 방법을 사용해 예측력을 높인 XGBoost 기법을 적용하였으며, 고객 의도에 영향을 미치는 요소들을 파악하기 위하여 대표적인 설명가능한 인공지능(XAI) 기법 중 하나인 SHAP 기법을 적용하였다. 이를 통해 특정 고객 행동에 대한 각 요인들의 전반적인 영향 뿐만 아니라, 각 개별 고객에 대해서도 어떤 요소가 환불결정에 영향을 미쳤는지 파악할 수 있었다. 이를 통해 기업은 고객 개개인의 의사 결정에 영향을 미치는 요소를 파악하여 개인화 마케팅에 사용할 수 있을 것으로 기대된다.

  • PDF

암세포 영상분류를 위한 심층학습 모델 연구 (Deep Learning Model for Classification of Multiple Cancer Cell Lines)

  • 박진형;최세운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.394-396
    • /
    • 2021
  • 특정 질병 진단을 위한 병리 검사는 필수적이며, 최근 이러한 분야의 시간적, 인적 자원의 필요성을 줄이기 위해 인공 지능을 활용한 암세포의 자동분류가 가능한 시스템 구축에 관련된 연구가 활발하게 진행되고 있다. 하지만, 이전 연구에서는 제한적인 심층학습 알고리즘에 기인한 비교적 낮은 정확도로 데이터 처리에 한계가 존재하였다. 본 연구에서는 심층 학습의 일종인 Convolution Neral Network를 통해 4종류의 암세포를 4 Class Classifciation을 시행하는 방법을 제안한다. EfficientNet, ResNet, Inception을 사용하였으며 여러 하이퍼 파라미터 튜닝을 통해 얻은 모델을 앙상블 하여 최종적으로 97.26의 정확도를 얻을 수 있었다.

  • PDF

비정상성 빈도해석을 위한 기상인자 선정 및 확률강우량 산정 (Selection of Climate Indices for Nonstationary Frequency Analysis and Estimation of Rainfall Quantile)

  • 정태호;김한빈;김현식;허준행
    • 대한토목학회논문집
    • /
    • 제39권1호
    • /
    • pp.165-174
    • /
    • 2019
  • 수문관측자료에서 비정상성(nonstationarity)이 관측됨에 따라 수공구조물 설계에서 비정상성 빈도해석에 대한 연구가 활발히 진행되고 있다. 대기-해양 시스템에 내재된 기후 변동성은 비정상성 현상과 관련이 있는 것으로 알려져 있지만, 비정상성 빈도해석은 일반적으로 선형적 추세를 기반으로 이루어지고 있다. 본 연구에서는 우리나라의 기후 변동성과 극치 강우 사상의 장기 경향성을 고려하기 위하여 기상인자를 활용한 비정상성 빈도해석을 수행하였다. 먼저, 경향성이 나타나는 11개 기상관측지점의 연 최대치 강우자료에 대하여 통계적 분해 방법인 앙상블 경험적 모드분해법을 활용해 자료에 내재된 장기 경향성을 추출하였으며, 계절에 따른 다양한 기상인자와의 상관성 분석을 수행하였다. 그 결과, 연 최대 강우 발생년도를 기준으로 전년도 가을철 AMM과 전년도 가을철 AMO, 그리고 전년도 여름철 NINO4가 10개 이상의 지점에서 연 최대치 강우자료의 장기 경향성에 유의한 영향을 미치는 것으로 나타났다. 선정된 기상인자를 일반 극치(generalized extreme value, GEV) 분포모형에 적용하여 비정상성 GEV (NS-GEV) 모형을 구축하고 기존의 선형적 추세를 고려한 NS-GEV 모형과의 AIC값을 비교하여 최적모형을 선정하였다. 선정된 모형과 기존의 선형적 추세를 고려한 NS-GEV 모형에 대한 성능 평가를 통해 기상인자를 활용한 NS-GEV 모형이 극치강우사상을 반영하여 확률강우량의 과소산정 문제를 보완할 수 있음을 확인하였다.