• 제목/요약/키워드: data anomaly detection

검색결과 394건 처리시간 0.028초

SIP 프로토콜 상태정보 기반 공격 탐지 기능을 제공하는 가상 프록시 서버 설계 및 구현 (Stateful Virtual Proxy Server for Attack Detection based on SIP Protocol State Monitoring Mechanism)

  • 이형우
    • 인터넷정보학회논문지
    • /
    • 제9권6호
    • /
    • pp.37-48
    • /
    • 2008
  • VoIP 서비스는 IP망에서 SIP 프로토콜을 이용하여 음성 데이터를 전송하는 기술이다. SIP 프로토콜은 IP망을 이용하여 다양한 음성과 멀티미디어 서비스를 제공하고 저렴한 통신 비용에 대한 장점 때문에 빠르게 보급되고 있다. 하지만 SIP 프로토콜은 IP기반 위협에 그대로 노출된다는 한계를 가지기 때문에 이에 대한 대처방안이 제시되어야 한다. 기존의 여러 보안 메커니즘이 존재하지만 새로운 방식의 SIP 공격에 즉각 대응하지 못하고, 프로토콜 서비스 지연시간의 문제와 시스템의 과부화의 단점을 해결하지 못하고 있다. 이에 본 연구에서는 기존의 프록시 서버 앞단에 새로운 가상 프록시 서버를 두어 SIP 세션에 대한 상태정보를 분석하고 비정상적인 행위를 효율적으로 탐지하는 방법을 제시하였다. 본 연구에서 제시한 상태정보 기반 가상 프록시 서버(Stateful Virtual Proxy Server) 시스템의 성능평가 결과 최소한의 트래픽 전송지연만으로도 SIP 메시지 폭주(Message Flooding) 공격을 탐지할 수 있었다.

  • PDF

엔트로피 기반의 이상징후 탐지 시스템 (An Anomalous Event Detection System based on Information Theory)

  • 한찬규;최형기
    • 한국정보과학회논문지:정보통신
    • /
    • 제36권3호
    • /
    • pp.173-183
    • /
    • 2009
  • 본 논문에서는 엔트로피에 기반한 이상징후 탐지 시스템을 제안한다. 엔트로피는 시스템의 무질서정도를 측정하는 지표로써, 이상징후 출현 시 네트워크의 엔트로피는 급증한다. 네트워크를 IP와 포트번호를 기준으로 분류하여, 패킷별로 역학을 관찰하고 엔트로피를 각각 측정한다. 분산서비스거부공격이나 웜, 스캐닝 등의 네트워크 공격 출현 시 패킷 교환과정이 정상적일 때와는 다르므로 엔트로피를 통하여 기존기법 보다 높은 탐지율로 이상징후를 탐지할 수 있다. 본 논문에서는 다수의 원과 서비스거부공격을 포함한 데이터 셋을 수집하여 제안기법을 검증하였다. 또한 지수평활법, Holt-winters 등의 시계열예측 기법과 주성분분석을 이용한 이상징후 탐지 기법과 정확도 측면에서 비교한다. 본 논문에서 제안한 기법으로 웜, 서비스거부공격 등의 이상징후 탐지에 있어 오탐지율을 낮출 수 있다.

질감 분석과 CNN을 이용한 잡음에 강인한 돼지 호흡기 질병 식별 (Noise-Robust Porcine Respiratory Diseases Classification Using Texture Analysis and CNN)

  • 최용주;이종욱;박대희;정용화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.91-98
    • /
    • 2018
  • 집단으로 사육되는 돼지 농장에서 돼지 소모성 질환의 자동 탐지는 매우 중요한 문제이다. 특히, 밀집된 돈사에서 사육되는 돼지들의 호흡기 질환은 축산 농가의 막대한 경제적 손실을 야기하는 대표적 질병들 중 하나이다. 본 논문에서는 소리 신호 해석에 기반하여 돼지의 호흡기 질환을 조기 탐지 및 식별하는 잡음에도 강인한 시스템을 제안한다. 제안하는 시스템은, 먼저 1차원의 소리 신호를 2차원의 회색조 영상으로 변환한 후, DNS기법으로 질감 특징 정보를 갖는 이미지를 생성한다. 마지막으로, 이를 CNN에 입력함으로써 잡음에도 강인한 돼지 호흡기 질병 탐지 및 식별 시스템을 구현하고자 한다. 실제 국내 돈사에서 취득한 돼지의 발성음을 이용하여 제안하는 시스템의 성능을 실험적으로 검증한바, 제안된 시스템은 경제적인 비용(저가의 소리 센서)과 시스템 정확도(96.0% 정확도)로 다양한 잡음 환경에서도 돼지의 호흡기 질병들을 탐지할 수 있음을 실험적으로 확인하였다. 제안된 시스템은 독자적인 혹은 기존 방법들의 보완책으로 사용될 수 있다.

빅데이터와 AI를 활용한 교육용 자료의 분석에 대한 조사 (A Survey on Deep Learning-based Analysis for Education Data)

  • 노영욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.240-243
    • /
    • 2021
  • 최근에 빅 데이터와 AI 기술을 교육의 평가와 개별 학습에 적용하는 연구 성과가 있었다. 정보 기술의 혁신으로 소셜 미디어, MOOC, 지능형 개인지도 시스템, LMS, 센서 및 모바일 장치 등으로부터 학생들의 개인 기록, 생리학적 데이터, 학습 로그 및 활동, 학습 성과 및 결과를 포함하는 동적이고 복잡한 데이터를 수집 가능하였다. 또한 COVID-19 환경에서 e-러닝이 활성화 되어 많은 양의 학습 데이터가 생성되었다. 이 데이터로부터 학습 분석과 AI 기술을 적용하여 의미있는 패턴의 추출과 지식의 발견이 될 것으로 예상된다. 학습자 측면에서 학생의 학습 및 정서적 행동 패턴과 프로필을 식별하고, 평가 및 평가 방법을 개선하고, 개별 학생의 학습 성과 또는 중퇴를 예측하고, 개인화 된 지원을 위한 적응 시스템에 대한 연구는 필요하다. 본 연구에서는 교육용 데이터를 대상으로 이상탐지와 추천시스템에서 사용하는 기계학습 기술에 대한 조사와 분류를 하여 교육 분야의 연구에 기여하고자 한다.

  • PDF

경사면의 안정성 모니터링 데이터의 품질관리를 위한 2 단계 접근방안 (Two-Phase Approach for Data Quality Management for Slope Stability Monitoring)

  • 최준혁;김용진;조준휘;정우철;석송희;최송;김용성;지봉준
    • 한국지반신소재학회논문집
    • /
    • 제22권1호
    • /
    • pp.67-74
    • /
    • 2023
  • 경사면의 안정성을 모니터링 하기 위해 데이터 기반으로 사면의 붕괴를 예측, 경보를 하려는 연구가 증가하고 있다. 하지만 대부분의 논문에서는 데이터의 품질에 대해 간과하고 있다. 이는 오경보와 같은 문제를 발생시킬 수 있다. 이에 본 논문에서는 사면에서 수집된 데이터의 품질관리를 위한 규칙과 기계학습 모델로 구성된 2 단계의 접근 방안을 제안하였다. 규칙 기반은 높은 정확도와 직관적인 해석이 가능하다는 장점이 있으며 기계학습 모델은 명시적으로 표현할 수 없는 패턴을 도출할 수 있다는 장점이 있으며 2단계의 접근 방안은 이 두 장점을 모두 취할 수 있었다. 사례연구를 통해 두 방법을 단독으로 사용하였을 경우와 2단계의 접근 방안을 사용하였을 때의 성능을 비교하였고 2단계 접근 방안이 높은 성능을 보이는 것으로 판단되었다. 따라서 데이터의 품질관리를 위해 단독으로 두 방법을 사용하는 것보다 2단계 접근 방안 방법을 사용하는 것이 적절할것으로 판단된다.

시간 기반의 비정상 행위 침입탐지 모델 설계 (A Design of Time-based Anomaly Intrusion Detection Model)

  • 신미예;정윤수;이상호
    • 한국정보통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.1066-1072
    • /
    • 2011
  • 시스템 호출 순서에 대한 관계를 분석하는 방법은 정상적인 시스템 호출 순서를 일정한 크기로 시스템 호출 순서를 분할하여 진을 생성하여 탐지자로 사용한다. 시스템 호출의 매개변수를 고려하는 방법은 매개변수의 길이에 대한 평균과 표준편차를 이용하여 탐지자로 사용한다. 시스템 호출 순서만을 고려한 모델은 시스템 호출 순서는 정상이지만 포맷 스트링 공격과 같이 매개변수의 값만 변하는 공격을 탐지할 수 없으며, 시스템 호출 매개변수만을 고려한 모델은 매개변수 각각을 고려하므로 공격이 시작되지 않은 구간에서 획득한 정보에 의해 긍정적 결함률이 높게 나타나는 문제점이 있다. 이러한 문제점을 해결하기 위해 공격과 관련된 시스템 호출의 여러 속성들을 동시에 고려하는 접근 방법으로서 연속적인 시스템 호출 순서 및 매개변수를 그룹(Group)화하여 보다 효율적으로 학습 및 탐지하는 방법이 필요하다. 이 논문에서는 비정상적인 행위를 정상적인 행위로 판단하는 긍정적 결함률을 개선하기 위하여 시스템 호출 순서 및 매개변수에 시간 개념을 적용하여 시스템 호출 순서 및 매개변수의 비정상행위를 탐지한다. 실험 결과 제안 기법은 DARPA 데이터 셋을 사용한 실험에서 시스템 호출의 긍정적 결함률은 시간을 고려하지 않은 시스템 호출 순서 모델보다 시간을 고려한 시스템 호출 순서 모델의 긍정적 결함률이 13% 향상되었다.

대용량 로그 데이터 처리를 위한 분산 실시간 자가 진단 시스템 (A Distributed Real-time Self-Diagnosis System for Processing Large Amounts of Log Data)

  • 손시운;김다솔;문양세;최형진
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.58-68
    • /
    • 2018
  • 분산 컴퓨팅이란 다수의 서버로 구성된 분산 시스템에서 데이터를 효율적으로 저장 및 처리하는 기술이다. 따라서 분산 시스템을 구성하는 서버의 상태에 따라 분산 컴퓨팅의 성능에 큰 영향을 미친다. 본 논문은 분산 시스템에서 실시간으로 발생하는 시스템 자원의 로그 데이터를 수집하고 이상을 탐지하여 결과를 시각화하는 자가 진단 시스템을 제안한다. 먼저, 자가 진단 과정을 수집, 전달, 분석, 저장, 시각화의 다섯 단계로 구분한다. 다음으로, 자가 진단 과정이 실시간성, 확장성, 고가용성의 목표를 만족하도록 실시간 자가 진단 시스템을 설계한다. 본 시스템은 대표적인 실시간 분산 기술인 Apache Flume, Apache Kafka, Apache Storm을 기반으로 구현되어 실시간성, 확장성, 고가용성의 세 가지 목표를 만족할 수 있다. 또한, 자가 진단 과정에서 로그 데이터 처리의 지연을 최소화하도록 간단하지만 효과적인 이동 평균 및 3-시그마 기반 이상 탐지 기법을 사용한다. 본 논문의 결과를 통해, 분산 시스템 내에서 서버 상태를 실시간으로 진단할 수 있는 분산 실시간 자가 진단 시스템을 구축할 수 있다.

오토인코더 기반의 외부망 적대적 사이버 활동 징후 감지 (Detection of Signs of Hostile Cyber Activity against External Networks based on Autoencoder)

  • 박한솔;김국진;정재영;장지수;윤재필;신동규
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.39-48
    • /
    • 2022
  • 전 세계적으로 사이버 공격은 계속 증가해 왔으며 그 피해는 정부 시설을 넘어 민간인들에게 영향을 미치고 있다. 이러한 문제로 사이버 이상징후를 조기에 식별하여 탐지할 수 있는 시스템 개발의 중요성이 강조되었다. 위와 같이, 사이버 이상징후를 효과적으로 식별하기 위해 BGP(Border Gateway Protocol) 데이터를 머신러닝 모델을 통해 학습하고, 이를 이상징후로 식별하는 여러 연구가 진행되었다. 그러나 BGP 데이터는 이상 데이터가 정상 데이터보다 적은 불균형 데이터(Imbalanced data)이다. 이는, 모델에 학습이 편향된 결과를 가지게 되어 결과에 대한 신뢰성을 감소시킨다. 또한, 실제 사이버 상황에서 보안 담당자들이 머신러닝의 정형적인 결과로 사이버 상황을 인식시킬 수 없는 한계도 존재한다. 따라서 본 논문에서는 전 세계 네트워크 기록을 보관하는 BGP(Border Gateway Protocol)를 조사하고, SMOTE(Synthetic Minority Over-sampling Technique) 활용해 불균형 데이터 문제를 해결한다. 그 후, 사이버 공방(Cyber Range) 상황을 가정하여, 오토인코더를 통해 사이버 이상징후 분류하고 분류된 데이터를 가시화한다. 머신러닝 모델인 오토인코더는 정상 데이터의 패턴을 학습시켜 이상 데이터를 분류하는 성능을 92.4%의 정확도를 도출했고 보조 지표도 90%의 성능을 보여 결과에 대한 신뢰성을 확보한다. 또한, 혼잡한 사이버 공간을 가시화하여 효율적으로 상황을 인식할 수 있기에 사이버 공격에 효과적으로 방어할 수 있다고 전망된다.

학생들이 제시한 질문의 유형 분석을 통한 개방적 참탐구 활동의 인지적 추론 측면의 효과 (The Effects of Authentic Open Inquiry on Cognitive Reasoning through an Analysis of Types of Student-generated Questions)

  • 김미경;김희백
    • 한국과학교육학회지
    • /
    • 제27권9호
    • /
    • pp.930-943
    • /
    • 2007
  • 이 연구에서는 과학자들의 연구 수행에서 나타나는 인식론적 특성을 반영한 개방적 참탐구 활동을 수행하도록 하고,이 과정에서 학생들이 실제로 과학의 인지과정을 경험하면서 참탐구 인식론을 반영한 추론 특성을 보이는지를 알아보고자 하였다. 서울시 소재 과학고등학교 1학년 학생 86명을 연구 대상으로 하였으며,4주 동안 비교집단 2개 학급의 학생들은 전통적인 학교 탐구 활동을 수행하게 하고 실험집단 2개 학급의 학생들은 개방적 참탐구 활동을 수행하게 한 후 학생들이 제기한 질문을 비교하였다. 그 결과 두 집단의 학생들이 제기한 질문의 빈도는 크게 차이가 없었으나,질문의 유형에는 차이가 있었다. 실험집단에서 사고 질문의 빈도가 높게 나타났고,질문의 세부 유형에서도 비교집단 학생들의 질문과 유의미한 차이를 보였다(p <.01) 특히 사고를 확장시키는 질문과 변칙 데이터에 대한 질문의 빈도에서 큰 차이가 있었다. 또한 실험 집단에서 제기된 질문 가운데에는 과학적 방법,변칙 데이터,추론의 불확실성과 같은 참과학의 인식론을 반영하는 질문들이 발견되어 개방적 참탐구 수행에서 학생들이 과학적 인식론을 이해하게 될 가능성을 확인할 수 있었다. 그리고 탐구주제에 따른 질문 비교에서 개방도가 높아질수록 변칙탐지 질문과 전략질문의 빈도가 높아지는 경향이 있었고,귀납적 질문과 유추적 질문의 경우에는 개방도보다는 탐구 주제와 관련이 있는 것으로 나타났다.

심층신경망 모델을 이용한 대기오염망 자료확정 알고리즘 연구 (A Study on the Air Pollution Monitoring Network Algorithm Using Deep Learning)

  • 이선우;양호준;이문형;최정무;윤세환;권장우;박지훈;정동희;신혜정
    • 융합정보논문지
    • /
    • 제11권11호
    • /
    • pp.57-65
    • /
    • 2021
  • 본 논문은 딥 러닝(Deep Learning)을 이용하여 대기오염측정망 데이터 중 특정 증상이 나타나는 이상 데이터를 탐지하는 방법을 제시한다. 기존 방법들은 일반적으로 시계열 데이터 내에서 기존과는 다른 특이한 패턴이 나타나는 데이터를 탐지하여 이상치로 분류하며, 이는 특정 증상만을 탐지하기에는 적합하지 않다. 본 논문에서는 주로 이미지의 전경 분리(Sementic Segmentation)에 사용되는 DeepLab V3+ 모델의 2차원 합성곱 신경망 구조를 1차원 구조로 변형하여 이미지 대신 여러 센서의 시계열 측정값을 입력받고 특정 증상이 나타나는 데이터를 탐지하도록 하는 방법을 제시한다. 또한, 데이터에 '조각별 집계 근사법(Piecewise Aggregate Approximation)'을 적용하여 잡음이 많은 대기오염측정망 데이터의 복잡도를 줄임으로써 성능을 높인다. 실험 결과를 통해 준수한 성능으로 이상치 탐지를 수행할 수 있음을 확인할 수 있다.