• 제목/요약/키워드: BMU(Best Matching Unit)

검색결과 3건 처리시간 0.016초

AE-SOM을 이용한 EVA 생산 공정 이상 검출 및 진단 (Fault Detection and Diagnosis for EVA Production Processes Using AE-SOM)

  • 박병언;지유미;심예슬;이규황;이호경
    • Korean Chemical Engineering Research
    • /
    • 제58권3호
    • /
    • pp.408-415
    • /
    • 2020
  • 본 연구에서는 auto-encoder와 self-organizing map을 결합한 auto-encoder with self-organizing map(AE-SOM) 기법을 이용하여 EVA 생산공정의 이상을 검출 및 진단하였고, Granger의 인과분석을 통해 이상 검출 데이터의 이상 전파 방향을 확인하였다. 분석 데이터는 1년 7개월 간의 조업데이터를 이용하였으며, autoclave 반응기의 조업 변수를 주로 분석하였다. 데이터 전처리 과정에서 데이터의 표준화를 먼저 진행하고, 조업의 각 grade의 sample 수를 동일하게 200개 임의로 추출하였다. 이후 AE-SOM을 적용하여 각 grade의 best matching unit (BMU)를 도출하였다. 각각의 BMU를 기준으로 조업 데이터가 얼마나 벗어났는지를 기준으로 데이터의 이상을 판별하였다. 공정 이상이 발견될 시 이상원인을 contribution plot을 이용하여 확인하였고 이상원인 변수의 인과성을 Granger의 인과분석을 통해 분석하였다. 그 결과 조업 시 발생한 2번의 셧다운의 전조를 모두 검출하였으며 이상이 발생한 원인변수에서 기인한 공정 이상의 전파 방향을 분석하였다.

SOM(Self-Organizing Map)을 이용한 대용량 웹 서비스 DoS 공격 탐지 기법 (Detection Mechanism of Attacking Web Service DoS using Self-Organizing Map)

  • 이형우;서종원
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.9-18
    • /
    • 2008
  • 웹 서비스는 개방형 서비스로 정보 공유가 주요 목적이다. 하지만 상대적으로 웹 서비스에 대한 공격 및 해킹 사고 또한 급증하고 있다. 현재 웹 해킹 등의 공격을 탐지하기 위해서는 웹 로그의 분석을 통해 우선적으로 수행 가능하며 중요한 역할을 수행하고 있다. 실제 웹 로그 분석을 통해 웹 서비스의 취약점을 분석하고 보완하는 사례가 늘어나고 있다. 이에 본 연구에서는 대용량의 웹 로그 정보에 대해 SOM 알고리즘을 적용하여 웹 DoS 공격 등과 같은 웹 서비스에서의 이상 탐지를 수행하였다. 구체적으로 대용량 웹 로그 정보에 대해 SOM 기반으로 BMU(Best Matching Unit)의 발생 빈도를 조사해 발생 빈도가 가장 높은 유닛을 이상(Abnormal) 유닛으로 판단하여 입력된 웹 로그 데이터에 대한 DoS 공격 탐지 성능을 향상시킬 수 있었다.

클래스 불균형 문제를 해결하기 위한 개선된 집중 샘플링 (Improved Focused Sampling for Class Imbalance Problem)

  • 김만선;양형정;김수형;챠위핑
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.287-294
    • /
    • 2007
  • 실세계의 문제에서 많은 기계학습의 알고리즘들은 데이터의 클래스 불균형 문제에 어려움을 겪는다. 이러한 클래스 불균형 문제를 해결하기 위하여 데이터의 비율을 변경하거나 좀 더 나은 샘플링 전략으로 극복하려는 연구들이 제안되었다. 그러나 데이터의 비율을 변경하는 연구에서는 전체 데이터 분포의 특성을 고려하지 못하고, 샘플링 전략을 제안하는 연구에서는 여러 가지 제한 조건을 고려해야만 한다. 본 논문에서는 위의 두가지 방법의 장점을 모두 포함하는 개선된 집중 샘플링 방법을 제안한다. 제안된 방법에서는 클래스 불균형 문제를 해결하기 위해 학습에 유용한 데이터들을 샘플링하는데 스코어링에 기반한 데이터 분할 방법을 이용한다. 즉, 입력 데이터들에 대해 SOM(Self Organizing Map)의 학습 결과로 얻은 BMU(Best Matching Unit)와의 거리를 계산하고, 이 거리론 스코어라 한다. 측정된 스코어는 오름차순으로 정렬되며, 이 과정에서 입력 데이터의 분포가 재 표현되고, 재 표현된 분포는 전체 데이터의 특성을 대표하게 된다. 그 결과로 얻은 데이터들 중에서 유용하지 못한 데이터들에 대해 제거하는 과정을 수행하여 새로운 학습 데이터 셋을 얻는다. 새로운 학습 데이터 생성 과정에서는 재 표현된 분포의 결과를 두 구간(upper, lower)으로 분할하는데, 두 추간 사이의 데이터들은 유용하지 못한 패턴들로 간주되어 학습에 이용되지 않는다. 본 논문에서 제안한 방법은 클래스 불균형의 비율 감수 훈련 데이터의 크기 감소, 과적합의 방지 등 몇 가지 장점을 보인다. 제안한 방법으로 샘플링된 데이터에 kNN 을 적용하여, 분류 실험한 결과 심한 불균형이 있는 ecoli 데이터의 분류 성능이 최대 2.27배 향상되었다.