• 제목/요약/키워드: Sequence Mining

검색결과 163건 처리시간 0.018초

베이지안 확률 및 폐쇄 순차패턴 마이닝 방식을 이용한 설명가능한 로그 이상탐지 시스템 (An Interpretable Log Anomaly System Using Bayesian Probability and Closed Sequence Pattern Mining)

  • 윤지영;신건윤;김동욱;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.77-87
    • /
    • 2021
  • 인터넷과 개인용 컴퓨터가 발달하면서 다양하고 복잡한 공격들이 등장하기 시작했다. 공격들이 복잡해짐에 따라 기존에 사용하던 시그니처 기반의 탐지 방식으로 탐지가 어려워졌으며 이를 해결하기 위해 행위기반의 탐지를 위한 로그 이상탐지에 대한 연구가 주목 받기 시작했다. 최근 로그 이상탐지에 대한 연구는 딥러닝을 활용해 순서를 학습하는 방식으로 이루어지고 있으며 좋은 성능을 보여준다. 하지만 좋은 성능에도 불구하고 판단에 대한 근거를 제공하지 못한다는 한계점을 지닌다. 판단에 대한 근거 및 설명을 제공하지 못할 경우, 데이터가 오염되거나 모델 자체에 결함이 발생해도 이를 발견하기 어렵다는 문제점을 지닌다. 결론적으로 사용자의 신뢰성을 잃게 된다. 이를 해결하기 위해 본 연구에서는 설명가능한 로그 이상탐지 시스템을 제안한다. 본 연구는 가장 먼저 로그 파싱을 진행해 로그 전처리를 수행한다. 이후 전처리된 로그들을 이용해 베이지안 확률 기반 순차 규칙추출을 진행한다. 결과적으로 "If 조건 then 결과, 사후확률(θ)" 형식의 규칙집합을 추출하며 이와 매칭될 경우 정상, 매칭되지 않을 경우, 이상행위로 판단하게 된다. 실험으로는 HDFS 로그 데이터셋을 활용했으며, 그 결과 F1score 92.7%의 성능을 나타내었다.

특허문서 필드의 기능적 특성을 활용한 IPC 다중 레이블 분류 (IPC Multi-label Classification based on Functional Characteristics of Fields in Patent Documents)

  • 임소라;권용진
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.77-88
    • /
    • 2017
  • 최근 지식과 정보가 가치를 생산하는 지식기반사회로 접어들면서 지식재산권의 대표적인 형태인 특허에 대한 중요성이 매우 높아지고 있으며 출원되는 특허의 양도 매년 증가하고 있다. 방대한 양의 특허정보를 효과적으로 이용하기 위해서 특허문서를 그 발명의 기술적 주제에 따라 적절하게 분류하는 것이 필요하며 이를 위해 IPC(International Patent Classification)가 주로 사용되고 있다. 현재 주로 사람의 손으로 이뤄지는 특허문서의 IPC 분류과정의 효율성을 높이기 위하여 다양한 데이터마이닝과 기계학습 알고리즘을 기반으로 IPC 자동분류에 관한 연구들이 수행되어 왔다. 하지만 기존의 IPC 자동분류에 관한 연구의 대부분은 특허문서의 구조적 특징과 같은 특허문서 고유의 데이터 특성에 대한 고려보다는 다양한 기계학습 알고리즘을 특허문서로 적용하는 것에 초점을 맞춰왔다. 이에 본 논문에서는 IPC 자동분류를 위해 특허문서의 특징과 구조적 필드의 역할을 기반으로 특허문서 분류에 영향을 끼치는 두 가지 필드, 기술분야 및 배경기술 필드의 활용을 제안한다. 그리고 특허문서가 동시에 다수의 IPC 분류코드를 가지는 점을 반영하여 다중 레이블 분류(multi-label classification) 모델을 구축한다. 또한 IPC 다중 레이블 분류의 실제 현장에서의 적용 가능성 확인을 위해 630개의 범주를 가지는 IPC 서브클래스 레벨까지 분류 가능한 수법을 제안한다. 이를 위해 국내에서 등록된 564,793건의 특허문서를 대상으로 특허문서의 구조적 필드의 영향을 확인하기 위한 IPC 다중 레이블 분류 실험을 수행하였고, 그 결과 제목, 요약, 청구항, 기술분야 및 배경기술 필드를 활용한 실험에서 87.2%의 싱글매치 정확도를 얻었다. 이를 통해 기술분야 및 배경기술 두 필드가 IPC 서브클래스 레벨까지의 다중 레이블 분류의 정확도를 향상시키는데 중요한 역할을 하고 있음을 확인하였다.

Structural and Compositional Characteristics of Skarn Zinc-Lead Deposits in the Yeonhwa-Ulchin Mining District, Southeastern Taebaegsan Region, Korea Part I: The Yeonhwa I Mine

  • Yun, Suckew
    • 자원환경지질
    • /
    • 제12권2호
    • /
    • pp.51-73
    • /
    • 1979
  • 본연구(本硏究)는 연화(蓮花)(제일(第一))광산(鑛山)의 연(鉛) 아연광상(亞鉛鑛床)에 대(對)하여 주(主)로 광상주변(鑛床周邊)의 지질구성(地質構成), 광화규제(鑛化規制)의 구조양식(構造樣式), 광상개체(鑛床個體)(광체(鑛體))의 형태(形態)와 규모(規模), 스카른광물(鑛物)의 대상분포(帶狀分布)와 공생(共生) 및 화학성분(化學成分) 그리고 광체내(鑛體內)에서의 금속품위(金屬品位)의 변화상(變化相)을 다루었다. 연화(蓮花)(제일(第一))광산(鑛山)은 일군(一群)의 광통형(鑛筒型) 괴상광체(塊狀鑛體)로 특징(特徵)지어졌으며 이들은 광체주변(鑛體周邊)에 스카른을 수반(隨伴)하면셔 두터운 풍촌석회암( 豊村石灰岩)과 그 상하(上下)에 놓이는 화절층(花折層) 및 묘봉층(描蜂層)을 관통(貫通)하여 부존(賦存)된다. 근(近)20개(個)의 서로 유이(類似)한 형태(形態)의 그러나 규모(規模)를 달리하는 광체(鑛體)들이 서북방향(西北方向)과 동북방향(東北方向)으로 V자형(字形)을 이루어 배열(配列)함으로서 그들이 공액펀 열하계(裂?系)의 규제(規制)를 받아 정착(定着)되었음을 보여주고 있다. 중요광체(重要鑛體)는 서부(西部)의 월암(月岩) 1, 2, 3 및 5 광체(鑛體)와 동부(東部)의 남산(南山) 1, 2, 3 및 5 광체(鑛體)이다. 월암(月岩) 1 광체(鑛體)의 -360 갱(坑)에서 -240 갱(坑) -120 갱(坑) 및 0 갱(坑)을 지나 지표노두(地表露頭)에 이르기까지의 약(約) 500m 사이에는 하부(下部)로부터 상부(上部)로 향(向)하여 스카른 광물조합(鑛物組合)과 금속품위(金屬品位)의 변화(變化)가 나타난다. 즉(卽) 스카른의 분대(分帶)는 하부(下部)의 휘석(輝石)-자류석대(?榴石帶), 중부(中部)의 휘석대(輝石帶) 및 상부(上部)의 능(菱)망간석맥(石脈)으로 특징(特徵)지어지는바 휘석(輝石)은 함(含)망간세일라이트로서 그의 Fe와 Mn 함량(含量)은 광체상부(鑛體上部)로부터 하부(下部)로 향(向)하여 증가(增加)되는데 대(對)해 자류석(?榴石)은 함석회철(含石灰鐵)번질(質)로서 그의 Fe 함량(含量)은 광체상부(鑛體上部)에서 하부(下部)로 향(向)하여여 오히려 감소(減少)됨으로서 휘석(輝石)과 자류석내(?榴石內)의 Fe 함량(含量)이 서로 역비례(逆比例)함을 가르킨다. 그러나 이들 변화(變化)의 폭(幅)은 크지 않다. 광석광물(鑛石鑛物)은 섬아연석(閃亞鉛石)을 주(主)로 하고 부적(副的)인 방연석(方鉛石)과 소량(少量)의 황동석(黃銅石)을 포함(包含)하며 유화맥석(硫化脈石)은 자류철석(磁硫鐵石)을 주(主)로 하고 후기(後期)의 황철석(黃鐵石) 및 자철석(白鐵石)을 소량수반(少量隨伴)한다. 광체내(鑛體內)에서의 금속품위(金屬品位)와 금속비(金屬比)의 변화상(變化相)에 두 가지의 유형(類型)이 나타나는데 하나는 Pb, Zn 및 Pb: Zu 비(比)가 광체상부(鑛體上部)로감에 따라 꾸준히 증가(增加)하다가 최상부(最上部)에서 감소(減少)되는 경우이고, 다른 하나는 불규칙(不規則)하게 굴곡변화(屈曲變化)하는 경우로서 전자(前者)는 광통형광체(鑛筒型鑛體)에서 그리고 후자(後者)는 맥상광체(脈狀鑛體)에서 나타나는 특징(特徵)이다. 광체내(鑛體內)에서의 Pb의 품위(品位)는 변동(變動)이 심(甚)한데 반(反)해 Zn의 품위(品位)는 비교적일정(比較的一定)하거나 변동(變動)이 완만(緩慢)하다.

  • PDF