• 제목/요약/키워드: Statistical feature

검색결과 667건 처리시간 0.026초

PageRank 특징을 활용한 RDP기반 내부전파경로 탐지 및 SHAP를 이용한 설명가능한 시스템 (RDP-based Lateral Movement Detection using PageRank and Interpretable System using SHAP)

  • 윤지영;김동욱;신건윤;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권4호
    • /
    • pp.1-11
    • /
    • 2021
  • 인터넷이 발달함에 따라 다양하고 복잡한 사이버공격들이 등장하기 시작했다. 공격들을 방어하기 위해 네트워크 외부에서 다양한 방식의 탐지 시스템들이 활용되었으나 내부에서 공격자를 탐지하는 시스템 및 연구는 현저히 드물어 내부에 들어온 공격자를 탐지하지 못해 큰 문제를 야기하기도 했다. 이를 해결하고자 공격자의 움직임을 추적하고 탐지하는 내부전파경로 탐지 시스템에 대한 연구가 등장하기 시작했다. 특히 그중에서도 Remote Desktop Protocol(RDP) 내 특징을 추출해 탐지하는 방식은 간편하면서도 매우 좋은 결과를 나타내었다. 하지만 그럼에도 불구하고 이전 연구들은 각 로그온 된 노드들 자체의 영향 및 관계성을 고려하지 않았으며, 제시된 특징 또한 일부 모델에서는 떨어지는 결과를 제공하기도 했다. 또한 왜 그렇게 판단했는지 판단에 대해 설명하지 못한다는 문제점도 존재했다. 이는 결과적으로 모델의 신뢰성 및 견고성 문제를 야기하게 된다. 이를 해결하기 위해 본 연구에서는 PageRank 특징을 활용한 RDP기반 내부전파경로 탐지 및 SHAP를 이용한 설명가능한 시스템을 제안한다. 페이지랭크 알고리즘과 여러 통계적인 기법을 활용해 여러 모델에서 활용 가능한 특징들을 생성하고 SHAP을 활용해 모델 예측에 대한 설명을 제공한다. 본 연구에서는 이전 연구에 비해 대부분의 모델에서 더 높은 성능을 보여주는 특징을 생성했고 이를 SHAP을 이용해 효과적으로 증명했다.

진동 데이터의 시간영역 특징 추출에 기반한 고장 분류 모델 (Fault Classification Model Based on Time Domain Feature Extraction of Vibration Data)

  • 김승일;노유정;강영진;박선화;안병하
    • 한국전산구조공학회논문집
    • /
    • 제34권1호
    • /
    • pp.25-33
    • /
    • 2021
  • 머신러닝 기법의 발달과 함께 기계에서 발생하는 다양한 종류(진동, 온도, 유량 등)의 데이터를 활용하여 기계의 상태를 진단하고 이상 탐지 및 비정상 분류 연구도 활발히 진행되고 있다. 특히 진동 데이터를 활용한 회전 기계의 상태 진단은 전통적인 기계 상태 모니터링 분야로 오랜 기간 동안 연구가 진행되었고, 연구 방법 또한 매우 다양하다. 본 연구에서는 가정용 에어컨에 사용되는 로터리 압축기에 가속도계를 직접 설치하여 진동 데이터를 수집하는 실험을 진행하였다. 데이터 부족 문제를 해결하기 위해 데이터 분할을 수행하였으며, 시간 영역에서의 진동 데이터로부터 통계적, 물리적 특징들을 추출한 후, Chi-square 검증을 통해 고장 분류 모델의 주요 특징을 추출하였다. SVM(Support Vector Machine) 모델은 압축기의 정상 혹은 이상 유무를 분류하기 위해 개발되었으며, 파라미터 최적화를 통해 분류 정확도를 개선하였다.

제 1상 임상시험에서 다양한 멈춤 규칙을 이용한 최대허용용량 추정법 (Maximum tolerated dose estimations using various stopping rules in phase I clinical trial)

  • 전소영;김동재
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.251-263
    • /
    • 2022
  • 제1상 임상시험은 '투약 용량 발견 시험(dose finding study)'라고도 불리는데 동물 실험 또는 시험관 실험을 통하여 개발된 신약 물질을 사람에게 시험하는 첫 단계이다. 제 1상 임상시험의 목적 중 하나는 환자에게 허용할 수 있으면서 최대의 효능을 가진 복용량인 최대허용용량(maximum tolerated dose, MTD)을 결정하는 것이다. 본 논문에서는 다양한 멈춤 규칙을 이용한 MTD 추정법들을 소개한다. 또한 모의실험을 통해 SM3, NM, Rim, J3, BSM 방법을 비교하고 효율적인 MTD 추정법에 대해 고찰한다. 모의실험 결과 BSM방법이 목표독성확률에 가장 가깝게 MTD를 추정하는 것으로 나타났다. 또한 J3방법의 피험자 수가 가장 적었다. 이러한 결과는 두 방법의 멈춤 규칙의 특성 때문이라고 판단되는데 BSM방법은 독성 반응이 있을 때 같은 용량에 피험자를 2명 또는 1명을 추가한다. 또한 J3방법은 동일한 용량에 할당되는 최대 피험자 수가 다른 방법에 비해 적다. 이러한 특성들을 결합하여 추정법을 개선한다면 더 효율적으로 MTD를 추정할 수 있을 것이다. 특히 BSM방법의 멈춤 규칙을 이용하면서 총 피험자 수를 줄일 수 있다면 적은 수의 피험자로 정확한 추정이 가능할 것이다.

다양한 데이터 전처리 기법 기반 침입탐지 시스템의 이상탐지 정확도 비교 연구 (Comparative Study of Anomaly Detection Accuracy of Intrusion Detection Systems Based on Various Data Preprocessing Techniques)

  • 박경선;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.449-456
    • /
    • 2021
  • 침입 탐지 시스템(IDS: Intrusion Detection System)은 보안을 침해하는 이상 행위를 탐지하는 기술로서 비정상적인 조작을 탐지하고 시스템 공격을 방지한다. 기존의 침입탐지 시스템은 트래픽 패턴을 통계 기반으로 분석하여 설계하였다. 그러나 급속도로 성장하는 기술에 의해 현대의 시스템은 다양한 트래픽을 생성하기 때문에 기존의 방법은 한계점이 명확해졌다. 이런 한계점을 극복하기 위해 다양한 기계학습 기법을 적용한 침입탐지 방법의 연구가 활발히 진행되고 있다. 본 논문에서는 다양한 네트워크 환경의 트래픽을 시뮬레이션 장비에서 생성한 NGIDS-DS(Next Generation IDS Dataset)를 이용하여 이상(Anomaly) 탐지 정확도를 높일 수 있는 데이터 전처리 기법에 관한 비교 연구를 진행하였다. 데이터 전처리로 패딩(Padding)과 슬라이딩 윈도우(Sliding Window)를 사용하였고, 정상 데이터 비율과 이상 데이터 비율의 불균형 문제를 해결하기 위해 AAE(Adversarial Auto-Encoder)를 적용한 오버샘플링 기법 등을 적용하였다. 또한, 전처리된 시퀀스 데이터의 특징벡터를 추출할 수 있는 Word2Vec 기법 중 Skip-gram을 이용하여 탐지 정확도의 성능 향상을 확인하였다. 비교실험을 위한 모델로는 PCA-SVM과 GRU를 사용하였고, 실험 결과는 슬라이딩 윈도우, Skip-gram, AAE, GRU를 적용하였을 때, 더 좋은 성능을 보였다.

TeGCN:씬파일러 신용평가를 위한 트랜스포머 임베딩 기반 그래프 신경망 구조 개발 (TeGCN:Transformer-embedded Graph Neural Network for Thin-filer default prediction)

  • 김성수;배준호;이주현;정희주;김희웅
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.419-437
    • /
    • 2023
  • 국내 씬파일러(Thin Filer)의 수가 1200만명을 넘어서며, 금융 업계에서 씬파일러의 신용을 정확히 평가하여 우량고객을 선별해 대출을 공급하는 시도가 많아지고 있다. 특히, 차주의 신용정보에 존재하는 비선형성을 반영하여 채무불이행을 예측하기 위해서 다양한 머신러닝 알고리즘을 활용한 연구가 진행되고 있다. 그 중 그래프 신경망 구조(Graph Neural Network)는 일반적인 신용정보 외에 대출자 간의 네트워크 정보를 반영할 수 있다는 점에서 데이터가 부족한 씬파일러의 채무 불이행 예측에서 주목할 만하다. 그러나, 그래프 신경망을 활용한 기존의 연구들은 신용정보에 존재하는 다양한 범주형 변수를 적절히 처리하지 못했다는 한계가 있었다. 이에 본 연구는 범주형 변수의 맥락적 정보를 추출할 수 있는 트랜스포머 메커니즘(Transformer mechanism)과 대출자 간 네트워크 정보를 반영할 수 있는 그래프 합성곱 신경망(Graph Convolutional Network)를 결합하여 효과적으로 씬파일러의 채무 불이행 예측이 가능한 TeGCN (Transformer embedded Graph Convolutional Network)를 제안한다. TeGCN는 일반 대출자 데이터셋과 씬파일러 데이터셋에 대하여 모두 베이스 라인 모델 대비 높은 성능을 보였으며, 특히 씬파일러 채무 불이행 예측에 우수한 성능을 달성했다. 본 연구는 범주형 변수가 많은 신용정보와 데이터가 부족한 씬파일러의 특성에 적합한 모델 구조를 결합하여 높은 채무 불이행 예측 성능을 달성했다는 시사점이 있다. 이는 씬파일러의 금융소외문제를 해결하고 금융업계에서 씬파일러를 대상으로 추가적인 수익을 창출하는데 기여할 수 있을 것이다.

Support Vector Machine과 상태공간모형을 이용한 단변량 수문 시계열의 동역학적 비선형 예측모형 (Dynamic Nonlinear Prediction Model of Univariate Hydrologic Time Series Using the Support Vector Machine and State-Space Model)

  • 권현한;문영일
    • 대한토목학회논문집
    • /
    • 제26권3B호
    • /
    • pp.279-289
    • /
    • 2006
  • 최근에 수문시계열로부터 저차원의 비선형 거동을 재구성하고자 하는 연구가 활발히 진행되고 있다. 이러한 관점에서 본 연구에서는 Support Vector Machine(SVM)을 이용하여 우수한 상태-공간 재구성 능력을 갖는 비선형 예측모형을 구성하여 Great Salt Lake(GSL) Volume에 적용하였다. SVM은 Kernel 함수로부터 유도된 고차원의 특성공간 안에서 선형함수의 가상공간을 이용하는 Machine Learning 방법론이다. 또한 SVM은 훈련자료로부터 얻어지는 평균제곱오차가 아닌 일반화된 오차를 최소화함으로써 상대적으로 기존 방법에 비해 적은 수의 매개변수와 과적합(over fitting)을 피하면서 비선형 함수의 최적화가 가능하다. 본 연구에서 제시한 SVM 회귀분석의 적용성은 미국의 GSL의 2주 간격 Volume을 대상으로 검토하였다. SVM을 이용한 비선형 예측모형은 GSL Volume의 2주(1-Step), 8주(4-Step)와 반복예측(Iterated Prediction, 121-Step)까지 적용되었다. 본 연구에서는 극치사상 즉, 급격한 감소 및 증가 구간을 예측하는데 있어서 훈련구간과 예측구간을 구분하여 모형의 신뢰성을 평가하였다. 예측결과SVM은 훈련자료로부터 적은 수의 관측치를 이용하여 동역학적 거동을 추출할 수 있었으며 실제 관측자료와 거의 유사한 예측이 가능함을 통계적 지표로 확인할 수 있었다. 따라서 비선형 수문시계열의 단기 예측을 위한 모형으로 적용이 가능할 것으로 판단된다.

시계열 신호 통계량 기반 캐비테이션 신호 탐지 (Cavitation signal detection based on time-series signal statistics)

  • 양해상;최하민;이석규;성우제
    • 한국음향학회지
    • /
    • 제43권4호
    • /
    • pp.400-405
    • /
    • 2024
  • 선박 프로펠러 캐비테이션 소음이 발생하면 수중 방사 소음의 수준이 급격히 상승하는데, 특히 함정의 경우에 피탐지 확률이 증가해 치명적인 위협 요인이 될 수 있다. 따라서 함정의 생존성 향상을 위하여 캐비테이션 신호를 정확하고 신속하게 판단하는 것이 매우 중요한데, 종래에는 센서로 계측한 음압/진동 준위가 기준값 이상이면 캐비테이션 발생으로 판단하는 기술과 데몬 기법을 통해 캐비테이션 발생 여부를 판별하는 방법이 주로 수행되었다. 그러나 이와 관련된 기술은 캐비테이션의 발생 현상에 대한 물리적 이해와 사용자의 주관적 기준을 기반으로 수행되며 여러 절차를 거치기 때문에 캐비테이션 신호를 조기에 자동으로 인식하는 기법의 개발이 필요하다. 본 논문에서는 선체에 부착된 음향 센서를 이용하여 계측된 음향 신호로부터 캐비테이션 신호의 특징을 반영한 간단한 통계량 기반 특징을 추출하고 이로부터 캐비테이션 발생 여부를 자동으로 판단하는 알고리즘을 제안한다. 제안된 기법의 성능은 센서 수와 모형 시험 조건에 따라 평가하는데, 단일 센서로 계측된 신호에 캐비테이션의 특징을 충분히 반영하여 훈련하면 캐비테이션 신호의 발생 여부를 판단 가능함을 확인했다.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

개인화 전시 서비스 구현을 위한 지능형 관객 감정 판단 모형 (The Intelligent Determination Model of Audience Emotion for Implementing Personalized Exhibition)

  • 정민규;김재경
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.39-57
    • /
    • 2012
  • 최근 기존 전시 공간 내에 유비쿼터스 환경이 구축되면서, 관객과의 상호작용을 통해 전시 효과를 배가할 수 있는 인터랙티브 전시에 많은 사람들의 관심이 집중되고 있다. 이러한 인터랙티브 전시가 보다 고도화되기 위해서는 전시물에 대한 다양한 관객 반응을 측정하고, 이를 통해 대상 관객이 어떤 감정을 느끼는지 예측할 수 있는 적절한 의사결정지원 모형이 요구된다. 이러한 배경에서 본 연구는 인터랙티브 전시 공간 내에서 수집 가능한 다양한 관객 반응 중 얼굴표정의 변화를 이용하여, 관객의 감정을 추론, 판단하는 지능형 모형을 제시한다. 본 연구에서 제시하는 모형은 무자극 상태의 관객의 표정과 자극이 주어졌을 때 관객의 표정이 어떻게 변화하는지 변화량을 측정하여, 이를 기반으로 인공신경망 기법을 이용해 해당 관객의 감정을 판단하는 모형이다. 이 때, 제안모형의 감정 분류체계로는 간결하면서도 실무에 적용이 용이하여 그간 기존 문헌에서 널리 활용되어 온 매력-각성(Valence-Arousal) 모형을 사용한다. 제안모형의 유용성을 검증하기 위해, 본 연구에서는 2011 서울 DMC 컬쳐 오픈 행사에 참여하여, 일반인을 대상으로 얼굴 표정 변화 데이터를 수집하고, 이들이 느끼는 감정 상태를 설문조사하였다. 그리고 나서, 이 자료들을 대상으로 본 연구에서 제안하는 모형을 적용해 보고, 제안모형이 비교모형으로 설정된 통계기반 예측모형에 비해 더 우수한 성과를 보이는지 확인해 보았다. 실험 결과, 본 연구에서 제시하는 모형이 비교 모형인 중회귀분석 모형보다 더 우수한 결과를 제공함을 확인할 수 있었다. 본 연구를 통하여 구축된 관객 감정 판단 모형을 실제 전시장에서 활용한다면 전시물을 관람하는 관객의 반응에 따라 시의적절하면서도 효과적인 대응이 가능하기 때문에, 관객의 몰입과 만족을 보다 증대시킬 수 있을 것으로 기대된다.

한방안이비인후피부과 입원환자의 특성 연구 -2012년 3월부터 2018년 2월까지 대전대학교 둔산한방병원을 중심으로- (A Study on the Characteristics of Inpatients in Korean Medicine Ophthalmology, Otolaryngology & Dermatology Clinic -From March, 2012 to February, 2018, Korean Medicine Hospital of Daejeon University-)

  • 황미리;정현아
    • 한방안이비인후피부과학회지
    • /
    • 제32권1호
    • /
    • pp.16-31
    • /
    • 2019
  • Objective : The purpose of this study is to analyze the charcateristics of inpatients in Ophthalmology, Otolaryngology & Dermatology Clinic by gender, age, season, and department of medical care after hospitalization from March, 2012 to February, 2018. Method : From March 1, 2012 to February 28, 2018, patients who were admitted to the Ophthalmology, Otolaryngology & Dermatology Clinic of Korean Medical Hospital were classified by gender, age, department, and season, and their relationship, hospitalization period, number of outpatient visits Differences were analyzed objectively using various statistical methods using IBM SPSS 18.0. Results : 1. The number of inpatients was 432, including duplication. Of these, 317 were female and 115 were male. The number of female patients was 2.8 times higher. 2. The average age of the inpatients was 43.9 years and the number of middle-aged 40-50 patients was 48.6%. 3. The number of inpatients in the departments was in the order of dermatology, otology, laryngology, rhinology, and ophthalmology. The most hospitalized diseases were eczema in the dermatology department, sudden hearing loss in the otology department, tonsillitis/peritonsillar abscess, rhinitis in the rhinology department, and dry eye syndrome in ophthalmology. 1) The effect of gender on the difference in the number of inpatients by subdivision was statistically significant. 2) The effect of age on the difference in the number of inpatients by subdivision was statistically significant. 3) The effect of seasons on the difference in the number of inpatients was not statistically significant. 4. The number of inpatients by season was in the order of winter, spring, summer, autumn, and the number of inpatients decreased significantly in autumn. 1) The effect of gender on the difference in the number of hospitalized patients by season was not statistically significant. 2) The effect of age on the difference in the number of hospitalized patients by season was not statistically significant. 5. The average length of hospital stay for inpatients was 10.7 days. 1) The effect of gender on length of hospital stay was not statistically significant. 2) The effect of age on hospital stay was not statistically significant. 3) The effect of the subdivision on hospital stay was statistically significant. 4) The effect of the season on hospital stay was not statistically significant. Conclusion : As a result of this study, the most distinctive feature of the present study was the high rate of inpatients with otic disease like idiopathic hearing loss and Meniere 's syndrome and the high rate of female patients. This may be related to the increased prevalence of the disease and the severity of the disease. In addition, the high rate of female patients suggests that women are more likely to be affected by illnesses, as well as to have more medical use and severe symptoms requiring hospitalization. In the future, it would be better to provide various treatment plans and policies for patients with otic diseases and female patients. Also it would be good if studies on these fields are made in the future.