• 제목/요약/키워드: Classification accuracy

검색결과 3,065건 처리시간 0.033초

싸이킷런과 사이버위협 데이터셋을 이용한 사이버 공격 그룹의 분류 (Clasification of Cyber Attack Group using Scikit Learn and Cyber Treat Datasets)

  • 김경신;이호준;김성희;김병익;나원식;김동욱;이정환
    • 융합정보논문지
    • /
    • 제8권6호
    • /
    • pp.165-171
    • /
    • 2018
  • 최근 IT보안의 화두가 되고 있는 가장 위협적인 공격은 APT공격이다. APT공격에 대한 대응은 인공지능기법을 활용한 대응이외에는 방법이 없다는 것이 현재까지의 결론이다. 여기서는 머신러닝 기법을 활용한 사이버위협 데이터를 분석하는 방법, 그 중에서도 빅데이터 머신러닝 프레임웍인 Scikit Learn를 활용하여 사이버공격 사례를 수집한 데이터셋을 이용하여 사이버공격을 분석하는 머신러닝 알고리즘을 구현하였다. 이 결과 70%에 육박하는 공격 분류 정확도를 보였다. 이 결과는 향후 보안관제 시스템의 알고리즘으로 발전가능하다.

네트워크 데이터 정형화 기법을 통한 데이터 특성 기반 기계학습 모델 성능평가 (Performance Evaluation of a Machine Learning Model Based on Data Feature Using Network Data Normalization Technique)

  • 이우호;노봉남;정기문
    • 정보보호학회논문지
    • /
    • 제29권4호
    • /
    • pp.785-794
    • /
    • 2019
  • 최근 4차 산업 혁명 기술 중 하나인 딥러닝(Deep Learning) 기술은 보안 분야에서는 탐지하기 어려운 네트워크 데이터의 숨겨진 의미를 식별하고 공격을 예측하는 데 사용되고 있다. 침입탐지에 사용될 딥러닝 알고리즘을 선택하기 전에 데이터의 속성과 품질 분석이 필요하다. 학습에 사용되는 데이터의 오염여부에 따라 탐지 방법에 영향을 주기 때문이다. 따라서 데이터의 특징을 파악하고 특성을 선정해야 한다. 본 논문에서는 네트워크 데이터 셋을 이용하여 악성코드의 단계적 특징을 분석하고 특성을 추출하여 딥러닝 모델을 적용하였을 때 각 특성이 성능에 미치는 영향을 분석하였다. 네트워크 특징에 따른 특성들의 비교에 대한 트래픽 분류 실험을 진행하였으며 선정한 특성을 기반으로 96.52% 정확도를 분류하였다.

정적 분석 기반 기계학습 기법을 활용한 악성코드 식별 시스템 연구 (A Study on Malware Identification System Using Static Analysis Based Machine Learning Technique)

  • 김수정;하지희;오수현;이태진
    • 정보보호학회논문지
    • /
    • 제29권4호
    • /
    • pp.775-784
    • /
    • 2019
  • 신규 및 변종 악성코드의 발생으로 모바일, IoT, windows, mac 등 여러 환경에서 악성코드 침해 공격이 지속적으로 증가하고 있으며, 시그니처 기반 탐지의 대응만으로는 악성코드 탐지에 한계가 존재한다. 또한, 난독화, 패킹, Anti-VM 기법의 적용으로 분석 성능이 저하되고 있는 실정이다. 이에 유사성 해시 기반의 패턴 탐지 기술과 패킹에 따른 파일 분류 후의 정적 분석 적용으로 기계학습 기반 악성코드 식별이 가능한 시스템을 제안한다. 이는 기존에 알려진 악성코드의 식별에 강한 패턴 기반 탐지와 신규 및 변종 악성코드 탐지에 유리한 기계학습 기반 식별 기술을 모두 활용하여 보다 효율적인 탐지가 가능하다. 본 연구 결과물은 정보보호 R&D 데이터 챌린지 2018 대회의 AI기반 악성코드 탐지 트랙에서 제공하는 정상파일과 악성코드를 대상으로 95.79% 이상의 탐지정확도를 도출하여 분석 성능을 확인하였다. 향후 지속적인 연구를 통해 패킹된 파일의 특성에 맞는 feature vector와 탐지기법을 추가 적용하여 탐지 성능을 높이는 시스템 구축이 가능할 것으로 기대한다.

타브 숫자 인식을 위한 기계 학습 알고리즘의 성능 비교 (Performance Comparison of Machine Learning Algorithms for TAB Digit Recognition)

  • 허재혁;이현종;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권1호
    • /
    • pp.19-26
    • /
    • 2019
  • 본 논문에서는 기타 타브 악보에서 추출한 프렛 번호를 대상으로 학습 알고리즘의 분류 성능을 비교한다. 타브 악보로부터 세그먼트를 통해 추출된 타브 숫자 데이터는 타브 선과 악보 기호가 포함하기 때문에 레이블링 기법과 비선형 필터를 이용하여 프렛 숫자를 추출한다. 추가적인 데이터 확보를 위해 전처리가 수행된 데이터에 대해 4 방향으로 이동 연산을 수행한다. 선택된 학습 모델은 베이지안 분류기, 지지벡터기기, 프로토타입 기반 학습, 다층 신경망 그리고 합성곱 신경망 모델 등이다. 실험 결과 베이지안 분류기는 85.0% 평균 정확도를 보였고 나머지 분류기는 99.0% 이상의 평균 정확도를 보였다. 일반화 성능과 전처리 단계를 고려 시 합성곱 신경망이 다른 학습 모델들보다 우수하다.

음성 정보를 이용한 자폐아 치료용 로봇의 동작 설계 (Therapeutic Robot Action Design for ASD Children Using Speech Data)

  • 이진규;이보희
    • 전기전자학회논문지
    • /
    • 제22권4호
    • /
    • pp.1123-1130
    • /
    • 2018
  • 이전 연구에서 자폐성 장애의 여러 특징적 증상을 갖는 아이들의 치료를 위해 사용될 수 있는 로봇을 설계 및 제작하여 현장실험이 진행 되었으며 기존 로봇은 터치에 의한 아이들과 상호작용을 통해 감정 표현 동작을 한다. 이러한 터치 상호작용에 감정 교육 및 치료를 위해 인공신경망을 이용한 동작 설계를 하였다. 하지만 이러한 물리적 접촉은 치료 활동의 초기에 사용되기 어려워 초기 치료 효과를 기대하기 어려웠다. 이에 본 논문에서는 동작 방식을 보완하여 음성 정보를 이용한 빠른 상호작용을 통해 치료 활동이 초기에 가능하고 유연한 대처와 다양한 상황에서 로봇이 사용될 수 있는 동작 설계를 기술한다. 이에 필요한 요소로서 음성 데이터 수집 방법 및 인공신경망을 이용한 음성 인식 구조가 설계되었으며 실험을 통하여 분류 결과를 분석하였다. 이렇게 설계된 인공신경망은 향후 다양한 음성 데이터를 수집하여 정확도를 향상시키고 현장실험을 통하여 동작의 효용성을 살펴볼 것이다.

딥러닝과 영상처리기법을 이용한 콘크리트 지반 구조물 균열 탐지 (Crack Detection of Concrete Structure Using Deep Learning and Image Processing Method in Geotechnical Engineering)

  • 김아람;김동현;변요셉;이성원
    • 한국지반공학회논문집
    • /
    • 제34권12호
    • /
    • pp.145-154
    • /
    • 2018
  • 교량, 터널 옹벽 등의 콘크리트 구조물에서 수행되는 손상 조사 및 검사 방법은 일반적으로 검사원이 현장에서 직접 측량 도구를 사용하여 시각적으로 검사하는 방법이다. 이 방법은 검사원의 주관성에 크게 의존하기 때문에 기록의 객관성과 신뢰성이 떨어지게 된다. 따라서 균열을 자동으로 탐지하고 균열 특성을 객관적으로 분석할 수 있는 새로운 이미지분석기법이 필요하다. 본 연구에서는 콘크리트 이미지에서 균열을 검출하고 특성(균열의 길이, 폭)을 분석하기 위한 딥러닝 및 이미지분석기법을 개발하였다. 균열 검출과 해당 균열의 특성을 얻기 위해 두 가지 단계의 방법이 제안되었다. 제안된 방법의 성능을 검증하기 위하여 라벨이 있는 다양한 균열 이미지가 사용되었으며, 균열 판단과 구획화에 대해 90% 이상의 정확도를 확인하였다. 최종적으로 실제 촬영된 균열 영상의 균열 특성을 분석하고 실제 측정치와 오차를 확인하여 개발된 기법의 성능을 검증하였다.

A Practical Implementation of Deep Learning Method for Supporting the Classification of Breast Lesions in Ultrasound Images

  • Han, Seokmin;Lee, Suchul;Lee, Jun-Rak
    • International journal of advanced smart convergence
    • /
    • 제8권1호
    • /
    • pp.24-34
    • /
    • 2019
  • In this research, a practical deep learning framework to differentiate the lesions and nodules in breast acquired with ultrasound imaging has been proposed. 7408 ultrasound breast images of 5151 patient cases were collected. All cases were biopsy proven and lesions were semi-automatically segmented. To compensate for the shift caused in the segmentation, the boundaries of each lesion were drawn using Fully Convolutional Networks(FCN) segmentation method based on the radiologist's specified point. The data set consists of 4254 benign and 3154 malignant lesions. In 7408 ultrasound breast images, the number of training images is 6579, and the number of test images is 829. The margin between the boundary of each lesion and the boundary of the image itself varied for training image augmentation. The training images were augmented by varying the margin between the boundary of each lesion and the boundary of the image itself. The images were processed through histogram equalization, image cropping, and margin augmentation. The networks trained on the data with augmentation and the data without augmentation all had AUC over 0.95. The network exhibited about 90% accuracy, 0.86 sensitivity and 0.95 specificity. Although the proposed framework still requires to point to the location of the target ROI with the help of radiologists, the result of the suggested framework showed promising results. It supports human radiologist to give successful performance and helps to create a fluent diagnostic workflow that meets the fundamental purpose of CADx.

The Application of the Next-generation Medium Satellite C-band Radar Images in Environmental Field Works

  • Han, Hyeon-gyeong;Lee, Moungjin
    • 대한원격탐사학회지
    • /
    • 제35권4호
    • /
    • pp.617-623
    • /
    • 2019
  • Numerous water disasters have recently occurred all over the world, including South Korea, due to global climate change in recent years. As water-related disasters occur extensively and their sites are difficult for people to access, it is necessary to monitor them using satellites. The Ministry of Environment and K-water plan to launch the next-generation medium satellite No. 5 (water resource/water disaster satellite) equipped with C-band synthetic aperture radar (SAR) in 2025. C-band SAR has the advantage of being able to observe water resources twice a day at a high resolution both day and night, regardless of weather conditions. Currently, RADARSAT-2 and Sentinel-1 equipped with C-band SAR achieve the purpose of their launch and are used in various environmental fields such as forest structure detection and coastline change monitoring, as well as for unique purposes including the detection of flooding, drought and soil moisture change, utilizing the advantages of SAR. As such, this study aimed to analyze the characteristics of the next-generation medium satellite No. 5 and its application in environmental fields. Our findings showed that it can be used to improve the degree of precision of existing environmental spatial information such as the classification accuracy of land cover map in environmental field works. It also enables us to observe forests and water resources in North Korea that are difficult to access geographically. It is ultimately expected that this will enable the monitoring of the whole Korean Peninsula in various environmental fields, and help in relevant responses and policy supports.

SVM 기법을 이용한 쉴드 TBM 디스크 커터 교환 주기 예측 (Prediction of replacement period of shield TBM disc cutter using SVM)

  • 나유성;김명인;김범주
    • 한국터널지하공간학회 논문집
    • /
    • 제21권5호
    • /
    • pp.641-656
    • /
    • 2019
  • 본 연구에서는 쉴드 TBM (Tunnel Boring Machine) 터널 디스크 커터의 적절한 교체 시기를 예측하기 위한 방법으로 머신러닝 기법을 사용한 방법을 제안하였으며, 이를 위해 국내 기 시공된 쉴드 TBM 현장의 데이터를 이용하여 다양한 머신러닝 알고리즘 중 SVM (Support Vector Machine)을 이용하여 예측 모델을 구축하고 그 성능을 평가하였다. 지반 조건별 디스크 커터의 마모와 높은 상관성을 갖는 TBM 기계 데이터와 디스크 커터 교체 이력을 분류하고, 이들을 SVM의 변수로 사용하여 3종류의 분류 함수를 적용하여 각각 학습을 한 후 예측을 수행한 결과, 각 지반 조건에 대해서 3종류의 SVM 분류 함수 중 전체적으로 RBF (Radial Basis Function) SVM의 예측성능이 가장 우수하며(평균적으로 80%의 정확도, 10% 오분류율), 지반 조건별로 구분 시 디스크 커터 교체 데이터의 수가 많을수록 예측 결과가 좋은 것으로 나타났다. 향후 많은 데이터를 축적하고 이를 모두 활용하여 학습모델을 지속적으로 발전시켜 나간다면 이와 같은 디스크 커터 교환주기를 예측하기 위한 머신러닝 기법의 실무 적용성이 매우 클 것으로 기대한다.

기계학습 기반 유전자 발현 데이터를 이용한 치주질환 예측 (Prediction for Periodontal Disease using Gene Expression Profile Data based on Machine Learning)

  • 이제근
    • 한국정보통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.903-909
    • /
    • 2019
  • 치주질환은 상당수의 성인들이 가지고 있는 질환이지만 아직 분자적인 수준에서의 발생 기작과 치료 방법에 대해서는 많은 것이 밝혀져 있지 않다. 본 연구에서는 치주질환 조직과 정상 조직에서 얻어진 유전자 발현 데이터를 이용하여 치주질환 조직과 정상 조직 사이에 분자적 차이가 있는지를 확인한다. 특히 기계학습 알고리즘을 이용하여 유전자 발현양 기반 치주질환 조직과 정상 조직의 분류가 가능한지를 확인하고, 각 조직에서 발현양 차이가 나는 유전자들이 주로 어떤 기능을 하는 것인지 살펴본다. t-SNE를 이용한 분석 결과 정상 조직과 치주질환 조직 샘플이 명확히 구분되어 군집화 될 수 있음이 확인되었다. 또한, 결정 트리, 랜덤 포레스트, 서포트 벡터 머신을 이용한 분류 알고리즘을 적용한 결과 불균형 데이터임에도 높은 정확도와 민감도, 특이도를 보였으며, 염증 반응 및 면역 반응 관련 유전자들이 주로 두 집단 간에 차이를 보임이 확인되었다.