• 제목/요약/키워드: information classification

검색결과 8,303건 처리시간 0.191초

하이브리드 특징 및 기계학습을 활용한 효율적인 악성코드 분류 시스템 개발 연구 (Development Research of An Efficient Malware Classification System Using Hybrid Features And Machine Learning)

  • 유정빈;오상진;박래현;권태경
    • 정보보호학회논문지
    • /
    • 제28권5호
    • /
    • pp.1161-1167
    • /
    • 2018
  • 기하급수적으로 증가하고 있는 변종 악성코드에 대응하기 위해 악성코드 분류 연구가 다양화되고 있다. 최근 연구에서는 기존 악성코드 분석 기술 (정적/동적)의 개별 사용 한계를 파악하고, 각 방식을 혼합한 하이브리드 분석으로 전환하는 추세이다. 나아가, 분류가 어려운 변종 악성코드를 더욱 정확하게 식별하기 위해 기계학습을 적용하기에 이르렀다. 하지만, 각 방식을 모두 활용했을 때 발생하는 정확성, 확장성 트레이드오프 문제는 여전히 해결되지 못했으며, 학계에서 중요한 연구 주제이다. 이에 따라, 본 연구에서는 기존 악성코드 분류 연구들의 문제점을 보완하기 위해 새로운 악성코드 분류 시스템을 연구 및 개발한다.

Feature Selection Algorithm for Intrusions Detection System using Sequential Forward Search and Random Forest Classifier

  • Lee, Jinlee;Park, Dooho;Lee, Changhoon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.5132-5148
    • /
    • 2017
  • Cyber attacks are evolving commensurate with recent developments in information security technology. Intrusion detection systems collect various types of data from computers and networks to detect security threats and analyze the attack information. The large amount of data examined make the large number of computations and low detection rates problematic. Feature selection is expected to improve the classification performance and provide faster and more cost-effective results. Despite the various feature selection studies conducted for intrusion detection systems, it is difficult to automate feature selection because it is based on the knowledge of security experts. This paper proposes a feature selection technique to overcome the performance problems of intrusion detection systems. Focusing on feature selection, the first phase of the proposed system aims at constructing a feature subset using a sequential forward floating search (SFFS) to downsize the dimension of the variables. The second phase constructs a classification model with the selected feature subset using a random forest classifier (RFC) and evaluates the classification accuracy. Experiments were conducted with the NSL-KDD dataset using SFFS-RF, and the results indicated that feature selection techniques are a necessary preprocessing step to improve the overall system performance in systems that handle large datasets. They also verified that SFFS-RF could be used for data classification. In conclusion, SFFS-RF could be the key to improving the classification model performance in machine learning.

고품질 슬라이드 선별을 위한 지식구조 기반 분류 기법 (Proposing and Validating a Classification Method based on Knowledge Structure to Identify High-Quality Presentation Slides)

  • 정원철;김성찬;이문용
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권12호
    • /
    • pp.676-681
    • /
    • 2014
  • 본 연구는 내용적으로 고품질인 슬라이드를 구분하고 분류하기 위해, 슬라이드의 지식정보를 내포하는 지식구조를 이용하는 분류 방법을 제안한다. 지식구조가 슬라이드의 내용적 품질정보를 내포하는지에 대해서 분석한 후, 그 결과로부터 지식구조를 이용한 분류 방법을 개발하였고, 슬라이드의 품질별로 분류한 결과를 비교하였다. 비교를 통해 고품질군에 속하는 슬라이드일수록 높은 품질의 슬라이드 위주로 분류할 수 있다는 점을 검증하였다. 이는 품질이 높은 슬라이드 위주로 검색하거나 추천하고자 할 때, 지식구조라는 인지적 모형을 활용하여 그 효과를 높일 수 있음을 보여준다.

Algorithm for Fault Detection and Classification Using Wavelet Singular Value Decomposition for Wide-Area Protection

  • Lee, Jae-Won;Kim, Won-Ki;Oh, Yun-Sik;Seo, Hun-Chul;Jang, Won-Hyeok;Kim, Yoon Sang;Park, Chul-Won;Kim, Chul-Hwan
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권3호
    • /
    • pp.729-739
    • /
    • 2015
  • An algorithm for fault detection and classification method for wide-area protection in Korean transmission systems is proposed. The modeling of 345-kV and 765-kV Korean power system transmission networks using the Electro Magnetic Transient Program - Restructured Version (EMTP-RV) is presented and the algorithm for fault detection and classification in transmission lines is developed. The proposed algorithm uses the Wavelet Transform (WT) and Singular Value Decomposition (SVD). The Singular value of Approximation coefficient (SA) and part Sum of Detail coefficient (SD) are introduced. The characteristics of the SA and SD at the fault conditions are analyzed and used in the algorithm for fault detection and classification. The validation of the proposed algorithm is verified by various simulation results.

최적 클러스터 분석 모델을 이용한 분류시스템의 데이터베이스 구축 (The database construction of a classification system using an optimal cluster analysis model)

  • 이현숙
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.1045-1050
    • /
    • 1998
  • 데이타의 분류기법은 공장자동화나 로보틱스 분야에서 사용되는 지능시스템의 중요한 기능이다. 일반적으로 이러한 분류시스템을 설계하고자 할때, 준비된 데이타는 레이블링 되어야 하고, 분류하고자하는 클래스의 수도 설정되어야한다. 본 연구에서는 이러한 사전 정보없이 분류 시스템을 설계하고자 최적 클러스터 분석 모델, OFCAM을 제안한다. 이때 사용되는 최적 클러스터 분석 모델은 데이타의 구조에 대한 사전정보 없이, 주어진 데이타의 최적 클러스터의 수와 클러스터 중심점 및 각 데이타에 대한 소속정보를 구해준다. 이를 위하여 OFCAM에서는 목적합수를 가지는 비교사 학습신경망과 클러스터 타당성 전략을 결합하고 있다. OFCAM의 결과를 바탕으로 분류시스템의 데이터베이스, PCSDB가 구축되며 이는 결정 모듈에서 쉽게 활용될 수 있음을 보인다. 이와같은 방법은 하나의 데이타베이스 안에서 필요한 테이블만을 첨가하므로 독립적으로 여러 응용의 분류문제를 다룰 수 있다.

  • PDF

Information Extraction and Sentence Classification applied to Clinical Trial MEDLINE Abstracts

  • Hara, Kazuo;Matsumoto, Yuji
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.85-90
    • /
    • 2005
  • In this paper, firstly we report experimental results on applying information extraction (IE) methodology to the task of summarizing clinical trial design information in focus on ‘Compared Treatment’, ‘Endpoint’ and ‘Patient Population’ from clinical trial MEDLINE abstracts. From these results, we have come to see this problem as one that can be decomposed into a sentence classification subtask and an IE subtask. By classifying sentences from clinical trial abstracts and only performing IE on sentences that are most likely to contain relevant information, we hypothesize that the accuracy of information extracted from the abstracts can be increased. As preparation for testing this theory in the next stage, we conducted an experiment applying state-of-the-art sentence classification techniques to the clinical trial abstracts and evaluated its potential in the original task of the summarization of clinical trial design information.

  • PDF

BIM 템플릿 개발을 위한 템플릿 구성요소 분석에 관한 연구 (A Study on Analysis of the Template Component for the Development of BIM Template)

  • 이상헌;김미경;최현아;전한종
    • KIEAE Journal
    • /
    • 제11권2호
    • /
    • pp.123-130
    • /
    • 2011
  • BIM based design methodology requires more information than traditional design methodology in order to insure efficiency throughout the project. BIM based design not only requires all building data in the form of 3D shapes, but also all other relevant data regarding building components. Information is typically grouped in a standard classification system such as by standardized material names. The development of a domestic BIM based standard classification system is yet to be created and deployed in the industry. Each designer is specifying their own building information classification systems which is causing inconsistency in the industry. Therefore BIM based designs, are causing confusion in the industry as each designer follow no guidelines for material standardization classification. The lack of information regarding this in the BIM template will continue to cause confusion about a projects building information data consistently. This study is that of preliminary research to develop a BIM template. First, overseas BIM templates were analyzed regarding BIM standards and documentation. Examination then followed regarding the element and characteristics needed for the development of a BIM template, a suggested hierarchy of elements required for a BIM template were then made. The result of this research is that it will be used to develop a "BIM template prototype", to support the generation of building information data regarding neighborhood facilities.

Two-Dimensional Qualitative Asset Analysis Method based on Business Process-Oriented Asset Evaluation

  • Eom, Jung-Ho;Park, Seon-Ho;Kim, Tae-Kyung;Chung, Tai-Myoung
    • Journal of Information Processing Systems
    • /
    • 제1권1호
    • /
    • pp.79-85
    • /
    • 2005
  • In this paper, we dealt with substantial asset analysis methodology applied to two-dimensional asset classification and qualitative evaluation method according to the business process. Most of the existent risk analysis methodology and tools presented classification by asset type and physical evaluation by a quantitative method. We focused our research on qualitative evaluation with 2-dimensional asset classification. It converts from quantitative asset value with purchase cost, recovery and exchange cost, etc. to qualitative evaluation considering specific factors related to the business process. In the first phase, we classified the IT assets into tangible and intangible assets, including human and information data asset, and evaluated their value. Then, we converted the quantitative asset value to the qualitative asset value using a conversion standard table. In the second phase, we reclassified the assets using 2-dimensional classification factors reflecting the business process, and applied weight to the first evaluation results. This method is to consider the organization characteristics, IT asset structure scheme and business process. Therefore, we can evaluate the concrete and substantial asset value corresponding to the organization business process, even if they are the same asset type.

Adversarial Detection with Gaussian Process Regression-based Detector

  • Lee, Sangheon;Kim, Noo-ri;Cho, Youngwha;Choi, Jae-Young;Kim, Suntae;Kim, Jeong-Ah;Lee, Jee-Hyong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권8호
    • /
    • pp.4285-4299
    • /
    • 2019
  • Adversarial attack is a technique that causes a malfunction of classification models by adding noise that cannot be distinguished by humans, which poses a threat to a deep learning model. In this paper, we propose an efficient method to detect adversarial images using Gaussian process regression. Existing deep learning-based adversarial detection methods require numerous adversarial images for their training. The proposed method overcomes this problem by performing classification based on the statistical features of adversarial images and clean images that are extracted by Gaussian process regression with a small number of images. This technique can determine whether the input image is an adversarial image by applying Gaussian process regression based on the intermediate output value of the classification model. Experimental results show that the proposed method achieves higher detection performance than the other deep learning-based adversarial detection methods for powerful attacks. In particular, the Gaussian process regression-based detector shows better detection performance than the baseline models for most attacks in the case with fewer adversarial examples.

초분광 영상의 Morphological Attribute Profiles와 추가 밴드를 이용한 감독분류의 정확도 평가 (Accuracy Evaluation of Supervised Classification by Using Morphological Attribute Profiles and Additional Band of Hyperspectral Imagery)

  • 박홍련;최재완
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.9-17
    • /
    • 2017
  • 초분광 영상(hyperspectral imagery)은 주성분분석이나 최소잡음비율 등을 이용하여 자료의 차원과 잡음을 감소시켜 토지피복분류에 사용되는 것이 일반적이다. 최근에는 분광정보와 공간적 특성을 가진 다양한 입력 자료를 이용한 감독분류에 관한 연구가 활발히 진행되고 있다. 본 연구에서는 초분광 영상을 이용한 토지피복분류를 위해 principle component(PC) 밴드와 normalized difference vegetation index(NDVI) 자료를 감독분류의 입력자료로 활용하였다. NDVI 자료는 초분광 영상에서 추출된 PC 밴드가 포함하고 있지 않는 추가적인 정보를 활용하여 식생지역에 대한 토지피복분류 정확도를 높이고자 사용하였으며, morphological filter를 통해 각 밴드의 extended attribute profiles(EAP)를 제작하여 분류를 위한 입력 자료로 사용하였다. 감독분류기법은 random forest 알고리즘을 이용하였으며, EAP를 기반으로 다양한 입력 자료의 적용에 따른 분류정확도를 비교하고자 하였다. 연구지역으로는 두 대상지를 선정하였으며, 영상 내에서 취득한 참조자료를 이용하여 정량적인 평가를 수행하였다. 본 연구에서 제안한 기법의 분류정확도는 85.72%와 91.14%로 다른 입력 자료들을 이용한 경우와 비교하여 가장 높은 분류정확도를 나타냈다. 향후, 초분광 영상을 이용한 토지피복분류의 정확도를 높이기 위한 분류 알고리즘 개발과 대상지역 특성에 맞는 추가 입력자료 개발에 관한 연구가 필요할 것으로 사료된다.