• Title/Summary/Keyword: 타입 분류

Search Result 270, Processing Time 0.026 seconds

Behavior based Malware Profiling System Prototype (행위기반 악성코드 프로파일링 시스템 프로토타입)

  • Kang, Hong-Koo;Yoo, Dae-Hoon;Choi, Bo-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.376-379
    • /
    • 2017
  • 전 세계적으로 악성코드는 하루 100만개 이상이 새롭게 발견되고 있으며, 악성코드 발생량은 해마다 증가하고 있는 추세이다. 공격자는 보안장비에서 악성코드가 탐지되는 것을 우회하기 위해 기존 악성코드를 변형한 변종 악성코드를 주로 이용한다. 변종 악성코드는 자동화된 제작도구나 기존 악성코드의 코드를 재사용하므로 비교적 손쉽게 생성될 수 있어 최근 악성코드 급증의 주요 원인으로 지목되고 있다. 본 논문에서는 대량으로 발생하는 악성코드의 효과적인 대응을 위한 행위기반 악성코드 프로파일링 시스템 프로토타입을 제안한다. 동일한 변종 악성코드들은 실제 행위가 유사한 특징을 고려하여 악성코드가 실행되는 과정에서 호출되는 API 시퀀스 정보를 이용하여 악성코드 간 유사도 분석을 수행하였다. 유사도 결과를 기반으로 대량의 악성코드를 자동으로 그룹분류 해주는 시스템 프로토타입을 구현하였다. 악성코드 그룹별로 멤버들 간의 유사도를 전수 비교하므로 그룹의 분류 정확도를 객관적으로 제시할 수 있다. 실제 유포된 악성코드를 대상으로 악성코드 그룹분류 기능과 정확도를 측정한 실험에서는 평균 92.76%의 분류 성능을 보였으며, 외부 전문가 의뢰에서도 84.13%로 비교적 높은 분류 정확도를 보였다.

Prototype-Based Classification Using Class Hyperspheres (클래스 초월구를 이용한 프로토타입 기반 분류)

  • Lee, Hyun-Jong;Hwang, Doosung
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.10
    • /
    • pp.483-488
    • /
    • 2016
  • In this paper, we propose a prototype-based classification learning by using the nearest-neighbor rule. The nearest-neighbor is applied to segment the class area of all the training data with hyperspheres, and a hypersphere must cover the data from the same class. The radius of a hypersphere is computed by the mid point of the two distances to the farthest same class point and the nearest other class point. And we transform the prototype selection problem into a set covering problem in order to determine the smallest set of prototypes that cover all the training data. The proposed prototype selection method is designed by a greedy algorithm and applicable to process a large-scale training set in parallel. The prediction rule is the nearest-neighbor rule and the new training data is the set of prototypes. In experiments, the generalization performance of the proposed method is superior to existing methods.

한글 Common Lisp에서 한글 함수 기능

  • Lee, Chang-Yeol;O, Seung-Jun;Im, Yeong-Hwan
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.172-179
    • /
    • 1990
  • 본 논문에서는 한글(한국어) ascii 코드와 4가지 한글 표현 원리에 만들어지는 한글음절을 정의한다. Common Lisp(CL)의 확장된 버전으로 한글이 사용 가능한 한글 CL(HCL)의 소개하고 CL에 추가되는 새로운 한글 함수에 대하여 설명한다. HCL의 모든 함수는 한글을 다루는 방법에 따라 4가지 타입으로 나뉘어진다. 1) 타입 0 - 한글을 입출력 값으로 취하지 않는 전형적인 CL 함수, 2) 타입 1 - 원래 CL 함수정의의 변경없이 입력으로 한글을 받아들이는 함수, 3) 타입 2 - 한글을 사용하기 위하여 함수의 정의를 확장해야하는 CL 함수, 4) 타입 3 - 한글 처리를 하기 위하여 새로 설계한 새로운 함수. 위의 타입에 의해 분류되는 각 함수에 대한 정의를 제안하고 한글 편집기에 대하여 소개한다.

  • PDF

Hyper-Rectangle Based Prototype Selection Algorithm Preserving Class Regions (클래스 영역을 보존하는 초월 사각형에 의한 프로토타입 선택 알고리즘)

  • Baek, Byunghyun;Euh, Seongyul;Hwang, Doosung
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.3
    • /
    • pp.83-90
    • /
    • 2020
  • Prototype selection offers the advantage of ensuring low learning time and storage space by selecting the minimum data representative of in-class partitions from the training data. This paper designs a new training data generation method using hyper-rectangles that can be applied to general classification algorithms. Hyper-rectangular regions do not contain different class data and divide the same class space. The median value of the data within a hyper-rectangle is selected as a prototype to form new training data, and the size of the hyper-rectangle is adjusted to reflect the data distribution in the class area. A set cover optimization algorithm is proposed to select the minimum prototype set that represents the whole training data. The proposed method reduces the time complexity that requires the polynomial time of the set cover optimization algorithm by using the greedy algorithm and the distance equation without multiplication. In experimented comparison with hyper-sphere prototype selections, the proposed method is superior in terms of prototype rate and generalization performance.

A Study of Component Categorization for Reuse and Representation with UML (재사용을 위한 컴포넌트 분류체계와 UML을 이용한 컴포넌트 분류체계 표기법에 관한 연구)

  • 박진구;김강태;이경환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.564-566
    • /
    • 2000
  • 컴포넌트 시장이 활성화됨에 따라 컴포넌트의 수는 기하급수적으로 증가하고 있으며, 이러한 컴포넌트들을 효과적으로 재사용하기 위해서는 컴포넌트 분류체계가 잘 정의되어질 필요성이 있다. 현재 컴포넌트 유통시장의 현황을 살펴보니, 대체적으로 구현과 관련된 실행가능모듈로서의 컴포넌트 들이 언어, 기능성, 플랫폼정도로 분류가 되어 사용되어지고 있었다. 앞으로 다양한 컴포넌트들이 많이 개발되어질 것이며, 이들을 위한 체계적인 분류방법이 필요하다고 생각되어, 본 논문에서는 효과적인 컴포넌트 재사용을 위한 컴포넌트 분류체계를 제시하였다. 또, 이를 컴포넌트 모델링에 적용하기 위해 제시한 분류체계를 UML의 스테레오타입으로 정의하여 시각화하였다.

  • PDF

Classification of Non-Signature Multimedia Data Fragment File Types With Byte Averaging Gray-Scale (바이트 평균의 Gray-Scale화를 통한 Signature가 존재하지 않는 멀티미디어 데이터 조각 파일 타입 분류 연구)

  • Yoon, Hyun-ho;Kim, Jae-heon;Cho, Hyun-soo;Won, Jong-eun;Kim, Gyeon-woo;Cho, Jae-hyeon
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.30 no.2
    • /
    • pp.189-196
    • /
    • 2020
  • In general, fragmented files without signatures and file meta-information are difficult to recover. Multimedia files, in particular, are highly fragmented and have high entropy, making it almost impossible to recover with signature-based carving at present. To solve this problem, research on fragmented files is underway, but research on multimedia files is lacking. This paper is a study that classifies the types of fragmented multimedia files without signature and file meta-information. Extracts the characteristic values of each file type through the frequency differences of specific byte values according to the file type, and presents a method of designing the corresponding Gray-Scale table and classifying the file types of a total of four multimedia types, JPG, PNG, H.264 and WAV, using the CNN (Convolutional Natural Networks) model. It is expected that this paper will promote the study of classification of fragmented file types without signature and file meta-information, thereby increasing the possibility of recovery of various files.

Automatic Scheme Matching using Classification and User update (자동분류와 사용자업데이트를 이용한 스키마 매칭)

  • Lee, Myung-Joo;Shin, Hyun-Doo;Park, So-Ra;Hwang, Soo-Chan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.102-104
    • /
    • 2011
  • 서로 다른 XML 스키마를 바탕으로 작성된 XML 문서간의 비교 및 검색을 위해서는 두 스키마 사이의 연관관계를 계산하는 스키마 매칭 과정이 필수적이다. 스키마 매칭방법으로는 구조적 연관성을 비교하는 방법, 의미적 연관성을 계산하는 방법, 타입의 연관성을 계산하는 방법이 존재한다. 또한, 자동분류기법을 사용하여 연관성을 계산하는 방법도 존재한다. 본 논문에서는 XML 문서의 비교을 위한 효율적인 스키마 매칭 방법을 제안한다. 제안된 방법은 두 단계로 구성된다. 먼저 자동분류기법을 사용하여 단말노드 사이의 매칭정도를 계산한다. 또한 의미적, 구조적, 타입의 연관성도 계산하여 최적의 매칭결과를 선택한다. 특히 의미적 연관성은 사용자 피드백에 의해 점증적으로 갱신되는 온톨로지에 기반한다.

A Model of Faults Classification in Component based Robots (컴포넌트 기반 로봇의 결점분류 모델)

  • Kim, Jaeyoung;Kim, Jongyoung;Yoon, Heebyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1582-1585
    • /
    • 2010
  • 로봇은 인간의 생명과 밀접하게 관련되어 있기 때문에 높은 안전성과 신뢰성이 요구된다. 특히 최근에는 지능형 서비스 로봇의 등장과 더불어 증가되는 로봇 개발환경의 복잡성 문제와 로봇의 신속한 개발 및 유지보수 문제를 해결하기 위해 컴포넌트 기반의 로봇 플랫폼에 대한 연구가 증가하고 있으며, 특히 로봇 플랫폼을 구성하는 컴포넌트의 장애문제 해결이 중요한 이슈로 대두되고 있다. 따라서 본 논문에서는 컴포넌트 기반 로봇의 결점분류 절차를 제시하고 로봇의 결점타입과 로봇 플랫폼과의 상관관계를 분석하고 로봇 플랫폼에 결점타입을 매핑하여 최종적으로 컴포넌트 기반 로봇의 결점분류 모델을 제안한다.

Adult Image Filtering using Support Vector Mchine (Support Vector Machine을 이용한 유해 이미지 분류)

  • Song, Chull-Hwan;Yoo, Seong-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.218-221
    • /
    • 2006
  • 본 논문은 인터넷의 대표적인 문제점중의 하나인 Adult Image 분류 연구에 대해 기술한다. 특히 우리는 이러한 Adult Image를 분류하기 위한 Data Set을 5가지 타입으로 구성한다. 이러한 각 Image에 대해 Color, Gradient, Edge Direction 특성의 Feature들을 추출하고 이를 Histogram으로 구성한다. 이렇게 구성된 Histogram을 Support Vector Machine에 적용하여 Adult Image를 분류한다. 그 결과, 우리는 8250개의 Test Set에 대하여 Recall(96.53%), Precision(97.33%), False Positive(2.96%), F-Measure(96.93%)의 성능 결과를 보여준다.

  • PDF

Extracting Comparative Elements from Comparative Sentences (비교 문장으로부터 비교 요소 자동 추출)

  • Yang, Seon;Ko, Young-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.225-228
    • /
    • 2011
  • 본 논문은 비교 마이닝(comparison mining) 의 일환인 비교 요소 자동 추출에 관하여 연구한다. 비교 마이닝은 텍스트 마이닝의 한 분야로서 대용량의 텍스트를 대상으로 비교 관계롤 자동 분석하며, 비교 문장인지 아닌지를 식별하는 단계, 비교 타입을 분류하는 단계, 다양한 비교 요소들을 추출하는 단계, 추출된 요소를 분석 및 요약하는 단계 등을 거치게 된다. 본 연구에서는 특정 타입의 비교 문장이 주어졌을때, 그 문장에서 비교 요소를 자동으로 추출하는 단계의 과제를 수행하며, 우열 비교 타입 및 최상급 타입 문장들을 대상으로 비교 주체, 비교 대상, 비교 술어를 추출한다. 실험 과정으로는, 우선 비교 요소 후보들을 선정하고, 그 후 각 요소별로 확률을 계산하여 가장 높은 수치를 기록한 요소를 정답으로 채택하게 된다. 확률 계산은 지지 벡터 기계 (Support Vector Machine)를 이용한다. 인터넷 상의 다양한 도메인에서 추출된 비교 문장들을 대상으로 비교 요소 추출을 수출한 결과, 정확도 86.81 %의 우수한 성능을 산출 할 수 있었다.