• 제목/요약/키워드: 이진 분류

검색결과 605건 처리시간 0.024초

계층적 침해자원 기반의 침해사고 구성 및 유형분석 (The Composition and Analytical Classification of Cyber Incident based Hierarchical Cyber Observables)

  • 김영수;문형진;조혜선;김병익;이진해;이진우;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.139-153
    • /
    • 2016
  • 최근 침해정보공유센터와 기업의 보안시스템으로 부터 수집되는 침해사고의 수는 악성코드의 확산으로 인해 기하급수적으로 증가하고 있다. 사이버 공격으로 인해 침해 사고가 발생했을 때 침해사고 분석가들은 대량의 침해사고 데이터를 분류 및 분석하는데 시간과 비용이 증가하는 문제점에 직면한다. 이에 대한 기존의 해결책으로 다중 연관분석을 통한 유사침해사고에 대한 정보를 제공하는 침해사고 분석시스템이 있으나 이는 분석가에게 분석할 침해사고의 수를 축소시켜 주는 효과가 있을 뿐 침해분석에 적합한 정보를 제공하지 못하고 있다. 그 근본적인 이유는 비현실적인 침해사고의 구성을 야기하는 침해자원 기준으로 침해사고를 분류하기 때문이다. 이를 해결하고자 본 논문에서는 침해사고를 기준으로 침해자원을 계층적으로 분류하고 유사도 분석을 수행하였다. 이 분석을 통하여 신규 침해사고가 발생하였을 때 유사한 침해사고 유형에 대한 정보를 침해사고 분석가에게 제시하는 침해사고 분석 모델을 제안하고 검증을 위하여 침해사고분석 모듈을 구현하였다. 제안 모델은 의미 있는 침해사고 구성과 유형 분류의 제공을 통해 실용성을 확대한다.

블록의 속성과 질감특징을 이용한 문서영상의 블록분류 (Block Classification of Document Images by Block Attributes and Texture Features)

  • 장영내;김중수;이철희
    • 한국멀티미디어학회논문지
    • /
    • 제10권7호
    • /
    • pp.856-868
    • /
    • 2007
  • 본 논문에서는 블록의 속성과 질감특징을 이용하여 효과적인 블록 분류 방법을 제안하였다. 제안한 방법에서는 먼저 명암도 문서영상을 이진화한 후, 평활화 기법을 적용하여 블록의 위치정보와 본 논문에서 사용할 특징 중에 하나인 각 블록의 내부에 있는 작은 블록들의 최대 높이 값을 구하였다. 이 위치정보들을 이용하여 문서영상을 각 블록으로 분할한다. 이 블록의 명암도 블록영상에서 문서의 속성이 잘 반영된 (0,1) 방향의 공간 명암도 의존 행렬을 구하여 7가지 질감특징을 구하였다. 먼저 블록의 속성을 최소거리 규칙(Nearest Neighbor Rule)에 입력하여 문자와 비문자 영역으로, 상세분류를 위하여 7가지 질감특징을 이용하여 큰 문자, 작은 문자, 표, 그래픽 및 사진 등으로 구분함으로써 문서인식을 위한 구조 해석뿐만 아니라 다양한 응용 분야에 효과적으로 이용될 수 있도록 하였다.

  • PDF

길이에 대한 2차원 이진검색을 이용한 패킷분류 구조 (Packet Classification Using Two-Dimensional Binary Search on Length)

  • 문주형;임혜숙
    • 한국통신학회논문지
    • /
    • 제32권9B호
    • /
    • pp.577-588
    • /
    • 2007
  • 인터넷의 성장은 다양한 응용 프로그램들의 발달을 야기 시켰으며, 그로 인해 모든 패킷을 동일하게 처리하는 현재의 최선지원 서비스 보다 나은 서비스를 제공할 것을 요구하고 있다. 따라서 차세대 인터넷 라우터들은 다양한 레벨의 품질보장 서비스를 제공하여야 한다. 품질보장 서비스를 제공하기 위해서는 모든 입력 패킷을 미리 정의된 룰에 따라 구분하는 패킷 분류가 실시간으로 수행되어야 한다. 패킷분류는 패킷에 포함된 여러 헤더 필드에 대하여 다양한 종류의 검색을 수행하여야 하며, 일치하는 룰들 중에서 가장 높은 우선순위를 갖는 룰을 찾아야 하는 다차원 검색이다. 영역분할을 사용한 사분트라이 구조는 근원지와 목적지 프리픽스를 2차원 트라이 구조로 저장하여 검색을 진행하는 좋은 알고리즘이나, 길이에 대하여 선형검색을 하는 방법이므로 좋은 검색 성능을 보이지 못한다. 본 논문에서는 사분트라이 구조에서 길이에 대하여 이진검색을 진행하는 새로운 패킷분류 알고리즘을 제안한다. 또한 패킷이 여러 개의 룰과 일치하였을 경우 가장 높은 우선순위를 가지는 룰을 선택한다는 특성을 이용하여, 사분트라이를 만드는 과정에서 우선순위를 고려하여 검색 성능을 향상시킬 수 있는 방안을 제안한다.

연속형 속성을 갖는 인공 신경망의 규칙 추출 (Extracting Rules from Neural Networks with Continuous Attributes)

  • 바트셀렘;이완곤;전명중;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.22-29
    • /
    • 2018
  • 지난 수십 년 동안 인공 신경망은 음성 인식에서 이미지 분류에 이르기까지 수많은 분야에서 성공적으로 사용되었다. 그러나 인공 신경망은 특정 결론이 어떻게 도출되었는지 알 필요가 있음에도 불구하고 이러한 결과를 설명할 수 있는 능력이 부족하다. 대부분의 연구는 신경망에서 이진 규칙을 추출하는데 초점을 맞추고 있지만, 기계 학습 응용 프로그램에 사용되는 데이터는 연속된 값이 포함되어 있기 때문에 실용적이지 않은 경우가 있다. 이러한 격차를 줄이기 위해 본 논문에서는 연속된 값이 포함된 데이터로부터 학습된 신경망에서 논리 규칙을 추출하는 알고리즘을 제안한다. 초평면 기반 선형 분류기를 사용하여 입력 및 은닉 층 사이에서 학습된 가중치로부터 규칙을 추출하고, 비선형 분류 규칙을 생성하기 위해 은닉 층과 출력 층에서 학습된 이진 규칙과 분류기를 결합한다. 비선형 연속값으로 구성된 여러 데이터셋을 대상으로 진행한 실험에서 제안하는 방법이 논리적 규칙을 정확하게 추출할 수 있음을 보였다.

이진 분류문제에서의 딥러닝 알고리즘의 활용 가능성 평가 (Feasibility of Deep Learning Algorithms for Binary Classification Problems)

  • 김기태;이보미;김종우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.95-108
    • /
    • 2017
  • 최근 알파고의 등장으로 딥러닝 기술에 대한 관심이 고조되고 있다. 딥러닝은 향후 미래의 핵심 기술이 되어 일상생활의 많은 부분을 개선할 것이라는 기대를 받고 있지만, 주요한 성과들이 이미지 인식과 자연어처리 등에 국한되어 있고 전통적인 비즈니스 애널리틱스 문제에의 활용은 미비한 실정이다. 실제로 딥러닝 기술은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Boltzmann Machine (DBM) 등 알고리즘들의 선택, Dropout 기법의 활용여부, 활성 함수의 선정 등 다양한 네트워크 설계 이슈들을 가지고 있다. 따라서 비즈니스 문제에서의 딥러닝 알고리즘 활용은 아직 탐구가 필요한 영역으로 남아있으며, 특히 딥러닝을 현실에 적용했을 때 발생할 수 있는 여러 가지 문제들은 미지수이다. 이에 따라 본 연구에서는 다이렉트 마케팅 응답모델, 고객이탈분석, 대출 위험 분석 등의 주요한 분류 문제인 이진분류에 딥러닝을 적용할 수 있을 것인지 그 가능성을 실험을 통해 확인하였다. 실험에는 어느 포르투갈 은행의 텔레마케팅 응답여부에 대한 데이터 집합을 사용하였으며, 전통적인 인공신경망인 Multi-Layer Perceptron, 딥러닝 알고리즘인 CNN과 RNN을 변형한 Long Short-Term Memory, 딥러닝 모형에 많이 활용되는 Dropout 기법 등을 이진 분류 문제에 활용했을 때의 성능을 비교하였다. 실험을 수행한 결과 CNN 알고리즘은 비즈니스 데이터의 이진분류 문제에서도 MLP 모형에 비해 향상된 성능을 보였다. 또한 MLP와 CNN 모두 Dropout을 적용한 모형이 적용하지 않은 모형보다 더 좋은 분류 성능을 보여줌에 따라, Dropout을 적용한 CNN 알고리즘이 이진분류 문제에도 활용될 수 있는 가능성을 확인하였다.

SVM을 이용한 3차원 해마의 지능적 형상 분석 (Intelligent Shape Analysis of the 3D Hippocampus Using Support Vector Machines)

  • 김정식;김용국;최수미
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1387-1392
    • /
    • 2006
  • 본 논문에서는 SVM (Support Vector Machine)을 기반으로 하여 인체의 뇌 하부구조인 해마에 대한 지능적 형상분석 방법을 제공한다. 일반적으로 의료 영상으로부터 해마의 형상 분석을 하기 위해서는 충분한 임상 데이터를 필요로 한다. 하지만 현실적으로 많은 양의 표본들을 얻는 것이 쉽지 않기 때문에 전문가의 지식을 기반으로 한 작업이 수반되어야 한다. 결국 이러한 요소들이 분석 작업을 어렵게 한다. 의학 기술이 복잡해 지면서 최근의 형상 분석 연구는 점차 통계적 모델을 기반으로 진행되고 있다. 본 연구에서는 해마로부터 고해상도의 매개변수형 모델을 만들어 형상 표현으로 이용하고, 집단간 분류 작업에 SVM 알고리즘을 적용하는 지능적 분석 방법을 구현한다. 우선 메쉬 데이터로부터 물리변형모델 기반의 매개변수 모델을 구축하고, PDM (point distribution model) 방법을 적용하여 두 집단을 대표하는 평균 모델을 생성한다. 마지막으로 SVM 기반의 이진 분류기를 구축하여 집단간 분류 작업을 수행한다. 구현한 모델링 방법과 분류기의 성능을 평가하기 위하여 본 연구에서는 네 가지 커널 함수 (linear, radial basis function, polynomial, sigmoid)들을 적용한다. 본 논문에서 제시한 매개변수형 모델은 다양한 형태의 의료 데이터로부터 보편적인 3차원 모델을 생성하고, 또한 모델의 전역적, 국부적인 특징들을 복합적으로 표현할 수 있기 때문에 통계적 형상분석에 적합하다. 그리고 SVM 기반의 분류기는 적은 수의 학습 데이터로부터 정상인 해마 집단과 간질 환자 집단간의 정확한 분류를 가능하게 한다.

  • PDF

K-Pop 디지털 음원 서비스를 위한 상용화에 최적화된 K-Pop 장르 분류 및 장르 기술자 연구 (Research of defining optimal music genre classes for commercial digital music services of K-pop and compatible genre schema)

  • 신사임;이종설;장세진;김무영;;최가현;이진하
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.42-45
    • /
    • 2014
  • 본 논문은 K-Pop 디지털 음원 서비스에 활용 가능한 음악 정보 (Music Information)를 기술하기 위한 Music Description 중 K-Pop Genre Description에 대한 연구이다. 본 연구는 K-Pop 상용화 서비스에 활용하기 위한 음악 장르 분류를 제안하였다. 기존에 서비스되고 있는 K-Pop 디지털 음원 포털의 음원 분류를 체계적으로 분석한 결과를 통하여, 상용화에 가장 적합한 K-Pop 음악 분류 서비스를 위한 장르 체계를 제안하고 있다. 또한, TV-anytime 등 국제적 상용화 및 표준화에 적용된 기존의 장르 분류들과의 매핑을 통하여 확장 및 공유가 가능한 형태의 새로운 장르 분류체계 관리를 위한 메타데이터 규격을 제안하고 있다.

  • PDF

Fuzzy Twin Support Vector Machine 개발 및 전리층 레이더 데이터를 통한 성능 평가 (Development of Fuzzy Support Vector Machine and Evaluation of Performance Using Ionosphere Radar Data)

  • 천민규;윤창용;김은태;박민용
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.549-554
    • /
    • 2008
  • Support Vector Machine(SVM)은 통계적 학습 이론에 기반을 둔 분류기이다. 또한 Twin Support Vector Machine(TWSVM)은 이진 SVM 분류기의 한 종류로써, 서로 관련된 두 개의 SVM 유형 문제를 통해 평행하지 않은 두개의 평면을 결정하고 이 두 평면을 통해 분류기를 완성하는 방식이다. 이러한 방식의 TWSVM은 학습 시간이 SVM에 비해 훨씬 짧으며, SVM과 비교하여 떨어지지 않는 성능을 보여준다. 본 논문은 분류기 입력에 Fuzzy Membership을 적용하는 방식의 TWSVM을 제안하고, 전리층 레이더 데이터를 이용한 실험을 통하여 기존에 세시 되었던 분류기와 비교한다.