• 제목/요약/키워드: supervised clustering

검색결과 112건 처리시간 0.021초

Identifying potential mergers of globular clusters: a machine-learning approach

  • Pasquato, Mario
    • 천문학회보
    • /
    • 제39권2호
    • /
    • pp.89-89
    • /
    • 2014
  • While the current consensus view holds that galaxy mergers are commonplace, it is sometimes speculated that Globular Clusters (GCs) may also have undergone merging events, possibly resulting in massive objects with a strong metallicity spread such as Omega Centauri. Galaxies are mostly far, unresolved systems whose mergers are most likely wet, resulting in observational as well as modeling difficulties, but GCs are resolved into stars that can be used as discrete dynamical tracers, and their mergers might have been dry, therefore easily simulated with an N-body code. It is however difficult to determine the observational parameters best suited to reveal a history of merging based on the positions and kinematics of GC stars, if evidence of merging is at all observable. To overcome this difficulty, we investigate the applicability of supervised and unsupervised machine learning to the automatic reconstruction of the dynamical history of a stellar system. In particular we test whether statistical clustering methods can classify simulated systems into monolithic versus merger products. We run direct N-body simulations of two identical King-model clusters undergoing a head-on collision resulting in a merged system, and other simulations of isolated King models with the same total number of particles as the merged system. After several relaxation times elapse, we extract a sample of snapshots of the sky-projected positions of particles from each simulation at different dynamical times, and we run a variety of clustering and classification algorithms to classify the snapshots into two subsets in a relevant feature space.

  • PDF

LBG 알고리즘 기반 데이터마이닝을 이용한 네트워크 침입 탐지율 향상 (Improvement of Network Intrusion Detection Rate by Using LBG Algorithm Based Data Mining)

  • 박성철;김준태
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.23-36
    • /
    • 2009
  • 네트워크 침입 탐지는 데이터마이닝 기법을 활용하면서 지속적으로 발전하여 왔다. 데이터마이닝에 의한 침입 탐지 기법에는 클래스 레이블을 이용한 감독 학습과 클래스 레이블이 없는 비감독 학습 방법이 있다. 본 논문에서는 클래스 레이블이 없는 비감독 학습 방법인 LBG 클러스터링 알고리즘을 이용하여 네트워크 침입 탐지 정확도를 높이는 방법을 연구하였다. 임의의 초기 중심값들로 시작하여 유클리디언 거리 기반에 의해 클러스터링을 수행하는 K-means 방법은 잡음(noisy) 데이터와 이상치(outlier)에 대하여 취약하다는 단점이 있다. 비균일이진 분할에 의한 클러스터링 알고리즘은 초기값 없이 이진분할에 의해 클러스터링을 수행하며 수행 속도가 빠르다. 본 논문에서는 이 두 알고리즘의 장단점을 통합한 EM(Expectation Maximization) 기반의 LBG 알고리즘을 네트워크 침입 탐지에 적용하였으며, KDD 컵 데이터셋을 대상으로 한 실험을 통하여 LBG 알고리즘을 이용함으로써 침입 탐지의 정확도를 높일 수 있음을 보였다.

  • PDF

자기조직형 최적 가버필터에 의한 다중 텍스쳐 오브젝트 추출 (Multiple Texture Objects Extraction with Self-organizing Optimal Gabor-filter)

  • 이우범;김욱현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.311-320
    • /
    • 2003
  • 고유의 텍스쳐 성분에만 최적 반응을 하는 최적 필터(optimal filter)는 다중 텍스쳐 영상으로부터 원하는 텍스쳐 성분을 추출하기 위한 가장 뛰어난 기술이다. 그러나 기존의 최적필터 설계 방법들은 영상에 내재된 텍스쳐 정보가 사전에 주어지는 교사적 방법이 대부분이며, 내재된 텍스쳐 인식을 기반으로 하는 완전 비교사적인 방법에 관한 연구는 거의 이루어지고 있지 않은 실정이다. 따라서 본 논문에서는 효율적인 텍스쳐 분석을 위한 비교사 학습 방법과 가버필터의 주파수 대역 통과형 특징을 이용한 새로운 최적 필터 설계 방법을 제안한다. 제안한 방법은 자기조직형 신경회로망에 의해서 영상에 내재된 텍스쳐 영역을 블록 단위로 군화(clustering)하며, 가버필터의 최적 주파수는 인식된 텍스쳐 오브젝트(texture objects)의 공간 주파수를 분석한 최적 주파수에 동조(turning)한다. 그리고 설계된 최적 가버필터의 성능 평가를 위해서는 다양한 형태의 다중 텍스쳐 영상을 생성하여 내재된 텍스쳐 오브젝트를 추출함으로써 성공적인 결과를 보인다.

실시간 침입탐지를 위한 자기 조직화 지도(SOM)기반 트래픽 속성 상관관계 메커니즘 (Traffic Attributes Correlation Mechanism based on Self-Organizing Maps for Real-Time Intrusion Detection)

  • 황경애;오하영;임지영;채기준;나중찬
    • 정보처리학회논문지C
    • /
    • 제12C권5호
    • /
    • pp.649-658
    • /
    • 2005
  • 네트워크 기반의 공격은 그 위험성과 피해의 규모가 크기 때문에 공격 초기에 빨리 탐지하는 것이 중요하다. 그러나 지도학습 데이터 마이닝을 이용한 네트워크상의 비정상 트래픽을 탐지하는 방법은 방대한 양의 데이터 전처리와 관리자의 분석이 요구되며 관리자의 분석이 정확하다는 보장이 없을 뿐만 아니라 각 네트워크의 실시간 특성을 고려하지 못하기 때문에 탐지의 어려움이 크다. 본 논문에서는 실시간 침입 탐지와 점진적 학습을 위해 비지도학습의 데이터마이닝 기법중 하나인 자기 조직화 지도를 기반으로 트래픽 속성 상관관계 메커니즘을 제안한다. 이는 세 단계로 이루어진다. 첫 번째 단계는 초기 학습이 이루어지는 단계로 비지도 학습을 통하여 성격이 비슷한 트래픽끼리 클러스터링 한 맵을 생성시킨다. 두 번째 단계는 맵의 각 클러스터가 정상과 비정상 트래픽의 클러스터로 구분되기 위해 각 공격별로 추출된 규칙(rule)을 적용하여 맵을 분석한다. 이 규칙은 지도 학습을 통한 규칙 기반의 방법으로, 각 데이터 항목마다 SOM을 이용한 속성별 맵의 상관관계(correlation) 분석을 통해 생성되었다. 마지막으로 분석된 맵을 이용하여 실시간 탐지와 함께 점진적 학습이 이루어지게 된다. 여러 실험을 통하여 비지도 학습과 지도 학습을 결합한 SOM 기반 트래픽 속성 상관관계 메커니즘이 지도 학습에 비해 실시간 탐지에 우수함을 증명하였다.

전력데이터 분석에서 이상점 추출을 위한 데이터 클러스터링 아키텍처에 관한 연구 (A Novel of Data Clustering Architecture for Outlier Detection to Electric Power Data Analysis)

  • 정세훈;신창선;조용윤;박장우;박명혜;김영현;이승배;심춘보
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권10호
    • /
    • pp.465-472
    • /
    • 2017
  • 과거에는 전력데이터를 분석하는 기법으로 주로 기계학습의 지도학습 기법을 많이 활용하였고 데이터 마이닝 기법을 통한 패턴 검출을 주로 연구하였다. 그러나 전력데이터의 규모 커지고 실시간 데이터 공급이 가능해진 현재에는 과거의 데이터 분류 및 분석 기법을 통한 데이터 분석 연구는 한계가 존재한다. 이에 본 논문에서는 큰 규모의 전력데이터를 분석할 수 있는 클러스터링 아키텍처를 제안한다. 제안하는 클러스터링 프로세스는 비지도학습기법인 K-means 알고리즘의 문제점을 보완하고 전력데이터 수집과 분석까지의 모든 과정을 자동화할 수 있는 프로세스이다. 총 3 Level로 구분하여 Row Data Level, Clustering Level, User Interface Level로 구분하여 전력데이터를 분류 및 분석한다. 또한 클러스터링의 효율성 향상을 위하여 주성분분석 및 정규분포기반의 최적의 클러스터 수 K값 추출과 이상점으로 분류되는 데이터 감소를 위한 변형된 K-means 알고리즘을 제시한다.

자기구성 신경회로망을 이용한 면삭밀링에서의 공구파단검출 (Tool Breakage Detection in Face Milling Using a Self Organized Neural Network)

  • 고태조;조동우
    • 대한기계학회논문집
    • /
    • 제18권8호
    • /
    • pp.1939-1951
    • /
    • 1994
  • This study introduces a new tool breakage detecting technology comprised of an unsupervised neural network combined with adaptive time series autoregressive(AR) model where parameters are estimated recursively at each sampling instant using a parameter adaptation algorithm based on an RLS(Recursive Least Square). Experiment indicates that AR parameters are good features for tool breakage, therefore it can be detected by tracking the evolution of the AR parameters during milling process. an ART 2(Adaptive Resonance Theory 2) neural network is used for clustering of tool states using these parameters and the network is capable of self organizing without supervised learning. This system operates successfully under the wide range of cutting conditions without a priori knowledge of the process, with fast monitoring time.

장면 분류를 위한 클래스 기반 클러스터링 (Bag-of-Words Scene Classification based on Supervised K-means Clustering)

  • 김준형;류승철;김승룡;손광훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.248-251
    • /
    • 2013
  • 컴퓨터 비전에서 BoW를 이용한 장면 분류 기법에 대한 연구가 활발히 진행되고 있다. BoW 기법의 장면 분류는 K-means 클러스터링을 통하여 코드북을 생성하는 과정에서 트레이닝 이미지의 클래스 정보를 활용하지 않기 때문에 성능이 제한적이라는 문제점을 가지고 있다. 본 논문에서는 BoW를 이용한 장면 분류 과정에서 코드북 생성을 위하여 각각 특징 기술자들의 유클리디안 거리뿐만이 아니라 클래스 확률 밀도 함수들의 히스토그램 교차값을 최소화 하는 최적화 K-means 클러스터링 기법을 제안한다. 장면의 SIFT 특징 기술자 정보뿐만 아니라 장면이 속해있는 클래스 정보를 결합하여 클러스터링을 수행함으로써 장면 분류의 정확도를 높일 수 있다. 장면 분류 정확도 실험에서 제안하는 클러스터링을 사용한 BoW 장면 분류 기법은 기존의 K-means을 사용한 BoW 장면 분류 기법보다 높은 정확도를 보여준다.

  • PDF

Reduced RBF Centers Based Multiuser Detection in DS-CDMA System

  • 이정식;화재정;박지연
    • 한국통신학회논문지
    • /
    • 제31권11C호
    • /
    • pp.1085-1091
    • /
    • 2006
  • The major goal of this paper is to develop a practically implemental radial basis function (RBF) neural network based multi-user detector (MUD) for direct sequence (DS)-CDMA system. This work is expected to provide an efficient solution for RBF based MUD by quickly setting up the proper number of RBF centers and their locations required in training. The basic idea in this research is to estimate all the possible RBF centers by using supervised ${\kappa-means$ clustering technique, and select the only centers which locate near seemingly decision boundary between centers, and reduce further by grouping the some of centers adjacent each other. Therefore, it reduces the computational burden for finding the proper number of RBF centers and their locations in the existing RBF based MUD, and ultimately, make its implementation practical.

유전자 온톨로지를 활용한 반지도 클러스터링 기법 (Gene ontology based semi-supervised clustering method)

  • 고송;김대원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.183-187
    • /
    • 2008
  • 본 논문은 유전자의 기능이 비슷한 정도에 따른 사전정보의 값을 부여하며, 클러스터링시 사전정보를 활용할 수 있는 방법을 제시한다. 실세계 문제인 유전자는 각기 다양한 기능을 하는 특징적인 것으로 사전정보의 형태를 1과 0등으로 구분하던 과거의 방식으로는 정의하기가 어렵다. 유전자간의 비슷한 정도에 따라 사전정보의 값이 정해져야 하는 것은 필요하며, 이는 생물학자가 구축해놓은 유전자 온톨로지의 분석을 통하여 산출한다. 유전자 온톨로지는 기능별 카테고리로 분류하며, 세부 기능은 하위의 카테고리로 형성된 거대한 트리 구조의 형태를 띤다. 온톨로지 분석을 통해 형성된 사전정보의 값은 0과 1사이의 연속적인 값으로 형성이 되며, 이 값은 클러스터링 과정 중 거리 계산에 활용함으로써, 그 결과의 성능이 우수함을 보인다.

  • PDF

Identifying Temporal Pattern Clusters to Predict Events in Time Series

  • Heesoo Hwang
    • KIEE International Transaction on Systems and Control
    • /
    • 제2D권2호
    • /
    • pp.125-134
    • /
    • 2002
  • This paper proposes a method for identifying temporal pattern clusters to predict events in time series. Instead of predicting future values of the time series, the proposed method forecasts specific events that may be arbitrarily defined by the user. The prediction is defined by an event characterization function, which is the target of prediction. The events are predicted when the time series belong to temporal pattern clusters. To identify the optimal temporal pattern clusters, fuzzy goal programming is formulated to combine multiple objectives and solved by an adaptive differential evolution technique that can overcome the sensitivity problem of control parameters in conventional differential evolution. To evaluate the prediction method, five test examples are considered. The adaptive differential evolution is also tested for twelve optimization problems.

  • PDF