• 제목/요약/키워드: feature

검색결과 16,325건 처리시간 0.036초

A Feature Selection-based Ensemble Method for Arrhythmia Classification

  • Namsrai, Erdenetuya;Munkhdalai, Tsendsuren;Li, Meijing;Shin, Jung-Hoon;Namsrai, Oyun-Erdene;Ryu, Keun Ho
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.31-40
    • /
    • 2013
  • In this paper, a novel method is proposed to build an ensemble of classifiers by using a feature selection schema. The feature selection schema identifies the best feature sets that affect the arrhythmia classification. Firstly, a number of feature subsets are extracted by applying the feature selection schema to the original dataset. Then classification models are built by using the each feature subset. Finally, we combine the classification models by adopting a voting approach to form a classification ensemble. The voting approach in our method involves both classification error rate and feature selection rate to calculate the score of the each classifier in the ensemble. In our method, the feature selection rate depends on the extracting order of the feature subsets. In the experiment, we applied our method to arrhythmia dataset and generated three top disjointed feature sets. We then built three classifiers based on the top-three feature subsets and formed the classifier ensemble by using the voting approach. Our method can improve the classification accuracy in high dimensional dataset. The performance of each classifier and the performance of their ensemble were higher than the performance of the classifier that was based on whole feature space of the dataset. The classification performance was improved and a more stable classification model could be constructed with the proposed approach.

AAM과 가버 특징 벡터를 이용한 강인한 얼굴 인식 시스템 (Robust Face Recognition System using AAM and Gabor Feature Vectors)

  • 김상훈;정수환;전승선;김재민;조성원;정선태
    • 한국콘텐츠학회논문지
    • /
    • 제7권2호
    • /
    • pp.1-10
    • /
    • 2007
  • 본 논문에서는 AAM(Active Appearance Model)과 가버 특징 벡터를 이용한 얼굴 인식 시스템을 제안한다. 가버 특징 벡터를 사용하는 대표적인 얼굴 인식 알고리즘인 EBGM(Elastic Bunch Graph Matching)은 가버 특징 벡터를 추출하기 위해 얼굴 특징점들의 검출을 필요로 한다. 그런데, EBGM에서 사용되는 얼굴 특징점 검출 방법은 가버젯 유사도에 기반하는데 이는 초기점에 민감하다. 잘못된 특징점 검출은 얼굴 인식에 영향을 미친다. AAM은 얼굴 특징점 검출에 효과적인 것으로 알려져 있다. 본 논문에서는 AAM으로 얼굴 특징점들을 대략적으로 추정하고 추정된 특징점들을 초기점으로 하여 가버젯 유사도 기반 특징점 검출방법으로 특징점 검출을 정교화하는 얼굴 특징점 검출 방법과 이에 기반한 얼굴 인식 시스템을 제안한다. 실험을 통해 제안된 특징점 검출 방법을 사용한 얼굴 인식 시스템이 EBGM과 같이 기존 가버젯 유사도만의 얼굴 특징점 검출을 이용한 얼굴 인식 시스템보다 더 나은 성능 개선을 보임을 실험을 통해 확인하였다.

규칙 기반 특성 모델 검증 도구 (Rule-based Feature Model Validation Tool)

  • 최승훈
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.105-113
    • /
    • 2009
  • 특성 모델(Feature Model)은 소프트웨어 제품 라인 개발 시 도메인 공학 단계에서 제품들 사이의 공통점과 차이점을 모델링하는데 널리 사용된다. 특성 모델의 오류 또는 불일치성에 대한 발견 및 수정은 성공적인 소프트웨어 제품 라인 공학을 위해서 필수적이다. 특성 모델의 검증을 효과적으로 수행하기 위해서는 자동화된 도구의 도움이 필요하다. 본 논문에서는 JESS 규칙 기반 시스템을 이용하여 특성 모델의 유효성을 검증하는 기법을 기술하고 이를 이용한 특성 모델 검증 도구를 제안한다. 본 논문의 도구는 특성 모델링 작업 시 실시간으로 특성 모델을 검증하여 오류의 존재 여부와 오류의 원인에 대한 설명을 제공함으로써 오류 없는 특성 모델을 생성할 수 있도록 해 준다. 특성 모델 검증 기법에 규칙 기반 시스템을 이용한 경우는 본 논문이 최초의 시도로 사료된다.

  • PDF

JESS 규칙 기반 시스템을 이용한 특성 구성 검증 (Feature Configuration Verification Using JESS Rule-based System)

  • 최승훈
    • 인터넷정보학회논문지
    • /
    • 제8권6호
    • /
    • pp.135-144
    • /
    • 2007
  • 특성 모델(Feature Model)은 소프트웨어 제품 라인 개발 시 도메인 공학 단계에서 제품들 사이의 공통된 개념들과 서로 다른 개념들을 모델링하는데 널리 사용된다. 특성 모델로부터 특정 제품에 포함될 특성들을 선택한 결과를 특성 구성(Feature Configuration)이라고 하며, 이것은 특정 제품에 대한 요구 사항을 나타낸다. 현재 소프트웨어 제품 라인 개발 시 특성 모델과 특성 구성을 어떻게 구축하고 이용하는지에 대한 연구는 많이 되어 있지만, 이들에 대한 정형적 시맨틱과 논리적 추론에 대한 연구는 부족하다. 본 논문에서는 소프트웨어 제품 라인 공학에서의 표준 문제로 제안된 Graph Product Line을 예제로 하여 규칙 기반 시스템인 JESS를 이용한 특성 구성 검증 기법을 제안한다. 본 논문의 기법은 특성 구성의 불일치성을 일으키는 원인을 명확히 제시하는 장점을 가지며, 자바 언어와의 결합성이 뛰어난 JESS 시스템에 기반을 두었기 때문에 다른 소프트웨어 제품 라인 개발 환경과 쉽게 통합될 수 있다.

  • PDF

특성 지향의 제품계열분석 모델의 정형적 정의와 일관성 분석 (Formal Definition and Consistency Analysis of Feature-Oriented Product Line Analysis Model)

  • 이관우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권2호
    • /
    • pp.119-127
    • /
    • 2005
  • 제품계열분석(product line analysis)은 제품계열자산(product line asset)을 개발하기에 앞서, 제품계열 내에 속한 제품들의 다양한 요구사항과 이들 간의 관계 및 제약사항을 분석하는 활동을 말한다. 지금까지 특성모델링(feature modeling)이라 불리는 특성 지향의 공통성과 가변성 분석은 제품계열분석의 핵심적인 부분으로 간주되어 왔다. 비록 공통성과 가변성 분석이 제품계열분석의 핵심적인 요소이지만, 이것만으로는 재사용가능하고 적응성이 뛰어난 제품계열자산(예, 아키텍처와 컴포넌트) 개발에 한계가 있다. 특성간의 의존성 및 특성결합시간도 제품계열자산 개발에 중대한 영향을 미치는 요소이다. 따라서 본 논문에서는 기존에 공통성과 가변성 관점에서 제품계열을 분석한 결과인 특성모델(feature model)을 세 가지의 특성 측면(즉, 제품특성의 공통성과 가변성, 특성간의 의존성, 그리고 특성결합시간)으로 확장한 특성지향의 제품계열분석 모델을 제안한다. 특히, 세 가지 측면의 일관성을 검증하기 위해서, 특성 지향의 제품계열분석 모델을 정형적으로 정의하고, 모델의 일관성을 검사하는 규칙을 제공한다.

Feature-Based Image Retrieval using SOM-Based R*-Tree

  • Shin, Min-Hwa;Kwon, Chang-Hee;Bae, Sang-Hyun
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.223-230
    • /
    • 2003
  • Feature-based similarity retrieval has become an important research issue in multimedia database systems. The features of multimedia data are useful for discriminating between multimedia objects (e 'g', documents, images, video, music score, etc.). For example, images are represented by their color histograms, texture vectors, and shape descriptors, and are usually high-dimensional data. The performance of conventional multidimensional data structures(e'g', R- Tree family, K-D-B tree, grid file, TV-tree) tends to deteriorate as the number of dimensions of feature vectors increases. The R*-tree is the most successful variant of the R-tree. In this paper, we propose a SOM-based R*-tree as a new indexing method for high-dimensional feature vectors.The SOM-based R*-tree combines SOM and R*-tree to achieve search performance more scalable to high dimensionalities. Self-Organizing Maps (SOMs) provide mapping from high-dimensional feature vectors onto a two dimensional space. The mapping preserves the topology of the feature vectors. The map is called a topological of the feature map, and preserves the mutual relationship (similarity) in the feature spaces of input data, clustering mutually similar feature vectors in neighboring nodes. Each node of the topological feature map holds a codebook vector. A best-matching-image-list. (BMIL) holds similar images that are closest to each codebook vector. In a topological feature map, there are empty nodes in which no image is classified. When we build an R*-tree, we use codebook vectors of topological feature map which eliminates the empty nodes that cause unnecessary disk access and degrade retrieval performance. We experimentally compare the retrieval time cost of a SOM-based R*-tree with that of an SOM and an R*-tree using color feature vectors extracted from 40, 000 images. The result show that the SOM-based R*-tree outperforms both the SOM and R*-tree due to the reduction of the number of nodes required to build R*-tree and retrieval time cost.

  • PDF

제품라인 공학을 위한 휘처 기반의 제품 구성 방법 (A Feature-based Product Configuration Method for Product Line Engineering)

  • 배성진;강교철
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제26권2호
    • /
    • pp.31-44
    • /
    • 2013
  • 소프트웨어 제품라인공학은 재사용성에 초점을 맞추어 소프트웨어의 높은 품질과 생산성을 만족시킬 수 있는 방법으로 제안되었다. 소프트웨어 제품라인에서 제품 구성 방법은 휘처모델로부터 주어진 제품을 위해 가장 최선의 휘처와 휘처속성을 선택해 나가는 프로세스이다. 성공적인 제품 개발을 위해서는 제품의 목표를 달성할 수 있는 휘처와 휘처 속성을 선택하는 것이 중요하다. 하지만 수천개의 휘처와 휘처 속성이 존재하는 경우에는 최적의 제품 구성을 하는 것이 매우 어렵다. 그렇기에 본 연구에서는 휘처와 휘처 속성간의 관계를 기반으로 제품의 목표를 달성하게 하는 휘처와 휘처 속성의 구성 조합을 찾는 휘처 구성 방법을 제안하여, 보다 정확한 제품의 목표 달성에 기여하는 휘처 구성이 될 수 있도록 한다.

  • PDF

RFA: Recursive Feature Addition Algorithm for Machine Learning-Based Malware Classification

  • Byeon, Ji-Yun;Kim, Dae-Ho;Kim, Hee-Chul;Choi, Sang-Yong
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권2호
    • /
    • pp.61-68
    • /
    • 2021
  • 최근 악성코드와 정상 바이너리를 분류하기 위해 기계학습을 이용하는 기술이 다양하게 연구되고 있다. 효과적인 기계학습을 위해서는 악성코드와 정상 바이너리를 식별하기 위한 Feature를 잘 추출하는 것이 무엇보다 중요하다. 본 논문에서는 재귀적인 방법을 이용하여 기계학습에 활용하기 위한 Feature 추출 방법인 RFA(Recursive Feature Addition) 제안한다. 제안하는 방법은 기계학습의 성능을 극대화 하기 위해 개별 Feature를 대상으로 재귀적인 방법을 사용하여 최종 Feature Set을 선정한다. 세부적으로는 매 단계마다 개별 Feature 중 최고성능을 내는 Feature를 추출하여, 추출한 Feature를 결합하는 방법을 사용한다. 제안하는 방법을 활용하여 Decision tree, SVM, Random forest, KNN등의 기계학습 알고리즘에 적용한 결과 단계가 지속될수록 기계학습의 성능이 향상되는 것을 검증하였다.

Feature Selection Algorithm for Intrusions Detection System using Sequential Forward Search and Random Forest Classifier

  • Lee, Jinlee;Park, Dooho;Lee, Changhoon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.5132-5148
    • /
    • 2017
  • Cyber attacks are evolving commensurate with recent developments in information security technology. Intrusion detection systems collect various types of data from computers and networks to detect security threats and analyze the attack information. The large amount of data examined make the large number of computations and low detection rates problematic. Feature selection is expected to improve the classification performance and provide faster and more cost-effective results. Despite the various feature selection studies conducted for intrusion detection systems, it is difficult to automate feature selection because it is based on the knowledge of security experts. This paper proposes a feature selection technique to overcome the performance problems of intrusion detection systems. Focusing on feature selection, the first phase of the proposed system aims at constructing a feature subset using a sequential forward floating search (SFFS) to downsize the dimension of the variables. The second phase constructs a classification model with the selected feature subset using a random forest classifier (RFC) and evaluates the classification accuracy. Experiments were conducted with the NSL-KDD dataset using SFFS-RF, and the results indicated that feature selection techniques are a necessary preprocessing step to improve the overall system performance in systems that handle large datasets. They also verified that SFFS-RF could be used for data classification. In conclusion, SFFS-RF could be the key to improving the classification model performance in machine learning.