• 제목/요약/키워드: Feature Classification

검색결과 2,155건 처리시간 0.026초

단백체 스펙트럼 데이터의 분류를 위한 랜덤 포리스트 기반 특성 선택 알고리즘 (Feature Selection for Classification of Mass Spectrometric Proteomic Data Using Random Forest)

  • 온승엽;지승도;한미영
    • 한국시뮬레이션학회논문지
    • /
    • 제22권4호
    • /
    • pp.139-147
    • /
    • 2013
  • 본 논문에서는 질량 분석 방법에 의하여 산출된 단백체 데이터(mass spectrometric proteomic data)의 분류 분석(classification analysis)을 위한 새로운 특성 선택(feature selection) 방법을 제안한다. 이 방법은 i)높은 상관관계를 가지는 중복된 특성을 효과적으로 제거하는 전처리 단계와 ii)토너먼트(tournament) 전략을 사용하여 최적 특성 부분집합(optimal feature subset)을 탐색해 내는 단계로 구성되어 있다. 제안되는 방법을 실제 암진단에 사용되는 공개된 혈액 단백체 데이터에 적용하였으며 널리 사용되는 타 방법과 비교할 때 우수한 성능과 균형된 특이도와 민감도를 달성함을 실증하였다.

유전자 알고리즘과 정보이론을 이용한 속성선택 (Feature Selection by Genetic Algorithm and Information Theory)

  • 조재훈;이대종;송창규;김용삼;전명근
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.94-99
    • /
    • 2008
  • 속성선택 (Feature Selection)은 패턴분류 문제에서 분류기들의 성능을 향상시킬 수 있는 중요한 기법이다. 특히, 많은 속성들을 가지는 데이터의 분류문제에서 관련이 적은 데이터, 중복되거나 또는 노이즈 있는 데이터를 제거한 주요 속성부분집합을 선택하여 이용함으로써 분류기의 정확도를 향상시킬 수 있다. 본 논문에서는 유전자 알고리즘과 정보이론의 상호정보량을 이용하여 속성선택을 하는 기법을 제안하였다. 실험을 통하여 제안된 알고리즘이 패턴인식문제에서 다른 방법들보다 성능이 우수함을 보였다.

신경망을 이용한 필기 숫자 인식에서 부류 분별에 기반한 특징 선택 (Feature Selection Based on Class Separation in Handwritten Numeral Recognition Using Neural Network)

  • 이진선
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.543-551
    • /
    • 1999
  • 본 논문의 목적은 필기 숫자 인식에서 특징의 부류 분별력을 분석하고, 이를 특징 선택에 활용하는 것이다. 부류 분별력을 측정하기 위하여 Parzen 윈도우를 이용하여 부류 분포를 추정하였고, 서로 다른 부류의 부류 분포간의 거리를 부류 분별로 정의하였다. 이렇게 계산된 부류 분별을 이용하여, 특징 벡터에서 쓸모 없거나 중복성을 갖는 특징을 제거하여 특징 벡터의 차원을 줄인다. 실험은 CENPARMI 필기 숫자에 대해 수행하였으며 10개 부류 전체 뿐 아니라 2개 부류에 대해서도 수행하였다. 실험 결과 10-부류 필기 숫자 인식에서 256-차원 원래 특징 벡터를 인식률 손실 없이 22% 줄일 수 있어, 부류 분별이 특징 선택을 위한 유용한 도구임을 보였다.

  • PDF

가중치 특징 벡터를 이용한 질감 영상 인식 방법 (Texture Classification by a Fusion of Weighted Feature)

  • 정수연;곽동민;윤옥경;박길흠
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.407-410
    • /
    • 2001
  • 최근 영상 검색(retrieval)과 분류(classification)에서 질감 특징(texture feature)을 이용한 연구들이 활발하게 진행되고 있다. 본 논문에서는 효율적인 질감 특징 추출을 위해 명암도 상호발생 행렬법(gray level co-occurrence matrix)과 웨이블릿 변환(wavelet transform)을 이용하여 질감의 특징을 추출한 후 특징의 중요도에 따라서 가중치를 부여하는 방법을 제안한다. 이렇게 추출된 가중치 대표 벡터들을 기반으로 베이시안 분류기(Bayesian classifier)를 통해 임의의 질감을 인식하였다.

  • PDF

선형 예측 계수의 인식에 의한 고저항 지락사고 유형의 분류 (Classification of High Impedance Fault Patterns by Recognition of Linear Prediction coefficients)

  • 이호섭;공성곤
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1996년도 하계학술대회 논문집 B
    • /
    • pp.1353-1355
    • /
    • 1996
  • This paper presents classification of high impedance fault pattern using linear prediction coefficients. A feature of neutral phase current is extracted by the linear predictive coding. This feature is classified into faults by a multilayer perceptron neural network. Neural network successfully classifies test data into three faults and one normal state.

  • PDF

SVM 기반 유전 알고리즘을 이용한 컴파일러 분석 프레임워크 : 특징 및 모델 선택 민감성 (Compiler Analysis Framework Using SVM-Based Genetic Algorithm : Feature and Model Selection Sensitivity)

  • 황철훈;신건윤;김동욱;한명묵
    • 정보보호학회논문지
    • /
    • 제30권4호
    • /
    • pp.537-544
    • /
    • 2020
  • 악성코드 기술 발전으로 변이, 난독화 등의 탐지 회피 방법이 고도화되고 있다. 이에 악성코드 탐지 기술에 있어 알려지지 않은 악성코드 탐지 기술이 중요하며, 배포된 악성코드를 통해 저자를 식별하여 알려지지 않은 악성코드를 탐지하는 악성코드 저자 식별 방법이 연구되고 있다. 본 논문에서는 바이너리 기반 저자 식별 방법에 대해 중요 정보인 컴파일러 정보를 추출하고자 하였으며, 연구 간에 특징 선택, 확률 및 비확률 모델, 최적화가 분류 효율성에 미치는 민감성(Sensitive)을 확인하고자 하였다. 실험에서 정보 이득을 통한 특징 선택 방법과 비확률 모델인 서포트 벡터 머신이 높은 효율성을 보였다. 최적화 연구 간에 제안하는 프레임워크를 통한 특징 선택 및 모델 최적화를 통해 높은 분류 정확도를 얻었으며, 최대 48%의 특징 감소 및 51배가량의 빠른 실행 속도라는 결과를 보였다. 본 연구를 통해 특징 선택 및 모델 최적화 방법이 분류 효율성에 미치는 민감성에 대해 확인할 수 있었다.

패턴 분류 문제에서 가중치를 고려한 퍼지 최대-최소 신경망 (A Weighted Fuzzy Min-Max Neural Network for Pattern Classification)

  • 김호준;박현정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.692-702
    • /
    • 2006
  • 본 연구에서는 패턴 분류문제를 위하여 가중치 개념을 갖는 퍼지 최대 최소 신경망 모델을 제안한다. 제안된 모델은 기존의 FMM 신경망 모델에 대하여 학습데이타에 포함되는 특징값의 빈도요소를 효과적으로 반영할 수 있도록 수정한 구조를 갖는다. 본 논문에서는 제안된 모델에 대하여 하이퍼박스 소속함수로 정의되는 새로운 활성화 특성과 학습알고리즘을 정의한다. 학습알고리즘은 하이퍼박스 생성 및 확장, 중첩 테스트, 하이퍼박스 축소의 3 단계 과정으로 이루어지며, 각 과정에서 특정값의 빈도요소를 고려하여 가중치값을 갱신하는 규칙이 새롭게 정의된다. 본 연구에서는 또한 제안된 모텔의 응용으로서 특정분석 기법을 제안한다. 이를 위하여 특정값, 특정유형, 하이퍼박스, 패턴클래스 상호간 연관도 요소를 4 가지 유형의 척도로 정의하여, 주어진 패턴분류 문제에서 각 특정의 상대적 중요도를 평가할 수 있도록 한다. 아이리스 데이타와 클리블랜드 의료데이타에 대한 분류문제에 적용한 실험결과를 통하여 제안된 방법의 타당성을 고찰하였다.

망 분리를 이용한 딥러닝 학습시간 단축에 대한 연구 (A Study on Reducing Learning Time of Deep-Learning using Network Separation)

  • 이희열;이승호
    • 전기전자학회논문지
    • /
    • 제25권2호
    • /
    • pp.273-279
    • /
    • 2021
  • 본 논문에서는 딥러닝 구조를 분할을 이용한 개별 학습을 수행하여 학습시간을 단축하는 알고리즘을 제안한다. 제안하는 알고리즘은 망 분류 기점 설정 과정, 특징 벡터 추출 과정, 특징 노이즈 제거 과정, 클래스 분류 과정 등의 4가지 과정으로 구성된다. 첫 번째로 망 분류 기점 설정 과정에서는 효과적인 특징 벡터 추출을 위한 망 구조의 분할 기점을 설정한다. 두 번째로 특징 벡터 추출 과정에서는 기존에 학습한 가중치를 사용하여 추가 학습 없이 특징 벡터를 추출한다. 세 번째로 특징 노이즈 제거 과정에서는 추출된 특징 벡터를 입력받아 각 클래스의 출력값을 학습하여 데이터의 노이즈를 제거한다. 네 번째로 클래스 분류 과정에서는 노이즈가 제거된 특징 벡터를 입력받아 다층 퍼셉트론 구조에 입력하고 이를 출력하고 학습한다. 제안된 알고리즘의 성능을 평가하기 위하여 Extended Yale B 얼굴 데이터베이스를 사용하여 실험 하였다. 실험 결과, 1회 학습에 소요되는 시간의 경우 제안하는 알고리즘이 기존 알고리즘 기준 40.7% 단축하였다. 또한 목표 인식률까지 학습 횟수가 기존 알고리즘과 비교하여 단축하였다. 실험결과를 통해 1회 학습시간과 전체 학습시간을 감소시켜 기존의 알고리즘보다 향상됨을 확인하였다.

강인한 음성인식을 위한 켑스트럼 거리와 로그 에너지 기반 묵음 특징 정규화 (Cepstral Distance and Log-Energy Based Silence Feature Normalization for Robust Speech Recognition)

  • 신광호;정현열
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.278-285
    • /
    • 2010
  • 훈련 환경과 인식 환경의 차이가 음성인식 성능저하의 주요요인이다. 이러한 환경의 불일치를 줄이기 위한 방법으로 다양한 묵음특징 정규화 방법이 제안되고 있다. 기존의 묵음특징 정규화 방법은 낮은 SNR (Signal-to-Noise Ratio)에서 묵음구간의 에너지 레벨이 증가하여 음성/묵음 분류의 정확도가 떨어짐으로 인해 인식성능이 저하되는 문제점이 있었다. 본 논문에서는 로그 에너지와 음성/묵음(또는잡음)의 켑스트럼 특징의 분포 특성의 차이를 나타내는 켑스트럼 유클리디언(Euclidean) 거리를 결합하여 음성/묵음을 분류하는 묵음특징 정규화 방법 (Cepstral distance and Log-energy based Silence Feature Normalization)을 제안하였다. 제안한 방법은 높은 SNR에서는 로그 에너지 특징이 잡음의 영향을 적게 받는 특성을 반영하여 기존의 묵음 특징 정규화 (Silence Feature Normalization)방법의 우수성을 그대로 유지하는 반면, 낮은 SNR에서는 로그 에너지 대신 음성/묵음 분류의 분별력이 우수한 켑스트럼 거리 정보를 이용함으로써 인식성능을 향상시킬 수 있다. 인식실험결과 기존의 SFN-I/II, CSFN 방법에 비해 전반적으로 향상된 인식성능을 얻을 수 있어 그 유효성을 확인할 수 있었다.