• Title/Summary/Keyword: 특징선택

검색결과 2,047건 처리시간 0.028초

유전적 특징선택에 관한 연구 (A Study on Genetic Feature Selection)

  • 한명묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.292-293
    • /
    • 2008
  • 많은 분야에서 최적의 기준을 바탕으로 특징들의 부분집합을 선택하는 문제들이 핵심 요소로 작용하고 있다. 다양한 특징들의 부분집합 중에서 가능한 한 가장 성능이 우수한 특징들의 부분집합을 선택하기 위해서는 특징선택 방법이 알고리즘과 적용분야들을 고려해야한다. 이 논문에서는 특징선택을 위해서 서로 다른 두 종류의 최적화 문제를 탐색하는 방법을 제안하고, 그 결과를 실험으로 보여준다.

  • PDF

IoT 기반의 특징 선택 기법 연구 동향 (IoT-based Feature Selection Technique Research Trend)

  • 임환희;이태호;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.41-42
    • /
    • 2018
  • 특징 선택이란, 기계학습에서 분류 정확도를 향상시키기 위해서 많은 특징들을 분석해 가장 좋은 성능을 나타낼 수 있게끔 특징의 부분집합을 찾아내는 방법이다. 특징 선택 연구는 수십만개의 변수가 있는 데이터 세트를 이용하는 응용분야에서 주로 연구된다. 이러한 응용 분야는 주로 텍스트 처리, 유전자 배열 분석과 같은 고차원 데이터를 분석하는 분야이다. 또한, IoT 환경은 많은 데이터를 처리하기 때문에, 데이터 분류나 데이터의 가공을 위해서는 특징 선택 기법이 필수적이다. 본 논문에서는 특징 선택 기법에 대해 설명하고, IoT 환경에서 특징 선택 기법을 제안한다.

  • PDF

KNHNAES (2013~2015) 에 기반한 대형 특징 공간 데이터집 혼합형 효율적인 특징 선택 모델 (A Hybrid Efficient Feature Selection Model for High Dimensional Data Set based on KNHNAES (2013~2015))

  • 권태일;이정곤;박현우;류광선;김의탁;박명호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.739-747
    • /
    • 2018
  • 고차원 데이터에서는 데이터마이닝 기법 중에서 특징 선택은 매우 중요한 과정이 되었다. 그러나 전통적인 단일 특징 선택방법은 더 이상 효율적인 특징선택 기법으로 적합하지 않을 수 있다. 본 논문에서 우리는 고차원 데이터에 대한 효율적인 특징선택을 위하여 혼합형 특징선택 기법을 제안하였다. 본 논문에서는 KNHANES 데이터에 제안한 혼합형 특징선택기법을 적용하여 분류한 결과 기존의 분류기법을 적용한 모델보다 5% 이상의 정확도가 향상되었다.

유전 알고리즘을 이용한 특징 결합과 선택 (Feature Combination and Selection Using Genetic Algorithm for Character Recognition)

  • 이진선
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.152-158
    • /
    • 2005
  • 문자 패턴에서 추출한 서로 다른 특징 집합을 결합함으로써 문자 인식 시스템의 성능을 향상시킬 수 있다. 이때 결합된 특징 벡터의 차원을 줄이기 위해 특징 선택을 수행해야 한다. 이 논문은 문자 인식 문제에서 특징 결합과 선택을 위한 일반적인 틀을 제시한다. 또한 필기 숫자 인식을 위한 설계와 구현을 제시한다. 이 설계에서는 필기 숫자 패턴에서 DDD 특징 집합과 AGD 특징 집합을 추출하며 특징 선택을 위해 유전 알고리즘을 사용한다. 실험 결과 CENPARMI 필기 숫자 데이터베이스에 대해 0.7%의 정확률 향상을 얻었다.

  • PDF

의미 기반 유전 알고리즘을 사용한 특징 선택 (Semantic-based Genetic Algorithm for Feature Selection)

  • 김정호;인주호;채수환
    • 인터넷정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.1-10
    • /
    • 2012
  • 본 논문은 문서 분류의 전처리 단계인 특징 선택을 위해 의미를 고려한 최적의 특징 선택 방법을 제안한다. 특징 선택은 불필요한 특징을 제거하고 분류에 필요한 특징을 추출하는 작업으로 분류 작업에서 매우 중요한 역할을 한다. 특징 선택 기법으로 특징의 의미를 파악하여 특징을 선택하는 LSA(Latent Semantic Analysis) 기법을 사용하지만 기본 LSA는 분류 작업에 특성화 된 기법이 아니므로 지도적 학습을 통해 분류에 적합하도록 개선된 지도적 LSA를 사용한다. 지도적 LSA를 통해 선택된 특징들로부터 최적화 기법인 유전 알고리즘을 사용하여 더 최적의 특징들을 추출한다. 마지막으로, 추출한 특징들로 분류할 문서를 표현하고 SVM (Support Vector Machine)을 이용한 특정 분류기를 사용하여 분류를 수행하였다. 지도적 LSA를 통해 의미를 고려하고 유전 알고리즘을 통해 최적의 특징 집합을 찾음으로써 높은 분류 성능과 효율성을 보일 것이라 가정하였다. 인터넷 뉴스 기사를 대상으로 분류 실험을 수행한 결과 적은 수의 특징들로 높은 분류 성능을 확인할 수 있었다.

효율적인 문서 분류를 위한 혼합 특징 집합과 하이브리드 특징 선택 기법 (Combined Feature Set and Hybrid Feature Selection Method for Effective Document Classification)

  • 인주호;김정호;채수환
    • 인터넷정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.49-57
    • /
    • 2013
  • 본 연구에서는 효율적인 온 라인 문서 자동 분류를 위해 매우 중요한 분류 작업의 전처리 단계인 특징선택을 위한 새로운 방법이 제안된다. 대부분의 기존 특징선택 방법 연구에서는 특징 집합의 모집단이 단일 모집단으로써 한 모집단이 가지는 정보만으로 분류에 적합한 특징들을 선택하여 특징 집합을 구성하였다. 본 연구에서는 단일 모집단에 한하여 수행되는 특징선택 뿐 만 아니라, 다중 모집단을 가지는 혼합 특징 집합에 대해서 특징선택을 함으로써 다양한 정보를 바탕으로 한 특징 집합을 구성하였다. 혼합 특징 집합은 두 종류의 특징 집합으로 구성된다. 즉 각각 문서로부터 추출한 단어로 구성된 원본 특징 집합과 원본 특징 집합으로부터 LSA를 이용하여 새로 생성한 변형 특징 집합이다. 혼합 특징 집합으로부터 필터 방법과 래퍼 방법을 이용한 하이브리드 방식의 특징 선택을 통해 최적의 특징 집합을 찾고, 이를 이용하여 문서 분류 실험을 수행하였다. 다양한 모집단의 특징들의 정보를 모두 고려함으로써 보다 향상된 분류 성능을 보일 것이라고 기대하였고, 인터넷 뉴스 기사를 대상으로 분류 실험한 결과 90% 이상의 향상된 분류성능을 확인하였다. 특히, 재현율과 정밀도 모두 90%이상의 성능을 보였으며, 둘 사이의 편차가 낮은 것을 확인하였다.

특징 선택 방법들의 성능 비교 분석에 대한 연구 (An Experimental Study on Feature Subset Selection Methods)

  • 윤철민;양지훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.439-442
    • /
    • 2007
  • 패턴 인식의 성능 향상을 위해 효율적인 특징 선택을 해주는 것은 중요한 과정 중 하나이다. 본 연구에서는 최근에 제시되었던 특징 선택 방법들 중 대표적인 4 가지의 방법을 선택하여 성능을 비교 분석하였다. 데이터의 특징을 줄여주는 기능과 적은 수의 특징으로 더 좋은 패턴 인식 성능을 보여주는 기능의 수행 능력을 중심으로 평가하였으며, 각기 다른 형태의 데이터에 대해 각 방법들이 보이는 성능도 관찰하였다. 이를 토대로 각 방법의 장단점과 특징에 대해 생각해 본다.

실시간 침입탐지 시스템을 위한 새로운 특징랭킹과 특징선택 프레임워크에 대한 연구 (A new feature ranking and feature selection framework for realtime IDS)

  • 이상재;김세헌
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.514-518
    • /
    • 2008
  • 인터넷의 보급에 따라 네트워크를 통한 공격에 피해가 급증하고 있다. 이러한 네트워크 침해를 막기위해 여러 연구자들은 침입탐지 시스템(IDS)을 제안하였으나, 시스템의 탐지율에만 초점을 맞추고 있기 때문에 실시간(Realtime)으로 동작하지 못하고 있다. 실시간 IDS를 위하여 최근 다양한 특징선택(Feature selection)들이 제안되고 있다. 본1) 논문에서는 특징들을 중요도의 순위를 정하는 새로운 랭킹 방법과 이 방법에 따라서 특징을 선택하는 특징 선택 알고리즘을 제안한다. 또한 제안된 알고리즘을 통하여 선택된 특징을 사용할 경우 탐지결과가 우수함을 실험으로 보여주고 있다.

  • PDF

문서 분류에서 단어의 통계 정보를 이용한 특징 선택 기법의 비교 (Comparison of Feature Selection Methods using the Statistics of Words in Text Categorization)

  • 임윤택;윤충화
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 1999년도 추계학술대회
    • /
    • pp.209-216
    • /
    • 1999
  • 정보 검색 분야의 문서 분류에 기계 학습 기법을 적용할 때 발생하는 가장 큰 문제는 문서를 패턴으로 표현할 때, 하나의 패턴이 가지는 특징의 수가 기계 학습 기법에서 처리할 수 있는 범위를 넘어서는 것이다. 이러한 문제를 해결하기 위하여 특징 선택 기법은 패턴을 구성하고 있는 특징 중에서 실제 문서 분류에 많은 영향을 주는 특징만을 선택하여, 기계 학습 기법에서 쉽게 처리할 수 있을 정도의 패턴을 구성하게 한다. 본 논문에서는 이러한 특징 선택 기법 중에서 IG(Information Gain), Gini index, Relief-F, DF(Document Frequency)를 비교하였다. 실험 결과 문서들에 포함된 모든 고유 단어를 특징의 길이로 하여 패턴을 구성했을 때보다 특징 선택 기법을 적용하여 고유 단어 중 일부를 특징으로 패턴을 구성할 때 기계학습에서 더 향상된 분류 성능을 보였다

  • PDF

거리 기반의 특징 선택을 이용한 간질 분류 (Classification of Epilepsy Using Distance-Based Feature Selection)

  • 이상홍
    • 디지털융복합연구
    • /
    • 제12권8호
    • /
    • pp.321-327
    • /
    • 2014
  • 특징 선택은 중복 또는 서로간의 관련이 없는 특징을 제거하여 분류 성능을 향상시키는 기술이다. 본 논문에서는 가중 퍼지소속함수 기반 신경망 (Neural Network with Weighted Fuzzy Membership Functions; NEWFM)에서 제공하는 가중 퍼지소속함수의 경계합 (Bounded Sum of Weighted Fuzzy Membership functions, BSWFM)의 무게중심간의 거리를 이용한 새로운 특징 선택을 제안하여 분류 성능을 향상시켰다. 이러한 거리 기반의 특징 선택을 이용하여 초기 24개의 특징으로부터 무게중심간의 거리가 짧은 특징을 하나씩 제거되면서 분류 성능이 가능 높은 22개의 최소 특징을 선택하였다. 이들 22개의 최소 특징을 NEWFM의 입력으로 사용하여 97.7%, 99.7%, 98.7%의 민감도, 특이도, 정확도를 각각 구하였다.