• 제목/요약/키워드: 특징 집합 선택

검색결과 112건 처리시간 0.026초

효율적인 문서 분류를 위한 혼합 특징 집합과 하이브리드 특징 선택 기법 (Combined Feature Set and Hybrid Feature Selection Method for Effective Document Classification)

  • 인주호;김정호;채수환
    • 인터넷정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.49-57
    • /
    • 2013
  • 본 연구에서는 효율적인 온 라인 문서 자동 분류를 위해 매우 중요한 분류 작업의 전처리 단계인 특징선택을 위한 새로운 방법이 제안된다. 대부분의 기존 특징선택 방법 연구에서는 특징 집합의 모집단이 단일 모집단으로써 한 모집단이 가지는 정보만으로 분류에 적합한 특징들을 선택하여 특징 집합을 구성하였다. 본 연구에서는 단일 모집단에 한하여 수행되는 특징선택 뿐 만 아니라, 다중 모집단을 가지는 혼합 특징 집합에 대해서 특징선택을 함으로써 다양한 정보를 바탕으로 한 특징 집합을 구성하였다. 혼합 특징 집합은 두 종류의 특징 집합으로 구성된다. 즉 각각 문서로부터 추출한 단어로 구성된 원본 특징 집합과 원본 특징 집합으로부터 LSA를 이용하여 새로 생성한 변형 특징 집합이다. 혼합 특징 집합으로부터 필터 방법과 래퍼 방법을 이용한 하이브리드 방식의 특징 선택을 통해 최적의 특징 집합을 찾고, 이를 이용하여 문서 분류 실험을 수행하였다. 다양한 모집단의 특징들의 정보를 모두 고려함으로써 보다 향상된 분류 성능을 보일 것이라고 기대하였고, 인터넷 뉴스 기사를 대상으로 분류 실험한 결과 90% 이상의 향상된 분류성능을 확인하였다. 특히, 재현율과 정밀도 모두 90%이상의 성능을 보였으며, 둘 사이의 편차가 낮은 것을 확인하였다.

유전적 특징선택에 관한 연구 (A Study on Genetic Feature Selection)

  • 한명묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.292-293
    • /
    • 2008
  • 많은 분야에서 최적의 기준을 바탕으로 특징들의 부분집합을 선택하는 문제들이 핵심 요소로 작용하고 있다. 다양한 특징들의 부분집합 중에서 가능한 한 가장 성능이 우수한 특징들의 부분집합을 선택하기 위해서는 특징선택 방법이 알고리즘과 적용분야들을 고려해야한다. 이 논문에서는 특징선택을 위해서 서로 다른 두 종류의 최적화 문제를 탐색하는 방법을 제안하고, 그 결과를 실험으로 보여준다.

  • PDF

유전 알고리즘을 이용한 특징 결합과 선택 (Feature Combination and Selection Using Genetic Algorithm for Character Recognition)

  • 이진선
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.152-158
    • /
    • 2005
  • 문자 패턴에서 추출한 서로 다른 특징 집합을 결합함으로써 문자 인식 시스템의 성능을 향상시킬 수 있다. 이때 결합된 특징 벡터의 차원을 줄이기 위해 특징 선택을 수행해야 한다. 이 논문은 문자 인식 문제에서 특징 결합과 선택을 위한 일반적인 틀을 제시한다. 또한 필기 숫자 인식을 위한 설계와 구현을 제시한다. 이 설계에서는 필기 숫자 패턴에서 DDD 특징 집합과 AGD 특징 집합을 추출하며 특징 선택을 위해 유전 알고리즘을 사용한다. 실험 결과 CENPARMI 필기 숫자 데이터베이스에 대해 0.7%의 정확률 향상을 얻었다.

  • PDF

엔트로피를 기반으로 한 특징 집합 선택 알고리즘 (Feature Subset Selection Algorithm based on Entropy)

  • 홍석미;안종일;정태충
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.87-94
    • /
    • 2004
  • 특징 집합 선택은 학습 알고리즘의 전처리 과정으로 사용되기도 한다. 수집된 자료가 문제와 관련이 없다거나 중복된 정보를 갖고 있는 경우, 이를 학습 모델생성 이전에 제거함으로써 학습의 성능을 향상시킬 수 있다. 또한 탐색 공간을 감소시킬 수 있으며 저장 공간도 줄일 수 있다. 본 논문에서는 특징 집합의 추출과 추출된 특징 집합의 성능 평가를 위하여 엔트로피를 기반으로 한 휴리스틱 함수를 사용하는 새로운 특징 선택 알고리즘을 제안하였다. 탐색 방법으로는 ACS 알고리즘을 이용하였다. 그 결과 학습에 사용될 특징의 차원을 감소시킴으로써 학습 모델의 크기와 불필요한 계산 시간을 감소시킬 수 있었다.

특징형상 모델링 연혁을 바탕으로 한 선택적 집합 연산 (Selective Set Operations based on Feature Modeling History)

  • 이상헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.280-281
    • /
    • 2011
  • 특징형상기반 다중해상도 모델링 기법은 컴퓨터 그래픽스의 응용분야인 컴퓨터 응용 설계, 해석, 가상생산과 같은 분야에 주목을 받고 있는 새로운 기술이다. 다중해상도 모델을 제공하기 위하여 특징형상을 재배열할 필요가 있는데 이 경우 빼기 더하기 집합연산의 순서가 달라지면 최종형상이 달라질 수 있다. 이러한 문제를 해결하기 위하여 특징형상 모델링 연혁을 고려한 선택적 집합 연산을 개발하였다. 이 작업을 적용하면 최종형상뿐만 아니라 합리저긴 중간단계의 다중해상도 모델도 생성할 수 있다.

Neighborhood 러프집합 모델을 활용한 유방 종양의 진단적 특징 선택 (A Diagnostic Feature Subset Selection of Breast Tumor Based on Neighborhood Rough Set Model)

  • 손창식;최락현;강원석;이종하
    • 한국산업정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.13-21
    • /
    • 2016
  • 특징선택은 데이터 마이닝, 기계학습 분야에서 가장 중요한 이슈 중 하나로, 원본 데이터에서 가장 좋은 분류 성능을 보여줄 수 있는 특징들을 찾아내는 방법이다. 본 논문에서는 정보 입자성을 기반으로 한 neighborhood 러프집합 모델을 이용한 특징선택 방법을 제안한다. 제안된 방법의 효과성은 5,252명의 유방 초음파 영상으로부터 추출된 298가지의 특징들 중에서 유방 종양의 진단과 관련된 유용한 특징들을 선택하는 문제에 적용되었다. 실험결과 19가지의 진단적 특징을 찾을 수 있었고, 이때에 평균 분류 정확성은 97.6%를 보였다.

Rough 집합 이론을 이용한 원격 탐사 다중 분광 이미지 데이터의 특징 추출 (Features Extraction of Remote Sensed Multispectral Image Data Using Rough Sets Theory)

  • 원성현;정환묵
    • 한국지능시스템학회논문지
    • /
    • 제8권3호
    • /
    • pp.16-25
    • /
    • 1998
  • 본 논문에서는 초 다중 밴드 환경의 효과적인 데이터 분류를 위해서 Roungh 집합 이론을 이용한 특징 추출 방법을 제안한다. 다중 분광 이미지 데이터의 특성을 분석하고, 그 분석 결과를 토대로 Rough집합이론의 식별 능력을 이용하여 가장 효과적인 밴드를 선택할 수 있도록 한다. 실험으로는 Landsat TM으로부터 취득한 데이터에 적용시켰으며, 이를 통해 전통적인 밴드 특성에 의한 밴드 선택 방법과 본 논문에서 제안하는 러프 집합 이론을 이용한 밴드 선택 방법이 일치됨을 보이고 이를 통해 초다중 밴드 환경에서의 특징 추출에 대한 이론적 근거를 제시한다.

  • PDF

퍼지 최대-최소 신경망을 이용한 특징 집합 선택에 관한 연구 및 보행 단계인식에의 응용 (A Study on Feature selection based the Fuzzy Min-Max Neural Network and Application on Gait Phase recognition using EMG)

  • 이태엽;이상완;변증남
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.167-171
    • /
    • 2007
  • 본 논문은 패턴 분류 문제에 사용되는 퍼지 최대-최소 신경망 방법을 이용하여 특정 집합으로부터 새로운 특정 집합을 추출해내고 추출된 특정 집합으로부터 의미 있는 특정을 선택해 내는 새로운 방법을 제안한다. 퍼지 최대-최소 신경망은 패턴 분류를 위해 주로 사용이 되어 왔지만, 퍼지 최대-최소 신경망을 이용해 특정 집합의 값들을 패턴 공간내의 초상자의 집합으로 변환하고 변환된 초상자들끼리의 인접성을 척도로 단순한 연산을 통한 빠른 특정 집합을 선택하게 된다. 마지막으로 본 논문의 특정 집합 선택 방법을 하지 근전도 신호를 이용한 보행 패턴 분류에 적용해 보고, 그 결과를 기존 여러 특정 집합 선태 방법들과 비교해 봄으로써 제안한 방법의 타당성 및 적용 가능성을 알아본다.

  • PDF

간단한 특징에 기반한 얼굴 검출 (The Real-Time Face Detection based on Simple Feature)

  • 임옥현;이우주;이경일;이배호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.247-250
    • /
    • 2004
  • 본 논문에서는 간단한 사각형 특징과 계층적 분류기를 이용하여 실시간으로 얼굴을 검출하는 방법을 제안하고자 한다. 우리는 다섯 가지 형태의 기본적인 특징 모델을 바탕으로 20*20 크기의 훈련 영상에 적용하여 많은 초기 특징 집합을 구성하였다. AdaBoost(Adaptive Boosting) 알고리즘을 이용한 학습을 통하여 초기 특징 집합 중에서 얼굴 검출하는데 강인한 집합들만을 선택하였다. 제안된 알고리즘을 이용한 실제 실험에서 90% 이상의 높은 검출율을 확인하였고 초당 10프레임의 실시간 검출에도 성공하였다.

  • PDF

실시간 공격 탐지를 위한 Pearson 상관계수 기반 특징 집합 선택 방법 (A Feature Set Selection Approach Based on Pearson Correlation Coefficient for Real Time Attack Detection)

  • 강승호;정인선;임형석
    • 융합보안논문지
    • /
    • 제18권5_1호
    • /
    • pp.59-66
    • /
    • 2018
  • 기계학습을 이용하는 침입 탐지 시스템의 성능은 특징 집합의 구성과 크기에 크게 좌우된다. 탐지율과 같은 시스템의 탐지 정확도는 특징 집합의 구성에, 학습 및 탐지 시간은 특징 집합의 크기에 의존한다. 따라서 즉각적인 대응이 필수인 침입 탐지 시스템의 실시간 탐지가 가능하도록 하려면, 특징 집합은 크기가 작으면서도 적절한 특징들로 구성하여야 한다. 본 논문은 실시간 탐지를 위한 특징 집합 선택 문제를 해결하기 위해 사용했던 기존의 다목적 유전자 알고리즘에 특징 간의 Pearson 상관계수를 함께 사용하면 탐지율을 거의 낮추지 않으면서도 특징 집합의 크기를 줄일 수 있음을 보인다. 제안한 방법의 성능평가를 위해 NSL_KDD 데이터를 사용하여 10가지 공격 유형과 정상적인 트래픽을 구별하도록 인공신경망을 설계, 구현하여 실험한다.

  • PDF