• 제목/요약/키워드: Machine learning algorithm

검색결과 1,480건 처리시간 0.027초

정보 유사성 기반 입자화 중심 RBF NN의 진화론적 설계 (Genetic Design of Granular-oriented Radial Basis Function Neural Network Based on Information Proximity)

  • 박호성;오성권;김현기
    • 전기학회논문지
    • /
    • 제59권2호
    • /
    • pp.436-444
    • /
    • 2010
  • In this study, we introduce and discuss a concept of a granular-oriented radial basis function neural networks (GRBF NNs). In contrast to the typical architectures encountered in radial basis function neural networks(RBF NNs), our main objective is to develop a design strategy of GRBF NNs as follows : (a) The architecture of the network is fully reflective of the structure encountered in the training data which are granulated with the aid of clustering techniques. More specifically, the output space is granulated with use of K-Means clustering while the information granules in the multidimensional input space are formed by using a so-called context-based Fuzzy C-Means which takes into account the structure being already formed in the output space, (b) The innovative development facet of the network involves a dynamic reduction of dimensionality of the input space in which the information granules are formed in the subspace of the overall input space which is formed by selecting a suitable subset of input variables so that the this subspace retains the structure of the entire space. As this search is of combinatorial character, we use the technique of genetic optimization to determine the optimal input subspaces. A series of numeric studies exploiting some nonlinear process data and a dataset coming from the machine learning repository provide a detailed insight into the nature of the algorithm and its parameters as well as offer some comparative analysis.

상황에 민감한 베이지안 분류기를 이용한 얼굴 표정 기반의 감정 인식 (Emotion Recognition Based on Facial Expression by using Context-Sensitive Bayesian Classifier)

  • 김진옥
    • 정보처리학회논문지B
    • /
    • 제13B권7호
    • /
    • pp.653-662
    • /
    • 2006
  • 사용자의 상황에 따라 적절한 서비스를 제공하는 컴퓨팅 환경을 구현하려는 유비쿼터스 컴퓨팅에서 사람과 기계간의 효과적인 상호작용과 사용자의 상황 인식을 위해 사용자의 얼굴 표정 기반의 감정 인식이 HCI의 중요한 수단으로 이용되고 있다. 본 연구는 새로운 베이지안 분류기를 이용하여 상황에 민감한 얼굴 표정에서 기본 감정을 강건하게 인식하는 문제를 다룬다. 표정에 기반한 감정 인식은 두 단계로 나뉘는데 본 연구에서는 얼굴 특징 추출 단계는 색상 히스토그램 방법을 기반으로 하고 표정을 이용한 감정 분류 단계에서는 학습과 테스트를 효과적으로 실행하는 새로운 베이지안 학습 알고리즘인 EADF(Extended Assumed-Density Filtering)을 이용한다. 상황에 민감한 베이지안 학습 알고리즘은 사용자 상황이 달라지면 복잡도가 다른 분류기를 적용할 수 있어 더 정확한 감정 인식이 가능하도록 제안되었다. 실험 결과는 표정 분류 정확도가 91% 이상이며 상황이 드러나지 않게 얼굴 표정 데이터를 모델링한 결과 10.8%의 실험 오류율을 보였다.

머신러닝 기반 안드로이드 모바일 악성 앱의 최적 특징점 선정 및 모델링 방안 제안 (Modeling and Selecting Optimal Features for Machine Learning Based Detections of Android Malwares)

  • 이계웅;오승택;윤영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권11호
    • /
    • pp.427-432
    • /
    • 2019
  • 모바일 운영체제 중 안드로이드의 점유율이 높아지면서 모바일 악성코드 위협은 대부분 안드로이드에서 발생하고 있다. 그러나 정상앱이나 악성앱이 진화하면서 권한 등의 단일 특징점으로 악성여부를 연구하는 방법은 유효성 문제가 발생하여 다양한 특징점 추출 및 기계학습을 통해 이를 극복하고자 한다. 본 논문에서는 APK 파일에서 구동에 필요한 다섯 종류의 특징점들을 안드로가드라는 정적분석 툴을 사용하여 학습데이터의 특성을 추출한다. 또한 추출된 중요 특징점을 기반으로 모델링을 하는 세 가지 방법을 제시한다. 첫 번째 방법은 보안 전문가에 의해 엄선된 132가지의 특징점 조합을 바탕으로 모델링하는 것이다. 두 번째는 학습 데이터 7,000개의 앱에서 발생 빈도수가 높은 상위 99%인 8,004가지의 특징점들 중 랜덤포레스트 분류기를 이용하여 특성중요도가 가장 높은 300가지를 선정 후 모델링 하는 방법이다. 마지막 방법은 300가지의 특징점을 학습한 다수의 모델을 통합하여 하나의 가중치 투표 모델을 구성하는 방법이다. 추가적으로 오탐률 및 미탐률을 개선하기 위해 권한 정보를 모두 제외하여 특징점을 재구성하고 위와 같은 환경으로 모델링하였다. 최종적으로 가중치 투표 모델인 앙상블 알고리즘 모델을 사용하여 97.8%로 정확도가 개선되었고 오탐률은 1.9%로 성능이 개선된 것이 확인되었다.

실시간 공격 탐지를 위한 Pearson 상관계수 기반 특징 집합 선택 방법 (A Feature Set Selection Approach Based on Pearson Correlation Coefficient for Real Time Attack Detection)

  • 강승호;정인선;임형석
    • 융합보안논문지
    • /
    • 제18권5_1호
    • /
    • pp.59-66
    • /
    • 2018
  • 기계학습을 이용하는 침입 탐지 시스템의 성능은 특징 집합의 구성과 크기에 크게 좌우된다. 탐지율과 같은 시스템의 탐지 정확도는 특징 집합의 구성에, 학습 및 탐지 시간은 특징 집합의 크기에 의존한다. 따라서 즉각적인 대응이 필수인 침입 탐지 시스템의 실시간 탐지가 가능하도록 하려면, 특징 집합은 크기가 작으면서도 적절한 특징들로 구성하여야 한다. 본 논문은 실시간 탐지를 위한 특징 집합 선택 문제를 해결하기 위해 사용했던 기존의 다목적 유전자 알고리즘에 특징 간의 Pearson 상관계수를 함께 사용하면 탐지율을 거의 낮추지 않으면서도 특징 집합의 크기를 줄일 수 있음을 보인다. 제안한 방법의 성능평가를 위해 NSL_KDD 데이터를 사용하여 10가지 공격 유형과 정상적인 트래픽을 구별하도록 인공신경망을 설계, 구현하여 실험한다.

  • PDF

머신러닝기반 확률론적 실시간 건물에너지 수요예측 및 BESS충방전 기법 (Stochastic Real-time Demand Prediction for Building and Charging and Discharging Technique of ESS Based on Machine-Learning)

  • 양승권;송택호
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제5권3호
    • /
    • pp.157-163
    • /
    • 2019
  • 현재까지 피크완화 및 에너지 절감을 위해 한국전력공사 120여개 사옥에 K-BEMS (KEPCO Building Energy Management System)가 운영 중이다. 이 시스템은 PV, PCS, BESS, EMS 등으로 구성되어 있으며 건물에너지 수요예측을 기반으로 BESS, PV 등을 활용하여 에너지 관리를 도모하고 있다. 이 시스템은 단기 과거데이터에 신경망기법을 단순 적용하여 수요를 예측함에 따라 예측 정확도가 높지 않고 운영자 수작업을 통한 BESS 충방전으로 피크 저감이 곤란하며 운영 경제성 제고가 어려운 실정이다. 이러한 문제를 해결하기 위해 전력연구원에서는 2016년부터 3년간 연구과제를 수행하였는데 이를 통해 에러를 최소화하며 높은 신뢰도를 가지는 실시간 수요예측기법과 이에 기반한 BESS충방전 최적화 자동화 기술 개발, 성능을 검증하였기에 이를 본 논문에서 소개하고자 한다.

홈 트레이닝을 위한 운동 동작 분류 및 교정 시스템 (Pose Classification and Correction System for At-home Workouts)

  • 강재민;박성수;김윤수;감진규
    • 한국정보통신학회논문지
    • /
    • 제25권9호
    • /
    • pp.1183-1189
    • /
    • 2021
  • 홈 트레이닝을 하는 사람들은 전문적인 대면 지도가 없기 때문에 잘못된 자세로 동작을 하여 신체에 무리가 올 수 있다. 본 연구에서는 자세 예측 모델과 다층 퍼셉트론을 이용하여 사용자의 자세를 교정 해주는 "영상 데이터 기반 동작 분류 및 자세 교정 시스템"을 제안한다. 자세 예측 모델로 뼈대 정보를 예측한 후 심층 신경망을 이용하여 어떤 운동 동작인지를 분류한 뒤, 올바른 관절의 각도를 알려주며 교정이 이루어진다. 이 과정에서 동작 분류 모델의 성능을 향상시키기 위해 연속적인 프레임들의 결과를 고려하는 투표 알고리즘을 적용하였다. 다층 퍼셉트론 기반 모델을 자세 분류 모델로 사용했을 때 0.9의 정확도를 가진다. 그리고 투표 알고리즘을 통해 분류 모델의 정확도는 0.93으로 향상된다.

조건적 제한된 볼츠만머신을 이용한 중기 전력 수요 예측 (Mid-Term Energy Demand Forecasting Using Conditional Restricted Boltzmann Machine)

  • 김수현;선영규;이동구;심이삭;황유민;김현수;김형석;김진영
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.127-133
    • /
    • 2019
  • 미래에 스마트 그리드 도입을 위해 전력수요예측은 중요한 연구 분야 중 하나이다. 하지만 전력데이터는 많은 외부적 요소들에 영향을 받기 때문에 예측하기 어렵다. 기존의 전력수요예측 방법들은 가공되지 않은 전력데이터를 그대로 이용하기 때문에 정확도 높은 예측을 하는데 한계가 있어왔다. 본 논문에서는 가공되지 않은 전력데이터를 이용하는 전력수요예측의 문제를 해결하기 위해 확률기반 학습알고리즘을 제안한다. 확률 모델은 전력데이터의 확률적 특성을 분석하기에 적합하다. 제안한 모델의 중기 전력수요예측 성능을 비교하기 위해 신경망 네트워크 중 하나인 순환신경망과 성능 비교를 해보았다. 매사추세츠 대학에서 제공한 전력데이터를 이용하여 성능 비교를 한 결과 본 논문에서 제안한 확률기반 학습알고리즘이 중기 수요예측에 더 좋은 성능을 나타냄을 확인하였다.

해양사고 절감을 위한 웨어러블 센서 기반 항해사 상황인지 인식 기법 개발 (Development of an Algorithm for Wearable sensor-based Situation Awareness Recognition System for Mariners)

  • 황태웅;윤익현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.395-397
    • /
    • 2019
  • 조선기술과 항해장비 기술이 발전하고 있지만 여전히 해양사고는 80%이상이 인적과실에서 비롯되고 있다. 인적과실을 저감시켜 해양사고를 절감시키려는 노력은 항해사를 대상으로 면담이나 설문을 시행하는 등 정성적인 연구방식에 많이 의존하고 있어서 객관적인 인적과실의 실체를 규명하는데 제한이 있다. 본 연구에서는 이 같은 단점을 극복하기 위하여 항해사의 항해 업무 수행을 방해하지 않으며 공간적 제한을 극복할 수 있도록 웨어러블 센서를 활용하여 항해사의 동작을 실측하고 상황인지 여부가 항해 수행 동작에 어떤 영향을 미치는지 구분하고자 한다. Full mission ship handling simulator를 활용하여 항해사가 특정한 시나리오를 수행하는 중에 위험성을 가진 장애물을 발견하기 전과 후의 어떤 행동패턴 변화를 보이는지 측정하였다. 구분된 항해 동작 패턴은 항해 위험 상황에서 적절한 조치를 취하고 있는지 여부를 객관적으로 구분하여 인적과실을 절감하는데 활용될 것으로 기대된다.

  • PDF

데이터 불균형 해소를 위한 유전알고리즘 기반 최적의 오버샘플링 비율 (Optimal Ratio of Data Oversampling Based on a Genetic Algorithm for Overcoming Data Imbalance)

  • 신승수;조휘연;김용혁
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.49-55
    • /
    • 2021
  • 최근에는 데이터베이스의 발달로 금융, 보안, 네트워크 등에서 생성된 많은 데이터가 저장 가능하며, 기계학습 기반 분류기를 통해 분석이 이루어지고 있다. 이 때 주로 야기되는 문제는 데이터 불균형으로, 학습 시 다수 범주의 데이터들로 과적합이 되어 분류 정확도가 떨어지는 경우가 발생한다. 이를 해결하기 위해 소수 범주의 데이터 수를 증가시키는 오버샘플링 전략이 주로 사용되며, 데이터 분포에 적합한 기법과 인자들을 다양하게 조절하는 과정이 필요하다. 이러한 과정의 개선을 위해 본 연구에서는 스모트와 생성적 적대 신경망 등 다양한 기법 기반의 오버샘플링 조합과 비율을 유전알고리즘을 통해 탐색하고 최적화 하는 전략을 제안한다. 제안된 전략과 단일 오버샘플링 기법으로 신용카드 사기 탐지 데이터를 샘플링 한 뒤, 각각의 데이터들로 학습한 분류기의 성능을 비교한다. 그 결과 유전알고리즘으로 기법별 비율을 탐색하여 최적화 한 전략의 성능이 기존 전략들 보다 우수했다.

빅 데이터 기반의 체납 수용가 예측 모델 (Prediction Model for Unpaid Customers Using Big Data)

  • 정재안;이규환;정회경
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.827-833
    • /
    • 2020
  • 본 논문에서는 지자체의 요금 체납을 줄이기 위해 특정 지자체를 대상으로 검침원의 면담 등을 통해 지방상수도 통합정보시스템에서 체납에 영향을 미치는 내부 데이터 요소를 찾았다. 또한 국가 통계 데이터 중에서 체납에 영향을 미치는 후보 데이터를 도출하였다. 독립변수가 종속변수에 미치는 영향도는 정보이득이라는 데이터 집합에서 종속변수에 대한 무질서도를 조사하여 표본 데이터를 수집하였다. 그리고 빅 데이터 분석 알고리즘인 의사결정트리와 로지스틱 회귀기법 중 어느 알고리즘이 더 높은 예측율을 나타내는지 n-fold cross-validation 방법을 사용하여 평가하였다. 이를 통해 지자체의 데이터를 기초로 알고리즘의 성능을 비교한 결과 의사결정트리가 로지스틱회귀보다 더 정확한 수용가 납부 패턴을 찾을 수 있음을 확인하였다. 머신러닝을 이용한 분석 알고리즘 모델 개발의 과정에서는 알고리즘의 정확성 향상을 위해 의사결정트리의 복잡성과 정확성에 직접적인 영향을 주는 최소 데이터 개수와 최대 순도라는 두 개의 환경변수의 최적값을 도출하였다.