• 제목/요약/키워드: Feature selection algorithm

검색결과 337건 처리시간 0.027초

입학사정관제 평가점수에 대한 객관적인 평가 알고리즘 구현 연구 (Study on realization for objective evaluation algorithm of grade by admission office system)

  • 최승배;이영학
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1359-1368
    • /
    • 2013
  • 대학 입학사정관제는 기존의 대학입학제도에 대한 개선 방안으로 수능 위주의 학생선발에서 벗어나 학생부 (교과와 비교과)와 학생의 잠재력, 대학의 설립이념 등을 고려하여 대학입학제도에 대한 패러다임을 전환하려는 의도에서 도입되었다. 입학사정관제의 특징 중에 하나는 입학사정관제도에 의해서 선발된 학생들을 선발자체에 그치지 않고 추후 관리를 통하여 창의적인 인재를 육성하고자 하는 것이다. 통상적으로 입학사정관제도에 의한 학생선발은 학생부 (서류전형)와 발표 토론 및 면접 등의 내용을 토대로 선발된다. 입학사정관제에 의한 학생들에 대한 평가는 주로 정성적인 평가이기 때문에 평가를 하는데 있어서 입학사정관의 주관이 개입되어 학생선발에 있어서 객관성이 떨어질 수 있다는 문제점이 제기된다. 본 연구에서는 이러한 입학사정관제에 의한 학생선발 과정에 있어서 학생들이 불이익을 받지 않도록 학생선발의 객관성을 유지할 수 있는 알고리즘을 제시한다.

배전계통 사고시 부하절체 방법의 GA 적용에 관한 연구 (The Application of Load Re-configuration Using Genetic Algorithm for the Distribute Systems Mischance)

  • 최대섭;신호철
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.115-123
    • /
    • 2011
  • 본 논문에서는 배전 손실 최소화 문제에 있어서 GA의 수렴특성을 개선하기 위해서는 새로운 수명의 개념을 도입한다. 즉 개체군의 균질화와 유전적 부동의 문제에 대해서 연령을 가진 집단에 유한의 수명을 부여하여 적응도에 의한 도태외에 어느수명에 도달한 경우에도 도태시키려는 방법을 제안하였다. 이 방법은 적응도가 가장 높은 개체는 개체수의 양, 엘리트 보존전략의 영향에 의해 자손을 남기는 확률이 높은 것인데 비해 적응도가 낮은 개체는 수명에 의해 빨리 도태되고 또한 수렴성의 향상을 기대할 수 있다. 게다가 수명을 고려한 볼수 법과 이미 제안되어 있는 DPM을 조합하여 이하와 같은 특징을 가진 GA의 탐색알고리즘을 개발한다.

2.4Ghz ISM(Industrial Scientific Medical) 밴드에서 간섭을 회피하기 위한 무선 센서 노드의 채널 선택 방법 (Channel Selection Method of Wireless Sensor Network Nodes for avoiding Interference in 2.4Ghz ISM(Industrial, Scientific, Medical) Band)

  • 김수민;금동현;김경훈;오일;최승원
    • 디지털산업정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.109-116
    • /
    • 2014
  • In recent, ISM (Industrial Scientific Medical) band that is 2.4GHz band authorized free of charge is being widely used for smart phone, notebook computer, printer and portable multimedia devices. Accordingly, studies have been continuously conducted on the possibility of coexistence among nodes using ISM band. In particular, the interference of IEEE 802.11b based Wi-Fi device using overlapping channel during communication among IEEE 802.15.4 based wireless sensor nodes suitable for low-power, low-speed communication using ISM band causes serious network performance deterioration of wireless sensor networks. This paper examined a method of identifying channel status to avoid interference among wireless communication devices using IEEE 802.11b (Wi-Fi) and other ISM bands during communication among IEEE 802.15.4 based wireless sensor network nodes in ISM band. To identify channels occupied by Wi-Fi traffic, various studies are being conducted that use the RSSI (Received Signal Strength Indicator) value of interference signal obtained through ED (Energy Detection) feature that is one of IEEE 802.15.4 transmitter characteristics. This paper examines an algorithm that identifies the possibility of using more accurate channel by mixing utilization of interference signal and RSSI mean value of interference signal by wireless sensor network nodes. In addition, it verifies such algorithm by using OPNET Network verification simulator.

진화적 기호회귀 분석기법 기반의 호우 특보 예측 알고리즘 (A Prediction Algorithm for a Heavy Rain Newsflash using the Evolutionary Symbolic Regression Technique)

  • 현병용;이용희;서기성
    • 제어로봇시스템학회논문지
    • /
    • 제20권7호
    • /
    • pp.730-735
    • /
    • 2014
  • This paper introduces a GP (Genetic Programming) based robust technique for the prediction of a heavy rain newsflash. The nature of prediction for precipitation is very complex, irregular and highly fluctuating. Especially, the prediction of heavy precipitation is very difficult. Because not only it depends on various elements, such as location, season, time and geographical features, but also the case data is rare. In order to provide a robust model for precipitation prediction, a nonlinear and symbolic regression method using GP is suggested. The remaining part of the study is to evaluate the performance of prediction for a heavy rain newsflash using a GP based nonlinear regression technique in Korean regions. Analysis of the feature selection is executed and various fitness functions are proposed to improve performances. The KLAPS data of 2006-2010 is used for training and the data of 2011 is adopted for verification.

유효 주파수 선택과 선형판별분석기법을 이용한 유도전동기 고장진단 시스템 (Induction Motor Diagnosis System by Effective Frequency Selection and Linear Discriminant Analysis)

  • 이대종;조재훈;윤종환;전명근
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.380-387
    • /
    • 2010
  • 본 논문에서는 3상 유도전동기의 고장진단을 수행하기 위해 상호정보량과 선형판별분석기법에 기반을 둔 진단 알고리즘을 제안한다. 실험 장치는 유도전동기 구동의 기계적 모듈과 고장신호를 구하기 위한 데이터 획득 모듈로 구성하였다. 제안된 방법은 취득된 전류신호를 DFT에 의해 주파수 영역으로 변환한 후 분산정보를 이용하여 고장상태별로 차별성이 큰 순서대로 유효 주파수 성분을 추출한다. 다음 단계로 선택된 주파수 성분에 대해서 선형판별분석기법을 적용하여 고장상태별 특징들을 추출한 후 k-NN 분류기에 의해 유도전동기의 상태를 진단하게 된다. 제안된 방법의 타당성을 보이기 위해 다양한 조건하에서 실험한 결과 기존방법에 비하여 우수한 결과를 나타냈다.

분산 객체의 확률적 비례 검색 기반 전송률 향상 검색 알고리즘 (Search Algorithm for Advanced Transmission Rate based on Probabilistic Proportion Search of Distributed Objects)

  • 김분희
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.49-56
    • /
    • 2006
  • P2P 분산 시스템의 가장 큰 특징은 해당 피어들이 항상 온라인 상태일 것이라는 보장이 없다는 것이다. 즉 P2P 시스템을 이용할 때에는 해당 피어로부터 파일을 다운로드받다가 다운로드 되지 않는 경우가 발생하게 된다. 이를 해결하기 위한 연구의 대부분은 재전송이라는 방법에 의존하고 있다. 이는 P2P 시스템의 성능 저하의 원인이 되므로 이에 대한 해결책이 필요하다. 본 연구에서는 해당 P2P 시스템을 이용하는 사용자의 평균 이용 시간대의 분석 자료를 자원 제공자 선택의 기준으로 적용하여 자원 전송 보장성을 높이고, 또한 인기도 높은 자원에 대해서 자료 전송 기회를 높여주는 역할의 기존의 분산 객체 리플리케이션 기법들과의 조합에 의한 분산 객체 전송률이 향상된 검색 알고리즘을 제안한다.

  • PDF

고혈압 예측을 위한 이상치 탐지 알고리즘 및 데이터 통합 기법 (An Outlier Detection Algorithm and Data Integration Technique for Prediction of Hypertension)

  • 홍고르출;김미혜 ;송미화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.417-419
    • /
    • 2023
  • Hypertension is one of the leading causes of mortality worldwide. In recent years, the incidence of hypertension has increased dramatically, not only among the elderly but also among young people. In this regard, the use of machine-learning methods to diagnose the causes of hypertension has increased in recent years. In this study, we improved the prediction of hypertension detection using Mahalanobis distance-based multivariate outlier removal using the KNHANES database from the Korean national health data and the COVID-19 dataset from Kaggle. This study was divided into two modules. Initially, the data preprocessing step used merged datasets and decision-tree classifier-based feature selection. The next module applies a predictive analysis step to remove multivariate outliers using the Mahalanobis distance from the experimental dataset and makes a prediction of hypertension. In this study, we compared the accuracy of each classification model. The best results showed that the proposed MAH_RF algorithm had an accuracy of 82.66%. The proposed method can be used not only for hypertension but also for the detection of various diseases such as stroke and cardiovascular disease.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

시스템 호출 기반의 사운덱스 알고리즘을 이용한 신경망과 N-gram 기법에 대한 이상 탐지 성능 분석 (Anomaly Detection Performance Analysis of Neural Networks using Soundex Algorithm and N-gram Techniques based on System Calls)

  • 박봉구
    • 인터넷정보학회논문지
    • /
    • 제6권5호
    • /
    • pp.45-56
    • /
    • 2005
  • 컴퓨터 네트워크의 확대 및 인터넷 이용의 급격한 증가에 따라 네트워크 서비스 품질의 보장과 네트워크의 관리가 어려울 뿐만 아니라 네트워크 보안의 취약성으로 인하여 해킹 및 정보유출 등의 위협에 노출되어 있다. 특히 시스템 침입의 보안 위협에 대한 능동적인 대처 및 침입 이후에 동일하거나 유사한 유형의 사건 발생에 대해 실시간에 대응하는 것이 중요하므로 침임 탐지 시스템에 대한 많은 연구가 진행되고 있다. 본 논문에서는 시스템 호출을 이용하여 이상 침입 탐지 시스템의 성능을 향상시키기 위해, 특징 선택과 가변 길이 데이터를 고정 길이 학습 패턴으로 변환 생성하는 문제를 해결하기 위한 사운덱스 알고리즘을 적용한 신경망 학습을 통하여 이상 침입 탐지의 연구를 하고자 한다. 즉, 가변 길이의 순차적인 시스템 호출 데이터를 사운덱스 알고리즘에 의한 고정 길이의 행위 패턴을 생성하여 역전파 알고리즘에 의해 신경망 학습을 수행하였다. 역전파 신경망 기법을 UNM의 Sendmail Data Set을 이용하여 시스템 호출의 이상 탐지에 적용하여 성능을 검증하였다.

  • PDF

회전수가 변하는 기기의 고장진단에 있어서 특성 기반 분류와 합성곱 기반 알고리즘의 예측 정확도 비교 (Comparison of Prediction Accuracy Between Classification and Convolution Algorithm in Fault Diagnosis of Rotatory Machines at Varying Speed)

  • 문기영;김형진;황세윤;이장현
    • 한국항해항만학회지
    • /
    • 제46권3호
    • /
    • pp.280-288
    • /
    • 2022
  • 본 연구는 정상 가동 중에도 회전수가 변하는 기기의 이상 및 고장 진단 방안을 다루고 있다. 회전수가 변함에 따라 비정상적 시계열 특성을 내포한 센서 데이터에 기계학습을 적용할 수 있는 절차를 제시하고자 하였다. 기계학습으로는 k-Nearest Neighbor(k-NN), Support Vector Machine(SVM), Random Forest을 사용하여 이상 및 고장 진단을 수행하였다. 또한 진단 정확성을 비교할 목적으로 이상 감지에 오토인코더, 고장진단에는 합성곱 기반의 Conv1D도 추가로 이용하였다. 비정상적 시계열로부터 통계 및 주파수 속성으로 구성된 시계열 특징 벡터를 추출하고, 추출된 특징 벡터에 정규화 및 차원 축소 기법을 적용하였다. 특징 벡터의 선택과 정규화, 차원 축소 여부에 따라 달라지는 기계학습의 진단 정확도를 비교하였다. 또한, 적용된 학습 알고리즘 별로 초매개변수 최적화 과정과 적층 구조를 설명하였다. 최종적으로 기존의 심층학습과 비교하여, 기계학습도 가변 회전기기의 고장을 정확하게 진단할 수 있는 절차를 제시하였다.