• 제목/요약/키워드: Feature Weighting

검색결과 127건 처리시간 0.023초

가중치 세분화 기반의 로지스틱 회귀분석 모델 (Fine-Grain Weighted Logistic Regression Model)

  • 이창환
    • 전자공학회논문지
    • /
    • 제53권9호
    • /
    • pp.77-81
    • /
    • 2016
  • 로지스틱 회귀분석은 오랫동안 다양한 분야에서 예측을 위한 기술 혹은 변수 간의 관계를 설명하기 위하여 사용되어 왔다. 로지스틱 회귀분석에서 각 속성은 목적 값에 대한 중요도를 가지는데 본 연구에서는 이를 세분화하여 각 속성의 값에 따라서 중요도를 부여하는 새로운 방법을 제시한다. 점진적 하강법을 이용하여 알고리즘의 성능을 최대화하는 각 속성값 가중치의 값을 계산하였다. 제안된 방법은 다양한 데이터를 이용하여 실험하였고 본 연구의 속성값 기반 로지스틱 회귀분석 방법은 기존의 로지스틱 회귀분석보다 우수한 학습 능력을 보임을 알 수 있었다.

Smoke Detection System Research using Fully Connected Method based on Adaboost

  • Lee, Yeunghak;Kim, Taesun;Shim, Jaechang
    • Journal of Multimedia Information System
    • /
    • 제4권2호
    • /
    • pp.79-82
    • /
    • 2017
  • Smoke and fire have different shapes and colours. This article suggests a fully connected system which is used two features using Adaboost algorithm for constructing a strong classifier as linear combination. We calculate the local histogram feature by gradient and bin, local binary pattern value, and projection vectors for each cell. According to the histogram magnitude, this paper applied adapted weighting value to improve the recognition rate. To preserve the local region and shape feature which has edge intensity, this paper processed the normalization sequence. For the extracted features, this paper Adaboost algorithm which makes strong classification to classify the objects. Our smoke detection system based on the proposed approach leads to higher detection accuracy than other system.

The Facial Expression Recognition using the Inclined Face Geometrical information

  • Zhao, Dadong;Deng, Lunman;Song, Jeong-Young
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.881-886
    • /
    • 2012
  • The paper is facial expression recognition based on the inclined face geometrical information. In facial expression recognition, mouth has a key role in expressing emotions, in this paper the features is mainly based on the shapes of mouth, followed by eyes and eyebrows. This paper makes its efforts to disperse every feature values via the weighting function and proposes method of expression classification with excellent classification effects; the final recognition model has been constructed.

  • PDF

최적화 사례기반추론을 이용한 통신시장 고객관계관리 (Customer Relationship Management in Telecom Market using an Optimized Case-based Reasoning)

  • 안현철;김경재
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.285-288
    • /
    • 2006
  • Most previous studies on improving the effectiveness of CBR have focused on the similarity function aspect or optimization of case features and their weights. However, according to some of the prior research, finding the optimal k parameter for the k-nearest neighbor (k-NN) is also crucial for improving the performance of the CBR system. Nonetheless, there have been few attempts to optimize the number of neighbors, especially using artificial intelligence (AI) techniques. In this study, we introduce a genetic algorithm (GA) to optimize the number of neighbors that combine, as well as the weight of each feature. The new model is applied to the real-world case of a major telecommunication company in Korea in order to build the prediction model for the customer profitability level. Experimental results show that our GA-optimized CBR approach outperforms other AI techniques for this mulriclass classification problem.

  • PDF

최적화와 기계학습 결합기법의 재무응용 (Financial Application of Integrated Optimization and Machine Learning Technique)

  • 김경재;박호연;차인준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.429-430
    • /
    • 2019
  • 본 논문에서는 최적화 기법에 기반한 지능형 시스템의 재무응용사례를 다룬다. 본 연구에서 제안하는 모형은 대표적인 최적화 기법 중 하나인 시뮬레이티드 어니일링인데 이는 유전자 알고리듬과 유사한 최적화 성능을 가지고 있는 것으로 알려져 있으나 재무분야에서 응용된 사례가 거의 없다. 본 연구에서 제안하는 지능형 시스템은 시뮬레이티드 어니일링과 기계학습 기법을 결합한 것이다. 일반적으로 최적화와 기계학습 기법을 결합하는 방법은 특징선택(feature selection), 특징 가중치 최적화(feature weighting), 사례선택(instance selection), 모수 최적화(parameter optimization) 등의 방법이 있는데 선행연구에서 가장 많이 사용된 것은 특징선택에 두 기법을 결합하는 방식이다. 본 연구에서도 기계학습 기법을 재무 문제에 활용함에 있어서 최적의 특징선택을 위해 시뮬레이티드 어니일링을 결합하는 방식을 사용한다. 본 연구에서 제안된 기법의 유용성을 확인하기 위하여 실제 재무분야의 데이터를 활용하여 예측 정확도를 확인하였으며 그 결과를 통하여 제안하는 모형의 유용성을 확인할 수 있었다.

  • PDF

Multitree 형상 인식 기법의 성능 개선에 관한 연구 (A Study on the Improvement of Multitree Pattern Recognition Algorithm)

  • 김태성;이정희;김성대
    • 한국통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.348-359
    • /
    • 1989
  • 본 논문은 [1]와 [2]에 의해 제안된 multitree 형상 인식 기법의 성능 개선에 관한 논문이다. Multitree 형상 인식 기법의 기본적인 생각은, Classifier 설계과정에서 각 특징별로 Binary Decision Tree 를 구성하고, 이들의 탐색 순서를 결정하며, 인식 과정에서는 앞에서 정한 탐색 순서에 의거하여, BDT(Binary Decision Tree)를 탐색해 나간다는 것이다. 이때 BDT를 추가하여 탐색하기 전에 그때까지 얻은 정보를 이용하여 입력 물체를 인식할 수 있는지에 대한 여부를 결정하며, 인식이 가능한 경우 BDT의 탐색을 멈추고, 인식이 불가능한 경우 BDT의 탐색을 계속해 나간다. 이 방법은 BDT를 각 특징별로 만들기 때문에 새로운 특징의 삭제나 첨가가 상당히 용이하며 인식에 사용되는 특징의 갯수가 감소하게 된다. 따라서 이 알고리즘은 특징의 수가 많거나 class수가 많을 경우 쉽게 이용될 수 있다. 본 논문은 각 특징에서 구한 근사화된 확률 분포로부터 입력 특징값에 대한 확률값을 구해 인식에 이용하였으며, 이 값을 이용한ㄴ 여러가지 인식 방법을 제안하였다. 그리고 Branch and Bound 방법을 사용하여 특징의 선택 순서와 탐색 범위를 구하였다. 위에서 제안한 것들을 실험한 결과 기존의 multitree형상 인식 기법보다 본 논문에서 제안한 기법의 성능이 향상되었다.

  • PDF

이진 분류를 위하여 거리계산을 이용한 특징 변환 기반의 가중된 최소 자승법 (Weighted Least Squares Based on Feature Transformation using Distance Computation for Binary Classification)

  • 장세인;박충식
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.219-224
    • /
    • 2020
  • 이진 분류(binary classification)는 머신러닝(machine learning) 분야에서 많이 다루어진 주제이다. 게다가 이진 분류는 다중 분류로 쉽게 발전될 수 있는 중요한 분야이다. 머신러닝 방법들을 적용할 때에 전처리(preprocessing)이나 특징 추출(feature extraction)과 같은 작업이 필수적이다. 이는 분류기 성능을 향상시키기 위한 중요한 작업이다. 본 논문에서는 가중된 최소 자승법을 기반으로 새로운 머신러닝 방법을 제안한다. 또한, 특징 변환시킬 수 있는 새로운 가중치 계산 방법을 제안한다. 이를 통해 특징 변환과 동시에 학습을 진행할 수 있는 방법을 제안한다. 본 제안을 다섯 개의 머신러닝 데이터베이스에서 실험을 진행하였으며 이 데이터베이스에서 우수한 성능을 얻을 수 있었다.

유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구 (A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research)

  • 박동진;최기석;이명선;이상태
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.54-62
    • /
    • 2009
  • 국가적으로 그리고 각 연구기관에서는 투자의 효율성을 기하기 위하여 연구사업 선정과정에서 데이터베이스로부터 중복과제 혹은 유사과제를 검색하는 과정을 거친다. 최근 부얼리언 기반의 키워드 매칭 검색알고리즘의 발전 및 이를 채택한 검색엔진의 개발로 인하여 검색의 정확도가 많이 향상되었지만, 사용자가 입력하는 제한된 수의 키워드들에 의한 검색은 유사과제 파악과 우선순위의 결정에 어려움이 있다. 본 연구에서는 제안된 과제의 문서를 분석하여 다수의 색인어들을 추출하고, 이들에게 가중치를 부여한 후, 기존의 문서들과 비교하여 유사과제를 찾아내는 문서단위의 검색 알고리즘을 제안한다. 구체적으로 벡터공간검색(Vector-Space Retrieval)모델의 한 종류인 TFIDF(Term Frequency Inverse document Frequency)를 기본 구조로 채택한다. 또한 개발되는 알고리즘에는 연구과제 제안문서의 구조에 적합한 속성별 가중치(feature weighting)를 반영하고 검색속도의 향상을 위하여 K-최근접 문서(KNN: K-Nearest Neighbors) 기법도 반영한 알고리즘을 제시한다. 실험을 위하여 실제 연구제안 문서와 구조가 동일한 기존의 보고서를 사용하였는데, KISTI에서 운영하는 과학기술정보포털서비스인 NDSL에서 이미 분류해 놓은 4분야의 1,000 개 연구 보고서 문서를 발췌하여 실험을 하였다.

SVM 기반 실리콘 웨이퍼 마이크로크랙의 분류성능 분석 (Classification Performance Analysis of Silicon Wafer Micro-Cracks Based on SVM)

  • 김상연;김경범
    • 한국정밀공학회지
    • /
    • 제33권9호
    • /
    • pp.715-721
    • /
    • 2016
  • In this paper, the classification rate of micro-cracks in silicon wafers was improved using a SVM. In case I, we investigated how feature data of micro-cracks and SVM parameters affect a classification rate. As a result, weighting vector and bias did not affect the classification rate, which was improved in case of high cost and sigmoid kernel function. Case II was performed using a more high quality image than that in case I. It was identified that learning data and input data had a large effect on the classification rate. Finally, images from cases I and II and another illumination system were used in case III. In spite of different condition images, good classification rates was achieved. Critical points for micro-crack classification improvement are SVM parameters, kernel function, clustered feature data, and experimental conditions. In the future, excellent results could be obtained through SVM parameter tuning and clustered feature data.

LSTM Android Malicious Behavior Analysis Based on Feature Weighting

  • Yang, Qing;Wang, Xiaoliang;Zheng, Jing;Ge, Wenqi;Bai, Ming;Jiang, Frank
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권6호
    • /
    • pp.2188-2203
    • /
    • 2021
  • With the rapid development of mobile Internet, smart phones have been widely popularized, among which Android platform dominates. Due to it is open source, malware on the Android platform is rampant. In order to improve the efficiency of malware detection, this paper proposes deep learning Android malicious detection system based on behavior features. First of all, the detection system adopts the static analysis method to extract different types of behavior features from Android applications, and extract sensitive behavior features through Term frequency-inverse Document Frequency algorithm for each extracted behavior feature to construct detection features through unified abstract expression. Secondly, Long Short-Term Memory neural network model is established to select and learn from the extracted attributes and the learned attributes are used to detect Android malicious applications, Analysis and further optimization of the application behavior parameters, so as to build a deep learning Android malicious detection method based on feature analysis. We use different types of features to evaluate our method and compare it with various machine learning-based methods. Study shows that it outperforms most existing machine learning based approaches and detects 95.31% of the malware.