• 제목/요약/키워드: linear discriminant analysis

검색결과 340건 처리시간 0.031초

UFKLDA: An unsupervised feature extraction algorithm for anomaly detection under cloud environment

  • Wang, GuiPing;Yang, JianXi;Li, Ren
    • ETRI Journal
    • /
    • 제41권5호
    • /
    • pp.684-695
    • /
    • 2019
  • In a cloud environment, performance degradation, or even downtime, of virtual machines (VMs) usually appears gradually along with anomalous states of VMs. To better characterize the state of a VM, all possible performance metrics are collected. For such high-dimensional datasets, this article proposes a feature extraction algorithm based on unsupervised fuzzy linear discriminant analysis with kernel (UFKLDA). By introducing the kernel method, UFKLDA can not only effectively deal with non-Gaussian datasets but also implement nonlinear feature extraction. Two sets of experiments were undertaken. In discriminability experiments, this article introduces quantitative criteria to measure discriminability among all classes of samples. The results show that UFKLDA improves discriminability compared with other popular feature extraction algorithms. In detection accuracy experiments, this article computes accuracy measures of an anomaly detection algorithm (i.e., C-SVM) on the original performance metrics and extracted features. The results show that anomaly detection with features extracted by UFKLDA improves the accuracy of detection in terms of sensitivity and specificity.

실시간 근전도 패턴인식을 위한 특징투영 기법에 관한 연구 (A Study on Feature Projection Methods for a Real-Time EMG Pattern Recognition)

  • 추준욱;김신기;문무성;문인혁
    • 제어로봇시스템학회논문지
    • /
    • 제12권9호
    • /
    • pp.935-944
    • /
    • 2006
  • EMG pattern recognition is essential for the control of a multifunction myoelectric hand. The main goal of this study is to develop an efficient feature projection method for EMC pattern recognition. To this end, we propose a linear supervised feature projection that utilizes linear discriminant analysis (LDA). We first perform wavelet packet transform (WPT) to extract the feature vector from four channel EMC signals. For dimensionality reduction and clustering of the WPT features, the LDA incorporates class information into the learning procedure, and finds a linear matrix to maximize the class separability for the projected features. Finally, the multilayer perceptron classifies the LDA-reduced features into nine hand motions. To evaluate the performance of LDA for the WPT features, we compare LDA with three other feature projection methods. From a visualization and quantitative comparison, we show that LDA has better performance for the class separability, and the LDA-projected features improve the classification accuracy with a short processing time. We implemented a real-time pattern recognition system for a multifunction myoelectric hand. In experiment, we show that the proposed method achieves 97.2% recognition accuracy, and that all processes, including the generation of control commands for myoelectric hand, are completed within 97 msec. These results confirm that our method is applicable to real-time EMG pattern recognition far myoelectric hand control.

커버곡 검색을 위한 확률적 선형 판별 분석 기반 음악 유사도 (A music similarity function based on probabilistic linear discriminant analysis for cover song identification)

  • 서진수;김정현;김혜미
    • 한국음향학회지
    • /
    • 제41권6호
    • /
    • pp.662-667
    • /
    • 2022
  • 음악 유사도 계산은 음악 검색 서비스 구현에서 가장 중요한 요소 중 하나이다. 본 논문은 커버곡 검색의 성능을 제고하기 위한 음악 유사도 학습에 대해서 다룬다. 음악 유사도 함수를 유도하는 데 확률적 선형 판별 분석을 이용하여 잠재 음악 공간을 구한다. 잠재 음악 공간은 같은 커버곡 간의 거리는 줄이고 다른 곡 간의 거리는 크게 되도록 학습한다. 추출된 음악 특징이 잠재 음악 변수에서 생성되었다는 가정 하에 확률 모델을 구하고, 음악의 동질성 여부를 가설검증하여 음악 유사도 함수를 유도한다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여 제안한 음악 유사도 함수가 커버곡 검색 성능을 개선시킬 수 있음을 보였다.

레이블 노이즈가 존재하는 자료의 판별분석 방법 비교연구 (A Comparative Study of Classification Methods Using Data with Label Noise)

  • 권소영;김경희
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2853-2864
    • /
    • 2018
  • 판별분석(discriminant analysis)은 새로운 개체가 입력되었을 때, 그 개체가 어느 그룹에 속하는지 예측하는데 사용되는 분석방법이다. 판별분석에서는 레이블(label)을 통해 새로운 개체를 예측하기 때문에 판별분석에서 레이블은 중요하다. 레이블 노이즈(label noise)는 관측된 레이블에 오류가 포함된 것을 의미하며, 실데이터에 발생하기 쉽고 판별성능에 영향을 미칠 수 있는 중요한 요인이다. 이를 개선하기 위해 레이블 노이즈와 레이블 노이즈에 강건한 모형들이 연구되고 있지만, 레이블 노이즈가 존재할 때 판별성능에 영향을 줄 수 있는 요인을 고려하고 이 요인들이 판별성능에 미치는 영향을 비교한 연구는 찾기 힘들다. 따라서 이 논문에서는 분류문제에서 많이 사용되는 LDA, QDA, KNN, SVM 방법을 이용하여 레이블 노이즈가 판별성능에 미치는 영향을 알아보고자 한다. 특히 판별분석의 성능과 연관이 있을 것으로 예상되는 레이블 노이즈의 발생 비율, 발생형태, 데이터의 개수에 따른 판별성능을 모의실험을 통해 살펴보았다. 그 결과, 데이터의 형태와 분석기법에 따라 레이블 노이즈가 판별성능에 영향을 미치는 정도가 다름을 확인하였다.

독립성분 분석을 이용한 번호판 숫자 인식 (Recognition of Numeric Characters in License Plate based on Independent Component Analysis)

  • 정병준;강현철
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.99-107
    • /
    • 2009
  • 본 논문에서는 자동차 번호판 숫자의 특징을 추출하기 위해 강화된 독립성분분석(independent component analysis)의 혼합모델을 제안한다 독립성분분석은 고차 통계적 특성만을 이용하기 때문에 고차 통계적 특성과 숫자 종류별 상관관계에 대한 특성을 고려하지 못한다. 이러한 독립성분분석의 한계를 극복하기 위해, 본 논문에서는 주성분분석(principle component analysis)과 선형판별분석(linear discriminant analysis)을 조합한 혼합 모델 형태의 독립성분분석을 제안한다. 실험 결과, 제안된 혼합 모델은 독립성분분석이나 다른 혼합 모델들보다 특징 추출과 인식에서 우수한 성능을 보임을 확인하였다.

Rapid discrimination of commercial strawberry cultivars using Fourier transform infrared spectroscopy data combined by multivariate analysis

  • Kim, Suk Weon;Min, Sung Ran;Kim, Jonghyun;Park, Sang Kyu;Kim, Tae Il;Liu, Jang R.
    • Plant Biotechnology Reports
    • /
    • 제3권1호
    • /
    • pp.87-93
    • /
    • 2009
  • To determine whether pattern recognition based on metabolite fingerprinting for whole cell extracts can be used to discriminate cultivars metabolically, leaves and fruits of five commercial strawberry cultivars were subjected to Fourier transform infrared (FT-IR) spectroscopy. FT-IR spectral data from leaves were analyzed by principal component analysis (PCA) and Fisher's linear discriminant function analysis. The dendrogram based on hierarchical clustering analysis of these spectral data separated the five commercial cultivars into two major groups with originality. The first group consisted of Korean cultivars including 'Maehyang', 'Seolhyang', and 'Gumhyang', whereas in the second group, 'Ryukbo' clustered with 'Janghee', both Japanese cultivars. The results from analysis of fruits were the same as of leaves. We therefore conclude that the hierarchical dendrogram based on PCA of FT-IR data from leaves represents the most probable chemotaxonomical relationship between cultivars, enabling discrimination of cultivars in a rapid and simple manner.

경항통 설문지를 이용한 한의학적 진단 및 분류체계에 관한 연구 (Research on Oriental Medicine Diagnosis and Classification System by Using Neck Pain Questionnaire)

  • 송인;이건목;홍권의
    • Journal of Acupuncture Research
    • /
    • 제28권3호
    • /
    • pp.85-100
    • /
    • 2011
  • Objectives : The purpose of this thesis is to help the preparation of oriental medicine clinical guidelines for drawing up the standards of oriental medicine demonstration and diagnosis classification about the neck pain. Methods : Statistical analysis about Gyeonghangtong(頸項痛), Nakchim(落枕), Sagyeong(斜頸), Hanggang (項强) classified experts' opinions about neck pain patients by Delphi method is conducted by using oriental medicine diagnosis questionnaire. The result was classified by using linear discriminant analysis (LDA), diagonal linear discriminant analysis (DLDA), diagonal quadratic discriminant analysis (DQDA), K-nearest neighbor classification (KNN), classification and regression trees (CART), support vector machines (SVM). Results : The results are summarized as follows. 1. The result analyzed by using LDA has a hit rate of 84.47% in comparison with the original diagnosis. 2. High hit rate was shown when the test for three categories such as Gyeonghangtong and Hanggang category, Sagyeong caterogy and Nakchim caterogy was conducted. 3. The result analyzed by using DLDA has a hit rate of 58.25% in comparison with the original diagnosis. The result analyzed by using DQDA has a accuracy of 57.28% in comparison with the original diagnosis. 4. The result analyzed by using KNN has a hit rate of 69.90% in comparison with the original diagnosis. 5. The result analyzed by using CART has a hit rate of 69.60% in comparison with the original diagnosis. There was a hit rate of 70.87% When the test of selected 8 significant questions based on analysis of variance was performed. 6. The result analyzed by using SVM has a hit rate of 80.58% in comparison with the original diagnosis. Conclusions : Statistical analysis using oriental medicine diagnosis questionnaire on neck pain generally turned out to have a significant result.

학교건물의 노후화에 따르는 개축 판정에 관한 모델의 정립 (School-Building Remodelling Model using Discriminant Analysis - A Case Study for Class Rooms in School Building -)

  • 민창기
    • 교육시설
    • /
    • 제4권4호
    • /
    • pp.29-41
    • /
    • 1997
  • The objective of this paper is to construct a model to be used in deciding whether to repair or rebuild school buildings is depending on their ages and other factors. The theme of this paper is the age is the main variable but other factors such as floor, innerwall, ceiling, door, inner window of the class room, outer window of the class room, inner window of the corridor, outer window of the corridor, middle window between the classroom and the corridor, light, heater, speaker, fire protection sensor, TV monitor, and telephone status would influence the final decisions. This paper employs an experimental case study method. Using the stepwise, statistical, classification method commonly used in discriminant analysis, it evaluates 12,766 rooms of 87 different high schools in Seoul. The result of this study indicates that some critical variables influencing the final decisions are the status of TV monitor, middle window between the classroom and the corridor, light, inner window of the corridor, fire protection sensor, innerwall, speaker utensil, outer window of the class room, and door of the class room. This paper also suggests a linear discriminant function will be used for this kind of studies. Finally the paper recommends policies with respect to the variables and discriminant functions evaluated.

  • PDF

유전자은행의 운영성과 제고를 위한 유전자원이용촉진 판별요인의 탐색 (Discriminant Factors Influencing Utilization of Genetic Resources)

  • 성봉석;조원권
    • 경영과정보연구
    • /
    • 제35권3호
    • /
    • pp.95-113
    • /
    • 2016
  • 본 연구는 유전자은행을 통한 유전자원활용을 극대화하기 위한 맥락에서 유전자은행의 유전자원이용에 대한 만족과 지속적 이용의 정도차이를 판별할 수 있는 요인, 즉 유전자원이용자(=연구자)가 유전자원에 부여하는 유용성 속성을 실증적으로 분석하고자 하였다. 이를 위해 기존문헌 고찰을 통해 연구자들이 유전자원에 부여하는 유용성 속성을 연구 활동에의 부합성, 유용특성정보, 활용가치, 연구 활동의 촉진성, 신규성으로 도출하고, 미생물유전자원을 이용하는 연구자들을 대상으로 유전자원이용정도가 높은 집단과 낮은 집단(유전자원이용에 대한 만족과 지속적 이용에 기초하여 분류)을 판별할 수 있는 유용성 속성의 파악을 위해 판별분석을 수행하였다. 분석결과, 5개의 유용성 속성 중에서 유전자원의 활용가치와 연구 활동에의 부합성이 판별력이 가장 높은 것으로 나타났다. 유용특성정보와 연구 활동의 촉진성은 판별력이 그리 높지 않았으며, 신규성은 판별력이 없는 것으로 나타났다. 본 연구의 결과에 기초하여 유전자원의 활용촉진을 위한 정책적 시사점을 제공하였으며, 본 연구의 한계점과 이를 극복하기 위한 향후 연구방향도 제시하였다.

  • PDF

선형 판별분석과 공통벡터 추출방법을 이용한 음성인식 (Speech Recognition Using Linear Discriminant Analysis and Common Vector Extraction)

  • 남명우;노승용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.35-41
    • /
    • 2001
  • 본 논문에서는 선형 판별분석 (LDA: Linear Discriminant Analysis)과 공통벡터 추출방법을 이용한 음성인식방법을 제안하였다. 음성신호는 화자의 성별, 나이, 출생지, 주위 잡음, 정신적 상태, 발성기관의 구조 등과 같은 다양한 정보를 포함하고 있다. 이로 인해 같은 음성신호라 할지라도 서로 다른 화자가 발성하게 되면 서로 다른 특성을 보이게 된다. 음성신호의 이러한 성질은 같은 음성군 (class)에 포함된 공통된 특성벡터를 추출하는 일을 상당히 어렵게 한다. 음성신호에서 공통된 특징 벡터를 추출하는 방법은 KLT (Karhunen-Loeve Transformation)와 같이 선형 대수적인 접근방법이 많이 사용되어지고 있으나, 본 논문에서는 M. Bilginer et al.이 제안한 공통벡터 추출 방법을 사용하였다. M. Bilginer et al.이 제안한 방법은 주어진 훈련 음성신호들에 대하여 최적의 공통 벡터를 추출하여 주면서 공통벡터 추출에 사용된 훈련 데이터에 대해서는 100%의 인식결과를 보여준다. 그러나 공통벡터 추출을 위한 훈련 음성신호의 수를 무한히 늘릴 수 없다는 점과 공통벡터들간의 구별정보 (discriminant information)가 정의되지 않았다는 단점이 있다. 본 논문에서는 단어그룹간 (class) 구별정보를 추출된 공통벡터와 결합해 단어간의 오인식률 (error rate)을 감소시킬 수 있는 방법과 공통벡터 추출방법에 적합한 파라미터 가공 방법을 제안하였다. 공통벡터 추출방법은 음성신호의 시간 축 정규화 방법과 벡터의 차원 크기에 따라 인식시간과 인식률에 영향을 받는다. 따라서 부적절한 시간 축 정렬과 너무 큰 벡터의 차원 수는 인식률 저하 등과 같이 알고리즘의 효율성을 떨어뜨린다. 본 논문에서 제안한 방법을 사용하여 실험한 결과 알고리즘의 효율성이 증가되었으며, 기존방법보다 약 2%정도의 향상된 인식률을 얻을 수 있었다.낮추는 효과를 나타내었다.다. 이상의 결과를 통하여 추출 온도와 용매 농도에 따른 수율의 차이가 있었으며 free radical 소거 활성에서는 종자 에탄을 추출물이 과피 에탄올 추출물 보다 145배 이상의 현저히 높은 활성을 나타내었다.을 나타내었다.'Lian(연)' : repeatability, continuance, plenty and intercommunicate, 2. 'Lian(연)'-'Lian(염)': integrity, 3. 'He (하)'-'He(화)' : peace, harmony and combination, 4. 'He(하)'-'He(하)' : clear river, 5.'He(하)'-'He(하)' ; all work goes well. When the Chinese use lotus patterns in lucky omen patterns, same pronunciation and pitch of Chinese language more prominent than natural properties or the image of Buddhism. I guess that it cause praying individual's peace and happiness more serious than philosophical meaning or symbol that base in Buddhism for ordinary people.ML., -9.00~12.49 and -19.81~19.81%, respectively). Therefore, it is concluded that the two formulations are bioequivalent for both the extent and the rate of absorption after single dose administration.ation.ion.ion.ation.ion.n. fibrosis, collagen bundle) was

  • PDF