• 제목/요약/키워드: Mahalanobis

검색결과 181건 처리시간 0.027초

지하철 재난 전조 예측 모델 개발 (Development of Predictive Models for Subway Disaster Forecasting)

  • 박미연;박완순;이정훈;권세곤
    • 한국방재안전학회논문집
    • /
    • 제10권2호
    • /
    • pp.1-6
    • /
    • 2017
  • 사물 인터넷(IOT)을 기반으로 한 지하철 재난 조기경보 및 승객 대피를 위한 재난전조 시스템 개발 연구가 이미 선행연구를 통해 수행하였다. 본 논문에서는 역에 설치된 센서 데이터를 분석하여 재난을 신속 하게 감지하기 위한 후속 연구이다. 특히, 본 연구는 초기 시스템 구축 시 센서의 설치 위치에 따라 다를 수 있는 환경변화를 고려한 마할라노비스 거리를 기반으로 통계적 방법론을 개발하였다.

다그룹 다차원 데이터의 시각화 (Visualizing multidimensional data in multiple groups)

  • 허명회
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.83-93
    • /
    • 2017
  • k (${\geq}2$) 그룹의 p-차원 데이터의 시각화에서 가장 전형적인 방법은 Fisher의 정준판별분석(canonical discriminant analysis; CDA)이다. CDA는 마할라노비스 공간에서 k개 그룹 중심을 근사하게 통과하는 저차원 부공간에 관측점들을 사영한다. 본 논문은 척도화 유클리드 공간에서 다그룹 다차원 데이터를 시각화하는 방법을 제안하는데, 저차원 부공간의 제1축(또는 제1축과 제2축)은 그룹 중심들의 최대변별(maximum discrimination)에서 찾고 부공간의 제2축(또는 제3축)은 관측개체들의 최대산포(maximum dispersion)에서 찾는다. 이러한 혼종방법(hybrid method)은 2-그룹 다차원 자료의 시각화에서 특히 유용하다.

Classification of Imbalanced Data Based on MTS-CBPSO Method: A Case Study of Financial Distress Prediction

  • Gu, Yuping;Cheng, Longsheng;Chang, Zhipeng
    • Journal of Information Processing Systems
    • /
    • 제15권3호
    • /
    • pp.682-693
    • /
    • 2019
  • The traditional classification methods mostly assume that the data for class distribution is balanced, while imbalanced data is widely found in the real world. So it is important to solve the problem of classification with imbalanced data. In Mahalanobis-Taguchi system (MTS) algorithm, data classification model is constructed with the reference space and measurement reference scale which is come from a single normal group, and thus it is suitable to handle the imbalanced data problem. In this paper, an improved method of MTS-CBPSO is constructed by introducing the chaotic mapping and binary particle swarm optimization algorithm instead of orthogonal array and signal-to-noise ratio (SNR) to select the valid variables, in which G-means, F-measure, dimensionality reduction are regarded as the classification optimization target. This proposed method is also applied to the financial distress prediction of Chinese listed companies. Compared with the traditional MTS and the common classification methods such as SVM, C4.5, k-NN, it is showed that the MTS-CBPSO method has better result of prediction accuracy and dimensionality reduction.

Assessing the Performance of Pongamia pinnata (l.) Pierre under Ex-situ Condition in Karnataka

  • Divakara, Baragur Neelappa;Nikhitha, Chitradurga Umesh
    • Journal of Forest and Environmental Science
    • /
    • 제38권1호
    • /
    • pp.12-20
    • /
    • 2022
  • Pongamia (Pongamia pinnata L.) as a source of non-edible oil, is potential tree species for biodiesel production. For several reasons, both technical and economical, the potential of P. pinnata is far from being realized. The exploitation of genetic diversity for crop improvement has been the major driving force for the exploration and ex situ/in situ conservation of plant genetic resources. However, P. pinnata improvement for high oil and seed production is not achieved because of unsystematic way of tree improvement. Performance of P. pinnata planted by Karnataka Forest Department was assessed based on yield potential by collecting 157 clones out of 264 clones established by Karnataka Forest Department research wing under different research circles/ranges. It was evident that the all the seed and pod traits were significantly different. Further, selection of superior germplasm based on oil and pod/seed parameters was achieved by application of Mahalanobis statistics and Tocher's technique. On the basis of D2 values for all possible 253 pairs of populations the 157 genotypes were grouped into 28 clusters. The clustering pattern showed that geographical diversity is not necessarily related to genetic diversity. Cluster means indicated a wide range of variation for all the pod and seed traits. The best cluster having total oil content of more than 34.9% with 100 seed weight of above 125 g viz. Cluster I, II, III, IX, XV, XIX, XXI, XXIII, XXVI and XXVII were selected for clonal propagation.

GNSS 부분 음영 지역에서 마할라노비스 거리를 이용한 GNSS/다중 IMU 센서 기반 측위 알고리즘 (GNSS/Multiple IMUs Based Navigation Strategy Using the Mahalanobis Distance in Partially GNSS-denied Environments)

  • 김지연;송무근;김재훈;이동익
    • 대한임베디드공학회논문지
    • /
    • 제17권4호
    • /
    • pp.239-247
    • /
    • 2022
  • The existing studies on the localization in the GNSS (Global Navigation Satellite System) denied environment usually exploit low-cost MEMS IMU (Micro Electro Mechanical Systems Inertial Measurement Unit) sensors to replace the GNSS signals. However, the navigation system still requires GNSS signals for the normal environment. This paper presents an integrated GNSS/INS (Inertial Navigation System) navigation system which combines GNSS and multiple IMU sensors using extended Kalman filter in partially GNSS-denied environments. The position and velocity of the INS and GNSS are used as the inputs to the integrated navigation system. The Mahalanobis distance is used for novelty detection to detect the outlier of GNSS measurements. When the abnormality is detected in GNSS signals, GNSS data is excluded from the fusion process. The performance of the proposed method is evaluated using MATLAB/Simulink. The simulation results show that the proposed algorithm can achieve a higher degree of positioning accuracy in the partially GNSS-denied environment.

Comparative Study on Similarity Measurement Methods in CBR Cost Estimation

  • Ahn, Joseph;Park, Moonseo;Lee, Hyun-Soo;Ahn, Sung Jin;Ji, Sae-Hyun;Kim, Sooyoung;Song, Kwonsik;Lee, Jeong Hoon
    • 국제학술발표논문집
    • /
    • The 6th International Conference on Construction Engineering and Project Management
    • /
    • pp.597-598
    • /
    • 2015
  • In order to improve the reliability of cost estimation results using CBR, there has been a continuous issue on similarity measurement to accurately compute the distance among attributes and cases to retrieve the most similar singular or plural cases. However, these existing similarity measures have limitations in taking the covariance among attributes into consideration and reflecting the effects of covariance in computation of distances among attributes. To deal with this challenging issue, this research examines the weighted Mahalanobis distance based similarity measure applied to CBR cost estimation and carries out the comparative study on the existing distance measurement methods of CBR. To validate the suggest CBR cost model, leave-one-out cross validation (LOOCV) using two different sets of simulation data are carried out. Consequently, this research is expected to provide an analysis of covariance effects in similarity measurement and a basis for further research on the fundamentals of case retrieval.

  • PDF

고혈압 예측을 위한 이상치 탐지 알고리즘 및 데이터 통합 기법 (An Outlier Detection Algorithm and Data Integration Technique for Prediction of Hypertension)

  • 홍고르출;김미혜 ;송미화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.417-419
    • /
    • 2023
  • Hypertension is one of the leading causes of mortality worldwide. In recent years, the incidence of hypertension has increased dramatically, not only among the elderly but also among young people. In this regard, the use of machine-learning methods to diagnose the causes of hypertension has increased in recent years. In this study, we improved the prediction of hypertension detection using Mahalanobis distance-based multivariate outlier removal using the KNHANES database from the Korean national health data and the COVID-19 dataset from Kaggle. This study was divided into two modules. Initially, the data preprocessing step used merged datasets and decision-tree classifier-based feature selection. The next module applies a predictive analysis step to remove multivariate outliers using the Mahalanobis distance from the experimental dataset and makes a prediction of hypertension. In this study, we compared the accuracy of each classification model. The best results showed that the proposed MAH_RF algorithm had an accuracy of 82.66%. The proposed method can be used not only for hypertension but also for the detection of various diseases such as stroke and cardiovascular disease.

마할라노비스 거리와 독립성분분석을 이용한 다변량 공정 고장탐지 방법에 관한 연구 (Fault Detection Method for Multivariate Process using Mahalanobis Distance and ICA)

  • 정승환;김성신
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.22-28
    • /
    • 2021
  • 화학공정, 기계공정, 발전소와 같은 다변량 공정은 여러 설비들이 복잡하게 연결되어 운영되기 때문에 특정 시스템에 고장이 발생하면 전체 공정에 치명적인 영향을 미칠 수 있다. 또한, 공정 데이터는 불안정한 환경에서 계측되므로, 데이터에 이상치가 포함될 가능성이 크다. 따라서 계측된 데이터의 이상치를 제거하고 시스템의 고장을 사전에 탐지할 수 있는 모니터링 기술이 필수적이다. 본 논문에서는 여러 종류의 공정에서 고장탐지를 수행하기 위해 다이나믹 공정과 다변량 공정 모델에서 생성된 데이터를 이용하였다. 다이나믹 공정은 자기회귀 특성을 가지는 공정을 모델링한 것이고 다변량 공정은 특정 센서의 고장이 발생했을 때 상황을 묘사한 공정이다. 본 논문에서는 두 공정에서 생성된 데이터에 마할라노비스 거리를 이용하여 데이터에 포함된 이상치를 제거한 후, 독립성분분석을 적용하여 고장탐지를 수행하였다. 제안된 방법의 성능 비교를 위해 기존의 단일모델 ICA와 성능을 비교하였다. 실험결과, 제안된 방법이 기존의 ICA 보다 다이나믹 공정의 바이어스 데이터의 경우에 0.84%p, 드리프트 데이터의 경우 6.82%p 성능이 개선되었다. 다변량 공정의 경우 3.78%p 성능이 개선되었으므로, 제안된 방법이 우수한 고장탐지 성능을 보였다.

사장교 케이블의 실시간 손상평가를 위한 센서 배치의 최적화 (Optimization of Sensor Location for Real-Time Damage assessment of Cable in the cable-Stayed Bridge)

  • 방건혁;허광희;이재훈;이유재
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제27권6호
    • /
    • pp.172-181
    • /
    • 2023
  • 본 연구에서는 케이블의 손상에 대한 사장교의 실시간 손상평가를 진행하였다. 사장교의 실시간 손상평가를 위한 센서는 가속도 센서를 사용하였으며, KEOT(Kinetic Energy Optimization Techniques)를 이용하여 센서의 위치와 수량에 대한 최적의 조건을 선정했다. KEOT는 구조물이 외력에 의해서 진동할 때, 최대변형에너지의 값을 계측하여 최적 계측 위치와 센서의 수량을 결정한다. 본 연구에서의 손상 조건은 케이블의 파단으로 제한하였으며 사장교를 4개의 구간으로 나누어 구간별 케이블 손상을 주었다. 사장교 케이블의 실시간 손상평가 방법은 FE 구조해석을 통하여 실제 모델과 유사한 가상의 모델을 만들었다. 생성된 가상 모델과 모형 구조물에 랜덤 가진파를 가한 이후 모형 구조물의 케이블 손상을 주었다. 가상 모델에서 출력되는 응답을 무손상 상태의 응답으로 정의하고 실제 모델에서 계측되는 응답을 손상 상태의 데이터로 정의하여 두 데이터를 비교하였다. 무손상 상태의 사장교의 데이터로부터 손상 상태의 사장교의 데이터를 IMD(Improved Mahalanobis Distance) 이론에 적용하여 손상의 정도를 평가하였다. IMD 이론으로 손상을 평가한 결과 구간별 손상을 실시간으로 적절하게 찾아내어 실시간 모니터링에 적용할 수 있는 유용한 손상평가 기술로 확인되었다.

On Assessing Inter-observer Agreement Independent of Variables' Measuring Units

  • Um, Yong-Hwan
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.529-536
    • /
    • 2006
  • Investigators use either Euclidean distance or volume of a simplex defined composed of data points as agreement index to measure chance-corrected agreement among observers for multivariate interval data. The agreement coefficient proposed by Um(2004) is based on a volume of a simplex and does not depend on the variables' measuring units. We consider a comparison of Um(2004)'s agreement coefficient with others based on two unit-free distance measures, Pearson distance and Mahalanobis distance. Comparison among them is made using hypothetical data set.

  • PDF