• Title/Summary/Keyword: 자료별판별분석

Search Result 97, Processing Time 0.031 seconds

Datawise Discriminant Analysis For Feature Extraction (자료별 분류분석(DDA)에 의한 특징추출)

  • Park, Myoung-Soo;Choi, Jin-Young
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.19 no.1
    • /
    • pp.90-95
    • /
    • 2009
  • This paper presents a new feature extraction algorithm which can deal with the problems of linear discriminant analysis, widely used for linear dimensionality reduction. The scatter matrices included in linear discriminant analysis are defined by the distances between each datum and its class mean, and those between class means and mean of whole data. Use of these scatter matrices can cause computational problems and the limitation on the number of features. In addition, these definition assumes that the data distribution is unimodal and normal, for the cases not satisfying this assumption the appropriate features are not achieved. In this paper we define a new scatter matrix which is based on the differently weighted distances between individual data, and presents a feature extraction algorithm using this scatter matrix. With this new method. the mentioned problems of linear discriminant analysis can be avoided, and the features appropriate for discriminating data can be achieved. The performance of this new method is shown by experiments.

통계적 분류방법을 이용한 문화재 정보 분석

  • Kang, Min-Gu;Sung, Su-Jin;Lee, Jin-Young;Na, Jong-Hwa
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

Time Series Analysis of Agricultural Reservoir Water Level Data for Abnormal Behavior Detection (농업용 저수지 이상거동 탐지를 위한 시계열 수위자료 특성 분석)

  • Lee, Sung Hack;Lee, Sang Hyun;Hong, Min Ki;Cho, Jin Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.275-275
    • /
    • 2015
  • 최근 기후변화에 따른 극한 강우사상의 증가로 인하여 농업용 저수지의 재해 위험도가 증가하고 있는 추세이며, 사고가 발생할 때 마다 파손/붕괴된 시설물을 보수하는 대응형 유지관리체계에서 벗어나 기반시설의 성능과 생애주기 등을 고려하여 재해 발생을 사전에 예보 및 경보를 알릴 수 있는 예방적 관리체계로의 전환이 필요하다. 한국농어촌공사는 전국 1,500개 저수지에서 10분 단위 수위자료를 측정하고 있으며, 이를 분석하여 재해예방에 활용할 수 있는 기반이 조성되어 있으나 이에 대한 관리가 이루어지지 않고 있고 수집된 자료를 활용하여 재해 징후를 분석할 수 있는 재해 예방적 분석기술이 마련되어 있지 않은 실정이다. 본 연구에서는 농업용 저수지 수위자료를 이용한 저수지 이상거동을 판별하기 위하여 전국 34개 한국농어촌공사 관할 저수의 시계열 수위자료의 특성(Feature)을 분석하고자 한다. 시계열 자료의 시계열 특성을 분석하기 위하여 한국농어촌공사 관할의 전국 34개 저수지를 선정하여 분석을 실시하였다. 대상저수지는 지역별, 저수용량, 안정등급, 붕괴발생, 1개 지사관할 저수지로 각각 구분하여 선정하였으며, 각 저수지의 수위 측정기간(최소 5개년)에 대한 자료를 수집하였다. 농업용 저수지의 시계열 수위 자료의 특성을 분석하기 위하여 자료의 전처리를 수행하였다. 자료의 전처리는 시계열 수위자료의 잡음 특성, 기상자료 관련 변동특성 등 분류(Classification)에 영향을 미치는 노이즈 요소를 제거하는 과정이다. 전처리과정을 거친 자료는 특징(Feature) 추출 과정을 거치게 되고, 추출된 특징의 적합성에 따라 분류 알고리듬 성능에 많은 영향을 미친다. 따라서 시계열 자료의 특성을 파악하고 특징을 추출하는 것은 이상치 탐지에 있어 매우 중요한 과정이다. 본 연구에서는 시계열 자료 특징 추출 방법으로 물리적인 한계치, 확률적인 문턱값(Threshold), 시계열 패턴, 주변 저수지와의 시계열 상관분석 등을 적용하였으며, 이를 데이터베이스로 구축하여 이후 분류알고리듬 학습에 적용하여 정상치와 이상치를 판별하는데 이용될 수 있도록 하였다. 따라서 본 연구에서 제시되는 농업용 저수지의 시계열 특성은 다양한 분류알고리듬에 적용할 수 있으며, 이를 통하여 저수지 이상거동 판별을 위한 최적을 분류알고리듬의 선택에 도움이 될 것이다.

  • PDF

Classification Performance Comparison of Inductive Learning Methods : The Case of Corporate Credit Rating (귀납적 학습방법들의 분류성능 비교 : 기업신용평가의 경우)

  • 이상호;지원철
    • Journal of Intelligence and Information Systems
    • /
    • v.4 no.2
    • /
    • pp.1-21
    • /
    • 1998
  • 귀납적 학습방법들의 분류성능을 비교 평가하기 위하여 대표적 분류문제의 하나인 신용평가 문제를 사용하였다. 분류기로서 사용된 귀납적 학습방법론들은 통계학의 다변량 판별분석(MDA), 기계학습 분야의 C4.5, 신경망의 다계층 퍼셉트론(MLP) 및 Cascade Correlation Network(CCN)의 4 가지이며, 학습자료로는 국내 3개 신용평가기관이 발표한 신용등급 및 공포된 재무제표를 사용하였다. 신용등급 예측의 정확도에 의한 분류성능을 평가하였는데 연도별 평가와 시계열 평가의 두 가지를 실시하였다. Cascade Correlation Network이 가장 좋은 분류성능을 보였지만 4가지 분류기들 사이에 통계적으로 유의한 차이는 발견되지 않았다. 이는 사용된 학습자료가 갖는 한계로 인한 것으로 추정되지만, 성능평가 과정에 있어 학습자료의 전처리 과정이 분류성과의 제고에 매우 유효함이 입증되었다.

  • PDF

Systematic Review on Diagnosis of Children with ADHD: With Special Regard to School-Based Identification and Multi-method Assessment (ADHD 아동 진단과 판별: 학교기반 및 다중방법 평가를 중심으로)

  • Kim, Dongil;Go, Eun-Yeong;Kim, Eun-Hyang;Go, Hye-Jeong;An, Ji-Yeong
    • (The) Korean Journal of Educational Psychology
    • /
    • v.26 no.4
    • /
    • pp.1225-1248
    • /
    • 2012
  • The present study explored how ADHD assessment, identification, and diagnosis were conducted in research through an overview of research papers on ADHD in the last 10 years. The collected studies were categorized and analyzed by topics including data collection settings, assessment and identification, coexistence with other disabilities, considerable variables throughout evaluation, and biological basis. They were categorized and analyzed according to the identification methods, the number of assessment(s) and the number of informant(s). The results were as follows: First, the assessment and identifying studies on children with ADHD were excessively biased toward clinical settings. Second, the majority of the previous studies explored more the development or validation of tools for the assessment and identifying of ADHD than the other topics. Finally, a high preference for the use of a multiple assessment method in identifying ADHD was found. However, considering methodological aspects, there was a lack of practical application of multi-step process such as including a personal interview, reviewing school records or direct observing rating criteria. Considering these results, we discussed an urgent need for the diagnosis and identification guidelines of ADHD for teachers to effectively identifying ADHD children at schools. The implications of school-based ADHD assessment and diagnosis research were suggested.

Model Development of Event Detection System Software in Water Distribution Networks (상수관망 수리이상감지시스템 SW(K-EDS) 모델 개발)

  • Noh, Joon Woo;Shin, Eun Her;Yoo, Do Guen
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.270-270
    • /
    • 2017
  • 스마트워터그리드와 같은 첨단 정보통신기술을 활용한 물 관리 기술의 도입으로 수도운영사업에서도 누수와 같은 이상사건인지 목적의 효율적 빅 데이터 분석기법의 중요성이 증대되고 있다. 국내외적으로 누수인지를 위한 다양한 연구기법, 범위, 계측항목, 샘플링 주기 등이 제시된 바 있으나, 이상감지시스템(Event Detection System, EDS)은 대상지역 특정적 특성을 가지고 있어 범용적인 모델을 구축하는 데는 어려움이 있다. 본 연구에서는 소블럭 단위의 유량자료 분석을 통한 이상감지시스템의 적용가능여부를 판별하고 적합 모델구축자료 방안을 제시하는 K-EDS 모델을 개발하였다. 모델분석의 절차는 자료획득, 자료 전처리, 탐색적 자료해석, 그리고 각 기법 평가로 진행된다. 개발된 모델을 다양한 특성을 가지는 실제 지방상수도시스템에 적용하여 분석하였으며, 최종적으로 모델적용 가능성과 영향인자 등을 도출하였다. 개발된 모델은 소블럭별 현장계측자료 기반의 이상감지모델 적용 적합도 판별에 활용될 수 있으며, 향후 누수 인지 및 누수지속시간 감소를 위한 SW로 개발이 가능하다.

  • PDF

Intrusion Types Identification for HMM-based Anomaly Detection System Using Edit Distance (Edit Distance를 이용한 오용탐지 시스템의 침입유형 판별)

  • 구자민;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.874-876
    • /
    • 2003
  • 전산 시스템에 대한 침입에 대응하기 위하여 시스템 호출 감사자료 척도를 사용하여 은닉 마르코프 모델(HMM)에 적용하는 비정상행위 기반 침입탐지 시스템에 대한 연구가 활발하다. 하지만, 이는 일정한 임계간 이하의 비정상행위만을 감지할 뿐, 어떠한 유형의 침입인지를 판별하지 못한다. 이에 Viterbi 알고리즘을 이용하여 상태 시퀀스를 분석하고, 공격 유형별 표준 상태시퀀스와의 유사성을 측정하여 유형을 판별할 수 있는데, 외부 혹은 내부 환경에 따라 상태 시퀀스가 항상 규칙적으로 추출될 수 없기 때문에, 단순 매칭으로 침입 유형을 판별하기가 어렵다. 본 논문에서는 이러한 문제를 해결하기 위하여 시퀀스의 변형을 효과적으로 고려하는 편집거리(Edit distance)를 이용하여 어떠한 유형의 침입이 발생하였는지를 판별하는 방법을 제안한다. 본 논문에서는 루트권한을 취득하기 위한 대표적인 침입유형으로 가장 널리 쓰이는 버퍼오버플로우 공격에 대해 실험하였는데, 그 결과 세부적인 침입 유형을 잘 판별할 수 있음을 확인하였다.

  • PDF

Traffic Safety Countermeasures According to the Accident Area Patterns and Impact Factor Analysis of the Large-scale Traffic Accident Locations (대형 교통사고 발생지점 유형화와 영향요인 분석에 따른 교통안전대책 방안에 관한 연구)

  • Kim, Bong-Gi;Jeong, Heon-Yeong;Go, Sang-Seon
    • Journal of Korean Society of Transportation
    • /
    • v.24 no.1 s.87
    • /
    • pp.39-52
    • /
    • 2006
  • This study divided the large-scale traffic accident locations into its own characteristics by using Cluster Analysis. Also, Quantification II and Classification and Regression Tree methods were used enabling evaluation for the amount of affecting influence by the crash type. After these analyses, we tested the fitness of the results and suggested the simplification of the quantification index. With the results from the discussed procedure, obvious differences were observed by groups according to the characteristics of crash type from the Discrimination and Classification analysis of divided four groups. Thus, measures and supplementary measures for the traffic accidents could be suggested in groups systematically. However, a lot of missing values in variables caused a huge loss of data and made this study difficult for more detailed analysis, With this difficulty. recording mandatory log files with a standardized format is also recommended to Prevent this Problem in advance.

New index for the gifted students(G-Index) with EEG analysis (뇌파검사 자료를 기반으로 한 과학영재 판별 지수(G-Index) 개발과 적용)

  • Kim, Kyung-Hwa;Kim, Kyu-Han;Lee, Sun-Kil;Hur, Myung;Kim, Yong-Jin
    • Journal of Gifted/Talented Education
    • /
    • v.15 no.1
    • /
    • pp.67-84
    • /
    • 2005
  • In this study we investigated the adequacy of tools for distinction gifted students through the comparison these mutual relation on the basis of data, like paper test, the depths interview score, and the rest data((TTCT: Torrance Tests of Creative Thinking, IQ test, FASP: Find A Shape Puzzle, V.T: Visualization Tests and Exp: experimental ability test), and analysis data of EEG test for examining the adequacy of tools for identification gifted students. So, we developed Brain Wave gifted Index(G-Index) for finding another distinction ability as using brain waves data. The standard of index development use gifted brain characteristic in closed-eyes rest state which is judged like that characteristic of distinction between gifted and normal students is the most clear and consistence. That is, the degree of unified pattern between each object and gifted PCA pattern was defined by Pearson method which added spatial mutual index to weight concept. This refer to mean number of spatial PCA pattern. Searching for the possibility of distinction gifted gave distinction effect in 76%. The result of regression analysis on the basis of mutual relation between the rest data is . The probability formula for distinct gifted group is as follow. $$P=\frac 1{1+e^{-[-0.018(TTCT)+0.057(IQ)+1.916(FASP)+0.682(V.T)+0.088(Exp.)+0.034(G-Index)-57.510]}}$$ The result of this calculation showed that probability for distinct in gifted group was very good(95.0%). On the basis of upper result, tools for identification gifted students should be estimated as using many-sided estimation data whatever possible. And following study about development, and operation of tools for distinction suitable to gifted student in science should be progressed.

Determination of Sasang Constitution from Artery Pulse Waves (요골 맥파를 이용한 사상체질 판별)

  • Cho, Jae Kyong
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.21 no.2
    • /
    • pp.359-365
    • /
    • 2020
  • Sasang Constitution data that were classified by the QSCCII (Questionnaire for the Sasang Constitution Classification II) and artery pulse waves of Chon, Guan, and Chuck data measured using an electronic manometer, were obtained from 732 subjects who visited an oriental hospital. The pulse width, peak height, and number of peaks were extracted from the pulse waves as feature variables. Validity and reliability analyses were performed to obtain the feature variables. The feature variables with high validity and reliability were selected as the discriminant variables. The pulse wave data were divided into training and predicting samples by applying a fivefold cross-validation technique. Discriminant analysis was performed for the training sample, and discriminant functions were obtained. The discriminant functions were applied to the predicting sample and the Sasang Constitution was predicted. The accuracy of prediction was estimated by comparing the predicted Sasang Constitution and that obtained by QSCCII. The accuracy of the predicted Sasang Constitution before (after) age and sex calibration was 73.6 % (70.4 %), 68.4 % (84.2 %), and 74.2 % (67.7 %) for Taeumin, Soumin, and Soyangin, respectively, and 72.5 % (73.8 %) in total.