• 제목/요약/키워드: 자료별판별분석

검색결과 97건 처리시간 0.039초

자료별 분류분석(DDA)에 의한 특징추출 (Datawise Discriminant Analysis For Feature Extraction)

  • 박명수;최진영
    • 한국지능시스템학회논문지
    • /
    • 제19권1호
    • /
    • pp.90-95
    • /
    • 2009
  • 본 논문은 선형차원감소(Linear Dimensionality Reduction)을 위해 널리 이용되고 있는 특징추출 알고리듬인 선형판별분석(Linear Discriminant Analysis)의 문제점을 해결할 수 있는 새로운 특징추출 알고리듬을 제안한다. 선형판별분석에 포함되는 평균-자료 간 거리 및 평균-평균 간의 거리에 기반한 분산행렬은 역행렬 연산, 계수의 제한 등으로 인하여 계산상의 문제와 추출되는 특징의 수가 제한되는 한계를 가지고 있다. 또한 자료의 집단이 단일 모드의 정규 분포로부터 얻어진 것으로 가정되며 그렇지 않은 경우에 대해서는 적절한 결과를 얻을 수 없다. 본 논문에서는 자료-자료 간의 거리에 기반하고 적절하게 가중치가 추가된 새로운 행렬을 정의하였으며. 이에 기반하여 특징을 추출하는 방법을 제안하였다. 그럼으로써 앞서 선형판별분석의 여러 문제를 해결하고자 시도하였다. 제안된 방법의 성능을 실험을 통해 확인하였다.

통계적 분류방법을 이용한 문화재 정보 분석

  • 강민구;성수진;이진영;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

농업용 저수지 이상거동 탐지를 위한 시계열 수위자료 특성 분석 (Time Series Analysis of Agricultural Reservoir Water Level Data for Abnormal Behavior Detection)

  • 이성학;이상현;홍민기;최진용
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.275-275
    • /
    • 2015
  • 최근 기후변화에 따른 극한 강우사상의 증가로 인하여 농업용 저수지의 재해 위험도가 증가하고 있는 추세이며, 사고가 발생할 때 마다 파손/붕괴된 시설물을 보수하는 대응형 유지관리체계에서 벗어나 기반시설의 성능과 생애주기 등을 고려하여 재해 발생을 사전에 예보 및 경보를 알릴 수 있는 예방적 관리체계로의 전환이 필요하다. 한국농어촌공사는 전국 1,500개 저수지에서 10분 단위 수위자료를 측정하고 있으며, 이를 분석하여 재해예방에 활용할 수 있는 기반이 조성되어 있으나 이에 대한 관리가 이루어지지 않고 있고 수집된 자료를 활용하여 재해 징후를 분석할 수 있는 재해 예방적 분석기술이 마련되어 있지 않은 실정이다. 본 연구에서는 농업용 저수지 수위자료를 이용한 저수지 이상거동을 판별하기 위하여 전국 34개 한국농어촌공사 관할 저수의 시계열 수위자료의 특성(Feature)을 분석하고자 한다. 시계열 자료의 시계열 특성을 분석하기 위하여 한국농어촌공사 관할의 전국 34개 저수지를 선정하여 분석을 실시하였다. 대상저수지는 지역별, 저수용량, 안정등급, 붕괴발생, 1개 지사관할 저수지로 각각 구분하여 선정하였으며, 각 저수지의 수위 측정기간(최소 5개년)에 대한 자료를 수집하였다. 농업용 저수지의 시계열 수위 자료의 특성을 분석하기 위하여 자료의 전처리를 수행하였다. 자료의 전처리는 시계열 수위자료의 잡음 특성, 기상자료 관련 변동특성 등 분류(Classification)에 영향을 미치는 노이즈 요소를 제거하는 과정이다. 전처리과정을 거친 자료는 특징(Feature) 추출 과정을 거치게 되고, 추출된 특징의 적합성에 따라 분류 알고리듬 성능에 많은 영향을 미친다. 따라서 시계열 자료의 특성을 파악하고 특징을 추출하는 것은 이상치 탐지에 있어 매우 중요한 과정이다. 본 연구에서는 시계열 자료 특징 추출 방법으로 물리적인 한계치, 확률적인 문턱값(Threshold), 시계열 패턴, 주변 저수지와의 시계열 상관분석 등을 적용하였으며, 이를 데이터베이스로 구축하여 이후 분류알고리듬 학습에 적용하여 정상치와 이상치를 판별하는데 이용될 수 있도록 하였다. 따라서 본 연구에서 제시되는 농업용 저수지의 시계열 특성은 다양한 분류알고리듬에 적용할 수 있으며, 이를 통하여 저수지 이상거동 판별을 위한 최적을 분류알고리듬의 선택에 도움이 될 것이다.

  • PDF

귀납적 학습방법들의 분류성능 비교 : 기업신용평가의 경우 (Classification Performance Comparison of Inductive Learning Methods : The Case of Corporate Credit Rating)

  • 이상호;지원철
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.1-21
    • /
    • 1998
  • 귀납적 학습방법들의 분류성능을 비교 평가하기 위하여 대표적 분류문제의 하나인 신용평가 문제를 사용하였다. 분류기로서 사용된 귀납적 학습방법론들은 통계학의 다변량 판별분석(MDA), 기계학습 분야의 C4.5, 신경망의 다계층 퍼셉트론(MLP) 및 Cascade Correlation Network(CCN)의 4 가지이며, 학습자료로는 국내 3개 신용평가기관이 발표한 신용등급 및 공포된 재무제표를 사용하였다. 신용등급 예측의 정확도에 의한 분류성능을 평가하였는데 연도별 평가와 시계열 평가의 두 가지를 실시하였다. Cascade Correlation Network이 가장 좋은 분류성능을 보였지만 4가지 분류기들 사이에 통계적으로 유의한 차이는 발견되지 않았다. 이는 사용된 학습자료가 갖는 한계로 인한 것으로 추정되지만, 성능평가 과정에 있어 학습자료의 전처리 과정이 분류성과의 제고에 매우 유효함이 입증되었다.

  • PDF

ADHD 아동 진단과 판별: 학교기반 및 다중방법 평가를 중심으로 (Systematic Review on Diagnosis of Children with ADHD: With Special Regard to School-Based Identification and Multi-method Assessment)

  • 김동일;고은영;김은향;고혜정;안지영
    • 교육심리연구
    • /
    • 제26권4호
    • /
    • pp.1225-1248
    • /
    • 2012
  • 본 연구는 ADHD 아동을 대상으로 한 평가 판별에 관한 논문을 개관함으로써 ADHD 아동 평가 판별이 실제 연구에서 어떻게 이루어지고 있는 지를 확인하고자 하였다. 이를 위해 최근 10년간 수행된 SCI, SSCI급 국외 연구를 분석하였다. 최종 147편을 자료 수집 장소별, 주제별, ADHD 판별 방법 및 과정별로 분석하였다. 분석 결과, 첫째, ADHD 평가 및 판별 연구는 대부분 임상현장에서 수집된 자료를 기반으로 이루어졌다. 둘째, ADHD 평가 및 판별 연구는 주로 평가도구의 개발 및 타당화에 대한 연구가 이루어지고 있었다. 셋째, ADHD를 2가지 이상의 다중방법을 사용하여 ADHD로 평가. 판별하는 연구가 많이 진행되었음을 확인할 수 있었으나, 학교기록의 검토, 직접관찰, 다중 정보원을 사용한 인터뷰 등 다양한 정보원과 방법의 활용이 아닌 대부분의 연구가 척도나 설문지, 단일 정보원과의 인터뷰 등에 한정된 방법을 사용하고 있었다. 논의에서는 ADHD 아동 판별 및 평가 연구가 학교현장을 기반으로 한 연구가 매우 제한적인 것에 대한 함의와 효율적 다중방법 평가절차 개발의 필요성 및 학교 기반 ADHD 아동 선별 및 판별 가이드라인 개발에 대한 시사점을 제기하였다.

상수관망 수리이상감지시스템 SW(K-EDS) 모델 개발 (Model Development of Event Detection System Software in Water Distribution Networks)

  • 노준우;신은허;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.270-270
    • /
    • 2017
  • 스마트워터그리드와 같은 첨단 정보통신기술을 활용한 물 관리 기술의 도입으로 수도운영사업에서도 누수와 같은 이상사건인지 목적의 효율적 빅 데이터 분석기법의 중요성이 증대되고 있다. 국내외적으로 누수인지를 위한 다양한 연구기법, 범위, 계측항목, 샘플링 주기 등이 제시된 바 있으나, 이상감지시스템(Event Detection System, EDS)은 대상지역 특정적 특성을 가지고 있어 범용적인 모델을 구축하는 데는 어려움이 있다. 본 연구에서는 소블럭 단위의 유량자료 분석을 통한 이상감지시스템의 적용가능여부를 판별하고 적합 모델구축자료 방안을 제시하는 K-EDS 모델을 개발하였다. 모델분석의 절차는 자료획득, 자료 전처리, 탐색적 자료해석, 그리고 각 기법 평가로 진행된다. 개발된 모델을 다양한 특성을 가지는 실제 지방상수도시스템에 적용하여 분석하였으며, 최종적으로 모델적용 가능성과 영향인자 등을 도출하였다. 개발된 모델은 소블럭별 현장계측자료 기반의 이상감지모델 적용 적합도 판별에 활용될 수 있으며, 향후 누수 인지 및 누수지속시간 감소를 위한 SW로 개발이 가능하다.

  • PDF

Edit Distance를 이용한 오용탐지 시스템의 침입유형 판별 (Intrusion Types Identification for HMM-based Anomaly Detection System Using Edit Distance)

  • 구자민;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.874-876
    • /
    • 2003
  • 전산 시스템에 대한 침입에 대응하기 위하여 시스템 호출 감사자료 척도를 사용하여 은닉 마르코프 모델(HMM)에 적용하는 비정상행위 기반 침입탐지 시스템에 대한 연구가 활발하다. 하지만, 이는 일정한 임계간 이하의 비정상행위만을 감지할 뿐, 어떠한 유형의 침입인지를 판별하지 못한다. 이에 Viterbi 알고리즘을 이용하여 상태 시퀀스를 분석하고, 공격 유형별 표준 상태시퀀스와의 유사성을 측정하여 유형을 판별할 수 있는데, 외부 혹은 내부 환경에 따라 상태 시퀀스가 항상 규칙적으로 추출될 수 없기 때문에, 단순 매칭으로 침입 유형을 판별하기가 어렵다. 본 논문에서는 이러한 문제를 해결하기 위하여 시퀀스의 변형을 효과적으로 고려하는 편집거리(Edit distance)를 이용하여 어떠한 유형의 침입이 발생하였는지를 판별하는 방법을 제안한다. 본 논문에서는 루트권한을 취득하기 위한 대표적인 침입유형으로 가장 널리 쓰이는 버퍼오버플로우 공격에 대해 실험하였는데, 그 결과 세부적인 침입 유형을 잘 판별할 수 있음을 확인하였다.

  • PDF

대형 교통사고 발생지점 유형화와 영향요인 분석에 따른 교통안전대책 방안에 관한 연구 (Traffic Safety Countermeasures According to the Accident Area Patterns and Impact Factor Analysis of the Large-scale Traffic Accident Locations)

  • 김봉기;정헌영;고상선
    • 대한교통학회지
    • /
    • 제24권1호
    • /
    • pp.39-52
    • /
    • 2006
  • 본 연구는 대형 교통사고의 발생지점들을 특성별로 유형화하기 위하여 군집분석(Cluster hnalysis)을 행하고, 아울러 충돌 형태에 미치는 영향요인에 대한 영향 정도를 판별할 수 있도록 하기 위하여 수량화 이론 II류(Quantification II)와 C&RT(Classification and Regression Trees) 방법에 의해 분석을 실시하여 이에 대한 적합성을 평가함으로써, 정량적 척도의 간략화를 도모하고자 하였다. 그 결과, 발생 지점별 유형화에 따른 4개 집단의 판별 및 분류분석의 충돌 형태별 제반 영향요인들 특성은 집단별로 명확한 차이를 보이는 것으로 나타나, 교통사고에 대해 우선 시행되어져야 할 대책과 보완 대책들을 집단별로 체계적으로 제시할 수 있었다. 하지만 상당수 변수들에 결측치가 많아, 막대한 정보 손실이 초래되어 보다 심층적인 분석을 하기 어려웠는바, 이러한 문제점을 해결하기 위해서는 대형 교통사고 조사. 분석 시 표준화된 원 자료 시트의 작성을 의무화할 필요가 있는 것으로 나타났다.

뇌파검사 자료를 기반으로 한 과학영재 판별 지수(G-Index) 개발과 적용 (New index for the gifted students(G-Index) with EEG analysis)

  • 김경화;김규한;이선길;허명;김용진
    • 영재교육연구
    • /
    • 제15권1호
    • /
    • pp.67-84
    • /
    • 2005
  • 과학영재 판별의 대안적 도구로서의 가능성을 찾아보기 위하여 영재 집단과 일반 집단의 뇌파검사를 실시하였다. 뇌파의 주성분 공간분석법인 PCA분석 자료의 집단별 차이점을 이용하여 과학영재 판별지수(Gifted Index: G-Index)를 개발하고 과학영재 판별의 가능성을 탐색하여 보았더니 76% 수준에서의 판별 효과를 얻을 수 있었다. 또 과학영재 판별이 가능한 기타 판별도구 성취도들 간의 상관관계를 바탕으로 하여 회귀분석을 시도한 결과는로 나타났다. 이를 근거로 한 영재 판별 확률식을 제안하면 $$P=\frac 1{1+e^{-[-0.018(TTCT)+0.057(IQ)+1.916(FASP)+0.682(V.T)+0.088(Exp.)+0.034(G-Index)-57.510]}}$$와 같고 이 회귀분석식을 적용한 결과 영재 집단 내에서의 판별 가능성이 95% 수준에서 매우 우수하였다. 따라서 과학영재 판별의 대안적 도구로서의 뇌파검사와 G-Index의 유용성을 확인할 수 있었다.

요골 맥파를 이용한 사상체질 판별 (Determination of Sasang Constitution from Artery Pulse Waves)

  • 조재경
    • 한국산학기술학회논문지
    • /
    • 제21권2호
    • /
    • pp.359-365
    • /
    • 2020
  • 한방병원에 건강검진을 목적으로 내원한 732명의 피험자를 대상으로 사상체질감별설문지 검사를 통하여 한의사가 감별한 사상체질 결과와 맥진기를 사용하여 촌, 관, 척 부위의 요골 맥파를 측정한 자료를 입수하였다. 입수한 맥파 자료로부터 맥파의 폭, 피크의 크기와 개수를 특징 변수로 추출했다. 특징 변수들 중 타당도와 신뢰도가 높은 것들을 판별변수로 선정했다. 5겹 교차 검증법을 적용하여, 맥파 자료를 사상체질을 알려주는 훈련 표본과 사상체질을 알려주지 않는 예측 표본으로 구분했다. 훈련 표본에 대해서 판별분석을 수행하여 판별 함수를 구한 후, 이것을 예측 표본에 적용하여 사상체질을 예측했다. 예측한 사상체질과 설문지 검사로 알고 있는 사상체질을 비교하여 사상체질 분류 정확도를 계산했다. 사상체질 분류 정확도는 나이별, 성별 보정 전에는 태음인: 73.6 %, 소음인: 68.4 %, 소양인: 74.2 %이었으며, 전체 분류 정확도는 72.5 %이었다. 한국 인구를 기반으로 한 성별, 나이별 가중치를 적용하여 보정을 한 후의 사상체질 분류 정확도는 태음인(70.4 %), 소음인(84.2 %), 소양인(67.7 %)이었으며, 전체 분류 정확도는 73.8 %이었다.