• 제목/요약/키워드: 판별분류분석

검색결과 493건 처리시간 0.025초

사상체질 분류모형 개발 및 진단시스템의 구현에 관한 연구 (Study on Development of Classification Model and Implementation for Diagnosis System of Sasang Constitution)

  • 범수균;전미란;오암석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 지능정보 및 응용 학술대회
    • /
    • pp.155-159
    • /
    • 2008
  • 본 논문에서는 사상체질분류검사 설문지를 이용하여 사상체질을 진단할 때 진단의 정확도를 향상시키기 위한 사상체질 분류모형을 개발하기 위하여 데이터마이닝의 주요 분류기법인 판별분석(discriminant analysis), 의사결정나무(decision tree analysis), 신경망분석(neural network analysis), 로지스틱 회귀분석(logistic regression analysis), 군집분석(clustering analysis) 등 다양한 분류분석모형을 이용한다. 본 연구에서는 분류의 비교적 정확도가 우수하며, 특히 분석과정을 쉽게 이해하고 설명할 수 있다는 점과 구현이 용이하다는 장점을 가지고 있는 판별분석모형과 의사결정나무분석모형을 기반으로 사상체질 분류모형을 개발하고, 두 분류모형을 적용한 사상체질 진단시스템을 구현하였다.

  • PDF

점진적 앙상블 SVM을 이용한 고객 분류 시스템 (Customer Classification System Using Incrementally Ensemble SVM)

  • 박상호;이종인;박선;강윤희;이주홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.190-192
    • /
    • 2003
  • 소비자의 신용 대출 규모가 점차 증가하면서 기업에서 고객의 신용 등급에 의한 정확한 고객 분류를 필요로 하고 있다 이를 위해 판별 분석과 신경망의 역전파(BP: Back Propagation)를 이용한 고객 분류 시스템이 연구되었다. 그러나, 판별 분석을 사용한 방법은 불규칙한 신용 거래의 성향을 보이는 비정규 분포의 고객 데이터의 영향으로 여러 개의 판별 함수와 판별점이 존재하여 분류 정확도가 떨어지는 단점이 있다. 신경망을 이용한 방법은 불규칙한 신용 거래의 성향을 보이는 고객 데이터에 의해서, 지역 최소점(Local Minima)에 빠져 최대의 분류 정확률을 보이는 분류자를 얻지 못하는 경우가 발생할 수 있다. 본 논문에서는 이러한 기존 연구의 분류 정확률을 저하시키는 단점을 해결하기 위해 SVM(Support Vector Machine)을 사용하여 고객의 신용 등급을 분류하는 방법을 제안한다. SVM은 SV(Support Vector)의 수에 의해서 학습 성능이 좌우되므로, 불규칙한 거래 성향을 보이는 고객에 대해서도 높은 차원으로의 매핑을 통하여, 효과적으로 학습시킬 수 있어 분류의 정확도를 높일 수 있다 하지만, SVM은 근사화 알고리즘(Approximation Algorithms)을 이용하므로 분류 정확도가 이론적인 성능에 미치지 못한다. 따라서, 본 논문은 점진적 앙상블 SVM을 사용하여, 기존의 고객 분류 시스템의 문제점을 해결하고 실제적으로 SVM의 분류 정확률을 높인다. 실험 결과는 점진적 앙상블 SVM을 이용한 방법의 정확성이 기존의 방법보다 높다는 것을 보여준다.

  • PDF

통합 수리계획법을 이용한 개인신용평가모형 (Consumer Credit Scoring Model with Two-Stage Mathematical Programming)

  • 이성욱;노태협
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제16권1호
    • /
    • pp.1-21
    • /
    • 2007
  • 신용평점을 위한 부도예측의 분류 문제를 다루는데 있어서 통계적 판별분석 및 인공신경망 및 유전자알고리즘 등을 이용한 데이터 마이닝의 방법들이 일반적으로 고려되어왔다. 이 연구에서는 수리계획법을 응용하여 classification gap을 고려한 이단계 수리계획 접근방법을 신용평가에 적용하는 방법론을 제안하여 수리계획법을 통한 신용평가모형 구축의 가능성을 제시한다. 1단계에서는 선형계획법을 이용해서 대출 신청자에게 대출을 허가할 것 인지의 여부를 결정하게 되는 대출 심사 filtering으로의 적용단계이고, 2단계에서는 정수계획법을 이용하여 오분류 비용이 최소가 되도록 하는 판별점수를 찾는 과정으로 모형을 구성한다. 개인 대출 신청자의 데이터(German Credit Data)에 대하여 피셔의 선형 판별함수, 로지스틱 회귀모형 및 기존의 수리계획 기법들과의 비교를 통해서 제안된 모델의 성능을 평가한다. 이단계 수리계획 접근법의 평가 결과를 통하여 신용평가모형에의 적용가능성을 기존 통계적인 접근방법 및 수리계획 접근법과 비교하여 제시하고 있다.

  • PDF

귀납적 학습방법들의 분류성능 비교 : 기업신용평가의 경우 (Classification Performance Comparison of Inductive Learning Methods : The Case of Corporate Credit Rating)

  • 이상호;지원철
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.1-21
    • /
    • 1998
  • 귀납적 학습방법들의 분류성능을 비교 평가하기 위하여 대표적 분류문제의 하나인 신용평가 문제를 사용하였다. 분류기로서 사용된 귀납적 학습방법론들은 통계학의 다변량 판별분석(MDA), 기계학습 분야의 C4.5, 신경망의 다계층 퍼셉트론(MLP) 및 Cascade Correlation Network(CCN)의 4 가지이며, 학습자료로는 국내 3개 신용평가기관이 발표한 신용등급 및 공포된 재무제표를 사용하였다. 신용등급 예측의 정확도에 의한 분류성능을 평가하였는데 연도별 평가와 시계열 평가의 두 가지를 실시하였다. Cascade Correlation Network이 가장 좋은 분류성능을 보였지만 4가지 분류기들 사이에 통계적으로 유의한 차이는 발견되지 않았다. 이는 사용된 학습자료가 갖는 한계로 인한 것으로 추정되지만, 성능평가 과정에 있어 학습자료의 전처리 과정이 분류성과의 제고에 매우 유효함이 입증되었다.

  • PDF

혈액여과투석 환자의 치료이행 지표와 분류기준, 융합형 혈액여과투석 치료이행 측정도구 개발 : 온라인 혈액여과투석을 중심으로 (The Development of Hemodiafiltration Treatment Compliance Indicators and Discriminant Standards, Development of Hemodiafiltration Treatment Compliance Measurement - Convergent Form(HDFTCM-CF) : Focused on On-line Hemodiafiltration)

  • 허정
    • 디지털융복합연구
    • /
    • 제13권7호
    • /
    • pp.269-282
    • /
    • 2015
  • 본 연구는 혈액여과투석 환자의 치료이행을 측정할 수 있는 지표와 분류기준을 개발하고 치료이행 정도를 측정할 수 있는 전문가의 의견이 반영된 융합형 도구를 개발하고자 시도되었다. 총 300명의 혈액여과투석 환자를 대상으로 자료가 수집되었으며, 저유량 혈액투석, 고유량 혈액투석 치료이행과 불이행에 대한 선행연구 결과 및 전문가 그룹, 임상전문가 그룹의 구성타당도, 내용타당도를 거쳐 혈액여과투석 지표와 분류기준을 개발하였다. 개발된 혈액여과투석 치료이행 지표와 분류기준의 판별분석력을 정준상관판별분석으로 검증한 결과 3가지 지표의 혈액여과투석 치료이행 판별분석력은 95.6%(wilks ramda=.256, p=.002)이었다. 또한 임상형 혈액여과투석 치료이행 측정도구는 91.7%의 판별력을 가진 것으로 검증되었다. 혈액여과투석 치료이행은 환자의 건강상태 악화와 합병증 발생 전 단계에서 환자교육과 간호중재가 이루어질 수 있다는 점에서 의미가 있으며 본 연구의 결과는 향후 혈액투석환자의 합병증 예방을 위한 간호중재의 기초자료로 활용될 수 있을 것이다.

뇌 MR 영상의 그룹핑을 의한 뇌척수액의 분류 (Classification of Cerebrospinal Fluid for Brain MR Images Grouping)

  • 채정숙;조경은;조형제
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.97-100
    • /
    • 2002
  • 뇌 MR 영상의 분석을 통해 질환을 자동적으로 진단하고 판별을 하기 위한 전처리 과정으로 정상인의 MR 영상 모델과 현재 고려되어지는 대상 영상과의 비교 작업이 요구된다. 이를 통해 보다 정확한 질병에 대한 근거를 제시함으로서 진단이 가능하게 된다. 이러한 비교 작업을 위해 우선적으로 해결해야 하는 것이 현재 대상 영상이 정상인의 MR 영상 시리즈 중 어느 위치의 영상과 일치하는 지를 판별해야 한다. 실질적으로 뇌 MR 시리즈는 영상의 특징에 따라 크게 몇 개의 그룹으로 분류된다. 그루핑 결과 뇌척수액이 존재하는 그룹은 또 다시 4 종류의 세부분류로 나누어지는데, 본 논문에서는 이 뇌 척수액의 모양에 따라 분류하는 알고리즘을 소개한다.

  • PDF

Adaptive Nearest Neighbors를 활용한 판별분류방법 (Adaptive Nearest Neighbors for Classification)

  • 전명식;최인경
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.479-488
    • /
    • 2009
  • 비모수적 판별분류방법으로 널리 사용되는 ${\kappa}$-Nearest Neighbors Classification(KNNC) 방법은 자료의 국소적 특징을 고려하지 않고 전체 자료에 대해 고정된 이웃의 개수 ${\kappa}$를 사용하여 개체를 분류하는 방법이다. 본 연구에서는 KNNC의 대안으로 자료의 국소적 특징을 고려하는 Adaptive Nearest Neighbors Classificaion(ANNC) 방법을 제안하였다. 제안된 방법의 특징을 규명하기 위하여 실제 자료에 대한 분석을 통하여 제안된 방법의 응용 가능성을 제시하였으며, 나아가 모의실험을 통하여 기존의 방법과의 효율성을 비교하였다.

종속구조를 가진 집단변수의 판별-분류에 관한 연구 (Classification of a binary group variable with dependece structure)

  • 황선영;나은정
    • 응용통계연구
    • /
    • 제11권1호
    • /
    • pp.177-184
    • /
    • 1998
  • 일반적인 판별분류분석은 자료점들간의 독립성 가정을 기본 전제로 한다. 본 연구에서는 자료점 간의 종속구조를 반영하는 판별분류기준을 제안하였으며 이를 위하여 조건부 자기 로지스틱(conditional autologistic) 모형을 이용하였다. 또한 모의실험을 통해 제시된 기준을 기존의 방법과 비교하였다.

  • PDF

지방산 조성과 선형판별분석을 활용한 유통판매 참기름의 원산지 판별 (Discrimination of the geographical origin of commercial sesame oils using fatty acids composition combined with linear discriminant analysis)

  • 김남훈;최채만;이영주;김나영;홍미선;유인실
    • 분석과학
    • /
    • 제34권3호
    • /
    • pp.134-141
    • /
    • 2021
  • GC-FID를 이용하여 유통판매 참기름 62건(국산 18건, 수입산 44건)의 지방산 조성을 확인 하였으며 참기름의 원산지 판별을 위해 주요지방산 5 종(C16:0, C18:0, C18:1, C18:2, C18:3)에 대하여 다변량 통계분석인 주성분 분석과 선형판별 분석을 실시하였다. t-검정 결과 국산과 수입산 참기름에서 C16:0, C18:0, C18:1, 및 C18:2 함량 간에 유의적인 차이가 확인되었으며, C16:0과 C18:1 및 C18:2의 상관성은 국산과 수입산 참기름에서 서로 반대되는 경향을 보였다. 실험법 검증을 위한 회수율 검정 결과 82.8~100.2 %의 양호한 결과를 얻을 수 있었다. 주성분 분석을 통해 참기름의 원산지에 따른 집단 분포 양상의 차이를 시각적으로 확인하였다. 참기름 시료를 원산지에 따라 두 집단으로 분류하기 위해 선형판별 분석을 실시한 결과 국산은 88.9 %, 수입산은 100 %의 판별 정확성을 보였다. C16:0 (Wilks λ = 0.361)과 C18:1 (Wilks λ= 0.637)은 참기름 원산지 판별에 가장 판별력이 큰 지방산으로 확인되었다. 전체 62건의 참기름 중 60건이 정확하게 분류되어 96.8 %의 예측정확성을 보였으며 이러한 결과는 상기의 접근법이 참기름의 원산지를 판별하고 분류하는 유용한 툴로서 활용될 수 있음을 보여준다.

SAS패키지를 이용한 EEG신호 시계열분석 시스템 (The Development of the Time Series Analysis System for EEG Signal using SAS Package)

  • 김진호;이현우;임성식;황민철
    • 감성과학
    • /
    • 제2권1호
    • /
    • pp.53-60
    • /
    • 1999
  • EEG 생리신호의 분석은 국내에서도 최근에 활발하게 연구가 진행되고 있으나, 시계열을 이용한 분석법은 통계학의 전문적인 지식을 요구하고 있기 때문에 연구에 많은 어려움이 있다. 그러므로 감성과학 연구자들이 보다 쉽게 이해하고 분석할 수 있는 Tool의 개발이 절실히 요구되고 있다. 본 논문에서는 EEG 생리신호 분석을 위한 모형분석 시스템과 생리신호 분류를 위한 판별분류 시스템을 구축하였다. 이 시스템에서는 신호분석을 위한 그래프 작성, 자극 신호에 대한 모형식별 방법의 제시, 모형에 대한 추정 및 진단 기준에 따른 최적의 모형선정 방법 등을 지원한다. 또한 선정된 모형에 이해 모수를 추정하고 이를 이용하여 통계에 대한 지식이 없이도 쉽게 각 뇌파 신호들을 판별 분류할 수 있다.

  • PDF