• 제목/요약/키워드: Misclassification probability

검색결과 33건 처리시간 0.023초

고객의 이탈 가능성과 LTV를 이용한 고객등급화 모형개발에 관한 연구 (A Model for Effective Customer Classification Using LTV and Churn Probability : Application of Holistic Profit Method)

  • 이훈영;양주환;류치훈
    • 지능정보연구
    • /
    • 제12권4호
    • /
    • pp.109-126
    • /
    • 2006
  • 성공적인 고객관계관리(CRM : customer relationship management)를 수행하기 위해서는 효과적인 고객 등급화가 필요하다. 일반적으로 고객등급화는 고객별로 LTV를 산정한 다음 일정한 비율로 고객을 분류하여 등급을 정하는 방법이 사용되어 왔다. 그러나 이러한 방법은 등급간의 이질성을 명확하게 반영하지 못하기 때문에 적지 않은 문제점을 내포하고 있다. 본 논문에서는 Holistic Profit을 이용해서 고객을 등급화 하는 방법을 제시하고, A 생명보험회사의 고객자료을 이용해서 이를 검증하였다. Holistic Profit은 신용대출 승인정책에서 승인임계점수(Cutoff Point) 책정에 활용되고 있는 방법들 중의 하나이다. 요약하면, 본 논문의 목적은 Holistic Profit을 활용하여 보다 효과적이고 과학적인 방법으로 고객 등급화 하는 방법의 개발과 검증에 있다. 본 논문에서 제시된 방법을 사용해서 고객을 등급화 함으로써 기업은 보다 효과적인 고객관계관리(CRM)와 마케팅 활동을 수행할 수 있을 것으로 기대된다.

  • PDF

합성곱신경망을 활용한 천리안위성 2A호 영상 기반의 동해안 냉수대 감지 연구 (A Study on the GK2A/AMI Image Based Cold Water Detection Using Convolutional Neural Network)

  • 박숭환;김대선;권재일
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1653-1661
    • /
    • 2022
  • 본 연구에서는 천리안위성 2A호 1일 평균 표층수온영상을 대상으로 합성곱신경망(convolution neural network, CNN) 딥러닝 기법을 적용하여 냉수대 발생 여부를 분류하는 연구를 수행하였다. 이를 위하여, 2019년부터 2022년까지 1,155장의 영상을 사용하였으며, 국립수산과학원 제공 냉수대 발생 주의보 및 경보자료로부터 냉수대 발생 영상과 그 외 영상으로 분류하여 학습을 수행하였다. 학습 결과로 82.5%의 probability of detection (POD)와 54.4%의 false alarm ratio (FAR) 지수를 획득하였다. 오분류 분석을 통해 냉수대 분류에 실패한 경우의 대부분은 구름의 영향 때문이며, 비냉수대를 오분류한 경우의 대부분은 실제 영상에 냉수대가 존재함을 확인하였다.

다층퍼셉트론의 잡음 강건성 분석 및 향상 방법 (An Analysis of Noise Robustness for Multilayer Perceptrons and Its Improvements)

  • 오상훈
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.159-166
    • /
    • 2009
  • 이 논문에서는 다층퍼셉트론(MLP:Multilayer Perceptron)에서 입력에 잡음이 섞인 경우 출력노드의 확률밀도 함수를 유도하고, 이의 적분으로 잡음에 의하여 패턴이 오인식될 확률을 유도하였다. 그리고, 이를 향상시키는 선형적 방법을 제안하였다. 즉, 독립성분분석(ICA: independent component analysis)과 주성분분석(PCA: principle component analysis)를 적용하여, 이들이 지닌 잡음 처리 효과를 SNR(Signal-to-Noise Ratio) 관점에서 분석하였다. 그리고 이들이 잡음을 처리한 후 MLP에 입력 시 나타나는 잡음 강건성을 필기체 숫자 인식의 시뮬레이션으로 확인하였다.

The Unified Framework for AUC Maximizer

  • Jun, Jong-Jun;Kim, Yong-Dai;Han, Sang-Tae;Kang, Hyun-Cheol;Choi, Ho-Sik
    • Communications for Statistical Applications and Methods
    • /
    • 제16권6호
    • /
    • pp.1005-1012
    • /
    • 2009
  • The area under the curve(AUC) is commonly used as a measure of the receiver operating characteristic(ROC) curve which displays the performance of a set of binary classifiers for all feasible ratios of the costs associated with true positive rate(TPR) and false positive rate(FPR). In the bipartite ranking problem where one has to compare two different observations and decide which one is "better", the AUC measures the quantity that ranking score of a randomly chosen sample in one class is larger than that of a randomly chosen sample in the other class and hence, the function which maximizes an AUC of bipartite ranking problem is different to the function which maximizes (minimizes) accuracy (misclassification error rate) of binary classification problem. In this paper, we develop a way to construct the unified framework for AUC maximizer including support vector machines based on maximizing large margin and logistic regression based on estimating posterior probability. Moreover, we develop an efficient algorithm for the proposed unified framework. Numerical results show that the propose unified framework can treat various methodologies successfully.

비대칭 오류비용을 고려한 분류기준값 최적화와 SVM에 기반한 지능형 침입탐지모형 (An Intelligent Intrusion Detection Model Based on Support Vector Machines and the Classification Threshold Optimization for Considering the Asymmetric Error Cost)

  • 이현욱;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.157-173
    • /
    • 2011
  • 최근 인터넷 사용의 증가에 따라 네트워크에 연결된 시스템에 대한 악의적인 해킹과 침입이 빈번하게 발생하고 있으며, 각종 시스템을 운영하는 정부기관, 관공서, 기업 등에서는 이러한 해킹 및 침입에 의해 치명적인 타격을 입을 수 있는 상황에 놓여 있다. 이에 따라 인가되지 않았거나 비정상적인 활동들을 탐지, 식별하여 적절하게 대응하는 침입탐지 시스템에 대한 관심과 수요가 높아지고 있으며, 침입탐지 시스템의 예측성능을 개선하려는 연구 또한 활발하게 이루어지고 있다. 본 연구 역시 침입탐지 시스템의 예측성능을 개선하기 위한 새로운 지능형 침입탐지모형을 제안한다. 본 연구의 제안모형은 비교적 높은 예측력을 나타내면서 동시에 일반화 능력이 우수한 것으로 알려진 Support Vector Machine(SVM)을 기반으로, 비대칭 오류비용을 고려한 분류기준값 최적화를 함께 반영하여 침입을 효과적으로 차단할 수 있도록 설계되었다. 제안모형의 우수성을 확인하기 위해, 기존 기법인 로지스틱 회귀분석, 의사결정나무, 인공신경망과의 결과를 비교하였으며 그 결과 제안하는 SVM 모형이 다른 기법에 비해 상대적으로 우수한 성과를 보임을 확인할 수 있었다.

주파수 영역에서의 인공지진과 자연지진의 식별 (Discrimination of Natural Earthquakes and Explosions in Spectral Domain)

  • 김성균;김명수
    • 자원환경지질
    • /
    • 제36권3호
    • /
    • pp.201-212
    • /
    • 2003
  • 한반도 남동부의 경상분지에 한국지질자원연구원의 지진관측망을 비롯한 관측소들이 급격히 증가함에 따라, 지진관측의 능력이 최근에 들어 크게 향상되었다. 그러나, 빈번한 중소규모의 화약발파에 의한 진동이 다수 관측되고 있다. 따라서, 이 지역에서 자연지진과 발파에 의한 인공지진의 식별이 중요한 문제로 부상하였다. 이 지역에서의 인공지진과 자연지진의 적절한 식별법을 확립하기 위하여 소규모의 지역지진 43개와 이에 대응되는 인공지진 43개를 선정하였다. 이 연구에서는 주파수 영역에서 Pg파, Sg파 및 Lg파의 스펙트럼 진폭비를 이용하는 기법들이 폭 넓게 검토되었다. 그들 중 Pg/Lg 스펙트럼 진폭비를 이용하는 방법이 가장 좋은 식별법으로 나타났다. 또한, 식별능력을 향상시키기 위하여 Pg/Lg 스펙트럼비에 다변량 판별분석법을 적용하였다. 거리보정이 안된 수직성분에 비하여 거리에 대한 감쇠효과를 보정한 3성분의 Pg/Lg비에 판별분석법을 적용했을 때의 판별능력은 뚜렷한 증가를 보인다. 주파수 대역 4-l4Hz의 범위에서, 거리 보정한 3성분의 Pg/Lg비에 대한 판별분석의 결과 총 분류비율은 0.89%에 불과한 것으로 나타난다.

ICD-10을 이용한 ICISS의 타당도 평가 (Validation of the International Classification of Diseases 10th Edition Based Injury Severity Score(ICISS))

  • 정구영;김창엽;김용익;신영수;김윤
    • Journal of Preventive Medicine and Public Health
    • /
    • 제32권4호
    • /
    • pp.538-545
    • /
    • 1999
  • Objective : To compare the predictive power of International Classification of Diseases 10th Edition(ICD-10) based International Classification of Diseases based Injury Severity Score(ICISS) with Trauma and Injury Severity Score(TRISS) and International Classification of Diseases 9th Edition Clinical Modification(ICD-9CM) based ICISS in the injury severity measure. Methods : ICD-10 version of Survival Risk Ratios(SRRs) was derived from 47,750 trauma patients from 35 Emergency Centers for 1 year. The predictive power of TRISS, the ICD-9CM based ICISS and ICD-10 based ICISS were compared in a group of 367 severely injured patients admitted to two university hospitals. The predictive power was compared by using the measures of discrimination(disparity, sensitivity, specificity, misclassification rates, and ROC curve analysis) and calibration(Hosmer-Lemeshow goodness-of-fit statistics), all calculated by logistic regression procedure. Results : ICD-10 based ICISS showed a lower performance than TRISS and ICD-9CM based ICISS. When age and Revised Trauma Score(RTS) were incorporated into the survival probability model, however, ICD-10 based ICISS full model showed a similar predictive power compared with TRISS and ICD-9CM based ICISS full model. ICD-10 based ICISS had some disadvantages in predicting outcomes among patients with intracranial injuries. However, such weakness was largely compensated by incorporating age and RTS in the model. Conclusions : The ICISS methodology can be extended to ICD-10 horizon as a standard injury severity measure in the place of TRISS, especially when age and RTS were incorporated in the model. In patients with intracranial injuries, the predictive power of ICD-10 based ICISS was relatively low because of differences in the classifying system between ICD-10 and ICD-9CM.

  • PDF

금속가공유 노출과 암 발생위험역학조사에서 금속가공유 노출 평가 방법에 대한 고찰 (Critical Literature Review on Exposure Assessment Methods for Metalworking Fluids in Epidemiological Cancer Study)

  • 박동욱
    • 한국산업보건학회지
    • /
    • 제17권4호
    • /
    • pp.282-288
    • /
    • 2007
  • 그 동안 많은 역학연구를 통해서 금속가공유(metalworking fluid, MWFs) 노출과 여러 조직에서 암 발생 위험과의 관계를 밝혔지만, 금속가공유 종류(비수용성, 수용성, 합성, 준합성)별로 구분된 위험은 아직 완전하게 규명되지 않았다. 역학조사에서 금속가공유 노출을 대체할 수 있는 인자(surrogate)로서 정성적(qualitative), 명목적(ordinal) 혹은 준정량적인(semi-quantitative) 변수들(금속가공유에 대한 노출 유무, 노출 정도: 높음, 낮음 등, 직업 유무, 근무기간 등)을 이용하여 금속가공유 노출을 평가하였다. 이러한 노출평가방법은 기본적으로 금속가공유 노출 강도(intensity)가 고려되지 않을 뿐만 아니라 노출 분류 오류(misclassification)도 항상 존재할 수 있어 금속가공유 노출은 물론이고 종류별 위험을 밝히기 어렵다. 일부 역학연구에서 금속가공유 종류별 누적 노출양(cumulative exposure level)과 암위험과의 관계를 밝혔다. 이러한 연구결과들은 모두 금속가공유 종류별로 과거노출을 추정할 수 있는 자료(정량적인 노출평가자료, 과거직업력, 취급했던 금속가공유 종류 등)가 잘 기록되어 있는 1개의 대규모 자동차공장에서 나온 것들이다. 따라서 금속가공유에 대한 노출자료가 부족하고 사용특성에 대한 기록이 없거나 부족한 일반 인구나 산업을 대상으로 한 역학연구에서는 금속가공유의 종류별 위험을 밝히는것은 불가능하다. 금속가공유 종류별로 과거 노출에 대한 확률(probability)을 추정하는데 일반적으로 활용할 수 있는 노출확률 메트릭스를 개발하는 것이 필요하다.

Feasibility Evaluation of High-Tech New Product Development Projects Using Support Vector Machines

  • 신택수;노전표
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.241-250
    • /
    • 2005
  • New product development (NPD) is defined as the transformation of a market opportunity and a set of assumptions about product technology into a product available for sale. Managers charged with project selection decisions in the NPD process, such as go/no-go choices and specific resource allocation decisions, are faced with a complicated problem. Therefore, the ability to develop new successful products has identifies as a major determinant in sustaining a firm's competitive advantage. The purpose of this study is to develop a new evaluation model for NPD project selection in the high -tech industry using support vector machines (SYM). The evaluation model is developed through two phases. In the first phase, binary (go/no-go) classification prediction model, i.e. SVM for high-tech NPD project selection is developed. In the second phase. using the predicted output value of SVM, feasibility grade is calculated for the final NPD project decision making. In this study, the feasibility grades are also divided as three level grades. We assume that the frequency of NPD project cases is symmetrically determined according to the feasibility grades and misclassification errors are partially minimized by the multiple grades. However, the horizon of grade level can be changed by firms' NPD strategy. Our proposed feasibility grade method is more reasonable in NPD decision problems by considering particularly risk factor of NPD in viewpoints of future NPD success probability. In our empirical study using Korean NPD cases, the SVM significantly outperformed ANN and logistic regression as benchmark models in hit ratio. And the feasibility grades generated from the predicted output value of SVM showed that they can offer a useful guideline for NPD project selection.

  • PDF

Improving Classification Accuracy in Hierarchical Trees via Greedy Node Expansion

  • Byungjin Lim;Jong Wook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.113-120
    • /
    • 2024
  • 정보통신 기술이 발전함에 따라 우리는 일상에서 다양한 형태의 데이터를 손쉽게 생성하고 있다. 이처럼 방대한 데이터를 효율적으로 관리하려면, 체계적인 카테고리별 분류가 필수적이다. 효율적인 검색과 탐색을 위해서 데이터는 트리 형태의 계층적 구조인 범주 트리로 조직화되는데, 이는 뉴스 웹사이트나 위키피디아에서 자주 볼 수 있는 구조이다. 이에 따라 방대한 양의 문서를 범주 트리의 단말 노드로 분류하는 다양한 기법들이 제안되었다. 그러나 범주 트리를 대상으로 하는 문서 분류기법들은 범주 트리의 높이가 증가할수록 단말 노드의 수가 기하급수적으로 늘어나고 루트 노드부터 단말 노드까지의 길이가 길어져서 오분류 가능성이 증가하며, 결국 분류 정확도의 저하로 이어진다. 그러므로 본 연구에서는 사용자의 요구 분류 정확도를 만족시키면서 세분화된 분류를 구현할 수 있는 새로운 노드 확장 기반 분류 알고리즘을 제안한다. 제안 기법은 탐욕적 접근법을 활용하여 높은 분류정확도를 갖는 노드를 우선적으로 확장함으로써, 범주 트리의 분류 정확도를 극대화한다. 실데이터를 이용한 실험 결과는 제안 기법이 단순 방법보다 향상된 성능을 제공함을 입증한다.