• 제목/요약/키워드: decision tree induction

검색결과 38건 처리시간 0.021초

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

Neural network rule extraction for credit scoring

  • Bart Baesens;Rudy Setiono;Lille, Valerina-De;Stijn Viaene
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.128-132
    • /
    • 2001
  • In this paper, we evaluate and contrast four neural network rule extraction approaches for credit scoring. Experiments are carried our on three real life credit scoring data sets. Both the continuous and the discretised versions of all data sets are analysed The rule extraction algorithms, Neurolonear, Neurorule. Trepan and Nefclass, have different characteristics, with respect to their perception of the neural network and their way of representing the generated rules or knowledge. It is shown that Neurolinear, Neurorule and Trepan are able to extract very concise rule sets or trees with a high predictive accuracy when compared to classical decision tree(rule) induction algorithms like C4.5(rules). Especially Neurorule extracted easy to understand and powerful propositional if -then rules for all discretised data sets. Hence, the Neurorule algorithm may offer a viable alternative for rule generation and knowledge discovery in the domain of credit scoring.

  • PDF

프로토타입 학습 모델에 관한 연구 (A Study on a Prototype Learning Model)

  • 송두헌
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.151-156
    • /
    • 2001
  • 우리는 개념 학습에 있어서 전통적으로 사용되어 온 연역 트리 구성법이나 규칙 학습법과 다른 새로운 개념 표현 기법을 소개하고자 한다. 우리의 PROLEARN 알고리즘은 각 클래스로부터 주어진 예제를 가장 잘 설명할 수 있는 가상 예제, 즉, 프로토타입을 하나 이상 학습하고 이것을 마치 주어진 예제처럼 취급하여 일반적인 개체 중심 학습법처럼 분류하도록 한다. 우리의 프로토타입 개념은 인지 심리학에서 사용한 같은 용어와는 하나의 개념이 하나 이상의 프로토타입을 가질 수 있도록 한 점에서 다르며 학습된 프로토타입은 근본적으로 ‘가상 예제’라는 점에서 다른 개체 중심 학습법과 다르다. 실험 결과 이 알고리즘은 정확도에서 다른 알고리즘에 뒤지지 않으며 실제 학습 문제에서 자주 발생하는 불안정성 문제, 즉 훈련 예제 집합이 바뀌면 알고리즘의 정확도도 영향 받는 부분도 해소하였다.

  • PDF

데이터마이닝을 활용한 한방분야에서의 데이터베이스 마케팅에 대한 연구 (A Study on the Database Marketing using Data Mining in the Traditional Medicine)

  • 이상영;이윤석
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.271-280
    • /
    • 2005
  • 본 연구에서는 한방분야에서 검진에 영향을 미치는 요인들에 대하여 의사결정나무기법을 이용하여 도출하였고, 군집 분석을 통해 환자들의 특성에 대하여 알아보았다. 또한 질병간 연관성 분석을 재입원 환자 군들의 질병 구조를 파악하기 위하여 실시하였다 아울러 도출된 군집들은 병원수익에 어떤 영향을 미치고 있는지에 대한 결과를 도출하였다. 즉 한방분야에 대하여 데이터마이닝 기법을 적용한 데이터베이스 마케팅을 통해 내원 환자들의 특성을 파악하고 병원 수익에 영향을 미치는 요인들을 실증적으로 도출하였다. 본 연구를 통하여 병원의 효율적인 운영과 활성화를 위한 데이터베이스 마케팅을 실시함으로써 병원 경영 에 효율성을 도모할 수 있을 것이다.

  • PDF

유전자 알고리즘을 활용한 데이터 불균형 해소 기법의 조합적 활용 (Combined Application of Data Imbalance Reduction Techniques Using Genetic Algorithm)

  • 장영식;김종우;허준
    • 지능정보연구
    • /
    • 제14권3호
    • /
    • pp.133-154
    • /
    • 2008
  • 데이터 마이닝 분류 문제에서 발생하는 데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극히 많거나 작은 경우를 말한다. 이러한 불균형 문제를 해결하기 위해 표본추출과 오분류 비용에 근거한 여러 가지 기법들이 제시되었으며, 이들 간의 성능 비교에 대한 연구들도 이루어졌다. 본 논문에서는 기존에 제시된 불균형 문제 해소기법들의 조합적 활용에 대한 타당성에 대해 살펴보고 유전자 알고리즘을 통해 그 결합 비율을 결정하여 더 좋은 성과를 낼 수 있는지에 대해 살펴보도록 한다. 소수 범주에 대한 정확성을 높이기 위해 소수 범주에 대한 F-value에 기초하여 기법들의 결합비율을 결정하고 기존 단일 기법들의 성과와 임의의 비율에 의한 격자표 형태의 결합 성과를 비교하여 결합적 활용의 타당성을 살펴본다. 이를 실증적으로 검토하기 위해서, 일반적으로 데이터 불균형 문제를 해결하기 위해 많이 사용되는 4개의 공개 데이터 집합을 이용하여 타당성 분석을 수행하였다. 분석 결과, 전체적으로 단일 기법들의 결합적 활용이 데이터 불균형 해소에 유용한 것으로 나타났다.

  • PDF

사전 세분화를 통한 고객 분류모형의 효과성 제고에 관한 연구 (Improving the Effectiveness of Customer Classification Models: A Pre-segmentation Approach)

  • 장남식
    • 경영정보학연구
    • /
    • 제7권2호
    • /
    • pp.23-40
    • /
    • 2005
  • 시장에서의 경쟁이 점차 심화되고 서비스나 상품에 대한 고객들의 요구와 기대치가 증가함에 따라 기업들에 있어 과학적인 데이터 분석에 근거한 경영전략 수립 및 실행의 필요성이 어느 때보다 크게 강조되고 있다. 그러나 인적자원과 및 자금 등을 포함한 가용자원은 한정적이기 때문에 이들 자원을 얼마나 효율적으로 사용하여 효과적인 결과를 획득하는가가 기업 성패를 좌우하는 주요 지표가 되고있다. 본 연구에서는 선택과 집중적 자원 배분이라는 이슈에 초점을 맞춰 사전 세분화를 통해 선정된 고객 군만을 대상으로 고객의 특성을 파악하고 관리하는 방안이 전체 고객을 대상으로 하는 것보다 보다 의미가 있다는 것을 실제 현업데이터를 통해 검증하고자 하였다. 이를 위해 카드사, 이동통신사, 보험사의 고객 인적데이터 및 거래데이터를 수집하였고, 통계분석과 현업전문가의 의견을 수렴해 고객 세분화를 수행하였으며, 각 세분 군별로 데이터마이닝의 의사결정나무 기법을 이용해 해지모형을 구축하여 전체 고객을 대상으로 한 모형과 정분류율과 규칙의 간결성 측면에서 비교 평가하였다. 결과적으로 세분 군별 해지모형이 전체 고객대상 모형에 비해 정분류율은 높거나 비슷한 수준을 유지하면서 보다 간결하고 의미있는 규칙을 제공하였다.

속성값 이산화 및 부정값 허용을 하는 의사결정트리 기반의 유전자 발현 데이터의 마커 후보 식별 (Candidate Marker Identification from Gene Expression Data with Attribute Value Discretization and Negation)

  • 이경미;이건명
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.575-580
    • /
    • 2011
  • 맞춤형 의료에 대한 기대가 커지면서 분자생물학적인 의료정보의 분석이 중요해지고 있다. 유전자 발현 데이터는 생명현상의 분자생물학적 동태을 보여주는 대표적인 데이터이다. 유전자 발현 데이터의 분석을 통해서 유전자 발현 수준에서의 특정 질병의 발병, 전이, 재발 등을 예측하기 위한 마커에 대한 관심이 많다. 두 개의 대조적인 관심 집단을 식별하는 유전자를 찾기 위해 통계적인 방법 등이 이용되어 왔다. 이 논문에서는 여러 유전자의 조합을 통해서 집단을 식별할 수 있는 후보 마커를 찾는 의사결정트리 기반 방법을 제안한다. 제안한 방법에서는 수치적인 유전자의 발현값을 세 개의 범주값으로 이산화시키고, 유전자 발현값을 해당 범주값뿐만 아니라 범주값의 부정값을 허용할 수 있도록 한다. 한편, 마커로 활용하기 위해서는 소수의 유전자만을 사용하는 것이 바람직하기 때문에, 마커에 소속할 유전자의 개수를 제한하여 마커를 찾도록 한다.

신경학적 손상에 의한 언어장애인 음성 인식률 개선(H/W, S/W)에 관한 연구 (A Study on Improving Speech Recognition Rate (H/W, S/W) of Speech Impairment by Neurological Injury)

  • 이형근;김순협;양기웅
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1397-1406
    • /
    • 2019
  • 신경학적 손상에 의한 언어장애인/비장애인 간의 일상적인 휴대폰 통화시 신경학적 손상으로 인한 발음의 정확도와 언어장애인의 발음 특징이 결합되어 원활한 의사소통을 저해하는 경우가 많다. 이러한 문제점을 개선하기 위하여 제한하는 방법은 언어장애인 특성에 맞춘 단어의 모호성(out of vocabulary) 개선과, 언어 장애인 구강 특성에 따른 어려운 발성 부분을 인위적으로 보정해주는 유도선이 포함된 MEMS(Micro Electro-mechanical System) Microphone 장치 개선이다. S/W적 개선은 도치기능이 포함된 결정트리이며, 연속어 특성을 감안하여 개선된 matrix-vector rnn 방법을 제시하였다. H/W와 S/W 특성을 감안하여 유사 사전을 만들어 원활한 의사소통을 위한 말명료도 향상에 기여하였다.