• 제목/요약/키워드: 의사결정나무 분석

검색결과 409건 처리시간 0.022초

사전 세분화를 통한 고객 분류모형의 효과성 제고에 관한 연구 (Improving the Effectiveness of Customer Classification Models: A Pre-segmentation Approach)

  • 장남식
    • 경영정보학연구
    • /
    • 제7권2호
    • /
    • pp.23-40
    • /
    • 2005
  • 시장에서의 경쟁이 점차 심화되고 서비스나 상품에 대한 고객들의 요구와 기대치가 증가함에 따라 기업들에 있어 과학적인 데이터 분석에 근거한 경영전략 수립 및 실행의 필요성이 어느 때보다 크게 강조되고 있다. 그러나 인적자원과 및 자금 등을 포함한 가용자원은 한정적이기 때문에 이들 자원을 얼마나 효율적으로 사용하여 효과적인 결과를 획득하는가가 기업 성패를 좌우하는 주요 지표가 되고있다. 본 연구에서는 선택과 집중적 자원 배분이라는 이슈에 초점을 맞춰 사전 세분화를 통해 선정된 고객 군만을 대상으로 고객의 특성을 파악하고 관리하는 방안이 전체 고객을 대상으로 하는 것보다 보다 의미가 있다는 것을 실제 현업데이터를 통해 검증하고자 하였다. 이를 위해 카드사, 이동통신사, 보험사의 고객 인적데이터 및 거래데이터를 수집하였고, 통계분석과 현업전문가의 의견을 수렴해 고객 세분화를 수행하였으며, 각 세분 군별로 데이터마이닝의 의사결정나무 기법을 이용해 해지모형을 구축하여 전체 고객을 대상으로 한 모형과 정분류율과 규칙의 간결성 측면에서 비교 평가하였다. 결과적으로 세분 군별 해지모형이 전체 고객대상 모형에 비해 정분류율은 높거나 비슷한 수준을 유지하면서 보다 간결하고 의미있는 규칙을 제공하였다.

워게임모델간 근접전투 피해평가 모의논리 일치에 관한 연구 : 제병협동통합연동체계를 중심으로 (The Study on Consistency of Simulation Logic about Close Combat Damage Assessment among Constructive Models : Based on Combined Arms Integrated Interoperability System)

  • 문호석;김형세;황명상;배현웅;이동근
    • 한국국방경영분석학회지
    • /
    • 제37권1호
    • /
    • pp.87-97
    • /
    • 2011
  • 본 논문에서는 앞으로 개발되어 전력화 예정인 제병협동통합연동체계에서 모델간 연동으로 인해서 발생가능한 문제점 중의 하나인 전투 피해평가 차이를 극복할 수 있는 근접전투 피해평가 전문가시스템을 제안하였다. 제병협동통합연동체계에서 서로 다른 모델에 속한 부대간 교전이 발생할 때에 피해평가 결과가 많은 차이를 보이고 있었는데, 이러한 피해평가의 차이는 제병협동통합연동체계의 신뢰성 문제와 직관되는 중요한 부분으로 반드시 해결되어야 할 부분이다. 이러한 문제점을 해결하고 신뢰할 만한 근접전투 피해평가를 위해 전문가시스템을 의사결정나무를 이용해서 제안하였다. 제안하는 전문가시스템은 실험 결과를 통해서 신뢰할 만한 결과를 보였고, 별도의 시스템으로 운용하지 않고 기존 모델에 모듈형식으로 탑재되기 때문에 시스템 측면에서 제병협동통합연동체계를 보다 단순화 시킬 수 있고 예산 절감의 효과를 기대할 수 있다.

퍼지이론과 SVM 결합을 통한 기업부도예측 최적화 (Optimized Bankruptcy Prediction through Combining SVM with Fuzzy Theory)

  • 최소윤;안현철
    • 디지털융복합연구
    • /
    • 제13권3호
    • /
    • pp.155-165
    • /
    • 2015
  • 기업부도예측은 재무 분야에 있어 중요한 연구주제 중 하나로 1960년대 이후부터 꾸준히 연구되어져 왔다. 국내의 경우, IMF 사태 이후 기업부도예측에 관한 중요성이 강조되고 있다. 이에 본 연구에서는 보다 정확한 기업부도예측을 위해 높은 예측력과 동시에 과적합화의 문제를 해결한다고 알려진 SVM(Support Vector Machine)을 기반으로 퍼지이론(fuzzy theory)을 활용해 입력변수를 확장하고, 유전자 알고리즘(GA, Genetic Algorithm)을 이용해 유사 혹은 유사최적의 입력변수집합과 파라미터를 탐색하는 새로운 융합모형을 제시한다. 제안모형의 유용성을 검증하기 위하여 H은행의 비외감 중공업 기업 데이터를 이용하여 실험을 수행하였으며, 비교모형으로는 로짓분석, 판별분석, 의사결정나무, 사례기반추론, 인공신경망, SVM을 선정하였다. 실험결과, 제안모형이 모든 비교모형들에 비해 우수한 예측력을 보이는 것으로 나타났다. 본 연구는 우수한 예측 성능을 가진 다기법 융합 모형을 새롭게 제안하여, 부도예측 분야에 학술적, 실무적으로 기여할 수 있을 것으로 기대된다.

연관성 규칙의 탐색을 위한 순수 대칭적 J 측도의 활용 (Utilizing Purely Symmetric J Measure for Association Rules)

  • 박희창
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2865-2872
    • /
    • 2018
  • 데이터 마이닝 분야에서 개발된 기법에는 연관성 규칙, 군집분석, 의사결정나무, 신경망 등 여러 가지가 있는데 이들 중에서 연관성 규칙은 지지도, 신뢰도, 그리고 향상도 등 여러 가지 연관성 평가 기준을 이용하여 항목들 간에 특정한 연관성을 탐색하는 기법이다(Park, 2014). 이러한 연관성 규칙은 Agrawal et al.(1993)이 처음 제안하였으며, 그 이후로 여러 연구자들에 의해 연구가 진행되고 있으며, 최근에는 교차 엔트로피와 관련된 연구들이 발표되고 있다(Park, 2016b). 본 논문에서는 기존에 발표된 J 측도에 방향성과 순수성을 고려한 순수 대칭적 J 측도를 제안하고 예제를 활용하여 그 유용성에 대해 알아보았다. 그 결과, 동시발생빈도가 증가함에 따라 순수 대칭적 J 측도가 기존의 J 측도와 대칭적 J 측도, 순수 교차 엔트로피 측도보다 훨씬 분명하게 변하는 것을 알 수 있었으며, 불일치빈도의 크기에 따라서도 순수 대칭적 J 측도가 변화하는 폭이 더 커짐에 따라 연관성 유무를 더 분명하게 파악할 수 있었다. 따라서 순수 대칭적 J 측도는 데이터가 존재하는 어느 분야에서든지 연관성 규칙의 평가에 적용이 가능할 것으로 생각된다.

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

Prediction of drowning person's route using machine learning for meteorological information of maritime observation buoy

  • Han, Jung-Wook;Moon, Ho-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-12
    • /
    • 2022
  • 해양조난사고 발생 시 해상 익수자의 안전과 생명 보장을 위해 구조자산을 활용한 신속한 탐색 및 구조작전은 매우 중요하다. 본 연구는 해양관측부이에서 수집되는 기상정보에 다중선형회귀분석, 의사결정나무, 서포트벡터머신, 벡터자기회귀, 순환신경망의 LSTM을 활용하여 울릉도 북서해역의 표층해류를 분석하고 유향과 유속에 대한 각각의 예측모형을 구축하여 예측된 유향과 유속정보를 통해 해상 익수자의 이동경로를 예측하는 모형들을 제안한다. 본 연구에서 적용한 다양한 기계학습 모형을 MAE와 RMSE의 성능 평가척도로 비교해 볼 때 LSTM이 가장 우수한 성능을 보였다. 또한, 익수자 이동지점과 예측모형의 예측지점 간 거리 차이에 있어서도 LSTM이 다른 모형들에 비해 탁월한 성능을 나타내었다.

빅데이터 및 인공지능을 활용한 축구선수 연봉등급 예측 (Predicting Soccer Players' Wage Grades Using Big Data and Artificial Intelligence)

  • 정현성;김진화;현대원
    • 산업융합연구
    • /
    • 제22권8호
    • /
    • pp.19-28
    • /
    • 2024
  • 본 연구는 빅데이터와 인공지능을 활용하여 축구선수의 연봉등급을 예측하는 새로운 방법을 제안한다. 축구선수의 연봉 예측은 선수의 성과와 잠재력을 정확하게 평가하고, 이를 연봉에 반영함으로써 축구 산업의 경제적 효율성을 높이는 중요한 과제이다. 본 연구는 FIFA 22에서 제공하는 선수 능력치 데이터를 분석하여, 다양한 빅데이터 및 인공지능 기법을 통해 선수의 연봉등급을 예측한다. 주요 연구 방법으로는 의사결정나무, 인공신경망, 랜덤 포레스트, 부스팅 등을 활용하였으며, 이를 통해 연봉등급을 예측하는 모델의 정확도를 비교 분석하였다. 연구 결과, 랜덤 포레스트와 부스팅 기법이 가장 높은 예측 정확도를 보였다. 이 연구는 빅데이터와 인공지능을 이용해 축구선수의 연봉등급을 예측하고, 축구 산업에 새로운 관점을 제공한다.

머신러닝 분류 알고리즘을 활용한 선박 접안속도 영향요소의 중요도 분석 (Analysis of Feature Importance of Ship's Berthing Velocity Using Classification Algorithms of Machine Learning)

  • 이형탁;이상원;조장원;조익순
    • 해양환경안전학회지
    • /
    • 제26권2호
    • /
    • pp.139-148
    • /
    • 2020
  • 선박이 접안할 때 발생하는 접안에너지에 가장 영향력이 큰 요소는 접안속도이며, 과도한 경우 사고로 이어질 수 있다. 접안속도의 결정에 영향을 미치는 요소는 다양하지만 기존 연구에서는 일반적으로 선박 크기에 제한하여 분석하였다. 따라서 본 연구에서는 다양한 선박 접안속도의 영향요소를 반영하여 분석하고 그에 따른 중요도를 도출하고자 한다. 분석에 활용한 데이터는 국내 한 탱커부두의 선박 접안속도를 실측한 것을 바탕으로 하였다. 수집된 데이터를 활용하여 머신러닝 분류 알고리즘인 의사결정나무(Decision Tree), 랜덤포레스트(Random Forest), 로지스틱회귀(Logistic Regression), 퍼셉트론(Perceptron)을 비교분석하였다. 알고리즘 평가 방법으로는 혼동 행렬에 따른 모델성능 평가지표를 사용하였다. 분석 결과, 가장 성능이 좋은 알고리즘으로는 퍼셉트론이 채택되었으며 그에 따른 접안속도 영향요인의 중요도는 선박 크기(DWT), 부두 위치(Jetty No.), 재화상태(State) 순으로 나타났다. 이에 따라 선박 접안 시, 선박의 크기를 비롯하여 부두 위치, 재화 상태 등 다양한 요인을 고려하여 접안속도를 설계하여야 한다.

특성화고등학교 졸업 후 취업자의 근속 원인 분석 연구 -상업계 고등학교를 중심으로 (Analysis of the Causes for Continuous Employment of Employed Students after Graduation from Characterization High School -Focusing on the Commercial High Schools)

  • 정규한;이장희
    • 실천공학교육논문지
    • /
    • 제14권1호
    • /
    • pp.165-177
    • /
    • 2022
  • 본 연구는 특성화고등학교를 졸업한 취업자의 근속 원인 분석을 통해 일선 학교에서 장기 근속을 위한 취업 지도의 방향을 제시하기 위함이다. 특별히, 상업계고등학교를 졸업한 학생들이 취업을 결정하는데 끼친 개인적 이유와 취업 후 근속에 대한 개인, 학교, 회사 및 정부 정책 요인 등을 분석하여 장기 근속을 위한 학생 지도 방안을 제시하는데 그 목적이 있다. 이를 위해, 전국의 상업계고등학교 졸업자를 대상으로 설문조사를 실시하고, 탐색적 요인 분석, Cronbach's Alpha, 의사결정나무 분석기법을 적용하여 설문 데이터의 타당도, 신뢰도 및 인과관계를 분석하였다. 취업에 대한 개인적인 목표 설정이 1년 이상 근속에 중요한 요인이고, 직장에서의 인간관계와 개인 성격이 3년 이상 근속에 중요한 요인이며, 취업을 하는 계기는 개인적 사유와 학교의 권장 영향이 크고, 취업 특강, 캠프, '선배와 교사의 조언' 프로그램이 취업에 도움이 되고, 회계 및 컴퓨터 관련 교과가 근속에 도움이 된다는 것을 확인할 수 있었다. 이에 따라, 특성화고등학교에서는 개인적인 목표 설정을 위한 교육과 사회생활의 기반이 되는 인간관계 형성 등에 대한 구체적인 지도방안 마련과 취업 및 근속에 도움되는 상기한 과목 및 프로그램의 적극적인 운영이 요구된다.

부도예측 개선을 위한 하이브리드 언더샘플링 접근법 (A Hybrid Under-sampling Approach for Better Bankruptcy Prediction)

  • 김태훈;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.173-190
    • /
    • 2015
  • 부도는 막대한 사회적, 경제적 손실을 야기할 수 있으므로, 미리 부도여부를 정확하게 예측하여 선제 대응하는 것은 경영분야에서 대단히 중요한 의사결정문제 중 하나이다. 이에 지능정보시스템 분야에서도 그간 기업의 재무 데이터에 기반해 부도예측을 개선하기 위한 노력을 기울여왔는데, 안타깝게도 기존의 연구들은 대부분 분류모형의 성능 개선을 통해 예측 정확도를 개선하는 것에만 주로 초점을 맞추어 다른 요소들을 충분히 고려하지 못했다는 한계가 있다. 이러한 배경에서 본 연구는 부도예측 모형의 정확도를 개선하기 위한 방편으로 새로운 데이터 전처리 방법, 그 중에서도 효과적인 표본추출 방법을 제안하고자 한다. 일반적으로 부도예측을 위해 사용되는 데이터들은 극심한 데이터 불균형 문제에 노출되어 있는데, 본 연구에서는 k-reverse nearest neighbor(k-RNN)와 one-class support vector machine(OCSVM) 방법을 결합한 하이브리드 언더샘플링(hybrid under-sampling) 접근법을 통해 이같은 데이터 불균형 문제를 해결하고자 하였다. 본 연구에서 제안한 접근법에서 k-RNN은 이상치를 효과적으로 제거할 수 있으며, OCSVM은 다수를 구성하는 등급의 데이터로부터 정보량이 풍부한 표본만 효과적으로 선택할 수 있는 수단으로 활용될 수 있다. 제안된 기법의 성능을 검증하기 위해, 본 연구에서는 국내 한 은행의 비외감기업 부도예측모형 구축에 제안 기법을 적용해 본 뒤, 일반적으로 많이 사용되는 랜덤샘플링(random sampling)과 제안 기법의 성능을 비교해 보았다. 그 결과, 로지스틱 회귀분석, 판별분석, 의사결정나무, SVM 등 대다수의 분류모형에 있어 분류 정확도가 개선됨을 확인할 수 있었으며, 모든 분류모형에 있어 부정 오류, 즉 부실기업을 정상으로 예측하는 오류율이 크게 감소함을 확인할 수 있었다.