• 제목/요약/키워드: Ensemble

검색결과 1,361건 처리시간 0.025초

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.

기상청 기후예측시스템(GloSea6) - Part 2: 기후모의 평균 오차 특성 분석 (The KMA Global Seasonal forecasting system (GloSea6) - Part 2: Climatological Mean Bias Characteristics)

  • 현유경;이조한;신범철;최유나;김지영;이상민;지희숙;부경온;임소민;김혜리;류영;박연희;박형식;추성호;현승훤;황승언
    • 대기
    • /
    • 제32권2호
    • /
    • pp.87-101
    • /
    • 2022
  • In this paper, the performance improvement for the new KMA's Climate Prediction System (GloSea6), which has been built and tested in 2021, is presented by assessing the bias distribution of basic variables from 24 years of GloSea6 hindcasts. Along with the upgrade from GloSea5 to GloSea6, the performance of GloSea6 can be regarded as notable in many respects: improvements in (i) negative bias of geopotential height over the tropical and mid-latitude troposphere and over polar stratosphere in boreal summer; (ii) cold bias of tropospheric temperature; (iii) underestimation of mid-latitude jets; (iv) dry bias in the lower troposphere; (v) cold tongue bias in the equatorial SST and the warm bias of Southern Ocean, suggesting the potential of improvements to the major climate variability in GloSea6. The warm surface temperature in the northern hemisphere continent in summer is eliminated by using CDF-matched soil-moisture initials. However, the cold bias in high latitude snow-covered area in winter still needs to be improved in the future. The intensification of the westerly winds of the summer Asian monsoon and the weakening of the northwest Pacific high, which are considered to be major errors in the GloSea system, had not been significantly improved. However, both the use of increased number of ensembles and the initial conditions at the closest initial dates reveals possibility to improve these biases. It is also noted that the effect of ensemble expansion mainly contributes to the improvement of annual variability over high latitudes and polar regions.

풍물굿의 해외 문화이주 현상에 관한 연구 - 캐나다 토론토의 풍물패 활동을 중심으로 - (A Study of Cultural Migration of Pungmul-gut - Focusing on a Pungmul-pae's Activity in Toronto, Canada -)

  • 이용식
    • 공연문화연구
    • /
    • 제41호
    • /
    • pp.353-380
    • /
    • 2020
  • 사물놀이/풍물굿은 해외 한인들에게는 민족정체성의 상징이다. 한인사회의 각종 행사에서 사물놀이/풍물굿은 한국문화의 대표적 디아스포라 음악으로 자리매김한다. 한편으로 해외에서 사물놀이/풍물굿은 한국인뿐만 외국인도 즐기는 글로벌음악으로 성장했다. 해외에서 결성된 각종 음악공동체를 통해 사물놀이/풍물굿은 '전통과 변형', '정통성과 혼종성'의 담론을 통해 문화변용과 문화적응의 문화이주 현상을 극명하게 보여준다. 이 글에서는 캐나다 토론토에서 활동하는 풍물패 '비춰주네'의 문화적·음악적 정체성을 통해 풍물굿의 문화이주 현상을 밝혔다. 이 글에서 논의하는 캐나다 토론토의 풍물패 '비춰주네'는 외국인 상쇠에 의해 조직된 단체이다. 외국인들에게 풍물굿은 월드뮤직의 한 갈래로서 쉽게 배울 수 있는 음악이다. 그렇기에 월드뮤직에 관심 있는 외국인들에게 풍물굿은 접근이 어렵지 않다. 현재 이 단체는 외국인과 한인이 함께 어우러지는 개방적 '음악공동체'를 지향한다. 그러면서도 풍물굿의 전통성과 정통성을 유지하려는 노력을 경주한다. 각종 교재와 인터넷 시청각자료를 활용하여 가락의 정통성을 유지하면서 변형과 혼종성이라는 문화변용이 작용하지 않는다. 오히려 한인뿐만 아니라 외국인이 함께 참가하면서 한국음악의 세계화를 촉진시킨다. 풍물패 '비춰주네'의 공연 사례를 통해 캐나다에서의 풍물굿의 문화적응을 살펴보았다. 진보적 주류사회에서 주최하는 공연과 보수적 한인사회에서 주최하는 공연의 대비를 통해 풍물굿에 대한 인식을 살펴보았다. 진보적 외국인 감상층은 풍물굿의 민중적 본성을 이해한다. 보수적 한인 감상층은 풍물굿의 전통적 본질을 받아들이지만, '소란'한 음악적 · 음향적 요인은 받아들이기가 쉽지 않다. 결국 풍물굿의 긍정적/부정적 수용은 외국인/한인이라는 민족적 요인보다는 진보적/보수적이라는 사상적 성향이 중요하게 작동한다.

관악영산회상 중 상령산의 선율 구조 - 피리 선율과 대금 연음의 관계를 중심으로 - (The Melodic Structure of Sangnyeongsan in Gwanak-yeongsanhoesang - Focused on the Relationship between Piri Melody and Daegeum yeoneum -)

  • 임현택
    • 공연문화연구
    • /
    • 제39호
    • /
    • pp.701-748
    • /
    • 2019
  • 삼현영산회상 또는 표정만방지곡으로도 불리는 관악영산회상은 삼현육각의 악기편성 혹은 여기에 소금과 아쟁이 추가되는 대규모의 관악합주편성으로 연주된다. 본 연구는 관악영산회상 상령산의 주선율을 연주하는 피리 선율의 구조 및 형식을 분석하고, 대금의 연음 구조 및 기능을 파악하여 피리 선율과 대금 연음의 관계를 고찰하는 것을 목적으로 한다. 관악영산회상 상령산에서 피리 선율의 악구를 나누는 기준이 되는 것은 연음이다. 특히 대금의 연음은 주선율을 연주하는 피리의 악구를 수식 또는 연장하여 마무리 짓고, 피리가 쉬는 동안 다음 악구의 동기 또는 동기 요소를 제시해주는 등의 기능을 수행한다. 피리의 최소 단위 선율의 여러 형태 중 a, b, g, i의 유형은 피리 선율의 한 악구를 이루는 중요한 동기 요소가 된다. 특히 주요 동기(Main Motive)인 a형(중(仲)→무(無))은 2도 위로 이도되어 강한 긴장감을 형성하는 b형(임(林)→한(潢))과 대비를 이루고 있으며, g형(중(仲)→임(林))의 형태로 변화되거나 3도 아래 이도된 i형(태(太)→임(林))으로의 변화를 거치면서 악곡의 후반부로 갈수록 점차 하행하게 되는데, 이것은 전통음악이 점차 하행하는 종지형을 갖는 것과 관련이 있다. 관악영산회상 상령산 피리 선율의 한 악구는 대부분 동기 요소인 a, b, g, i형과 종지형(x형 계열)의 결합으로 구성되어 있고, 각각의 악구는 긴장-이완이 반복되는 구조로 짜여 있다. 피리의 악구를 유사한 유형별로 묶어 그 구조를 살펴보면, 각 악구는 음의 생략 및 추가, 선율의 교차와 같은 방법을 통해 논리적인 변주 구조를 갖추고 있음을 알 수 있다 대금 연음의 최소 단위 선율 형태는 a~b형의 뒷연음과 x1~x3형의 앞연음으로 구분하여 나타낼 수 있다. x형 계열은 피리 선율의 종지음인 중려(중(仲))를 수식하거나 단순히 연장하는 뒷연음으로 사용되고, a, b형은 피리 선율의 다음 악구의 시작을 예비하는 앞연음의 기능을 갖고 있다. 대금 연음의 최소 단위 선율 형태의 결합 유형은 대부분 뒷연음+앞연음의 형태로 나타난다. 이외에도 a, b형의 앞연음이 뒷연음 없이 독자적으로 등장하기도 하고, x3형과 같이 앞연음 없이 뒷연음의 형태만을 취하여 나타나기도 한다. 대금의 연음을 유사한 형태별로 묶어 그 구조를 파악해보면, 대금의 연음 또한 피리 선율과 마찬가지로 음의 생략 및 추가와 같은 방법을 통한 변주 구조로 이루어져 있음을 알 수 있다.

기계학습 분류모델을 이용한 하천퇴적물의 중금속 오염원 식별 (Identifying sources of heavy metal contamination in stream sediments using machine learning classifiers)

  • 반민정;신상욱;이동훈;김정규;이호식;김영;박정훈;이순화;김선영;강주현
    • 한국습지학회지
    • /
    • 제25권4호
    • /
    • pp.306-314
    • /
    • 2023
  • 하천퇴적물은 유역내 다양한 오염원으로부터 발생하는 중금속, 유기물 등 오염물질의 수용체일 뿐만 아니라 수질 오염 및 수생태 악영향을 유발할 수 있는 2차적 오염원이기에 중요한 관리대상이라고 할 수 있다. 오염된 하천퇴적물의 효과적인 관리를 위해서는 오염원에 대한 식별과 이와 연계된 관리대책의 수립이 우선되어야 한다. 본 연구는 하천퇴적물내 측정된 다양한 이화학적 오염항목 분포 특성에 기반하여 퇴적물의 주요 오염원을 식별하기 위한 방법으로서 기계학습모델의 적용성을 평가하였다. 기계학습 모델의 성능 평가를 위해 전국 4대강 수계내 주요 폐금속광산 및 산업단지 인근에서 수집된 총 356개의 하천퇴적물에 대한 중금속 10개 항목(Cd, Cu, Pb, Ni, As, Zn, Cr, Hg, Li, Al)과 토양항목 3개(모래, 실트, 점토 비율) 수질항목 5개(함수율, 강열감량, 총유기탄소, 총질소, 총인)를 포함한 총 18개 오염항목에 대한 분석자료를 활용하였다. 기계학습 분류 모델로서 선형판별분석(linear discriminant analysis, LDA)과 서포트벡터머신(support vector machine, SVM) 분류기를 사용하여 폐금속광산('광산')과 산업단지('산단') 인근에서의 하천퇴적물 시료의 분류 성능을 평가한 결과, 채취 지점 및 시기별 4가지 경우(비강우시 광산, 강우시 광산, 비강우시 산단, 및 강우시 산단)에 대한 퇴적물 시료의 분류 성능이 우수하였으며, 특히 비선형 모델인 SVM(88.1%)이 선형모델인 LDA(79.5%) 보다 퇴적물을 분류하는데 있어 보다 우수한 성능을 나타냈다. SVM 앙상블 기반 비배타적 다중라벨분류기 모델을 이용하여 각 시료채취 지점 상류 유역 1km 반경 내 지배적인 토지이용 및 오염원을 다중 타겟값으로 다중분류 예측을 수행한 결과, 폐금속광산과 산업단지의 분류는 비교적 높은 정확도로 수행하였으나, 도시와 농업지역 등 다른 비점오염원에 대한 분류정확도는 56~60%범위로 비교적 낮게 나타났다. 이는 다중라벨 분류모델의 복잡성에 비해 데이터셋의 크기가 상대적으로 작아서 발생한 과적합에 기인한 것으로 향후 보다 많은 측정자료가 확보될 경우 기계학습 모델을 적용한 오염원 분류의 정확도를 보다 향상시킬 수 있을 것으로 판단된다.

머신러닝 기반 위성영상과 수질·수문·기상 인자를 활용한 낙동강의 Chlorophyll-a 농도 추정 (Estimation of Chlorophyll-a Concentration in Nakdong River Using Machine Learning-Based Satellite Data and Water Quality, Hydrological, and Meteorological Factors)

  • 박소련;손상훈;배재구;이도이;서동주;김진수
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.655-667
    • /
    • 2023
  • 전 세계적으로 녹조 대발생은 빈번하게 보고되고 있으며, 국내에서도 매년 녹조로 인한 심각한 수질 오염 문제가 발생하고 있다. 지속적인 관리와 신속한 대응을 통한 수생태계 보호가 필요하다. 녹조 발생의 지표인 chlorophyll-a (Chl-a) 농도를 예측하기 위해 위성 영상을 이용한 연구가 많이 이루어지고 있다. 하지만 수계에 따라 변하는 분광특성과 대기 보정 오류로 인해 정확한 Chl-a 산출에 어려움이 있어 최근 머신러닝 모델을 활용하고 있다. 위성 분광지수 뿐만 아니라 녹조에 영향을 미치는 인자들에 대한 복합적인 고려가 필요하다. 따라서, 본 연구는 수질, 수문 및 기상 인자와 Sentinel-2 영상을 복합적으로 고려하여 데이터셋을 구축하였다. 최근 5년간 낙동강에 위치한 8개 보 구간의 Chl-a 농도 예측에 대표적인 앙상블 모델 random forest (RF)와 extreme gradient boosting (XGBoost)을 활용하였다. 모델 평가 지표로 r-squared score (R2), root mean square errors(RMSE), mean absolute errors (MAE)를 사용하였으며, XGBoost의 R2가 0.810, RMSE가 6.612, MAE가 4.457로 유의미한 결과를 얻은 것을 확인하였다. Shapley additive explanations (SHAP) 분석을 통해 두 모델 모두 수질 인자 suspended solids (SS), biochemical oxygen demand (BOD), dissolved oxygen (DO)과 red edge 밴드를 활용한 밴드비가 높은 중요도를 보인 것을 알 수 있었다. 다양한 입력 데이터는 모델 성능 향상에 도움을 주는 것을 확인할 수 있었으며, 국내외 녹조 탐지에 적용될 수 있을 것으로 보인다.

'함양 용유담(咸陽 龍遊潭)', 전래명승으로서의 의의와 가치 구명 ('Yongyudam of Hamyang', the Significance and Value as a Traditional Scenic Place)

  • 노재현
    • 헤리티지:역사와 과학
    • /
    • 제47권1호
    • /
    • pp.82-101
    • /
    • 2014
  • '함양 용유담'에 얽힌 유래와 전설, 지리산유산기 속의 경관 인식, 지형지질학적 특성 그리고 주변 유구(遺構)와 바위글씨의 해석과 분석을 통해 이곳의 경관 특성을 밝히고 이를 근거로 용유담의 명승적 가치와 경관보존의 당위성을 확보하고자 시도된 본 연구의 결론은 다음과 같다. 함양의 대표적인 전래승경 '금대지리(金臺智異)'가 천왕봉과 용유동에 대한 묘사이듯, 고지도나 고문헌에서 또한 엄천강의 중심 '용유동(龍遊洞) 용유담'은 이 지역의 대표적인 승경으로서 자리매김 되어왔다. '구룡과 마적도사' '가사어' 전설과 기우(祈雨)의 주술신인 '용신(龍神)의 성소(聖所)'로서의 경관적 은유는 용유담의 본질일 뿐 아니라 신령함과 장소성을 심화시키는 촉매였다. 선인들의 지리산유산기 속에 드러난 용유담의 핵심적 이미지는 '자맥질하는 용과 관련된 지형경관적 특이성', '다양한 모습과 크기의 포트홀', '와류현상에 의한 여울목의 폭음(瀑音)' 그리고 '용 전설의 경관적 은유' 등으로 이들 이미지는 용유담의 장소관성(場所慣性)을 이끌어 왔다. 또한 이곳의 장구소(杖?所) 바위글씨는 김종직을 비롯하여 김일손 조식 정여창 그리고 강대수 등 지리산을 생활경관으로 체험하고 인식하였던 경상우도 사림(士林)들의 '장구 상영지소(杖? 觴詠之所)'로서 기념비적 석문(石文)이자 추모의 표식이다. 또한 용유담 주변의 3단 층계(層階)와 '용유담(龍遊潭)' 바위글씨 그리고 샘[泉]물을 모으기 위해 가공된 수반(水盤)은 제의터로서 영역성이 감지되는 전통조경적 유구이다. 더불어 본 연구를 통해 처음으로 확인된 용유동문(龍遊洞門), 방장제일산수(方丈第一山水) 등의 바위글씨는 선경지처(仙境之處) 용유담을 알리는 표식이자, 용유담이 지리산의 대표적 승경이라는 자부심의 표현이다. 그밖에 심진대 영귀대 강화대 등의 대(臺)는 옛 선인들의 풍류처이자 유계(遊契)의 흔적으로 용유담의 의의를 더해 준다. 용유담의 기묘하고 독특한 경관은 수려한 자연을 바탕으로 오랜 역사를 두고 이어져 온 장소관성의 산물이자 문화경관의 총체(總體)임을 여실히 보여준다. 본 연구를 통해 지리산 용유담은 '물리적 실체' 뿐만 아니라 역사 문화적 가치의 중첩을 통해 꾸준히 전승되어온 복합유산으로 명승 지정 조건에 충일(充溢)함이 확인되었다. 단언컨대 용유담이 갖는 장소성은 물론 지질지형 역사문화적 가치는 그 어떤 정치경제적 이해관계나 논리로도 폄하되거나 훼손되어서는 안 될 전래 명승의 진수(眞髓)이다.

1920년대 전통음악공연의 형태와 특징 - 서양식 장르와의 혼성공연형태를 중심으로 - (Types and Characteristics of Traditional Music Performance of the 1920s - Focused on the mixed performances type in the western-style genre -)

  • 금용웅
    • 공연문화연구
    • /
    • 제35호
    • /
    • pp.61-92
    • /
    • 2017
  • 일제강점기 전통음악공연은 식민지라는 특수한 상황에 놓이면서 점차 축소, 약체화 되어 갔고, 개화기 이후부터 사회전반에 꾸준히 확산되기 시작한 서양문물의 영향으로 서양식 장르의 공연이 활성화되었다. 이러한 상황 속에서 전통음악공연은 단독공연형태보다는 서양식 장르와 함께 연행되는 혼성공연(混成公演)형태를 보이는데, 특히 서양음악과의 혼성공연형태가 주를 이루었고 이 밖에 연극, 강연, 영화, 댄스, 마술과 같은 장르와도 함께 공연되었다. 이와 같은 서양식 장르와의 혼성공연형태는 1920년대에 들어 더욱 활발하게 전개되면서, 전통음악공연의 한 형태로 자리 잡게 되었다. 따라서 서양식장르와 전통음악의 혼성공연형태에 대한 연구는 한국근대음악사에서 아직 조명되지 않은 전통음악의 공연형태를 밝혀, 일제강점기 전반적인 전통음악공연의 동향을 파악하는데 그 의의가 있다고 하겠으나, 지금껏 이에 대한 연구는 거의 이루어진 바가 없는 실정이다. 이에 본 연구는 1920년대 서양식 장르와 전통음악의 혼성공연형태에 대해 당시의 신문기사들을 중심으로, 서양식 장르와 전통음악의 혼성공연형태 활성화 배경과 형태별 특징에 대해 고찰하였다. 서양식 장르와 전통음악의 혼성공연형태 활성화 배경에서는 1920년대에 들어 서양식 장르와 전통음악의 혼성공연형태가 이전에 비해 활성화 되었음을 알 수 있었다. 이와 같은 원인은 1920년대에 들어 공연의 주최나 후원 단체들이 늘어남에 따라, 전반적인 공연의 개최 수가 이전보다 급격히 증가하였고, 증가한 공연의 양상이 서양문물의 확산으로 더욱 다양해진 대중들의 기호 충족을 위해 대부분 혼성공연형태로 이루어진 데에 기인하고 있었다. 서양식 장르와 전통음악의 혼성공연형태별 특징에서는 전통음악과 함께 공연된 서양식 장르들을 분류하여, 전통음악이 개개의 서양식 장르와 함께 공연되었을 때 어떠한 특징이 나타나는지 살펴보았다. 첫째, 서양음악과 전통음악의 혼성공연형태에서는 전반적으로 서양음악의 프로그램 수가 많은 비중을 차지하였으며, 당시에 흔치 않았던 서양악기와 전통악기의 합주가 이루어지기도 하였고, 부제나 날짜별로 두 장르를 구분하여 공연되기도 하는 특징을 보였다. 둘째, 연극과 전통음악의 혼성공연형태에서는 전통음악이 창극과 유사한 형식으로 연극에 직접 참여하거나, 연극의 무대전환을 위한 막간공연의 역할로 연극과 독립되어 공연되기도 했고, 관객모집이나 여흥을 위해서도 공연되는 특징이 있었다. 셋째, 강연과 전통음악의 혼성공연형태에서는 전통음악이 강연의 전이나 후에 연주 되어서 강연의 분위기 조성과 여흥의 역할을 하는가 하면, 관객모집을 위해서도 공연되는 특징을 보였다. 넷째, 영화와 전통음악의 혼성공연형태에서는 전통음악이 영화에 직접 참여하거나, 독립적인 공연의 성격을 띠기도 했고, 영화 상영 후 여흥을 위해서도 공연되는 특징이 있었다.

이차원 고객충성도 세그먼트 기반의 고객이탈예측 방법론 (A Methodology of Customer Churn Prediction based on Two-Dimensional Loyalty Segmentation)

  • 김형수;홍승우
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.111-126
    • /
    • 2020
  • CRM의 하위 연구 분야로 진행되었던 고객이탈예측은 최근 비즈니스 머신러닝 기술의 발전으로 인해 빅데이터 기반의 퍼포먼스 마케팅 주제로 더욱 그 중요도가 높아지고 있다. 그러나, 기존의 관련 연구는 예측 모형 자체의 성능을 개선시키는 것이 주요 목적이었으며, 전체적인 고객이탈예측 프로세스를 개선하고자 하는 연구는 상대적으로 부족했다. 본 연구는 성공적인 고객이탈관리가 모형 자체의 성능보다는 전체 프로세스의 개선을 통해 더 잘 이루어질 수 있다는 가정하에, 이차원 고객충성도 세그먼트 기반의 고객이탈예측 프로세스 (CCP/2DL: Customer Churn Prediction based on Two-Dimensional Loyalty segmentation)를 제안한다. CCP/2DL은 양방향, 즉 양적 및 질적 로열티 기반의 고객세분화를 시행하고, 고객세그먼트들을 이탈패턴에 따라 2차 그룹핑을 실시한 뒤, 이탈패턴 그룹별 이질적인 이탈예측 모형을 독립적으로 적용하는 일련의 이탈예측 프로세스이다. 제안한 이탈예측 프로세스의 상대적 우수성을 평가하기 위해 기존의 범용이탈예측 프로세스와 클러스터링 기반 이탈예측 프로세스와의 성능 비교를 수행하였다. 글로벌 NGO 단체인 A사의 협력으로 후원자 데이터를 활용한 분석과 검증을 수행했으며, 제안한 CCP/2DL의 성능이 다른 이탈예측 방법론보다 우수한 성능을 보이는 것으로 나타났다. 이러한 이탈예측 프로세스는 이탈예측에도 효과적일 뿐만 아니라, 다양한 고객통찰력을 확보하고, 관련된 다른 퍼포먼스 마케팅 활동을 수행할 수 있는 전략적 기반이 될 수 있다는 점에서 연구의 의의를 찾을 수 있다.

기계학습을 이용한 수출신용보증 사고예측 (The Prediction of Export Credit Guarantee Accident using Machine Learning)

  • 조재영;주지환;한인구
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 2021
  • 2020년 8월 정부는 한국판 뉴딜을 뒷받침하기 위한 공공기관의 역할 강화방안으로서 각 공공기관별 역량을 바탕으로 5대 분야에 걸쳐 총 20가지 과제를 선정하였다. 빅데이터(Big Data), 인공지능 등을 활용하여 대국민 서비스를 제고하고 공공기관이 보유한 양질의 데이터를 개방하는 등의 다양한 정책을 통해 한국판 뉴딜(New Deal)의 성과를 조기에 창출하고 이를 극대화하기 위한 다양한 노력을 기울이고 있다. 그중에서 한국무역보험공사(KSURE)는 정책금융 공공기관으로 국내 수출기업들을 지원하기 위해 여러 제도를 운영하고 있는데 아직까지는 본 기관이 가지고 있는 빅데이터를 적극적으로 활용하지 못하고 있는 실정이다. 본 연구는 한국무역보험공사의 수출신용보증 사고 발생을 사전에 예측하고자 공사가 보유한 내부 데이터에 기계학습 모형을 적용하였고 해당 모형 간에 예측성과를 비교하였다. 예측 모형으로는 로지스틱(Logit) 회귀모형, 랜덤 포레스트(Random Forest), XGBoost, LightGBM, 심층신경망을 사용하였고, 평가 기준으로는 전체 표본의 예측 정확도 이외에도 표본별 사고 확률을 구간으로 나누어 높은 확률로 예측된 표본과 낮은 확률로 예측된 경우의 정확도를 서로 비교하였다. 각 모형별 전체 표본의 예측 정확도는 70% 내외로 나타났고 개별 표본을 사고 확률 구간별로 세부 분석한 결과 양 극단의 확률구간(0~20%, 80~100%)에서 90~100%의 예측 정확도를 보여 모형의 현실적 활용 가능성을 보여주었다. 제2종 오류의 중요성 및 전체적 예측 정확도를 종합적으로 고려할 경우, XGBoost와 심층신경망이 가장 우수한 모형으로 평가되었다. 랜덤포레스트와 LightGBM은 그 다음으로 우수하며, 로지스틱 회귀모형은 가장 낮은 성과를 보였다. 본 연구는 한국무역보험공사의 빅데이터를 기계학습모형으로 분석해 업무의 효율성을 높이는 사례로서 향후 기계학습 등을 활용하여 실무 현장에서 빅데이터 분석 및 활용이 활발해지기를 기대한다.