• 제목/요약/키워드: logit analysis

검색결과 546건 처리시간 0.024초

도심항공교통(UAM) 도입에 따른 대중교통 이용자들의 UAM에 대한 선호도 분석 (인천공항-인천길병원 노선사례) (Analysis of Preference for UAM of Public Transportation Users Following UAM Adoption (Incheon Airport - Incheon Gil Medical Center Line))

  • 이한솔;이수범;임준범
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.1-14
    • /
    • 2022
  • 본 연구에서는 도심항공교통(UAM) 도입에 따른 대중교통 이용자들의 도심항공교통(UAM) 선호도를 분석하기 위하여 도심항공교통(UAM) 실증노선 구간인 인천국제공항-인천 길병원 노선을 대상구간으로 하여 인천광역시 대중교통 이용자 807명을 대상으로 선호의식(SP)조사를 실시하였다. 또한, 도심항공교통(UAM) 도입 초기, 성장기, 성숙기로 구분하여 시기별 통행시간, 통행비용을 달리하여 선호의식(SP)조사를 실시한 결과를 토대로 수단선택모형을 추정하였다. 구축된 수단선택모형을 활용하여 통행에 대한 시간가치를 분석한 결과 56,428원/시로 나타났고, 모형에서 통행비용(원), 차내시간(분), 차외시간(분)에 대한 탄력성 검증 결과 본 모형에서 도심항공교통(UAM) 분담율에 미치는 영향은 통행비용(원), 차내시간(분), 차외시간(분) 순서로 나타났고, 통행비용(원)이 증가할 때보다 감소할 때 미치는 영향이 크게 나타났다.

물류산업의 "괜찮은 일자리(Decent Work)" 결정요인에 관한 연구 : 전체산업 모형과의 비교를 중심으로 (A Study on the Determinants of "Decent Work" in the Logistics Industry : Focusing on the comparison with whole industries)

  • 소애림;신승식
    • 한국항만경제학회지
    • /
    • 제38권4호
    • /
    • pp.139-169
    • /
    • 2022
  • 본 연구는 물류산업에서 괜찮은 일자리 결정요인을 규명하였고 분석 결과를 물류산업 노동 관련 정책 입안을 위한 기초자료로서의 활용과 물류산업 특성에 맞는 정책을 마련하는 데 목적이 있다. 모형의 종속변수는 첫 번째 연구에서 도출한 괜찮은 일자리(Decent Job) 여부를 활용하였고, 물류산업 일자리가 가지는 고유한 특성을 파악하기 위해 전체산업의 패널 자료로 대상 모형을 도출한 후 이를 물류산업 모형에 적용하였다. 그 결과 전체산업의 괜찮은 일자리 모형에서 유의미한 요인으로 분석되었던 '나이(age)', '성별(sex)', '교대근무(shift)' 변수는 물류산업 모형에서 유의미하지 않은 것으로 분석되었다. 특히 타 선행연구와 본 연구의 한국노동패널조사(KLIPS) 데이터를 활용한 일자리 모형에서 '나이(age)' 변수는 대부분 나이가 많을수록 직무만족도 및 소득 생산성이 높게 나타나 물류산업의 경우도 비슷한 결과가 나올 것으로 예상하였으나, 물류산업의 경우는 '나이(age)' 변수가 '괜찮은 일자리(Decent Work)' 취업을 결정하는 요인이 아닌 것으로 나타났다. 전체산업과 물류산업이 공통으로 괜찮은 일자리(Decent Work)에 종사하기 위해 가장 중요한 요인은 '건강상태(health)' 요인으로 나타났다. 선행연구와 마찬가지로 일반적인 직무만족도, 소득생산성, 승진 등을 위해서는 개인적 특성인 '건강상태(health)'가 괜찮은 일자리(Decent Work)에 종사하기 위해 중요하다는 것이 본 연구에서도 다시 한번 입증되었다. 따라서 물류산업은 전체산업에 비해 '직업훈련'을 통해 물류 산업의 전문성을 키우는 것이 정규 교육과정을 통해 '학력수준'을 높이는 것보다 중요한 요인인 것으로 나타났다. 이는 특히 본연구에서 분석한 세부 물류산업 중 괜찮은 일자리 종사자 비율이 높은 '철도운송업', '내륙 수상 및 항만 내 운송업', '항공 화물 운송업' 등의 경우 전문화된 직업훈련이 필요한 분야로 이와 같은 물류산업의 특성이 반영된 것으로 보인다. 따라서 정규 교육과정을 통해서 배우는 학문적 영역과 더불어 직업훈련 등의 추가적인 인력양성 프로그램을 통해 직무의 전문성을 키우는 것이 물류산업뿐만 아니라 타 산업에서도 '괜찮은 일자리(Decent Work)'에 종사하는 데에 매우 중요한 요인인 것으로 나타났다.

조손가족의 특징과 손자녀 양육지속의사에 관한 질적연구: 충남지역을 중심으로 (A Qualitative Study about the Care-giving Experiences of Grandparents and the Characteristics: Focused on Chung Nam Province)

  • 박현식
    • 한국노년학
    • /
    • 제30권3호
    • /
    • pp.779-791
    • /
    • 2010
  • 본 연구는 최근에 증가하고 있는 조손가족의 특징과 손자녀 양육지속의사에 관한 질적인 연구(qualitative approach)이다. 본 연구에서 분석내용은 첫째, 주양육자의 일반적 특성, 손자녀의 특징을 분석하였다. 둘째, 조손가족의 형성배경을 파악하기 위해 양육동기별 형성과정인 조부모가 어떻게 손자녀를 맡아 양육하게 되었는가에 대해 파악한다. 마지막으로 조손가족의 복지욕구를 파악하고, 양육지속의사에 대해 분석하였다. 연구 결과는 다음과 같다. 조손가족의 조사대상자의 주양육자는 조모가 대부분을 차지하였으며 주양육자의 평균 연령은 68.1세로 조사되었다. 대부분의 조부모는 직업이 없는 상태였으며 비교적 건강하였다. 조사대상 손자녀의 일반적 특성 중 성별은 손녀가 51.7%, 손자가 48.3%였고, 평균연령은 11.3세이고 대부분의 손자녀는 건강하였다. 조손가족 형성 배경을 살펴보면, 부모의 이혼으로 인한 조손가족형성이 가장 많았고, 조손가족이 원하는 복지욕구는 경제적 지지를 많이 요구하였다. 조부모의 손자녀 평균양육기간은 평균8년6개월로 나타났다. 양육지속의사에 대한 응답으로 조부모 100%는 손자녀를 양육하겠다고 하였다. 그러나 손가족의 주부양자들은 손자녀 양육에 대한 부담, 혼란스러움, 절망과 같은 부정적인 감정에서부터 희망, 기쁨, 감사에 이르기 까지 다양한 감정을 느끼는 것으로 나타났고 조부모들은 손자녀를 양육하면서 힘든 점도 있었지만, 손자녀와 함께 하면서 인생의 보람과 즐거움을 경험하고 있는 것으로 나타났다. 본 연구는 조손가족 특징과 양육에 대한 어려움을 이해하는데 도움이 되고자하며, 조손가족의 양육기능을 지지할 수 있는 맞춤식 지원 서비스 프로그램 개발 및 개입전략을 모색해 볼 수 있다는 점에서 그 의의를 찾을수 있다.

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.

다변량 프로빗 모형을 이용한 가전제품 구매의 상관관계 분석 (Correlation among Ownership of Home Appliances Using Multivariate Probit Model)

  • 김창섭;신정우;이미숙;이종수
    • 마케팅과학연구
    • /
    • 제19권2호
    • /
    • pp.17-26
    • /
    • 2009
  • As the lifestyle of consumers changes and the need for various products increases, new products are being developed in the market. Each household owns various home appliances which are purchased through the choice of a decision maker. These appliances include not only large-sized products such as TV, refrigerator, and washing machine, but also small-sized products such as microwave oven and air cleaner. There exists latent correlation among possession of home appliances, even though they are purchased independently. The purpose of this research is to analyze the effect of demographic factors on the purchase and possession of each home appliances, and to derive some relationships among various appliances. To achieve this purpose, the present status on the possession of each home appliances are investigated through consumer survey data on the electric and energy product. And a multivariate probit(MVP) model is applied for the empirical analysis. From the estimation results, some appliances show a substitutive or complementary pattern as expected, while others which look apparently unrelated have correlation by co-incidence. This research has several advantages compared to previous literatures on home appliances. First, this research focuses on the various products which are purchased by each household, while previous researches such as Matsukawa and Ito(1998) and Yoon(2007) focus just on a particular product. Second, the methodology of this research can consider a choice process of each product and correlation among products simultaneously. Lastly, this research can analyze not only a substitutive or complementary relationship in the same category, but also the correlation among products in the different categories. As the data on the possession of home appliances in each household has a characteristic of multiple choice, not a single choice, a MVP model are used for the empirical analysis. A MVP model is derived from a random utility model, and has an advantage compared to a multinomial logit model in that correlation among error terms can be derive(Manchanda et al., 1999; Edwards and Allenby, 2003). It is assumed that the error term has a normal distribution with zero mean and variance-covariance matrix ${\Omega}$. Hence, the sign and value of correlation coefficients means the relationship between two alternatives(Manchanda et al., 1999). This research uses the data of 'TEMEP Household ICT/Energy Survey (THIES) 2008' which is conducted by Technology Management, Economics and Policy Program in Seoul National University. The empirical analysis of this research is accomplished in two steps. First, a MVP model with demographic variables is estimated to analyze the effect of the characteristics of household on the purchase of each home appliances. In this research, some variables such as education level, region, size of family, average income, type of house are considered. Second, a MVP model excluding demographic variables is estimated to analyze the correlation among each home appliances. According to the estimation results of variance-covariance matrix, each households tend to own some appliances such as washing machine-refrigerator-cleaner-microwave oven, and air conditioner-dish washer-washing machine and so on. On the other hand, several products such as analog braun tube TV-digital braun tube TV and desktop PC-portable PC show a substitutive pattern. Lastly, the correlation map of home appliances are derived using multi-dimensional scaling(MDS) method based on the result of variance-covariance matrix. This research can provide significant implications for the firm's marketing strategies such as bundling, pricing, display and so on. In addition, this research can provide significant information for the development of convergence products and related technologies. A convergence product can decrease its market uncertainty, if two products which consumers tend to purchase together are integrated into it. The results of this research are more meaningful because it is based on the possession status of each household through the survey data.

  • PDF

교통방송이 제공하는 교통정보가 직장인의 통행행태에 미치는 영향 분석 (Analysis of the Effects of Radio Traffic Information on Urban Worker's Travel Choice Behavior)

  • 윤대식
    • 대한교통학회지
    • /
    • 제20권5호
    • /
    • pp.33-43
    • /
    • 2002
  • 본 연구는 교통방송이 제공하는 교통정보가 직장인의 통행행태에 미치는 영향을 분석하고자 하였다. 이러한 연구목적을 달성하기 위해 직장인의 통행전 교통수단 변경여부와 통행중 노선 전환행태를 분석하고자 하였으며, 통행자가 통행전 또는 통행중에 교통방송이 제공하는 실시간 정보를 접했을 때 나타나는 행태의 변화를 분석하고자 하였다. 본 연구를 위해 대구시에 있는 직장인을 대상으로 한 설문조사를 통해 현시선호자료(revealed preferences data)와 잠재선호자료(stated preferences data)를 수집하였고, 이 자료를 이용하여 네스티드 로짓모형을 추정하고 그 결과를 논의하였다. 본 연구를 통해 직장인의 통행전 교통수단 변경여부와 통행중 노선 전환여부 선택행태를 분석한 결과를 요약해서 살펴보면 다음과 같다. 첫째, 통행자의 통행중 노선 전환여부 선택에는 첨두시에는 나이, 성별, 통행시간, 청취빈도, 인지노선수, 사고정보가 의미 있는 영향을 미치는 것으로 밝혀졌다. 한편 비첨두시에는 첨두시와는 달리 통행시간이 의미 있는 영향을 미치지 않는 것으로 확인되었다. 둘째 통행자의 통행전 교통수단 변경여부 선택에는 첨두시와 비첨두시 공히 나이, 성별, 통행시간, 시간여유, 청취빈도, 사고정보가 의미 있는 영향을 미치는 것으로 밝혀졌다. 셋째, 모형의 경험적 추정결과는 본 연구에서 가설화된 네스티드 로짓모형의 타당성을 입증케 한다. 즉 통행 전 교통수단 변경여부의 선택과 통행중 노선 전환여부의 선택은 상호 밀접한 관련을 가지면서 이루어진다는 사실을 확인할 수 있으며, 특히 직장인이 통행전에 교통정보를 접하고 교통수단 변경여부를 선택할 상황에서도 향후 나타날 통행중 노선 전환여부의 선택상황까지도 고려하여 의사결정을 한다는 사실을 알 수 있었다.ing strategy) 문제를 인식하고, 이 차량들을 링크상의 교통량 전파조건(flow propagation constraint)을 토대로 다음 통행배정 시간대의 실시간 수요로서 반영할 수 있는 방안을 제시한다.여도 취소소송의 대상으로 삼도록 하는 보다 명확하고 일관성 있는 논의전개를 제안하였다.수 있었다.로 첨가하여 48시간 배양한 후 암항원 유전자 발현성을 측정한 결과 세포주에 따라 다소 차이는 있으나 대개 0.2 uM농도에서도 유전자 발현이 유도되었으며 1, 5 uM농도에서 매우 강하게 유도되었다. ADC 처리가 페암세포주의 MHC와 B7 발현을 증가시키는가를 알아보기 위해 1 uM 농도의 ADC를 72시간 처치한 후 FACS 분석을 실시한 결과 4개의 페암세포주에서 MHC 및 B7분자의 발현은 유도되지 않았다. 또 ADC농도가 세포성장에 미치는 영향을 알아보기 위하여 ADC를 0.2, 1, 5 uM농도로 96시간 처치 후 세포수를 측정하여 상대성장지수를 알아본 결과 ADC 처치 농도가 증가함에 따라 세포의 성장은 매우 감소하였다. 결론: 폐암세포주에서 ADC처치는 MAGE, GAGE 및 NY-ESO-1과 같은 세포독성 T 림프구 반응을 유도할 수 있는 암항원의 발현을 증가시킬 수 있으며, ADC의 세포독성과 항원 발현 유발시간을 분석할 때 1 uM 농도에서 48시간 처치한 후 ADC가 없는 배지에서 수일간 배양하는 것이 가장 효과적이라고 생각된다. 그러나, ADC를 처치하여도 MHC 및 B7의 발현의 변화는 없었으므로 ADC를 처치한 폐암세포를 암백신으로 사용하기 위해서는 MHC나 B7 및 cytokine의 발현을 증가시키는 추가적인 처치가 필요하다고 생각된다.ded.한 질소제거를 N-balance로부터 구해보면, R3 반응조의 경우가 가장 높은

한국 기업의 기술혁신 지속 특성에 대한 탐색적 연구 (An exploratory study on the characteristics of technology innovation persistence of Korean firms)

  • 송창현;이정우;장필성
    • 기술혁신연구
    • /
    • 제29권3호
    • /
    • pp.1-31
    • /
    • 2021
  • 기업의 경쟁우위를 결정하는 핵심 요소로서 기술혁신의 중요성이 강조되는 가운데, 혁신의 지속 여부 또한 중요한 연구 대상이 되고 있다. 혁신 지속(innovation persistence)은 기업의 혁신이 일회성으로 그치지 않고 지속적으로 이루어지고 있는지를 나타내는 개념이다. 혁신 연구에 사용되는 자료는 대부분의 국가에서 횡단면 조사로 수행됨에 따라 종단적인 지속 현상을 다룬 연구는 드문 편이며, 특히 국내의 혁신조사 자료를 이용하여 혁신 지속 현상을 살펴본 연구는 거의 없다. 본 연구는 문헌 연구를 바탕으로 기업의 혁신 지속에 대한 개념과 특징을 고찰하는 한편, 우리나라 기업의 기술혁신 지속 현황 및 특성에 대한 실증 분석을 수행하였다. 분석을 위해 2012년부터 2018년까지 격년으로 수행된 한국기업혁신조사 자료를 바탕으로, 복수관측된 3,379개 기업에 대한 불균형 패널자료를 구성하였다. 기술혁신의 지속 현상을 살펴본 결과, 지속적인 혁신이 관측되는 기업은 전체 중 일부(혁신성과에서는 10~12%, 혁신활동에서는 15~17%)에 불과하였으며, 오히려 비혁신의 지속 현상이 두드러지는 것으로 나타났다(약 52~57%). 또한 혁신성과보다는 혁신활동의 지속 현상이 강한 것으로 확인되었다. 이 외에도 제품혁신이 공정혁신보다, 내부 R&D가 공동/외부 R&D보다 지속성이 높게 나타나는 등 세부 유형에 따른 지속 현상의 특징들을 도출할 수 있었다. 그리고 혁신 지속의 영향요인 식별을 위해 추가적으로 로짓분석을 수행한 결과, 급진적 혹은 점진적 제품혁신이 다음 시기에서 혁신이 지속되게 하는 가장 영향력 높은 요인인 것으로 나타났다. 본 연구에서 구축한 패널자료는 원시자료의 한계로 인해 표본 선택 편의가 존재하기 때문에, 분석 결과의 지나친 일반화는 경계해야 한다. 그럼에도 불구하고 한국 기업을 대상으로 기술혁신 지속 현상을 종합적으로 분석한 초기연구로서 의의가 있으며, 후속 연구의 시발점이 될 것으로 기대된다. 향후 공식적인 패널자료의 구축 및 개선된 방법론 등을 통해, 혁신 지속 관련 발전된 연구 결과가 도출되기를 기대한다.

노년기 연령집단별 객관적·주관적 사회적 고립과 대인관계갈등 유형이 인지기능에 미치는 영향 (The Effect of Objective and Subjective Social Isolation and Interpersonal Conflict Type on the Probability of Cognitive Impairment by Age Group in Old Age)

  • 이상철
    • 한국노년학
    • /
    • 제38권4호
    • /
    • pp.811-835
    • /
    • 2018
  • 노년기의 사회적 관계와 인지기능은 상호 밀접한 관계가 존재한다. 사회적 관계(social relation)는 구조적 특성과 이에 대한 인지적 정서적 평가를 반영하는 질적 특성으로 구분되며, 최근 노년기의 사회적 관계와 관련하여 사회적 고립(social isolation) 개념이 부각되고 있다. 사회적 고립은 사회연결망, 가구형태, 사회참여 등 객관적 차원과 지각된 사회적 지지에 대한 결핍과 외로움 등 주관적 차원으로 구분되는 다차원적인 이론적 구조를 가진다. 노년기 대인관계갈등 역시 인지기능과 밀접한 관계가 존재한다. 본 연구에서는 사회적 관계의 구조적 특성을 나타내는 객관적 사회적 고립과, 질적 특성을 나타내는 주관적 사회적 고립, 대인관계갈등이 노년기 연령집단별 인지기능에 미치는 주효과와 상호작용효과를 검증하였다. 분석자료는 KSHAP 1차조사부터 3차조사까지 총 1,740명의 패널자료를 활용하여, 무선효과 패널로짓모형을 적용하여 분석하였다. 분석결과는 다음과 같다. 첫째, 노년기 연령증가에 따라 인지기능 저하는 급격하게 증가하는 경향성이 나타났다. 객관적 주관적 사회적 고립은 모두 80세를 변곡점으로 U자형의 분포가 나타났다. 아울러 배우자, 자녀 친척, 이웃 친구 노년기 연령증가에 따라 대체적으로 감소하는 분포가 나타났다. 둘째, 인지기능저하에 대한 주효과는 객관적 주관적 사회적 고립과 정적으로 유의미하게 나타난 반면, 대인관계갈등 유형은 유의미하게 나타나지 않았다. 셋째, 노년기 인지기능저하에 영향을 미치는 이원상호작용효과 분석결과, 주관적 사회적 고립과 인지기능저하와의 관계는 배우자와의 갈등수준별로 유의미하게 다른 것으로 나타났다. 또한 주관적 사회적 고립을 많이 느낄수록 연소노인(65~74세)에 비해 초고령노인(85세 이상)의 경우 인지기능저하가 급격하게 높아지는 것으로 나타났다. 본 연구결과에 기초하여 노년기 연령집단별 인지기능 저하를 감소시키기 위한 정책적 실천적 시사점을 제시하였으며, 연구의 한계점과 추후연구를 위한 제언에 대해 논의하였다.

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.