• 제목/요약/키워드: Rating Prediction

검색결과 198건 처리시간 0.02초

Support Vector Machine을 이용한 지능형 신용평가시스템 개발 (Development of Intelligent Credit Rating System using Support Vector Machines)

  • 김경재
    • 한국정보통신학회논문지
    • /
    • 제9권7호
    • /
    • pp.1569-1574
    • /
    • 2005
  • In this paper, I propose an intelligent credit rating system using a bankruptcy prediction model based on support vector machines (SVMs). SVMs are promising methods because they use a risk function consisting of the empirical error and a regularized term which is derived from the structural risk minimization principle. This study examines the feasibility of applying SVM in Predicting corporate bankruptcies by comparing it with other data mining techniques. In addition. this study presents architecture and prototype of intelligeht credit rating systems based on SVM models.

Rating Prediction by Evaluation Item through Sentiment Analysis of Restaurant Review

  • So, Jin-Soo;Shin, Pan-Seop
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.81-89
    • /
    • 2020
  • 우리가 SNS상에서 흔하게 접하는 온라인 리뷰에는, 소비자들의 선호도에 영향을 미치는 다양한 평가정보가 복합적으로 포함되어 있지만 이를 매우 간단한 형태의 수치(또는 평점)로 제공하는 것이 일반적이다. 이러한 리뷰에서, 소비자가 원하는 구체적인 정보를 얻고, 이를 구매를 위한 판단에 활용하기란 쉽지 않다. 따라서 본 연구에서는 한국어로 작성된 음식점 리뷰를 대상으로, 감성분석을 수행하여 평가항목별로 세분화된 평점을 제공 가능한 예측 방법론을 제안한다. 이를 위해, 음식점의 주요 평가항목으로 '음식', '가격', '서비스', '분위기'를 선정하고, 평가항목별 맞춤형 감성사전을 새롭게 구축한다. 또한 평가항목별 리뷰 문장을 분류하고 감성분석을 통해 세분화된 평점을 예측하여 소비자가 의사결정에 활용 가능한 추가적인 정보를 제공한다. 마지막으로, MAE와 RMSE를 평가지표로 사용하여 기존의 연구보다 제안기법의 평점 예측 정확도가 향상되었음을 보이며, 제안 방법론의 활용 사례도 제시한다.

귀납적 학습방법들의 분류성능 비교 (Classification performance comparison of inductive learning methods)

  • 이상호;지원철
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1997년도 추계학술대회발표논문집; 홍익대학교, 서울; 1 Nov. 1997
    • /
    • pp.173-176
    • /
    • 1997
  • In this paper, the classification performances of inductive learning methods are investigated using the credit rating data. The adopted classifiers are Multiple Discriminant Analysis (MDA), C4.5 of Quilan, Multi-Layer Perceptron (MLP) and Cascade Correlation Network (CCN). The data used in this analysis is obtained using the publicly announced rating reports from the three korean rating agencies. The performances of 4 classifiers are analyzed in term of prediction accuracy. The results show that no classifier is dominated by the other classifiers.

  • PDF

러프집합을 이용한 통합형 채권등급 평가모형 구축에 관한 연구 (A Hybrid Credit Rating System using Rough Set Theory)

  • 박기남;이훈영;박상국
    • 한국경영과학회지
    • /
    • 제25권3호
    • /
    • pp.125-135
    • /
    • 2000
  • Many different statistical and artificial intelligent techniques have been applied to improve the predictability of credit rating. Hybrid models and systems have also been developed by effectively combining different modeling processes or combining the outcomes of individual models. In this paper, we introduced the rough set theory and developed a hybrid credit rating system that combines individual outcomes in terms of rough set theory. An experiment was conducted to compare the prediction capability of the system with those of other methods. The proposed system based on rough set method outperformed the others.

  • PDF

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

우울증에 대한 예측모형 (A Prediction Model for Depression Risk)

  • 김재용;민병주;이재훈;장재승;하태현;하규섭;박태성
    • 응용통계연구
    • /
    • 제27권2호
    • /
    • pp.317-330
    • /
    • 2014
  • 양극성 장애는 조증 삽화(manic episode)와 주요 우울삽화(major depressive episode)를 특징으로 하는 정신질환이다. 주요 우울삽화 시기에는 양극성 장애 환자들의 810%가 자살하는 것으로 알려져 있다. 그러므로 양극성 장애 환자를 치료할 때, 우울증상의 정도를 측정하는 것이 중요하다. 우울증상의 정도를 측정하기 위해 가장 많이 사용하는 검사법은 해밀턴 우울평가 척도(Hamilton depression rating scale)이다. 본 논문에서는 해밀턴 우울평가척도 점수를 이용하여 환자들의 치료 효과를 예측하기 위해 선형혼합효과모형(linear mixed effects model)과 전이모형(transition model)을 제시하였다. 예측을 위해 사용된 자료는 분당서울대학교병원을 방문하여 초진일 당시의 해밀턴 우울평가 척도 점수가 8 점 이상인 환자들의 정보를 사용하였다. 첫 조사시점부터 6개월, 12개월 후 세 차례에 걸쳐 관측된 해밀턴 우울평가 척도 점수를 선형혼합효과모형과 전이모형에 적합시켰다. 그 결과를 토대로 특정시점의 해밀턴 우울평가 척도 점수를 예측하였다. 첫 조사시점부터 6개월, 12개월 후의 해밀턴 우울평가 척도 점수를 사용해 선형혼합효과모형과 전이모형에 적합 시켰다. 이 모델들을 이용해 조사시점부터 24개월 후의 해밀턴 우울평가 척도 점수를 예측한다. 이 예측모델은 조사된 24개월 후의 점수와 예측된 24개월의 후의 점수를 비교하여 평가하였다.

Support Vector Regression에서 분리학습을 이용한 고객의 구매액 예측모형 (The Prediction of Purchase Amount of Customers Using Support Vector Regression with Separated Learning Method)

  • 홍태호;김은미
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.213-225
    • /
    • 2010
  • 본 연구에서는 기업의 마케팅 프로모션에 따른 반응고객의 구매액 예측을 위한 방법을 제시하고 SVR의 효과적인 학습방법을 제시하였다. 프로모션에 의한 고객의 구매액을 기반으로 고객을 5등급으로 등급화하고 각 등급 내에서 SVR을 적용하여 고객의 구매액을 예측하였다. 본 연구에서 제안하는 예측된 고객의 등급 내에서 고객 구매액을 예측하는 분리데이터 학습법이 프로모션에 반응한 모든 고객을 대상으로 구매액을 예측하는 전체데이터 학습법보다 높은 예측성과를 보여주었다. 일반적으로 세분화된 고객집단을 하나의 집단으로 보고 동일한 마케팅 전략을 제시하나 본 연구를 통해 구매액에 따라 등급화 된 고객의 등급 내에서 다시 고객의 거래 구매액을 예측하여 동일한 집단 내에서도 차별화된 마케팅 전략을 제시할 수 있는 기반을 제시하였다. 즉 동일한 등급에서도 고객 구매액에 따라 고객의 우선순위를 정할 수 있으며, 이는 마케팅 담당자가 프로모션을 제시할 고객을 선정할 때 유용한 정보로 활용될 수 있다.

국내 드라마 시청률 예측 및 영향요인 분석 (A Study on Domestic Drama Rating Prediction)

  • 강수연;전희정;김지혜;송종우
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.933-949
    • /
    • 2015
  • 최근 상업방송의 도입과 채널의 다양화로 국내 드라마 시장의 시청률 경쟁이 심화되었다. 이에 시청률에 대한 실증적인 연구의 필요성이 대두되고 있다. 본 연구의 목적은 다양한 데이터마이닝 기법을 이용하여 최근 방송시장의 변화를 고려한 국내 드라마 시청률 예측 모형을 제시하고 시청률에 유의한 영향을 미치는 변수들을 도출하는 데 있다. 모형 적합 시 선형회귀모형, LASSO 회귀모형, 랜덤 포레스트, 그래디언트 부스팅 등과 같은 다양한 분석 방법을 고려하였다. 이 때 드라마 방영 전 알 수 있는 기본 정보들만을 고려하여 드라마의 초반 시청률을 예측하는 모형을 적합한 후 방영 초기의 여론을 고려한 평균 시청률 예측 모형을 적합하였다. 그 결과 드라마 초반 시청률은 방송사, 방송시간, 드라마 방영 이전 드라마 관련 검색량 등 드라마의 구조적 요인과 임소문 효과의 영향을 크게 받으며, 평균 시청률은 드라마 초반 시청률과 드라마 방영 이후 드라마 관련 검색량 등 방영 초기의 여론에 큰 영향을 받는 것으로 나타났다.

차륜 슬립과 침하를 이용한 실시간 정격 원추 지수 예측 (Real Time Prediction of Rating Cone Index using Measured Wheel Sinkage and Slip)

  • 남주석;김대철;김경욱
    • Journal of Biosystems Engineering
    • /
    • 제34권4호
    • /
    • pp.205-210
    • /
    • 2009
  • It has been known from Willoughby's empirical equation that rating cone index can be determined if wheel sinkage and slip of a vehicle can be measured on soil surface. A field data of wheel sinkage and slip was collected from two tractors of different sizes on gravelly sand and gravelly loamy sand. Using the data, rating cone index of the soil was estimated. The estimated rating cone index demonstrated that it could be determined in real time by measuring wheel sinkage and slip. It was also demonstrated statistically that the same soil strength could be obtained under the same soil conditions regardless of the vehicle platforms used for the wheel sinkage and slip measurements.

사용자 리뷰 분석을 통한 호텔 평가 항목별 누락 평점 예측 방법론 (Predicting Missing Ratings of Each Evaluation Criteria for Hotel by Analyzing User Reviews)

  • 이동훈;부현경;김남규
    • 한국IT서비스학회지
    • /
    • 제16권4호
    • /
    • pp.161-176
    • /
    • 2017
  • Recently, most of the users can easily get access to a variety of information sources about companies, products, and services through online channels. Therefore, the online user evaluations are becoming the most powerful tool to generate word of mouth. The user's evaluation is provided in two forms, quantitative rating and review text. The rating is then divided into an overall rating and a detailed rating according to various evaluation criteria. However, since it is a burden for the reviewer to complete all required ratings for each evaluation criteria, so most of the sites requested only mandatory inputs for overall rating and optional inputs for other evaluation criteria. In fact, many users input only the ratings for some of the evaluation criteria and the percentage of missed ratings for each criteria is about 40%. As these missed ratings are the missing values in each criteria, the simple average calculation by ignoring the average 40% of the missed ratings can sufficiently distort the actual phenomenon. Therefore, in this study, we propose a methodology to predict the rating for the missed values of each criteria by analyzing user's evaluation information included the overall rating and text review for each criteria. The experiments were conducted on 207,968 evaluations collected from the actual hotel evaluation site. As a result, it was confirmed that the prediction accuracy of the detailed criteria ratings by the proposed methodology was much higher than the existing average-based method.