• 제목/요약/키워드: neural network model

검색결과 4,593건 처리시간 0.042초

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

심부 대염수층 CO2 격리 메커니즘에 관한 효율성 평가 모델 개발 (Development of the Efficiency-Evaluation Model for the Mechanism of CO2 Sequestration in a Deep Saline Aquifer)

  • 김정균;이영수;이정환
    • 한국가스학회지
    • /
    • 제16권6호
    • /
    • pp.55-66
    • /
    • 2012
  • $CO_2$ 감축은 최근 문제되고 있는 온실가스를 감축시킬 수 있는 직접적인 수단이 되고 있으며, 이러한 방법으로는 CCS 기술이 현실적인 대안기술로 부상하고 있다. 특히 전 세계적으로 널리 분포되어 있고 많은 양의 $CO_2$ 를 격리할 수 있는 심부 대염수층을 대상으로 활발한 연구가 진행 중이다. 이에 본 연구에서는 심부 대염수층에 대한 $CO_2$ 지중격리시 예비 타당성 평가 수행을 위하여 인공신경망을 이용한 효율성 평가 모델을 개발하였다. 모델 개발에 앞서 심부 대염수층을 대표할 수 있는 기본 모델을 선정하고 상용시뮬레이터 GEM을 활용하여 민감도 분석을 수행하였으며, 분석 결과를 바탕으로 심부 대염수층에 영향을 미치는 주요 인자 및 영향범위를 선정하였다. 인공신경망 학습을 위한 격리 시나리오 구성 결과 용해트랩과 잔류트랩에 의한 $CO_2$ 격리를 확인할 수 있었으며, 인공신경망 모델 자체 검증 결과 0.99이상의 높은 상관계수를 나타내어 심부 대염수층에서의 $CO_2$ 지중격리 효율성 평가에 활용 가능함을 확인하였다.

주식 시장 예측을 위한 π-퍼지 논리와 SVM의 최적 결합 (An Optimized Combination of π-fuzzy Logic and Support Vector Machine for Stock Market Prediction)

  • 다오두안훙;안현철
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.43-58
    • /
    • 2014
  • 최근 정보기술의 발전으로 복잡하고 방대한 양의 주가 데이터에 대한 실시간 분석이 가능해지면서 인공지능 기법을 활용해 주식 시장의 등락을 예측하고, 이를 기반으로 매매 거래를 수행하는 트레이딩 시스템에 대한 세간의 관심이 높아지고 있다. 본 연구는 이러한 트레이딩 시스템의 시장 예측 알고리즘으로 활용될 수 있는 새로운 주식 시장 등락 예측 모형을 제시한다. 본 연구의 제안 모형은 ${\pi}$-퍼지 논리를 이용해 모든 입력변수의 차원을 low, medium, high로 퍼지변환한 입력값을 대상으로 Support Vector Machine(SVM)을 적용하여 익일 시장의 등락을 예측하도록 설계되었다. 그런데 이 경우 입력변수의 수가 3배로 늘어나기 때문에, 적절한 입력변수의 선택이 요구된다. 이에 본 연구에서는 유전자 알고리즘을 활용하여 입력변수 선택 집합을 최적화하도록 하였으며, 동시에 ${\pi}$-퍼지 논리 및 SVM에 적용되는 조절 파라미터들의 값도 함께 최적화 하도록 하였다. 모형의 성능을 검증하기 위해, 본 연구에서는 지난 2004년부터 2013년까지의 10년치 국내 주식시장 데이터를 기반으로 한 KOSPI 200 지수의 등락 예측에 제안모형을 적용해 보았다. 이 때, 비교모형으로 로지스틱 회귀모형, 다중판별분석, 의사결정나무, 인공신경망, SVM, 퍼지SVM 등도 함께 적용시켜 성과를 정밀하게 검증해 보고자 하였다. 그 결과, 제안모형이 예측 정확도는 물론 투자수익률(Return on Investment) 측면에서도 다른 모든 비교모형들에 비해 월등히 우수한 성능을 보임을 확인할 수 있었다.

시간처짐현상을 고려한 장거리구간 통행시간 예측 모형 개발 (Development of a Freeway Travel Time Forecasting Model for Long Distance Section with Due Regard to Time-lag)

  • 이의은;김정현
    • 대한교통학회지
    • /
    • 제20권4호
    • /
    • pp.51-61
    • /
    • 2002
  • 본 연구에서는 운전자 입장에서 원하는 고속도로 다구간의 통행시간을 예측하는 모형을 구축하였다. 현재 지점검지기를 통해 생성되는 예상통행시간 정보는 장거리 통행시 발생되는 시간처짐현상을 반영하지 못하고 있다. 이로 인하여 도로이용자들의 신뢰가 떨어져. 전체적인 ATIS의 효과를 거두지 못하고 있다. 따라서 본 연구에서는 시간처짐 현상과 영업소 지체를 반영한 고속도로 다구간의 통행시간예측을 위하여, 한국도로공사에서 운영중인 검지기의 교통량 자료와 TCS자료를 사용하였다. 또한 실제 시스템에의 적용을 위해 이상치가 섞여 있는 자료를 유지하였다. 예측에 사용된 모형은 3개의 입력유니트와 2개의 출력유니트를 가지는 선행신경망의 형태로 구성하였으며, 학습방법은 역전파법을 이용하였다. 또한 학습속도와 예측력에 영향을 주는 학습계수, 은닉층의 유니트수, 반복 횟수에 따라 12개의 대안을 구성하여 예측결과를 토대로 최적대안을 모형으로 채택하였다. 이러한 본 연구의 자료특성에 의해 원하는 구간까지의 통행시간을 구할 수가 있다.

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구 (A Correction of East Asian Summer Precipitation Simulated by PNU/CME CGCM Using Multiple Linear Regression)

  • 황윤정;안중배
    • 한국지구과학회지
    • /
    • 제28권2호
    • /
    • pp.214-226
    • /
    • 2007
  • 강수는 다양한 대기 변수들의 영향으로 나타나기 때문에 비선형성이 매우 강하다. 따라서 역학 모형을 통해 예측된 강수의 보정은 비선형 모형인 인공 신경망 등을 통해 가능할 것이지만, 인공 신경망의 경우 초기 가중치 선택, 지역 최소화 문제, 뉴런의 수 결정 등의 문제로 인한 한계가 있다. 그러므로 본 연구에서는 가장 보편적으로 사용되는 다중 선형 회귀 모형을 이용하여 CGCM에 의해 모사된 강수를 보정하였으며, 예측성을 살펴보았다. 이를 위하여 우선 PNU/CME 접합 대순환 모형(Coupled General Circulation model, CGCM)(박혜선과 안중배, 2004)을 이용하여 1979년부터 2005년까지 매해 4월부터 8월까지 5개월간 앙상블 적분을 하였다. 적분 결과 중 한반도를 포함한 동북아시아 지역$(110^{\circ}E-145^{\circ}E,\;25^{\circ}N-55^{\circ}N)$의 여름철인 6월(리드 2), 7월(리드 3), 8월(리드 4) 및 여름철 평균인 JJA(from June to August) 기간의 PNU/CME CGCM에 의해 모사된 강수를 보정하기 위해 다중 선형 회귀(Multiple Linear Regression, MLR)를 이용하였다. PNU/CME 접합 대순환 모형의 결과 중 강수, 500 hPa 연직 속도, 200 hPa 발산장, 지상 기온 등의 예측 인자와 관측 강수와의 선형적인 관계를 이용하여 MLR 모형을 구축하였다. 그리고 교차 검증(cross- validation)을 수행하여 PNU/CME 접합 대순환 모형의 결과와 교차 검증 결과를 비교하였다. 상관계수, 적중률 (hit rate), 오보율(false alarm rate) 그리고 Heidke 기술 점수(Heidke skill score) 등을 살펴본 바, 보정하지 않은 모형의 결과에 비해 MLR 모형을 이용하여 보정한 결과의 강수에 대한 예측성이 뛰어난 것을 알 수 있었다.

퇴원손상심층조사 자료를 기반으로 한 급성심근경색환자 재원일수의 중증도 보정 모형 개발 (Severity-Adjusted LOS Model of AMI patients based on the Korean National Hospital Discharge in-depth Injury Survey Data)

  • 김원중;김성수;김은주;강성홍
    • 한국산학기술학회논문지
    • /
    • 제14권10호
    • /
    • pp.4910-4918
    • /
    • 2013
  • 본 연구는 급성심근경색환자의 효율적인 재원일수 관리를 위해 재원일수에 대한 중증도 보정 모형을 개발하고자 하였다. 2004-2009년 퇴원손상심층조사 자료에서 주진단이 I21인 급성심근경색환자 6,074명을 추출하였으며, 모형 개발 시 데이터마이닝 기법(다중회귀분석, 의사결정나무, 신경망 기법)을 적용하였다. 개발된 모형들 중에서 의사결정나무 모형이 가장 우수한 모형으로 판정되어 이를 본 연구의 중증도 보정 모형으로 채택하였다. 급성심근경색 환자의 재원일수의 중증도 보정에 영향을 미치는 주요한 요인은 관상동맥우회술 시행유무, 퇴원 시 사망유무, 동반지수 등 이였으며, 병상규모와 의료기관 소재지 별로 중증도 보정 재원일수와 실제 재원일수에 차이가 있었다. 급성심근경색환자의 재원일수 변이를 줄이고 효율적으로 관리하기 위해서는 개발된 모형에 각 의료기관의 자료를 적용하여 중증도를 보정한 후, 차이가 나는 요인을 규명하여 이를 해결하는 활동이 수행되어야 할 것이다.

기후변화에 따른 남강유역의 수문환경의 변화가 하천수질에 미치는 영향 (Effect of Change in Hydrological Environment by Climate Change on River Water Quality in Nam River Watershed)

  • 강지윤;김영도;강부식
    • 한국수자원학회논문집
    • /
    • 제46권8호
    • /
    • pp.873-884
    • /
    • 2013
  • 우리나라는 몬순기후의 영향으로 여름철 강우가 집중되기 때문에 작은 기후변화에도 심각한 수자원의 문제를 야기시킬 수 있다. 이로 인해 기후변화에 대한 많은 관심이 집중되어 그에 따른 연구도 활발히 진행되고 있다. 본 연구는 남강유역에서의 미래 기후변화에 의한 하천의 흐름과 수질변화를 예측하기 위해 유역-하천모형을 연계하여 하고자 하였다. 인공신경망기법을 이용하여 기후시나리오를 예측한 후 유역수문 모형인 SWAT모형을 구축하였고 모형의 적용성 평가를 위해 환경부자료를 이용하여 검보정한 결과 $R^2$이 0.7 이상으로 적정수준으로 모의되었다. SWAT의 결과와 HEC-ResSIM을 이용한 미래 남강댐 방류량을 QUALKO의 입력 자료로 사용하였다. 그 결과 저수기에는 풍수기와는 달리 연도별 유량에 따라 BOD가 많게는 약 2mg/L의 차이를 보이는 등 변화 폭이 크게 나타났다. 강우와 유역의 유출이 하천의 수질에 큰 영향을 끼치기 때문에 풍수기에 비해 유량이 적은 저수기에 수질 농도가 높은 것을 알 수 있다. 그러므로 남강댐의 저수기의 용수확보를 통해 남강하류 하천의 유지용수를 확보하고 효율적인 관리를 통해 향상된 수질을 관리 할 수 있을 것으로 판단된다.

부분 단어 토큰화 기법을 이용한 뉴스 기사 정치적 편향성 자동 분류 및 어휘 분석 (Automatic Classification and Vocabulary Analysis of Political Bias in News Articles by Using Subword Tokenization)

  • 조단비;이현영;정원섭;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 미등록어 수가 감소되는 것을 확인하였다. 분류 실험에서 가장 성능이 좋은 임베딩 모델을 이용하여 정치적 인물을 기반한 어휘를 추출하였으며 각 성향의 정치적 인물 벡터와의 평균 유사도를 통해 어휘의 편향성을 검증하였다.

주기성을 갖는 입출력 데이터의 연관성 분석을 통한 회귀 모델 학습 방법 (Learning Method for Regression Model by Analysis of Relationship Between Input and Output Data with Periodicity)

  • 김혜진;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.299-306
    • /
    • 2022
  • 최근 로봇이나 설비, 회로 등에 센서 내장이 보편화 되고, 측정된 센서 데이터를 학습하여 기기의 고장을 진단하기 위한 연구가 활발하게 수행되고 있다. 이러한 고장 진단 연구는 고장 상황이나 종류를 예측하기 위한 분류(Classification) 모델 개발과 정량적으로 고장 상황을 예측하기 위한 회귀(Regression) 모델 개발로 구분된다. 분류 모델의 경우, 단순히 고장이나 결함의 유무(Class)를 확인하는 반면, 회귀 모델은 무수히 많은 수치 중에 하나의 값(Value)을 예측해야 하므로 학습 난이도가 더 높다. 즉, 입력과 출력을 대응시켜 고장을 예측을 할 때, 유사한 입력값이 동일한 출력을 낸다고 결정하기 어려운 불규칙한 상황이 다수 존재하기 때문이다. 따라서 본 논문에서는 주기성을 지닌 입출력 데이터에 초점을 맞추어, 입출력 관계를 분석하고, 슬라이딩 윈도우 기반으로 입력 데이터를 패턴화 하여 입출력 데이터 간의 규칙성을 확보하도록 한다. 제안하는 방법을 적용하기 위해, 본 연구에서는 MMC(Modular Multilevel Converter) 회로 시스템으로부터 주기성을 지닌 전류, 온도 데이터를 수집하여 ANN을 이용하여 학습을 진행하였다. 실험 결과, 한 주기의 2% 이상의 윈도우를 적용하였을 때, 적합도 97% 이상의 성능이 확보될 수 있음을 확인하였다.

Pix2Pix의 수용 영역 조절을 통한 전통 고궁 이미지 복원 연구 (A Study on the Restoration of Korean Traditional Palace Image by Adjusting the Receptive Field of Pix2Pix)

  • 황원용;김효관
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.360-366
    • /
    • 2022
  • 본 논문은 흑백 사진으로만 남아 있는 한국의 전통 고궁 사진을 적대적 생성 신경망 기법의 하나인 Pix2Pix를 활용하여 컬러 사진으로 복원하기 위한 학습 모델 구조를 제시한다. Pix2Pix는 합성 이미지를 생성기와 합성 여부를 판정하는 판별기의 학습 모델 조합으로 구성된다. 본 논문은 판별기의 수용 영역을 조절하여 인공지능 모델을 학습하고 그 결과를 고궁 사진이 가지는 특성을 고려하여 분석하는 내용을 다룬다. 기존에 흑백 사진 복원에 사용하는 Pix2Pix의 수용 영역은 주로 고정된 크기로 사용하였으나 이미지의 변화가 다양한 고궁 사진을 복원함에 있어서는 고정된 수용 영역을 일률적으로 적용하기에 적합하지 않다. 본 논문에서는 고궁의 특성을 반영할 수 있는 판별기의 수용 영역을 확인하기 위해 기존의 고정된 수용 영역의 크기를 변화시켜 나타나는 결과를 관찰하였다. 실험은 사전에 준비한 고궁 사진을 기반으로 판별기의 수용 영역을 조정하고 모델의 학습을 진행하였다. 판별기의 수용 영역 변화에 따른 모델의 손실을 측정하고 최종 학습한 학습 모델을 복원 대상 흑백 사진에 대입하여 복원 결과를 확인한다.