• 제목/요약/키워드: Kernel machine technique

검색결과 41건 처리시간 0.023초

Corporate credit rating prediction using support vector machines

  • 이영찬
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.571-578
    • /
    • 2005
  • Corporate credit rating analysis has drawn a lot of research interests in previous studies, and recent studies have shown that machine learning techniques achieved better performance than traditional statistical ones. This paper applies support vector machines (SVMs) to the corporate credit rating problem in an attempt to suggest a new model with better explanatory power and stability. To serve this purpose, the researcher uses a grid-search technique using 5-fold cross-validation to find out the optimal parameter values of kernel function of SVM. In addition, to evaluate the prediction accuracy of SVM, the researcher compares its performance with those of multiple discriminant analysis (MDA), case-based reasoning (CBR), and three-layer fully connected back-propagation neural networks (BPNs). The experiment results show that SVM outperforms the other methods.

  • PDF

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Clustering-based Statistical Machine Translation Using Syntactic Structure and Word Similarity)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.297-304
    • /
    • 2010
  • 통계기계번역에서 번역성능의 향상을 위해서 문장의 유형이나 장르에 따라 클러스터링을 수행하여 도메인에 특화된 번역을 시도하는 방법이 있다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 각 문장의 문법적 구조 유사도에 따른 유형별분류 기법과, 단어 유사도 정보를 사용한 장르 구분법을 적용하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 도메인 특화 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조 유사도와 단어 유사도의 계산 방법으로는 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정에서는 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

Algorithm for Discrimination of Brown Rice Kernels Using Machine Vision

  • C.S. Hwang;Noh, S.H.;Lee, J.W.
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 1996년도 International Conference on Agricultural Machinery Engineering Proceedings
    • /
    • pp.823-833
    • /
    • 1996
  • An ultimate purpose of this study is to develop an automatic brown rice quality inspection system using image processing technique. In this study emphasis was put on developing an algorithm for discriminating the brown rice kernels depending on their external quality with a color image processing system equipped with an adaptor for magnifying the input image and optical fiber for oblique illumination. Primarily , geometrical and optical features of sample images were analyzed with unhulled paddy and various brown rice kernel samples such as sound, cracked, green-transparent , green-opaque, colored, white-opaque and brokens. Secondary, an algorithm for discrimination of the rice kernels in static state was developed on the basis of the geometrical and optical parameters screened by a statistical analysis(STEPWISE and DISCRIM Procedure, SAS ver.6). Brown rice samples could be discriminated by the algorithm developed in this study with an accuracy of 90% to 96% for the sound , cracked, colored, broken and unhulled , about 81% for the green-transparent and the white-opaque and about 75% for the green-opaque, respectively. A total computing time required for classification was about 100 seconds/1000 kernels with the PC 80486-DX2, 66MHz.

  • PDF

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

Sentinel-2 위성영상을 이용한 DMZ 산불 피해 면적 관측 기법 연구 (The Study of DMZ Wildfire Damage Area Detection Method Using Sentinel-2 Satellite Images)

  • 이슬기;송종성;이창욱;고보균
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.545-557
    • /
    • 2022
  • 본 연구는 직접적인 접근이 어려운 demilitarized zone (DMZ)의 산불 피해 지역을 파악하기 위하여, 고해상도 위성영상 및 머신러닝 기반의 감독 분류 기법을 이용하였다. 고해상도 위성 영상은 Sentinel-2 A/B를 이용하였으며, SVM 감독분류 기법을 기반으로 토지피복도를 산출하였다. DMZ 산불 피해 지역을 분류하기 위한 최적의 조합을 찾기 위하여 SVM 내에 다양한 커널과 밴드 조합에 따른 감독 분류를 진행하고 오차 행렬을 통해 정확도를 평가하였다. 또한, 2020년, 2021년은 위성영상 자료 기반의 산불 탐지 결과와 산불 연보의 피해 지역 면적 간의 비교를 통한 검증을 수행하였다. 이후, 현재 피해 면적 자료가 없는 2022년의 산불 피해 지역을 탐지함으로써 신뢰할 만한 수준의 결과를 신속적으로 파악하고자 하였다.

SVM 교차검증을 활용한 토지피복 ROI 선정 (Region of Interest (ROI) Selection of Land Cover Using SVM Cross Validation)

  • 정종철;윤형진
    • 지적과 국토정보
    • /
    • 제50권1호
    • /
    • pp.75-85
    • /
    • 2020
  • 본 연구는 토지피복 분류에 사용 가능한 ROI 생성 과정에서 기계학습 기반 교차검증을 활용하였다. 연구지역은 세종시를 포함한 2019년 10월 28일 단시기 KOMPSAT-3A 영상을 활용하였다. 연구 과정에서 4개의 밴드(Red, Green, Blue, Near Infra-red)를 독립변수로 교차검증 과정에서 학습시켰다. 또한 SVM의 4가지 기법(Linear, Polynomial, RBF, Sigmoid)을 활용하여 추출된 ROI를 기반으로 토지피복 분류를 실시하였다. 교차검증 과정에서 훈련된 3,500개의 데이터 중 1,813개의 데이터가 추출되었으며 건물, 도로, 그리고 초지에서 약 60%의 데이터가 제거되었다. 추출된 ROI를 기반으로 다른 SVM기법에 비해 SVM Linear 기법이 91.77%로 가장 높은 분류 정확도를 나타냈다. 분류 클래스 중 초지의 경우 산림과의 오분류가 가장 많이 발생하며 79.43%의 생산자 정확도로 가장 낮은 분류 정확도를 보여주었다. 연구 결과에 따라 교차검증에서 추출된 ROI는 산림, 수역, 그리고 농업지역에 대해서는 90%이상의 분류정확도를 보여주며 효과적인 분류결과를 도출할 수 있었으나, 80%의 분류정확도를 보여주는 건물, 도로, 나대지, 그리고 초지 지역을 분류하는 방법에 대해서는 추가적인 연구가 진행되어야 할 필요성이 존재한다.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

기계학습을 활용한 상품자산 투자모델에 관한 연구 (A Study on Commodity Asset Investment Model Based on Machine Learning Technique)

  • 송진호;최흥식;김선웅
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.127-146
    • /
    • 2017
  • 상품자산(Commodity Asset)은 주식, 채권과 같은 전통자산의 포트폴리오의 안정성을 높이기 위한 대체투자자산으로 자산배분의 형태로 투자되고 있지만 주식이나 채권 자산에 비해 자산배분에 대한 모델이나 투자전략에 대한 연구가 부족한 실정이다. 최근 발전한 기계학습(Machine Learning) 연구는 증권시장의 투자부분에서 적극적으로 활용되고 있는데, 기존 투자모델의 한계점을 개선하는 좋은 성과를 나타내고 있다. 본 연구는 이러한 기계학습의 한 기법인 SVM(Support Vector Machine)을 이용하여 상품자산에 투자하는 모델을 제안하고자 한다. 기계학습을 활용한 상품자산에 관한 기존 연구는 주로 상품가격의 예측을 목적으로 수행되었고 상품을 투자자산으로 자산배분에 관한 연구는 찾기 힘들었다. SVM을 통한 예측대상은 투자 가능한 대표적인 4개의 상품지수(Commodity Index)인 골드만삭스 상품지수, 다우존스 UBS 상품지수, 톰슨로이터 CRB상품지수, 로저스 인터내셔날 상품지수와 대표적인 상품선물(Commodity Futures)로 구성된 포트폴리오 그리고 개별 상품선물이다. 개별상품은 에너지, 농산물, 금속 상품에서 대표적인 상품인 원유와 천연가스, 옥수수와 밀, 금과 은을 이용하였다. 상품자산은 전반적인 경제활동 영역에 영향을 받기 때문에 거시경제지표를 통하여 투자모델을 설정하였다. 주가지수, 무역지표, 고용지표, 경기선행지표 등 19가지의 경제지표를 이용하여 상품지수와 상품선물의 등락을 예측하여 투자성과를 예측하는 연구를 수행한 결과, 투자모델을 활용하여 상품선물을 리밸런싱(Rebalancing)하는 포트폴리오가 가장 우수한 성과를 나타냈다. 또한, 기존의 대표적인 상품지수에 투자하는 것 보다 상품선물로 구성된 포트폴리오에 투자하는 것이 우수한 성과를 얻었으며 상품선물 중에서도 에너지 섹터의 선물을 제외한 포트폴리오의 성과가 더 향상된 성과를 나타남을 증명하였다. 본 연구에서는 포트폴리오 성과 향상을 위해 기존에 널리 알려진 전통적 주식, 채권, 현금 포트폴리오에 상품자산을 배분하고자 할 때 투자대상은 상품지수에 투자하는 것이 아닌 개별 상품선물을 선정하여 자체적 상품선물 포트폴리오를 구성하고 그 방법으로는 기간마다 강세가 예측되는 개별 선물만을 골라서 포트폴리오를 재구성하는 것이 효과적인 투자모델이라는 것을 제안한다.

비닐피복 땅콩 재배시 생육 및 수량에 미치는 국소시비 효과 (Effect of Band Spotty Fertilization on the Yield and Growth of Peanut(Arachis hypogaea L.) in Plastic Film Mulching Cultivation)

  • 양창휴;류철현;신복우;정영근;강승원
    • 한국토양비료학회지
    • /
    • 제39권5호
    • /
    • pp.298-302
    • /
    • 2006
  • 비닐피복작물 재배시 시비효율 증대 및 생력시비기술 확립을 위하여 파종과 동시에 시비가 가능한 토중시비기를 개발하였고 개발된 파종기와 시비기를 이용하여 1999년부터 2000년까지 시비간격 30 cm, 시비깊이 15 cm, 파종간격 25 cm로 배수가 양호한 사양토에서 땅콩을 재배한 후 작업정도, 토양화학성, 양분흡수량 및 수량성에 미치는 영향을 평가하였다. 땅콩의 파종 소요시간은 인력($173hr\;ha^{-1}$)에 비하여 90% 이상 노력절감 효과가 있었으나 출현일수는 4일정도 지연되었으며 입모율은 관행구에 비하여 11~18% 낮았다. 시험 전 토양에 비하여 시험 후 토양의 총질소 함량은 증가한 반면에 유기물, 유효인산 및 치환성 칼륨함량은 감소되었으며 토양의 질산태질소 합량은 생육초기에서 중기까지 국소시비구에서 시비량이 많을수록 증가하였다. 땅콩의 질소흡수량은 근류균에 의한 자체 고정량이 많아 시비방법 및 시비량별 큰 차이가 없었으나 인산 및 칼리흡수량은 국소시비 70%, 100%구에서 높은 경향을 나타냈다. 땅콩의 생장속도는 시비방법별 공히 파종 후 120일에 가장 많이 증가되었고 관행시비구와 국소시비 70%구에서 생육후기까지 증가폭이 크게 나타났으며 국소시비 70%구는 협수가 많고 협실비율 및 완숙립중 비율이 높아 종실중이 관행시비구 $3,150kg\;ha^{-1}$에 비하여 4% 증수되었다.

Deep Neural Network와 Convolutional Neural Network 모델을 이용한 산사태 취약성 매핑 (Landslide Susceptibility Mapping Using Deep Neural Network and Convolutional Neural Network)

  • 공성현;백원경;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1723-1735
    • /
    • 2022
  • 산사태는 가장 널리 퍼진 자연재해 중 하나로 인명 및 재산피해 뿐만 아니라 범 국가적 차원의 피해를 유발할 수 있기 때문에 효과적인 예측 및 예방이 필수적이다. 높은 정확도를 갖는 산사태 취약성도를 제작하려는 연구는 꾸준히 진행되고 있으며 다양한 모델이 산사태 취약성 분석에 적용되어 왔다. 빈도비 모델, logistic regression 모델, ensembles 모델, 인공신경망 등의 모델과 같이 픽셀기반 머신러닝 모델들이 주로 적용되어 왔고 최근 연구에서는 커널기반의 합성곱신경망 기법이 효과적이라는 사실과 함께 입력자료의 공간적 특성이 산사태 취약성 매핑의 정확도에 중요한 영향을 미친다는 사실이 알려졌다. 이러한 이유로 본 연구에서는 픽셀기반 deep neural network (DNN) 모델과 패치기반 convolutional neural network (CNN) 모델을 이용하여 산사태 취약성을 분석하는 것을 목적으로 한다. 연구지역은 산사태 발생 빈도가 높고 피해가 큰 인제, 강릉, 평창을 포함한 강원도 지역으로 설정하였고, 산사태 관련인자로는 경사도, 곡률, 하천강도지수, 지형습윤지수, 지형위치 지수, 임상경급, 임상영급, 암상, 토지이용, 유효토심, 토양모재, 선구조 밀도, 단층 밀도, 정규식생지수, 정규수분지수의 15개 데이터를 이용하였다. 데이터 전처리 과정을 통해 산사태관련인자를 공간데이터베이스로 구축하였으며 DNN, CNN 모델을 이용하여 산사태 취약성도를 작성하였다. 정량적인 지표를 통해 모델과 산사태 취약성도에 대한 검증을 진행하였으며 검증결과 패치기반의 CNN 모델에서 픽셀기반의 DNN 모델에 비해 3.4% 향상된 성능을 보였다. 본 연구의 결과는 산사태를 예측하는데 사용될 수 있고 토지 이용 정책 및 산사태 관리에 관한 정책 수립에 있어 기초자료 역할을 할 수 있을 것으로 기대된다.