• 제목/요약/키워드: 커널모수

검색결과 52건 처리시간 0.022초

Support Vector Machine을 이용한 부도예측모형의 개발 -격자탐색을 이용한 커널 함수의 최적 모수 값 선정과 기존 부도예측모형과의 성과 비교- (Support Vector Bankruptcy Prediction Model with Optimal Choice of RBF Kernel Parameter Values using Grid Search)

  • 민재형;이영찬
    • 한국경영과학회지
    • /
    • 제30권1호
    • /
    • pp.55-74
    • /
    • 2005
  • Bankruptcy prediction has drawn a lot of research interests in previous literature, and recent studies have shown that machine learning techniques achieved better performance than traditional statistical ones. This paper employs a relatively new machine learning technique, support vector machines (SVMs). to bankruptcy prediction problem in an attempt to suggest a new model with better explanatory power and stability. To serve this purpose, we use grid search technique using 5-fold cross-validation to find out the optimal values of the parameters of kernel function of SVM. In addition, to evaluate the prediction accuracy of SVM. we compare its performance with multiple discriminant analysis (MDA), logistic regression analysis (Logit), and three-layer fully connected back-propagation neural networks (BPNs). The experiment results show that SVM outperforms the other methods.

이차 평활스플라인 (A Second Order Smoother)

  • 김종태
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.363-376
    • /
    • 1998
  • 선형 평활스플라인 추정은 경계 편의의 영향력을 제거 하기위해 수정된 것이다. 제시된 추정량은 적합된 값들과 관련있는 평활 모수 선택 기준의 계산을 개선시킨 O(n) 얄고리즘을 사용하여 효과적으로 계산할 수 있게 하였다. 추정량의 점근적 성질들이 균일 계획의 경우에 대하여 연구되었다. 이 경우에 경계수정 선형 평활스플라인들의 평균 제곱 오차의 성질들은 표준 이차 커널 평활들에 대한 평균제곱오차들과 점근적 특성으로 비교하였다.

  • PDF

ROC 함수 추정 (ROC Function Estimation)

  • 홍종선;;홍선우
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.987-994
    • /
    • 2011
  • 모집단이 부도와 정상상태로 구분되는 신용평가 관점에서 부도와 정상 상태의 조건부 누적분포함수를 추정하는 방법으로 정규혼합 분포추정과 kernel density estimation을 이용하는 분포추정을 고려한다. 정규혼합 분포의 모수를 EM 알고리즘을 사용해 추정하고, KDE 방법에서는 많이 사용하는 다섯 종류의 커널 함수와 네가지의 띠폭을 이용한다. 그리고 추정한 분포로부터 구한 각각의 ROC 함수를 구한다. 추정한 분포들의 적합도를 비교 분석하고, 이를 바탕으로 구한 ROC 곡선의 성과를 비교 토론한다. 본 연구에서는 KDE 방법으로 추정한 분포함수가 더 적합하고, 추정한 정규혼합 분포를 이용한 ROC 함수가 더 좋은 성과를 나타내는 것을 발견하였다.

국제곡물가격에 대한 기후의 고차 선형 적률 인과관계 연구 (Linear causality in moments from climate to international crop prices)

  • 정기호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.67-74
    • /
    • 2017
  • 본 논문은 기후와 국제곡물가격의 인과관계를 분석한다. 기후는 곡물시장에 영향을 미치는 중요한 요인이지만 국제곡물가격의 인과관계를 분석한 선행연구는 제한적이다. 본 논문은 대표적인 세계기후 변수인 해양표면온도 (sea surface temperature; SST)와 세계 3대 곡물인 밀, 옥수수, 콩의 국제가격을 이용하여 1987년 5월부터 2013년 7월까지 기간의 월별자료를 분석하였다. 분석방법으로서 비모수 커널방법으로 제시된 고차 적률 인과관계 개념 (Nishiyama 등, 2011)을 모수적인 방법으로 변환하여 적용하였다. 분석결과, 기후는 1차 적률에서 3개 곡물가격 모두에 대해 그리고 2차 적률에서 옥수수와 콩의 가격에 대해 각각 인과관계를 가지며 3차 적률에서는 3개 곡물가격 모두에 대해 인과관계를 갖지 않는 것으로 나타났다.

기대효용최대화를 통한 한국형 기업 신용평가 모형 (Korea-specified Maximum Expected Utility Model for the Probability of Default)

  • 박유성;송지현;최보승
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.573-584
    • /
    • 2007
  • 기업의 신용을 평가하는데 있어 정확한 파산확률의 추정은 무엇보다도 중요한 요소이다. 선형로지스틱회귀모형보다 성능이 좋은 기대효용최대화 (Maximum Expected Utility) 모형이 제안되었다. 그러나 이 모형에 포함되어 있는 모수의 일부가 북미와 유럽지역의 자료를 토대로 경험적으로 추정되어진 것이므로 우리나라 기업에 바로 적용하기에는 무리가 있다. 따라서 우리나라 중소기업의 자료를 바탕으로 모수를 재추정하여 한국형 MEU모형을 제안하고자 한다. 34,057개의 중소기업을 이용하여 한국형 MEU모형을 설계한 결과, 기존의 북미 유럽형 모형과 차이가 많이 나는 것으로 나타났으며 성능면에서도 선형로지스틱회귀모형보다 전 산업분류에 걸쳐 한국형 MEU모형이 매우 우수한 것으로 나타났다.

관능특성 및 판별함수를 이용한 한우고기 맛 등급 분석 (Palatability Grading Analysis of Hanwoo Beef using Sensory Properties and Discriminant Analysis)

  • 조수현;서그러운달님;김동훈;김재희
    • 한국축산식품학회지
    • /
    • 제29권1호
    • /
    • pp.132-139
    • /
    • 2009
  • 본 연구에서는 1,300명의 소비자들이 직접 먹어보고 평가한 한우고기 데이터를 이용하여 쇠고기 맛 등급을 구분 해 내기 위한 판별분석 방법들을 비교하였다. 한우 관능평가의 주요 세 변수인 연도, 다즙성, 향미를 포함한 정준 판별분석과 대표적인 맛 변수로 여겨지는 전반적인 기호도 만을 이용하여 선형판별분석과 비모수 판별분석을 하였다. 전반적인 기호도와 같은 한 개의 변수만을 사용할 경우 두 가지 모두 비슷한 분류율을 나타내지만 선형판별 함수는 이해와 사용 측면에서 장점이 있었던 반면에 비모수적 방법은 커널함수와 띠폭에 대한 선택이 불편하지만 잘 선택하면 정확한 분류율을 높일 수 있는 장점이 있었다. 그러나 다른 정보를 가진 변수들이 있음에도 불구하고 한 개의 변수만을 이용한 판별 분석은 판별에 영향을 미치는 다른 중요한 변수들의 정보를 활용하지 못한다는 문제점이 있다. 한편, 정준판별분석의 경우 정준판별함수의 오분류율이 일변량 선형 판별함수와 비모수 판별함수의 오분류율에 비해 크게 떨어지지 않으면서 분포에 대한 특별한 가정이 필요하지 않아 통계적 가정이 까다롭지 않고 또한 맛에 중요한 요인인 연도, 다즙성, 향미의 세 개변수를 모두 사용하므로 맛 정보를 최대로 활용한다는 장점이 있었다. 따라서 본 연구결과 연도, 다즙성, 향미의 세가지 변수 정보를 모두 포함한 다변량 정준판별분석법을 이용하는 것이 맛 등급을 구분하는데 가장 적절할 것으로 판단되었다.

Support Vector Regression을 이용한 GARCH 모형의 추정과 투자전략의 성과분석 (Estimation of GARCH Models and Performance Analysis of Volatility Trading System using Support Vector Regression)

  • 김선웅;최흥식
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.107-122
    • /
    • 2017
  • 주식시장의 주가 수익률에 나타나는 변동성은 투자 위험의 척도로서 재무관리의 이론적 모형에서뿐만 아니라 포트폴리오 최적화, 증권의 가격 평가 및 위험관리 등 투자 실무 영역에서도 매우 중요한 역할을 하고 있다. 변동성은 주가 수익률이 평균을 중심으로 얼마나 큰 폭의 움직임을 보이는가를 판단하는 지표로서 보통 수익률의 표준편차로 측정한다. 관찰 가능한 표준편차는 과거의 주가 움직임에서 측정되는 역사적 변동성(historical volatility)이다. 역사적 변동성이 미래의 주가 수익률의 변동성을 예측하려면 변동성이 시간 불변적(time-invariant)이어야 한다. 그러나 대부분의 변동성 연구들은 변동성이 시간 가변적(time-variant)임을 보여주고 있다. 이에 따라 시간 가변적 변동성을 예측하기 위한 여러 계량 모형들이 제안되었다. Engle(1982)은 변동성의 시간 가변적 특성을 잘 반영하는 변동성 모형인 Autoregressive Conditional Heteroscedasticity(ARCH)를 제안하였으며, Bollerslev(1986) 등은 일반화된 ARCH(GARCH) 모형으로 발전시켰다. GARCH 모형의 실증 분석 연구들은 실제 증권 수익률에 나타나는 두터운 꼬리 분포 특성과 변동성의 군집현상(clustering)을 잘 설명하고 있다. 일반적으로 GARCH 모형의 모수는 가우스분포로부터 추출된 자료에서 최적의 성과를 보이는 로그우도함수에 대한 최우도추정법에 의하여 추정되고 있다. 그러나 1987년 소위 블랙먼데이 이후 주식 시장은 점점 더 복잡해지고 시장 변수들이 많은 잡음(noise)을 띠게 됨에 따라 변수의 분포에 대한 엄격한 가정을 요구하는 최우도추정법의 대안으로 인공지능모형에 대한 관심이 커지고 있다. 본 연구에서는 주식 시장의 주가 수익률에 나타나는 변동성의 예측 모형인 GARCH 모형의 모수추정방법으로 지능형 시스템인 Support Vector Regression 방법을 제안한다. SVR은 Vapnik에 의해 제안된 Support Vector Machines와 같은 원리를 회귀분석으로 확장한 모형으로서 Vapnik의 e-insensitive loss function을 이용하여 비선형 회귀식의 추정이 가능해졌다. SVM을 이용한 회귀식 SVR은 두터운 꼬리 분포를 보이는 주식시장의 변동성과 같은 관찰치에서도 우수한 추정 성능을 보인다. 2차 손실함수를 사용하는 기존의 최소자승법은 부최적해로서 추정 오차가 확대될 수 있다. Vapnik의 손실함수에서는 입실론 범위내의 예측 오차는 무시하고 큰 예측 오차만 손실로 처리하기 때문에 구조적 위험의 최소화를 추구하게 된다. 금융 시계열 자료를 분석한 많은 연구들은 SVR의 우수성을 보여주고 있다. 본 연구에서는 주가 변동성의 분석 대상으로서 KOSPI 200 주가지수를 사용한다. KOSPI 200 주가지수는 한국거래소에 상장된 우량주 중 거래가 활발하고 업종을 대표하는 200 종목으로 구성된 업종 대표주들의 포트폴리오이다. 분석 기간은 2010년부터 2015년까지의 6년 동안이며, 거래일의 일별 주가지수 종가 자료를 사용하였고 수익률 계산은 주가지수의 로그 차분값으로 정의하였다. KOSPI 200 주가지수의 일별 수익률 자료의 실증분석을 통해 기존의 Maximum Likelihood Estimation 방법과 본 논문이 제안하는 지능형 변동성 예측 모형의 예측성과를 비교하였다. 주가지수 수익률의 일별 자료 중 학습구간에서 대칭 GARCH 모형과 E-GARCH, GJR-GARCH와 같은 비대칭 GARCH 모형에 대하여 모수를 추정하고, 검증 구간 데이터에서 변동성 예측의 성과를 비교하였다. 전체 분석기간 1,487일 중 학습 기간은 1,187일, 검증 기간은 300일 이다. MLE 추정 방법의 실증분석 결과는 기존의 많은 연구들과 비슷한 결과를 보여주고 있다. 잔차의 분포는 정규분포보다는 Student t분포의 경우 더 우수한 모형 추정 성과를 보여주고 있어, 주가 수익률의 비정규성이 잘 반영되고 있다고 할 수 있다. MSE 기준으로, SVR 추정의 변동성 예측에서는 polynomial 커널함수를 제외하고 linear, radial 커널함수에서 MLE 보다 우수한 예측 성과를 보여주었다. DA 지표에서는 radial 커널함수를 사용한 SVR 기반의 지능형 GARCH 모형이 가장 우수한 변동성의 변화 방향에 대한 방향성 예측력을 보여주었다. 추정된 지능형 변동성 모형을 이용하여 예측된 주식 시장의 변동성 정보가 경제적 의미를 갖는지를 검토하기 위하여 지능형 변동성 거래 전략을 도출하였다. 지능형 변동성 거래 전략 IVTS의 진입규칙은 내일의 변동성이 증가할 것으로 예측되면 변동성을 매수하고 반대로 변동성의 감소가 예상되면 변동성을 매도하는 전략이다. 만약 변동성의 변화 방향이 전일과 동일하다면 기존의 변동성 매수/매도 포지션을 유지한다. 전체적으로 SVR 기반의 GARCH 모형의 투자 성과가 MLE 기반의 GARCH 모형의 투자 성과보다 높게 나타나고 있다. E-GARCH, GJR-GARCH 모형의 경우는 MLE 기반의 GARCH 모형을 이용한 IVTS 전략은 손실이 나지만 SVR 기반의 GARCH 모형을 이용한 IVTS 전략은 수익으로 나타나고 있다. SVR 커널함수에서는 선형 커널함수가 더 좋은 투자 성과를 보여주고 있다. 선형 커널함수의 경우 투자 수익률이 +526.4%를 기록하고 있다. SVR 기반의 GARCH 모형을 이용하는 IVTS 전략의 경우 승률도 51.88%부터 59.7% 사이로 높게 나타나고 있다. 옵션을 이용하는 변동성 매도전략은 방향성 거래전략과 달리 하락할 것으로 예측된 변동성의 예측 방향이 틀려 변동성이 소폭 상승하거나 변동성이 하락하지 않고 제자리에 있더라도 옵션의 시간가치 요인 때문에 전체적으로 수익이 실현될 수도 있다. 정확한 변동성의 예측은 자산의 가격 결정뿐만 아니라 실제 투자에서도 높은 수익률을 얻을 수 있기 때문에 다양한 형태의 인공신경망을 활용하여 더 나은 예측성과를 보이는 변동성 예측 모형을 개발한다면 주식시장의 투자자들에게 좋은 투자 정보를 제공하게 될 것이다.

배경잡음에 적응하는 진동센서 기반 목표물 탐지 알고리즘 (Target Detection Algorithm Based on Seismic Sensor for Adaptation of Background Noise)

  • 이재일;이종현;배진호;권지훈
    • 전자공학회논문지
    • /
    • 제50권7호
    • /
    • pp.258-266
    • /
    • 2013
  • 본 논문에서는 진동센서를 기반으로 하는 탐지 시스템에서 불규칙적으로 변화는 잡음의 특성을 고려하여 허위경보(false alarm)를 감소하기 위한 적응형 탐지 알고리즘을 제안한다. 제안된 알고리즘은 커널 함수(Kerenl function)을 이용한 1차 검출과 탐지 확정 단계를 적용한 2차 검출로 구성된다. 1차 검출기의 커널 함수는 측정된 신호로부터 잡음의 확률적 모수를 이용하여 잡음 변화에 따라 Neyman-Pearson 결정법으로 문턱 값을 찾아 구한다. 그리고 2차 탐지기는 1차 탐지된 표본수를 이용하여 발걸음 신호의 점유시간을 계산한 후 4단계의 탐지 확정 단계로 구성된다. 본 논문에서 제안된 알고리즘을 검증하기 위해 측정된 걷기와 뛰기 진동 신호를 이용하여 발걸음 신호에 대한 탐지 실험을 수행 하였으며 고정 문턱 값을 이용한 탐지 결과와 비교 하였다. 제안된 1차 검출기의 목표물 탐지 결과 사람의 걷기와 뛰기에 대하여 10m 구간까지 95%의 높은 탐지 성능을 획득하였다. 또한, 허위경보 확률은 고정 문턱 값과 비교할 때 40%에서 20%로 감소하였으며 탐지 확정 단계를 적용한 결과 4%미만으로 크게 감소한 결과를 얻었다.

비선형 모델을 이용한 결측 대체 방법 비교 (A comparison of imputation methods using nonlinear models)

  • 김혜인;송주원
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.543-559
    • /
    • 2019
  • 자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체 방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.

준지도 학습의 모수 선택에 관한 연구 (Smoothing parameter selection in semi-supervised learning)

  • 석경하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.993-1000
    • /
    • 2016
  • 반응 값이 없는 자료를 지도학습 (supervised learning)에 사용하는 준지도 학습 (semi-supervised learning)은 분류에 더 많은 관심을 갖는다. 본 연구는 준지도학습을 회귀분석에 적용하는 준지도 회귀함수 추정법을 제안한다. 제안된 방법은 기존의 방법과 형태는 같지만 반응 값이 있는 자료와 없는 자료의 주변분포를 다르게 가정하고, 서로 다른 평활계수를 사용하는 등 좀 더 일반화된 형태를 가진다. 제안된 추정법의 점근분포를 계산하고 점근평균제곱오차를 최소화하는 최적의 평활계수가 가지는 조건을 찾는다. 설명변수의 주변분포에 대한 추정이 잘 이루이지고, 반응 값이 있는 자료와 없는 자료의 크기에 대한 조건을 적절하게 통제할 수 있고, 그리고 평활계수가 적절하게 선택될 수 있다면 라벨없는 자료가 회귀분석에서도 도움을 줄 수 있음을 보인다. 그리고 준지도 분류에서 사용하는 것처럼 반응 값이 없는 자료의 초기추정은 작은 값을 가지는 평활계수를 사용하여 과적합 (overfitting)되도록 하는 것이 좋음을 증명한다.