• 제목/요약/키워드: Stepwise logistic regression

검색결과 98건 처리시간 0.025초

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

유전자 알고리즘을 이용한 다분류 SVM의 최적화: 기업신용등급 예측에의 응용 (Optimization of Multiclass Support Vector Machine using Genetic Algorithm: Application to the Prediction of Corporate Credit Rating)

  • 안현철
    • 경영정보학연구
    • /
    • 제16권3호
    • /
    • pp.161-177
    • /
    • 2014
  • 기업신용등급은 금융시장의 신뢰를 구축하고 거래를 활성화하는데 있어 매우 중요한 요소로서, 오래 전부터 학계에서는 보다 정확한 기업신용등급 예측을 가능케 하는 다양한 모형들을 연구해 왔다. 구체적으로 다중판별분석(Multiple Discriminant Analysis, MDA)이나 다항 로지스틱 회귀분석(multinomial logistic regression analysis, MLOGIT)과 같은 통계기법을 비롯해, 인공신경망(Artificial Neural Networks, ANN), 사례기반추론(Case-based Reasoning, CBR), 그리고 다분류 문제해결을 위해 확장된 다분류 Support Vector Machines(Multiclass SVM)에 이르기까지 다양한 기법들이 학자들에 의해 적용되었는데, 최근의 연구결과들에 따르면 이 중에서도 다분류 SVM이 가장 우수한 예측성과를 보이고 있는 것으로 보고되고 있다. 본 연구에서는 이러한 다분류 SVM의 성능을 한 단계 더 개선하기 위한 대안으로 유전자 알고리즘(GA, Genetic Algorithm)을 활용한 최적화 모형을 제안한다. 구체적으로 본 연구의 제안모형은 유전자 알고리즘을 활용해 다분류 SVM에 적용되어야 할 최적의 커널 함수 파라미터값들과 최적의 입력변수 집합(feature subset)을 탐색하도록 설계되었다. 실제 데이터셋을 활용해 제안모형을 적용해 본 결과, MDA나 MLOGIT, CBR, ANN과 같은 기존 인공지능/데이터마이닝 기법들은 물론 지금까지 가장 우수한 예측성과를 보이는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안모형이 더 우수한 예측성과를 보임을 확인할 수 있었다.

일부지역 노인들의 인지기능과 우울에 관련된 요인에 관한 연구 (A Study on the Factors Related to the Cognitive Function and Depression Among the Elderly)

  • 신철호;김수영;이영수;조영채;이태용;이동배
    • Journal of Preventive Medicine and Public Health
    • /
    • 제29권2호
    • /
    • pp.199-214
    • /
    • 1996
  • 노인들의 인지기능과 우울에 관련이 있는 요인을 알아보기 위해 대전시 및 대전시의 인근지역의 노인들 729명을 대상으로 MMSE 및 GDS를 이용한 면접조사를 실시하고 자료를 분석한 결과는 다음과 같다. 1. 조사대상군의 인지기능은 정상이 56.8%, 치매가 의심되는 경도장애가 24.1%, 치매가 거의 확실 한 중증의 장애가 19.1%로 나타났으며, 인지기능에 장애가 심할수록 우울의 정도가 증가하였다. 2. 연령이 증가함에 따라 인지기능은 감소하였으며, 남자보다는 여자에서 인지기능 및 우울증상의 정도가 높게 나타났다. 3. 연령의 효과를 보정한 후 인지기능 장애여부에 관련이 있는 요인은 성, 배우자 유무, 교육정도, 과거직업, 도구적 일상생활능력, 규칙적 운동, 외출빈도와 신체적 증상 중 흉부통중, 시력 및 청력장애, 어지러움증이었다. 4. 연령효과를 보정한 후에 유의한 관련성이 있는 변수를 이용한 회귀모형에서 도구적 일상생활 능력, 연령, 시력장애, 성, 집밖 외출의 요인이 통계적 유의성을 보였다. 5. 단계적 회귀분석을 통해 우울점수에 유의한 관련성을 보인 변수는 교육수준, 집밖 외출과 직업 활동 및 집안일의 참여, 규칙적 운동, 도구적 일상생활능력, 주관적으로 평가한 본인의 건강과 영양상태, 신체적 증상으로 어지러움증, 시력장애 및 흥부통증이었다. 이상의 결과를 볼 때 조사대상 노인들에 있어서 인지 기능과 우울에 관련성이 높은 주된 특성은 신체적 활동 능력과 주관적으로 평가된 건강상태라고 볼 수 있다.

  • PDF

말기암환자 가족 간병인의 간병 부담과 관련된 요인 (Factors Associated with Care Burden among Family Caregivers of Terminally Ill Cancer Patients)

  • 이지혜;박현경;황인철;김효민;고수진;김영성;이용주;최윤선;황선욱;안홍엽
    • Journal of Hospice and Palliative Care
    • /
    • 제19권1호
    • /
    • pp.61-69
    • /
    • 2016
  • 목적: 말기암환자 가족 간병인의 간병 부담을 줄이는 것은 가족뿐 아니라 환자를 위해서도 중요하다. 본 연구에서는 말기암환자 가족 간병인의 간병 부담과 관련된 요인에 대해 살펴보았다. 방법: 국내 7개 기관의 완화의료병동에서 입원치료를 받는 말기암환자의 가족 간병인 289명의 자료를 분석하였다. 간병인이 느끼는 주관적 간병 부담은 암환자 가족 돌봄 경험 평가도구를 사용하였고, 5가지 차원에서 단계적 변수 선정을 사용한 로지스틱 회귀 모형을 통해 유의한 인자를 확인하였다. 결과: 간병부담의 각 차원에서 다양한 인자들과의 관련성이 확인되었다. 감정적 요인은 가장 폭넓은 영향을 미쳤는데, 감정적 스트레스를 가진 군은 그렇지 않은 군에 비해, 생활패턴이 변할 가능성이 2.54배(95% confidence interval, 1.29~5.02), 가족의 협조가 부족할 가능성이 2.27배(1.04~4.97), 그리고 신체적 부담이 커질 가능성이 5.44배(2.50~11.88)였다. 가족기능은 가족의 협조부족을 매우 잘 반영하였으며, 심한 가족기능 장애를 보일 경우 경제적 부담과도 관련이 있었다. 종교를 가진 군과 동반질환이 없는 군에서 오히려 간병 부담이 더 높은 것으로 나타났으며, 간병기간과 하루 중 간병시간은 생활패턴의 변화와 신체적 부담을 유의하게 예측하였다. 직업을 가지고 있거나, 사회적 지지가 부족하거나, 자주 방문하지 못하는 가족 간병인은 낮은 자아 존중감을 보였다. 결론: 본 연구 결과에 의하면, 가족 간병인의 간병 부담을 파악하기 위해서는 그들의 정서상태와 가족기능을 파악하는 것이 도움이 되며, 사회적 지지체계를 포함하여 경제적 부담을 완화시키는 노력이 필요하겠다.

휴식기 T1-201/디피리다몰 부하 게이트 Tc-99m-MIBI/24시간 지연 T1-201 SPECT를 이용한 관상동맥 우회로 수술 후 심근벽 운동 호전의 예측 (Prediction of Improvement of Myocardial Wall Motion after Coronary Artery Bypass Surgery Using Rest T1-201/Dipyridamole Stress Gated Tc-99m-MIBI/24 Hour Delay T1-201 SPECT)

  • 이동수;이원우;여정석;김석기;김기봉;정준기;이명철
    • 대한핵의학회지
    • /
    • 제32권6호
    • /
    • pp.497-508
    • /
    • 1998
  • 목적: 휴식기 T1-201/디피리다몰 부하 게이트 Tc-99m-MIBI/24시간 T1-201 SPECT을 이용하여 심근 벽운동의 수술 후 호전 가능성을 예측하고 어떤 지표가 예측률이 좋은지 조사하였다. 대상 및 방법: 39명(남자:여자=34:5, 나이: $58{\pm}8세$)에서 우회로 수술을 시행하고 수술전과 수술한지 3개월 후에 심근 관류 SPECT를 하여 수술 전 SPECT로부터 부하-휴식기 가역성, 휴식기 T1-201 섭취, T1-201 휴식-재분포 양상, 심근의 수축기 두꺼워짐을 준정량적으로 등급화하고 이 지표가 수술 후 심근 벽운동 호전여부를 얼마나 잘 예측할 수 있는지 보았다. 휴식기에 관류 감소가 있는 16명은 24시간 지연재분포 T1-201 SPECT를 촬영하였다. 17분절로 나누어 관류는 0에서 3 (0: 정상, 1: 가벼운 감소, 2 심한 감소, 3: 결손), 벽운동은 0 에서 4 (0: 정상, 1. 가벼운 저운동, 2: 심한 저운동, 3: 무운동, 4: 이상운동), 심근의 수축기 두꺼워짐은 좋거나 나쁨으로 판정하였다. 전체 99동맥영역의 585분절 중에서 142분절이 벽운동이 이상이 있어서 우회로 또는 수술적 성형술로 재관류 수술을 시행하였다. 결과: 수술 후 구혈률은 수술 전에 구혈률이 낮은 환자 22명은 $37.8{\pm}9.0%$에 비해 $45.5{\pm}12.3%$ 까지 증가하였다. 103 개의 분절(72.5%)의 벽운동이 수술 후 호전되었다. 부하-휴식기 가역성, 휴식기 T1-201 섭취, T1-201 휴식-재분포 양상, 심근의 수축기 두꺼워짐의 벽운동 호전 예측능은 각각 83%, 76%, 43%, 69%이었다. 음성예측률은 48%, 44%, 58%, 21%이었다. 네 지표중 어느 하나라도 있는 경우 양성예측률은 74% 음성 예측률은 46%이었다. 판단도표 분석에 의한 양성예측률은 78%, 음성예측률은 58%이었다. 단변량분석에서 부하-휴식기 가역성(p=0.0008)과 휴식기 T1-201 섭취(p=0.024)가 유의한 지표였으나 다변량 단계별 로짓분석에서는 부하-휴식기 가역성(p=0.0008)만 유의하였다. 결론 휴식기 운동이상 분절의 심근생존능을 조사한 이 연구에서 휴식기 T1-201/디피리다몰 부하 게이트 Tc-99m-MIBI/24시간 T1-201 SPECT에서 얻은 여러 지표로 수술 후 벽운동 호전을 예측할 수 있지만 부하-휴식기 가역성이 생존 심근을 찾는데 유용한 실제적인 예후 지표임을 알았다. 환자 단위로 수술여부를 판단할 때 생존심근을 가진 환자를 찾을 때에도 부하-휴식기 가역성이 중요한 단일지표인지 조사할 필요가 있다고 생각하였다.

  • PDF

베타 3-아드레날린 수용체의 유전자형이 고혈당증 유발에 미치는 영향 (Effects of β3-Adrenergic Receptor Polymorphism on the Hyperglycemia in Korean Subjects)

  • 오현희;최선미;양현성;김길수;윤유식
    • 한국식품영양과학회지
    • /
    • 제33권1호
    • /
    • pp.83-90
    • /
    • 2004
  • 한국인 남녀 530명을 대상으로 $\beta$3-AR의 유전자 다형성이 비만과 혈당의 증가에 미치는 영향을 연구한 결과 연구대상자들의 평균 연령은 26.55$\pm$0.31세이었고, 남성이 9.1%,여성이 90.9%이었다. $\beta$3-AR의 유전자 다형성의 분포는 WW형 0.75, WR형 0.22, RR형 0.03이었고, BMI 25 kg/$m^2$를 기준으로 하여 정상군에서 WW, WR, RR형의 빈도수는 각각0.75, 0.23, 0.02이었고, 비만군에서는 각각 0.76, 0.21, 0.03이었다. 유전자 다형성에 따라 혈당은 WR+RR형에서 WW형에 비해 유의적으로 증가하였다(p=0.001). 혈당 6.105 mmol/L을 기준으로 $\beta$3-AR의 유전자 다형성의 빈도수를 분석한 결과 WR+RR형의 빈도수가 고혈당군에서는 35.6%이었고 정상혈당군에서는 23.3%으로 변이형의 빈도가 고혈당군에서 유의적으로 높았다(p=0.011). 혈당에 따라 비만도와 체지방율은 고혈당군에서 유의적으로 증가하였다(p=0.044, 0.046). HDL 콜레스테롤은 정상혈당군에서 유의적으로 증가하였고(p=0.006), 중성지방은 고혈당군에서 유의적으로 증가하였다(p=0.000). 혈당의 증가에 가장 영향을 미치는 지표를 분석하기 위해 다단계 로지스틱 회귀분석한 결과 중성지방(p=0.000), 혈중 알부민(p=0.008), $\beta$3-AR의 유전자 다형성 (p=0.011), HDL 콜레스테롤(p=0.059) 순으로 나타났다. 특히 중성지방의 증가와 $\beta$3-AR의 유전자의 WR+RR형은 고혈당의 유발 위험율을 각각 2.165배, 2.015배 증가시키고, HDL 콜레스테롤의 증가는 위험율을 0.491배 감소시키는 결과를 보인다. 각각의 유전자다형성 군에서 혈당과 BMI, WHR, 체지방량의 상관성을 분석한 결과에서 정상군에서는 비만의 판정지표인 BMI, WHR, 체지방량과 혈당이 유의적인 정의 상관관계를 나타내었으나 변이형인 WR, RR형에서는 이들 변수간에 상관성이 보이지 않았다 결과적으로 $\beta$3-AR 유전자의 변이형에서 혈당은 증가하였고, 고혈당에서는 체지방 및 중성지방이 증가하였고, HDL 콜레스테롤은 감소하였다. 또한 고혈당과 변이형의 빈도는 유의적인 상관성을 나타내었다. 따라서 $\beta$3-AR 유전자의 변이형은 혈당과 혈중 지질의 조성변화에 영향을 미치며 이는 고혈당의 위험성을 예견할 수 있는 독립적인 지표로 나타났다.

미숙아에서 초기 스트레스성 고혈당과 예후 사이의 연관성 (Early stress hyperglycemia as independent predictor of increased mortality in preterm infants)

  • 위영선;안계현;유은경;임인숙;이규형
    • Clinical and Experimental Pediatrics
    • /
    • 제51권5호
    • /
    • pp.474-480
    • /
    • 2008
  • 목 적 : 스트레스성 고혈당은 중환자의 급성 질병기에 흔히 동반되며, 이는 여러 질환의 유병율과 사망률을 증가시킨다. 이 연구는 미숙아에서 생후 48시간 이내에 나타나는 스트레스성 고혈당이 예후에 어떤 영향을 미치는지 알아보고자 하였다. 방 법 : 재태 주령 30주 이하의 신생아 141명을 대상으로, 생후 48시간동안 혈당이 한번이라도 150 mg/dL 이상이었던 고혈당군(n=61)과 모두 150 mg/dL 미만이었던 비고혈당군(n=80)으로 분류하였다. 두 군의 분만력 상의 특징, CRIB score를 이용한 임상적 중증도, 임상 경과, 예후 및 사망률에 대해 비교하였다. 결 과 : 두 군의 재태 주령은 차이가 없었으나, 고혈당군에서 비고혈당군에 비해 출생체중은 더 작았고(P<0.001), CRIB 점수는 더 높았다(P<0.001). 임상적으로 패혈증이 의심된 경우와 파종성 혈관내응고증은 고혈당군에서 더 많았으며(P=0.046, P< 0.001), 사망률은 고혈당군이 41.0%, 비고혈당군이 11.3%로 고혈당군에서 월등히 높았다(P<0.001). 단계적 로지스틱 회귀분석 결과, 고혈당(OR 3.787; 95% CI 1.324 to 10.829)은 CRIB score (OR 1.252; 95% CI 1.047 to 1.496), 출생체중(OR 0.997; 95% CI 0.994 to 1.000)과 함께 사망률에 독립적으로 의미 있는 영향을 미쳤다. 결 론 : 30주 이하의 미숙아에서 생후 48시간 이내에 나타나는 스트레스성 고혈당은 임상 경과의 악화 및 사망률의 증가와 독립적인 연관성을 보였다.

말기암환자에서 혈청 비타민 C 농도와 연관된 인자들 (Factors Related to Serum Vitamin C Level in Terminally Ill Cancer Patients)

  • 김형준;황인철;염창환;안홍엽;최윤선;이재준;임수혁
    • Journal of Hospice and Palliative Care
    • /
    • 제17권4호
    • /
    • pp.241-247
    • /
    • 2014
  • 목적: 혈청 비타민 C 수치는 체내 항산화상태를 나타내는 지표로서, 암환자에서는 정상인에 비해 감소되어 있다. 하지만, 이 지표가 말기암환자에서 어느 정도 감소되어 있고, 그 감소에 어떤 요인들이 관련되는지에 대한 연구는 매우 드물다. 방법: 두 개 기관의 완화의료병동에 입원했던 암환자 65명을 대상으로 하였다. 환자의 나이, 성별, 암의 종류, 기능상태, 임상증상, 완치 목적의 암 치료력, 그리고 혈청 비타민 C를 포함한 혈액검사 자료를 수집하였다. 혈청 비타민 C 수치의 사분위수를 기준으로 두 군(3사분위수 이하 vs. 4 사분위수)으로 분류한 후 각 군의 차이를 비교하였고, 단계적 다중 로지스틱 회귀분석을 통해 혈청 비타민 C 수치와 관련된 인자를 확인하였다. 결과: 대상자의 혈청 비타민 C의 평균은 $0.44{\mu}g/mL$이었으며, 대상자 전체가 비타민 C 결핍에 해당되었다. 단변량 분석에서는, 비폐암 환자이거나(P=0.041) 발열이 있는 환자(P=0.034)에서 낮은 혈청 비타민 C 수치를 보였다. 폐암, 발열, 삼킴곤란, 호흡곤란, C 반응단백, 그리고 항암화학요법 등의 잠재적인 인자들을 보정한 다변량 분석에서, 낮은 혈청 비타민 C 수치를 나타낼 가능성은 항암화학요법을 받은 군에서 그렇지 않은 군에 비해 3.7배 높았고(P=0.046), 발열이 있는 군에서 그렇지 않은 군에 비해 7.22배 높았다(P=0.020). 결론: 말기암환자에서 비타민 C 부족은 매우 심각하였고, 항암화학요법 치료력과 발열이 관련 있었다.