• 제목/요약/키워드: decision tree and system analysis

검색결과 215건 처리시간 0.034초

비신호 횡단보도에서의 어린이 횡단행태 분석 연구 (A Study on Analyzing Children's Crossing Behaviors on Non-signalized Crosswalk)

  • 이덕환;이윤석;김원호;이백진
    • 대한교통학회지
    • /
    • 제31권3호
    • /
    • pp.19-32
    • /
    • 2013
  • 본 연구의 목적은 그간 교통안전 정책에서 간과되어온 어린이 보행자 횡단행태에 대한 분석을 통해 향후 어린이 교통안전 정책을 개선하기 위한 기초자료를 제공함에 있다. 어린이 횡단행태 분석은 물리적 형태와 사고발생빈도가 상이한 어린이 보호구역에서의 횡단행태 및 패턴의 차이를 비교하는 부분에 초점을 두고 이루어졌다. 자료는 경기도 7개 초등학교 비신호 횡단보도를 대상으로 현장관찰과 비디오 녹화를 통해 수집하였으며, 통계분석, CHAID 알고리즘 분석, 통행 패턴비교를 실시하였다. 분석결과, 사고발생 빈도와 유의한 관계가 있는 횡단특성은 대기유무, 주의유무, 특이행동 유무 순으로 나타났다. 구체적으로 사고발생빈도가 낮은 지점에서 대기후 횡단하는 비율이 69.1%인 반면, 사고다발지점에서 대기를 하지 않고 횡단하는 경우가 83.6%로 상이함을 확인하였다. 횡단 전 대기 및 주의 정도는 횡단 시작부 보도폭이 넓고 학교 출구에서 횡단보도까지 거리가 일정규모 이상일 때 높게 나타났다. 한편, 횡단패턴과 사고발생빈도의 관계성은 뚜렷하게 나타나지 않았다. 향후 어린이 보호구역의 안전성 개선을 위해서는 대기 후 통행이 이루어질 수 있도록 각 보호구역에서의 어린이 횡단특성에 기반한 차별화된 맞춤형 접근이 긴요할 것으로 판단된다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

명상프로그램(α version) 시행 전후의 사상체질별 심리척도 및 HRV 변화 연구 (Research on Change of Heart Rate Variability and Psychological Scale by Sasang Constitution according to before and after of the Meditation Programs (α version))

  • 김근우;배효상;손한범;이필원;김병수;박성식
    • 동의신경정신과학회지
    • /
    • 제25권1호
    • /
    • pp.1-12
    • /
    • 2014
  • Objectives: In this study, the meditation programs (${\alpha}$ version), which are properly coordinated according to the motion, breathing, and relaxation, are evaluated and researched upon to have positive effects on stress and in the area of psychology. Methods: Approved by the Clinical Trials Deliberation Committee in Oriental Medicine, Dongguk University, Ilsan Hospital, this study collected data according to the applicant's consents, demographic information and anthropometry for the Sasang Constitutional diagnosis. Sasang Constitutional diagnosis measured the beta tools by Institute of Oriental Medicine and a decision tree was made for the Sasang Constitutional questionnaires. The STAI, STAXI, BDI, and HRV were measured before and after the meditation in order to compare the effects of meditation according to Sasang Constitution. The HRV was used as a ProComP KM Tech (co). Results: 1) The positive changes available in the Time-domain analysis of heart rate variability assessment showed that the peace of mind is increased. By analyzing the Sasang constitution, So-eum In's peace of mind included a physical stability of the autonomic nervous system. 2) According to the psychological scale evaluation, each depression scale, trait anger, anger-in, state anxiety and trait anxiety index proved significantly positive effects. By analyzing the Sasang constitution, Eun-In which involved So-eum In and Tae-eum In, had positive effects. 3) The psychological scale changed the group of diagnosed depression or anxiety, it did not mean that the psychological scale changes in the depression group, but the index of the anxiety group had been significantly reduced. This program had clinical effects for anxious patients and Eum-In which involved Tae-eum In and So-eum In according to the analysis of Sasang constitution. 4) Correlations between the gender of each psychological scale showed that women have overall low correlations, but, there were no significant changes. Conclusions: The meditation program developed by adequately mixing Action, relaxation and breathing shows that it is effective for overall Eum-in physical and mental relaxation and concentration. In the future, It will have to be developed Meditation program to show the same effect for all people.

Support Vector Machine 기법을 이용한 고객의 구매의도 예측 (Forecasting of Customer's Purchasing Intention Using Support Vector Machine)

  • 김진화;남기찬;이상종
    • 경영정보학연구
    • /
    • 제10권2호
    • /
    • pp.137-158
    • /
    • 2008
  • 기업 경쟁력 강화의 중요한 이슈인 대량 개별화(mass-customization)의 실행을 위하여 통합 고객관계 관리 프로세스로서의 CRM(customer relationship management)에 대한 관심과 활용에 대한 필요성은 점점 더 높아지고 있다. 특히, 기존 고객들의 구매 정보를 기반으로 고객의 구매 패턴을 파악하고 의도를 예측하는 것은 오늘날 실질적인 판매 전략을 수립하는 마케팅 분야에서 상당히 큰 비중을 차지하고 있다. 고객의 구매의도 예측에는 대량의 데이터로부터 과거에 인지하지 못했던 의미 있고, 근거 있는 정보를 추출하는 데이터마이닝(datamining)이 주로 사용되고 있다. 기존의 구매의도 예측에 사용된 데이터마이닝 기법들은 주로 신경망(neural networks)과 로지스틱 회귀분석(logistic regression analysis)이었는데, 예측 정확성 및 모형 구축의 어려움으로 인한 다양한 문제점들이 제기되고 있는 실정이다. 따라서, 본 논문에서는 기존의 기법들이 가지고 있는 단점들을 개선하기 위하여 신경망과 로지스틱 회귀분석 외에 연관규칙(association rule), 연관성 매트릭스(association matrix), 의사결정 나무(decision tree), 베이지안 망(bayesian network), SVM(support vector machine) 기법들을 추가로 제안하였다. 본 연구의 목적은 고객의 특정 상품에 대한 구매의도 예측을 위하여 새로운 알고리즘을 제시하기보다는 기존의 다양한 데이터마이닝 기법들을 적용시켜 봄으로써, 가장 우수한 예측성과를 나타내는 기법을 발견하는 것이다. 연구에 사용된 자료는 기존의 연구에서는 적용되지 않았던 편의점의 영수증 데이터이다. 예측 목표상품은 카테고리화 된 '우유'와 '냉동식품'이며, 제안된 기법들의 신뢰성을 위하여 전체 데이터를 10개의 training과 test 셋으로 중복되지 않게 구분함과 동시에 10번의 교차 검증(cross validation)을 실시하였다. 실험 결과 SVM이 영수증 데이터를 이용한 고객의 특정 상품에 대한 구매의도 예측에서 가장 우수한 성과를 나타내는 것을 확인하였다.

지역사회 건강행태, 고혈압, 당뇨병 유병률 변화와 변이 요인 (Changes and determinants affecting on geographic variations in health behavior, prevalence of hypertension and diabetes in Korean)

  • 김유미;강성홍
    • 디지털융복합연구
    • /
    • 제13권11호
    • /
    • pp.241-254
    • /
    • 2015
  • 본 연구의 목적은 지역의 건강행태, 고혈압, 당뇨병 유병률의 변화와 변화율의 지역 간 변이에 영향을 미치는 요인을 분석하는 것이다. 이를 위해 2008년과 2013년 지역사회건강조사 결과를 이용하였으며, 5년간 지역 간 건강행태 변화와 고혈압 및 당뇨병 유병률 변화의 지역 간 변이 정도, 변이의 요인을 확인하기 위해 지리정보시스템, 의사결정나무 등 융복합적 분석을 하였다. 지난 5년간 현재 흡연율과 월간 음주율의 증가는 남서부 지역에서 높았고, 걷기 실천율의 증가는 서부 지역에서 다소 높게 나타났다. 고혈압은 서부와 남부, 당뇨병은 동부와 북부 지역에서 증가율이 높았다. 고혈압 및 당뇨병 유병률 변화의 지역 간 변이 요인은 고혈압 및 당뇨병 이외에 음주, 신체활동, 비만, 관절염, 우울증상 및 스트레스로 나타났다. 우울증상이 증가하는 지역에서 고혈압과 당뇨병의 유병률의 증가는 중요한 영향을 미치는 것으로 나타났다. 따라서 고혈압과 당뇨병의 유병률을 감소시키기 위해서는 지역특성에 기반한 주민 정신건강 관리 프로그램을 개발할 필요가 있다.

돌발홍수 예보를 위한 빅데이터 분석방법 (The big data method for flash flood warning)

  • 박다인;윤상후
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.245-250
    • /
    • 2017
  • 돌발홍수는 강우유출수가 하천으로 모여드는 유역이 좁은 지역에 집중호우로 인해 유입되는 물의 양이 급증하여 나타난다. 돌발홍수는 유속이 빠르고 홍수를 대비할 수 있는 시간이 부족하므로 인명과 재산상의 피해를 발생시킨다. 본 연구에서는 돌발홍수를 예보를 위한 빅데이터 분석방법을 수행하였다. 연구 자료는 2009년에서 2012년까지 국민안전처 국가재난정보센터에 보고된 38건의 홍수 피해 자료와 지표수문모형(TOPLATS)에 의해 생성된 수문기상정보인 강우량, 토양수분 상태, 지표유출량이다. 돌발홍수 발생 선행 6시간의 강우량, 토양수분 상태, 지표유출량 데이터를 요인분석을 통해 토양수분 상태, 장기요인에 의한 강우량과 지표유출량, 단기요인에 의한 강우량과 지표유출량으로 축소하였다. 빅데이터 분석 방법으로는 유형분석인 의사결정나무, 랜덤포레스트, 나이브베이즈, 서포트벡터머신, 로지스틱 회귀모형을 사용하였다. 돌발홍수 사고발생 자료가 38건으로 한정되어 있기 때문에 예측성능 정확도 판단이 중요하다. 예측성능 정확도 평가방법으로 kappa계수, TP Rate, FP Rate, F-Measure를 이용하였다. 이 외에 돌발홍수 발생 선행 시점별 재현성 평가와 과거 4년간 돌발홍수 경보 횟수를 통해 최적 유형분석 방법을 제시하였다. 연구결과 로지스틱회귀모형과 랜덤포레스트가 돌발홍수 예보를 위한 예측 성능이 가장 좋았다. 사고발생 자료가 2009년부터 2012년까지 38건으로 한정되어 있어 분석을 위한 훈련자료와 검증자료 구축에 한계가 있었다. 장기간의 자료가 수집된다면 더욱 정확한 빅데이터 분석을 수행할 수 있다.

머신러닝 기반 대학생 중도 탈락 예측 모델의 성능 비교 (Performance Comparison of Machine Learning based Prediction Models for University Students Dropout)

  • 정석봉;김두연
    • 한국시뮬레이션학회논문지
    • /
    • 제32권4호
    • /
    • pp.19-26
    • /
    • 2023
  • 전국 대학생의 중도 탈락 비율의 증가는 학생 개인 뿐만 아니라 대학과 사회에 심각한 부정적 영향을 끼친다. 본 연구에서는 중도 탈락이 예상되는 학생을 사전에 식별하기 위하여, 각 대학의 학사관리 시스템에서 손쉽게 얻을 수 있는 학적 데이터를 기반으로 머신러닝 분야의 결정트리, 랜덤 포레스트, 로지스틱 회귀 및 딥러닝 기반의 중도 탈락 예측 모델을 구축하고, 그 성능을 비교·분석하였다. 분석 결과 로지스틱 회귀 기반 예측 모델의 재현율이 가장 높았으나 f-1 및 auc 값이 낮은 한계를 보였고, 랜덤 포레스트 기반의 예측 모델의 경우 재현율을 제외한 다른 모든 지표에서 가장 우수한 성능을 보였다. 또한 예측 기간에 따른 예측 모델의 성능을 확인하기 위하여 예측 기간을 단기(1개 학기 이내), 중기(2개 학기 이내) 및 장기(3개 학기 이내)로 나누어 분석해 본 결과, 장기 예측 시 가장 높은 예측력을 보였다. 본 연구를 통해 각 대학은 중도 탈락이 예상되는 학생들을 조기에 식별하고, 이들에 대한 집중 관리를 통해 중도 탈락 비율을 줄이며 나아가 대학 재정 안정화에 기여할 수 있을 것으로 기대된다.

부도예측 개선을 위한 하이브리드 언더샘플링 접근법 (A Hybrid Under-sampling Approach for Better Bankruptcy Prediction)

  • 김태훈;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.173-190
    • /
    • 2015
  • 부도는 막대한 사회적, 경제적 손실을 야기할 수 있으므로, 미리 부도여부를 정확하게 예측하여 선제 대응하는 것은 경영분야에서 대단히 중요한 의사결정문제 중 하나이다. 이에 지능정보시스템 분야에서도 그간 기업의 재무 데이터에 기반해 부도예측을 개선하기 위한 노력을 기울여왔는데, 안타깝게도 기존의 연구들은 대부분 분류모형의 성능 개선을 통해 예측 정확도를 개선하는 것에만 주로 초점을 맞추어 다른 요소들을 충분히 고려하지 못했다는 한계가 있다. 이러한 배경에서 본 연구는 부도예측 모형의 정확도를 개선하기 위한 방편으로 새로운 데이터 전처리 방법, 그 중에서도 효과적인 표본추출 방법을 제안하고자 한다. 일반적으로 부도예측을 위해 사용되는 데이터들은 극심한 데이터 불균형 문제에 노출되어 있는데, 본 연구에서는 k-reverse nearest neighbor(k-RNN)와 one-class support vector machine(OCSVM) 방법을 결합한 하이브리드 언더샘플링(hybrid under-sampling) 접근법을 통해 이같은 데이터 불균형 문제를 해결하고자 하였다. 본 연구에서 제안한 접근법에서 k-RNN은 이상치를 효과적으로 제거할 수 있으며, OCSVM은 다수를 구성하는 등급의 데이터로부터 정보량이 풍부한 표본만 효과적으로 선택할 수 있는 수단으로 활용될 수 있다. 제안된 기법의 성능을 검증하기 위해, 본 연구에서는 국내 한 은행의 비외감기업 부도예측모형 구축에 제안 기법을 적용해 본 뒤, 일반적으로 많이 사용되는 랜덤샘플링(random sampling)과 제안 기법의 성능을 비교해 보았다. 그 결과, 로지스틱 회귀분석, 판별분석, 의사결정나무, SVM 등 대다수의 분류모형에 있어 분류 정확도가 개선됨을 확인할 수 있었으며, 모든 분류모형에 있어 부정 오류, 즉 부실기업을 정상으로 예측하는 오류율이 크게 감소함을 확인할 수 있었다.

관광 e-마켓플레이스의 성공전략에 관한 연구 (A Study on Strategy for success of tourism e-marketplace)

  • 홍지환;김근형
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.333-336
    • /
    • 2006
  • e-마켓플레이스는 기업과 기업간의 비지니스 거래를 지원하기 위한 B2B e-Business 시스템의 일종이다. e-마켓플레이스가 활성화된다면 기업간의 거래비용을 절감할 수 있을 뿐만 아니라 판매기회 확대를 도모할 수 있어서 관련 산업의 발전을 기대할 수 있다. 이러한 관점에서 관광산업에서도 e-마켓플레이스의 도입과 활성화가 필요하다. 관광 e-마켓플레이스의 참여자는 여행사, 숙박업체, 운송업체 등 관광관련 기업들이 될 수 있지만 관광객들도 관광 e-마켓플레이스에서 다양한 관광상품을 구입하거나 관광콘텐츠를 검색하기를 원할 것이다. 따라서, 관광 e-마켓플레이스는 기존의 B2B e-Business시스템 특성뿐만 아니라 B2C e-Business 시스템 특성을 동시에 갖고 있어야 한다. 본 논문에서는 관광 e-마켓플레이스의 성공에 영향을 미칠 수 있는 요인들을 파악해보고자 한다. 기존의 B2B e-마켓플레이스의 성공요인과 B2C 관광 웹사이트의 성공 요인들을 분석하여 관광 e-마켓플레이스의 성공영향요인을 설정하고 관광업체 들을 대상으로 설문조사를 실시할 것이다. 수집된 데이터를 로지스틱 회귀분석과 의사 결정나무 분석을 통하여 관광 e-마켓플레이스의 성공을 위한 유의한 시사점을 도출할 것이다.

  • PDF

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.