• 제목/요약/키워드: 분류 회귀 나무

검색결과 72건 처리시간 0.035초

보행자통행량이 상가권리금에 미치는 영향의 평가 (Assessing the Impact of Pedestrian Traffic Volumes on Locational Goodwill)

  • 정승영
    • 지적과 국토정보
    • /
    • 제45권1호
    • /
    • pp.225-240
    • /
    • 2015
  • 통행하는 보행자의 특징이 상가권리금에 미치는 효과를 실증적으로 모형을 구축하고 시험 하였다. 이 연구를 위한 이론적 근거는 중심지 이론, 입찰지대, 집적이론, 외부수요 이론이다. 자료에는 서울시 100개 $3.3m^2$당 상권의 상가권리금, $3.3m^2$당 상가보증금, $3.3m^2$당 상가월세 그리고 보행자의 특성과 관련된 정보가 포함되어 있다. 실증분석은 서울시 상가 1,307개를 표본을 사용하여 시험하였다. 그리고 자료집합은 회귀나무 및 회귀방법을 이용하여 분석이 이루어졌다. 이 분석한 결과로서, 각각의 상권에서 상가권리금에 영향을 주는 변수는 평일 오후 2시 보행자의 통행량, 평일 오후 4시 보행자의 통행량, 평일 오후 8시 보행자의 통행량이다. 요약하면, 상권의 경제적 기반을 뿐만 아니라 통행 보행자의 특징은 상가권리금을 결정하기 위해 고려되어야한다.

데이터 마이닝의 지도학습 기법 성능향상을 위한 불일치 패턴 모델 (Inconsistent Pattern Model for Improving the Performance of Supervised Learning in Data Mining)

  • 허준;김종우
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2007년도 추계학술대회 및 정기총회
    • /
    • pp.288-305
    • /
    • 2007
  • 본 논문은 데이터 마이닝의 기법 중 가장 잘 알려진 지도학습 기법의 성능 향상을 위한 새로운 Hybrid 및 Combined 기법인 불일치 패턴 모델(오차 패턴 모델)에 대한 연구 논문이다. 불일치 패턴 모델이란 2개 이상의 기법 중 향후 더 레코드별로 더 잘 맞출 수 있는 기법을 메타 분류하는 불일치 패턴 모델을 개발하여, 최종적으로는 기존의 기법보다 더 좋은 분류 정확도 및 예측 향상율을 기대하기 위한 기법을 의미한다. 본 논문에서는 의사 결정나무 추론 기법인 C5.0과 C&RT 그리고 신경망 분석, 그리고 로지스틱 회귀분석과 같은 대표적인 데이터 마이닝의 지도학습 기법을 이용하여 불일치 패턴 모델을 생성하여 보고, 이들이 기존 단일 기법과 기존의 Combined 모델인 Bagging, Boosting 그리고 Stacking 기법보다 성능이 우수함을 23개의 실제 데이터 및 공신력 있는 공개 데이터를 이용하여 증명하여 보였다. 또한 데이터의 특성에 따라서 불일치 패턴 모델의 성능의 변화 및 더 우수해 지는지를 알아보기 위한 연구포 같이 수행을 하여 본 모델의 활용성을 높이고자 하였다.

  • PDF

하이브리드 의사결정나무와 인공신경망 모델을 이용한 방문학습지사의 고객세분화 (Customer Segmentation of a Home Study Company using a Hybrid Decision Tree and Artificial Neural Network Model)

  • 서광규;안범준
    • 한국산학기술학회논문지
    • /
    • 제7권3호
    • /
    • pp.518-523
    • /
    • 2006
  • 본 논문은 하이브리드 의사결정 나무(CART)와 인공신경망 모델을 개발하여 고객의 이탈에 대한 예측을 높이기 위하여 가정방문 학습지 고객의 패턴을 분류하고, 분석하는 새로운 방법에 대하여 연구하였다. 의사 결정나무(CART5)를 형성하여 선택된 결정변수들은 인공신경망의 입력벡터 값으로 선택되는 새로운 방법을 제시하였다. 고객 관리측면에서 본 논문은 가정방문 학습지 회사의 기존고객을 분류하여 패턴을 분석함으로써 우수한 고객의 지속적인 관리와 이탈 가능성이 많은 고객을 차별 관리하여 기업이익을 증대시킬 수 있을 것이다. 새롭게 제안한 하이브리드 모델은 기존의 의사결정트리모델(CART), 회귀모형, 인공신경망 모델과 비교한 결과 그 예측 정확성이 높음을 확인할 수 있었다.

  • PDF

건설현장의 아차사고 연결가능성에 대한 패턴분석 (A Pattern Analysis on the Possibility of Near Miss Connection in Construction Sites)

  • 김상현;신연철;문유미
    • 한국재난정보학회 논문집
    • /
    • 제19권1호
    • /
    • pp.216-230
    • /
    • 2023
  • 연구목적: 아차사고의 분석을 통하여 재해를 예측하여 사고를 예방하는 목적이 있다. 연구방법: 본 연구에 서는 건설 현장의 아차사고 문헌조사 및 데이터를 수집하고, 설문조사를 실시하여 아차사고 연결 가능성 분류를 위해 로지스틱 회귀분석 및 의사결정나무 분석을 이용하였다. 연구결과: 아차사고 types이 정신적, 신체적, 안전습관 행동에 미치는 영향을 분석한 결과, 신체에 영향력이 높은 요인은 아차사고 관리의 필요성, 직종은 전기·정보통신, 건강 상태 순으로, 정신적 요인에서 공사 규모가 영향력이 높았으며, 경험 공종, 중상자 수, 직종 순으로 습관 행동 요인에 영향력이 높은 요인은 착각, 부적절한 작업지시, 신체 부위 순으로 분석되었다. 의사결정나무 분석을 통해 아차사고가 놀랄 정도의 사고로 연결가능성에 영향을 미치는 요인과 패턴을 확인하였다. 결론: 건설현장관계자는 아차사고 관찰을 고려하여 정신적. 신체적 측면의 아차사고와의 연관성에 대한 구체적 관리가 실행되어야 하며, 부적절한 작업지시가 아차사고로 연결되지 않도록 인원 배치, 작업계획, 작업절차 및 방법, 피드백을 통해 중대재해가 저감하는 작업환경을 기대한다.

보행자-차량 충돌사고 특성분석 방법론 비교 연구 (Comparison of Methodologies for Characterizing Pedestrian-Vehicle Collisions)

  • 최새로나;정은비;오철
    • 대한교통학회지
    • /
    • 제31권6호
    • /
    • pp.53-66
    • /
    • 2013
  • 최근 운전자의 보행자-차량 충돌사고 감소를 목적으로 한 다양한 연구가 수행되고 있으며, 본 연구에서는 보행자-차량 사고 발생 특성 및 심각도 영향요인 분석을 위하여 다양한 분석방법론을 활용한 보행자 교통사고 분석을 수행하였다. 통계모형과 휴리스틱모형 적용시 각 기법에 따른 결과를 도출함으로써 보행자 사고분석시 분석목적에 적합한 방법론을 제시하는 것을 목적으로 하였다. 이를 위하여 최근 3년간 발생한 경기도 교통사고자료(2008-2010년)를 활용하여 보행자 교통사고의 발생특성을 분석하였다. 또한, 통계모형인 이항 로지스틱 회귀분석, 순서형 프로빗 모형을 이용하여 보행자 교통사고 심각도 증가에 통계적으로 유의한 영향을 미치는 변수를 도출하였으며, 휴리스틱모형인 서포트 벡터 머신, 의사결정나무를 적용하여 교통사고 심각도 분류를 위한 모형을 개발하고 그 결과를 비교분석 하였다. 본 연구의 분석결과는 보행자 교통안전분석의 기초자료로 활용할 수 있으며 향후 국내 보행자-차량 충돌사고 분석시 유용하게 활용될 수 있을 것으로 기대된다.

초음파를 이용한 한우 육량등급의 조기예측 (Early Prediction of Carcass Yield Grade by Ultrasound in Hanwoo)

  • 이용준;석홍기;김석중;송영한
    • Journal of Animal Science and Technology
    • /
    • 제45권2호
    • /
    • pp.327-334
    • /
    • 2003
  • 본 시험은 초음파를 이용하여 한우의 도체형질을 조기에 예측하기 위하여 거세한우 66두를 대상으로 18, 21 및 24개월령에 도체형질을 측정하고, 중회귀 분석 및 의사결정나무 분석을 이용하여 24개월령 출하시 도체형질을 예측하였다. 그 결과를 요약하면 다음과 같다. 도체육량등급에 따라 군을 분류하고 성장에 따른 도체형질의 변화를 관찰한 결과, 등지방 두께는 전기간에 걸쳐 각 도체육량등급간에 유의적(p<0.05)인 차이를 보이며 A, B, C등급 순으로 얇게 나타났다. 중회귀 분석에 의한 도체육량등급의 예측율은 18, 21 및 24개월령에서 각각 78.8%, 86.4% 및 90.9%를 나타냈으며, 의사결정나무 분석에 의한 도체육량등급 예측율은 각 개월령에 따라 78.8%, 89.4% 및 89.4%를 나타냈다.

A Study of Combined Splitting Rules in Regression Trees

  • 이영섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권1호
    • /
    • pp.97-104
    • /
    • 2002
  • Regression trees, a technique in data mining, are constructed by splitting function-a independent variable and its threshold. Lee (2002) considered one-sided purity (OSP) and one-sided extreme (OSE) splitting criteria for finding a interesting node as early as possible. But these methods cannot be crossed each other in the same tree. They are just concentrated on OSP or OSE separately in advance. In this paper, a new splitting method, which is the combination and extension of OSP and OSE, is proposed. By these combined criteria, we can select the nodes by considering both pure and extreme in the same tree. These criteria are not the generalized one of the previous criteria but another option depending on the circumstance.

  • PDF

인공지능을 이용한 급성 뇌졸중 환자의 재원일수 예측모형 개발 (Development of Predictive Model for Length of Stay(LOS) in Acute Stroke Patients using Artificial Intelligence)

  • 최병관;함승우;김촉환;서정숙;박명화;강성홍
    • 디지털융복합연구
    • /
    • 제16권1호
    • /
    • pp.231-242
    • /
    • 2018
  • 병원 재원일수의 효율적 관리는 병원의 수익과 환자의 진료비 절감을 위해 매우 중요한 요소이다. 이러한 재원일수의 효율적 관리를 위해서는 병원들이 재원일수에 대해서 벤치마킹을 할 수 있도록 지원이 필요하고 재원일수 절감의 구체적인 방향을 제시해 줄 수 있는 재원일수 예측모형의 개발이 필요하다. 본 연구에서는 2013년과 2014년도 퇴원손상환자자료 중 급성뇌졸중 환자를 추출하여 분석용 자료를 만들고 인공지능을 이용하여 급성뇌졸중 환자의 재원일수 예측모형을 개발하였다. 분석용 자료는 훈련용 60%, 평가용 40%로 분류하였다. 모형개발은 전통적 통계기법인 다중회귀분석기법과 인공지능기법인 대화식 의사결정나무기법, 신경망 기법, 그리고 이들을 모두 통합한 앙상블기법을 이용하였다. 모형평가는 Root ASE(Absolute error) 지표를 이용하였는데, 다중회귀분석은 23.7, 대화식결정나무 23.7, 신경망 분석은 22.7, 앙상블은 22.7로 나타났고 이를 통하여 재원일수 예측모형 개발에 인공지능기법의 유용성이 입증되었다. 앞으로 재원일수 예측모형개발에 인공지능 기법을 보다 효율적으로 활용할 수 있는 방안에 대해서 계속적인 연구가 이루어 질 필요가 있다.

청년 1인가구 임차인의 주거만족도에 관한 연구: 부산·경남지역을 중심으로 (A Study on the Residential Satisfaction of Single Youth Households Tenants)

  • 권정표;강정규
    • 토지주택연구
    • /
    • 제13권2호
    • /
    • pp.65-79
    • /
    • 2022
  • 본 연구에서는 부산·경남지역 청년 1인가구 임차인의 주거만족도에 영향을 미치는 주요 특성 및 청년층 주거관에 대한 영향력을 분석하고 세부적으로 분류하여 향후 주거 문제 및 방향에 대한 시사점을 제시하고자 한다. 이를 위해 선행연구를 토대로 한 이론을 바탕으로 청년 1인가구 임차인의 주거 특성 만족도에 대한 주요 변수 및 향후 1인가구 지속 의향, 혼인 의향 및 가구원 증가에 대한 의향을 질문하기 위한 청년층 주거관에 대한 변수도 포함하여 연구하였다. 실증분석은 설문조사의 결과를 바탕으로 SPSS Statistics 25.0 통계 프로그램을 사용하여 다중회귀분석 및 의사결정나무모형 분석을 실시하였다. 실증분석 결과 첫째, 주거 임차특성 만족도 및 1인가구 지속 의향은 자연적 특성, 주거 특성, 물리적 특성, 1인가구 지속 의향 순으로 주거만족도에 정(+)의 영향을 미치는 것으로 나타났다. 둘째, 주거 임차특성 만족도 및 향후 혼인 의향은 자연적 특성, 주거 특성, 물리적 특성 순으로 주거만족도에 정(+)의 영향을 미치는 것으로 나타났다. 셋째, 주거 임차특성 만족도 및 향후 가구원 증가 의향은 자연적 특성, 주거 특성, 물리적 특성 만족도 순으로 주거만족도에 정(+)의 영향을 미치는 것으로 나타났다. 넷째, 주거만족도를 종속변수로 한 의사결정나무모형 분석 결과, 자연적 특성이 3.4 초과이며, 전세일 때 주거만족도가 가장 높게 나타났다. 본 연구의 시사점은 다음과 같다. 첫째, 부산·경남지역 청년 1인가구의 주거환경 개선 정책이 필요하다. 둘째, 부산·경남지역 청년 1인가구 임차인을 위한 맞춤형 주택 공급은 청년층의 주거만족도를 향상시키는데 도움이 될 것이다. 셋째, 부산·경남지역 청년 1인가구 임차인의 라이프스타일에 적합한 공간에 일정비율 주거공급이 이루어져야 한다.

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구: 재무적 데이터를 중심으로 (Study on Predicting the Designation of Administrative Issue in the KOSDAQ Market Based on Machine Learning Based on Financial Data)

  • 윤양현;김태경;김수영
    • 벤처창업연구
    • /
    • 제17권1호
    • /
    • pp.229-249
    • /
    • 2022
  • 본 연구는 다양한 머신러닝 기법을 통해 코스닥(KOSDAQ) 시장 내 관리종목 지정을 예측할 수 있는 모델에 대해 연구하였다. 증권시장 내 기업이 관리종목으로 지정이 되면 시장에서는 이를 부정적인 정보로 인식하여 해당 기업과 투자자에게 손실을 가져오게 된다. 본 연구를 통해 기업의 재무적 데이터를 바탕으로 조기에 관리종목 지정을 예측하고, 투자자들의 포트폴리오 리스크 관리에 도움을 주기 위한 머신러닝 접근이 타당한지 살펴본다. 본 연구를 위해 활용한 독립변수는 수익성, 안정성, 활동성, 성장성을 나타내는 21개의 재무비율을 활용하였으며, K-IFRS가 적용된 2011년부터 2020년까지 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 추출하였다. 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, LightGBM을 활용하여 관리종목 지정 예측 연구를 수행하였다. 연구결과는 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 의사결정나무 기반 학습 모형의 변수 중요도의 상위 3개 변수를 확인한 결과 각 모형에서 공통적으로 나온 재무변수는 ROE(당기순이익), 자본금회전율(Capital stock turnover ratio)로 해당 재무변수가 관리종목 지정에 있어 상대적으로 중요한 변수임을 확인하였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높은 것을 확인하였다. 기존 선행연구가 K-IFRS에 대한 고려를 하지 않았고, 다소 제한된 머신러닝에 의존하였다. 따라서 본 연구의 필요성과 함께 현실적 요구를 충족시키는 결과를 제시하였음을 알 수 있으며, 시장참여자들에게 있어 관리종목 지정에 대한 사전 예측을 확인할 수 있도록 기여했다고 볼 수 있다.