• 제목/요약/키워드: CART 분석

검색결과 153건 처리시간 0.034초

CART분석을 이용한 신도시지역의 지하철 역세권 설정에 관한 연구 (Development of Selection Model of Subway Station Influence Area (SIA) in New town using Categorical and Regression Tree (CART))

  • 김태호;이용택;황의표;원제무
    • 한국철도학회논문집
    • /
    • 제11권3호
    • /
    • pp.216-224
    • /
    • 2008
  • 본 연구는 합리적인 역세권 범위를 설정하고 이에 미치는 요인을 규명하기 위해 CART(Categorical Analysis Regression Tree) 분석을 이용하여 4대 신도시(분당, 평촌, 일산, 산본)에 대해 SIA 모형을 개발하였으며, 그 결과를 요약하면 다음과 같다. 첫째, 지하철 역세권에 영향을 마치는 변수를 중심으로 상관관계를 분석한 결과, 역세권 지가에 영향을 미치는 주요요인이 도보거리로 나타났으며, 두 관계를 이용하여 SIA 모형을 개발하였다. 둘째, SIA모형식(선형식, 다항식)을 비교분석한 결과, 신도시별 역세권의 범위는 철도역사로부터 도보거리기준으로 분당 신도시가 856m, 일산 산본 신도시가 508m, 평촌신도시가 495m로 각각 다르게 나타났다. 셋째, SIA 모형간 계수를 비교분석한 결과, 철도역사로부터 도보거리가 가까울수록 지가에 대한 영향이 커지는 것으로 나타났다. 또한 신도시별로는, 분당 평촌신도시가 일산 산본 선도시 보다 도보거리에 대한 지가의 영향이 크고 지가 또한 높은 것으로 나타났다. 따라서 현행 도시철도법상 역세권 범위인 반경 500m 이내로 획일적으로 정한 역세권 범위기준은 불합리하며 신도시지역의 토지이용 및 보행접근성(도보거리) 특성을 반영하여 재설정하는 것이 바람직하다고 판단된다.

CART 분석을 이용한 지하철 마모 영향인자 분석 (Analysis of Factors Influencing upon the Metro Wear Using the Classification and Regression Trees)

  • 정민철;이원우;김정훈;공정식
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2011년도 정기 학술발표대회
    • /
    • pp.38-38
    • /
    • 2011
  • 일반적으로 레일마모는 열차의 주행안전 및 승차감에 미치는 영향이 크고, 소음 진동의 주요원인으로 작용한다. 또한 레일마모가 발생할 경우 궤도구조의 파괴를 촉진시킴으로써 차량 및 궤도유지보수비를 크게 증가시킨다. 따라서 구간 특성 및 환경 영향 인자 등 현장에서 발생하는 마모 원인을 체계적으로 분석함으로써 마모를 저감할 수 있도록 차량운행 조건과 선로선형 및 궤도구조를 설계하는 것은 중요한 과제이다. CART(Classification And Regression Tree; 분류와 회귀나무) 분석은 패키지화된 좋은 분류 및 예측도구 기법으로 나무의 상위 분리수준에서 일반적으로 나타나는 가장 중요한 입력변수들을 사용하는 등의 입력변수를 선정하는 경우 매우 유용하다. 본 연구에서는 다변수 구간특성 및 환경인자를 고려한 검측 자료 상관관계 분석을 위한 회귀 나무기반 모델(TBM: Tree Based Model) 분석 수행을 위해 지하철 2호선 마모 데이터와 마모 데이터에 영향을 미치는 각종 다변수 구간특성 및 환경인자를 사용하였다. 2호선 지하철의 구간특성 인자 및 환경인자는 레일의 종류, 레일의 위치, 도상, 곡률반경, 캔트 슬랙 및 운행 일수 등으로 구분하였다. 레일의 종류는 ks-50kg과 ks-60kg 두 종류의 레일이 있으며, 레일의 위치는 지상과 지하로 크게 구분할 수 있다. 도상은 콘크리트 도상, 자갈 도상과 일부 구간의 방진상 콘크리트 도상으로 구분할 수 있으며, 곡률반경은 직선구간과 완화곡선 구간 및 최소 250m부터 627m까지 분포된 원 곡선 구간으로 구분할 수 있다. 캔트 간격은 최소 96cm 부터 120cm 간격으로 구분하며, 슬랙은 5~9cm에 분포하고, 운행 기간은 해당 기간 동안 유지보수 이력이 없는 구간을 선정하여 2005년부터 2006년까지 4번에 걸쳐 검측된 지하철 2호선 내선 마모데이터를 사용하였다. 총 X1부터 X7까지 총 7개의 구간특성 또는 환경특성을 영향인자로 선정하였으며, 이러한 영향인자에 의해 결정되는 종속 인자로 Y1인 직마모와 Y2인 측마모를 선정하여 이 중 실질적으로 지하철 궤도의 성능 평가에 주요 판단인자로 사용되는 측마모와 구간특성 및 환경영향인자와의 상관관계 분석을 수행하였다. 해당 마모 데이터가 검측되는 기간 동안 유지보수 이력이 없는 12272 point의 데이터를 검출하였고 CART 프로그램을 이용하여 데이터를 분석하였으며, CART 프로그램의 해석을 위해 종속변수인 직마모량은 각 검측 지점의 마모량에 해당하는 등급으로 변환하여 분석을 수행하였다. 레일의 마모에 영향을 미치는 구간특성 및 환경인자와 종속 변수로 사용된 레일의 마모량 사이의 CART를 이용한 상관관계 분석은 실제 구조물에서 영향인자간의 상관 관계와 유사하며, 추후 연구에서는 이를 바탕으로 하여 정량화된 검측 데이터를 종속변수로 하여 구간특성 또는 환경인자 등 외부 영향인자를 고려한 궤도 검측데이터와의 상관관계 분석을 수행할 계획이다.

  • PDF

무선네트워크에서의 효율적 트래픽 분류 기법 연구 (Efficient Traffic Classifier in Wireless Network)

  • 이성진;송종우;안수한;원유집;장재성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (D)
    • /
    • pp.485-490
    • /
    • 2008
  • 무선 인터넷의 구조적 특성상 한 셀에서 대역폭을 공유하고 그 안에서 각기 다른 QoS를 요구하는 서비스들이 한정된 자원을 사용한다. 트래픽의 변화와 패턴을 예측하기 위한 분석은 실제 서비스를 제공하기 전인 기획단계에서 매우 중요한 도구로 사용이 된다. 무선망의 트래픽을 예측하기 위해서는 유선망의 분석과는 다른 방법이 필요하기 때문에 정확한 분류를 위해서 본 연구에서는 세션의 단위로 분석할 것을 제안한다. 또한 Classification and Regression Tree(CART) 와 Support Vector Machine(SVM) 의 두 개의 판별 분류 기법을 서로 비교하고 그 성능을 평가한다. 두 개의 판별 기법의 오차는 CART의 경우 0.0094 그리고 SVM의 경우 0.0089로 둘 다 우수한 성능을 보였지만 쉬운 결과 해석이 가능한 CART가 사용하기 용이함을 보인다.

  • PDF

로그 회귀분석 및 CART를 활용한 수력사업의 CDM 승인여부 예측 모델에 관한 연구 (Predicting the success of CDM Registration for Hydropower Projects using Logistic Regression and CART)

  • 박종호;구본상
    • 한국건설관리학회논문집
    • /
    • 제16권2호
    • /
    • pp.65-76
    • /
    • 2015
  • 청정개발체제(CDM) 사업은 신재생에너지사업의 보조를 통해 지구온난화 가스의 감축을 꾀하는 대표적인 국가 및 기업 간 배출권 거래(cap and trade)제도이다. 재래식 발전 방식에 비해 수익성이 낮은 태양광, 풍력, 수력 등의 사업이 CDM 사업으로 승인을 받으면 매년 탄소배출권(CER)을 제공받고, 이의 판매를 통해 발생한 추가 수익으로 인해 사업 타당성이 향상될 수 있다. 그러나 CDM 사업으로 인정받기 위해서는 환경적, 기술적, 경제적 추가성(Additionality)를 입증해야 하는데, 해당 적용 기술, 베이스라인 측정 방법론, 온실 가스 감축량, 사업 내부 수익률(IRR) 등 다수의 변수에 따라 결과가 달라지기 때문에 사전적으로 승인여부를 파악하기가 어렵다. 본 연구에서는 신재생에너지로 분류되는 수력 사업의 CDM 승인여부를 예측할 수 있는 모델을 개발하는 것을 목표로 하였다. 구체적으로 UNFCCC에서 제공하는 수력 사업 데이터를 활용하여 로그 회귀분석 및 CART 분석을 실시하여 예측모델을 개발하였으며 이와 함께 승인 여부에 유의하게 영향을 미치는 핵심 인자들을 파악하였다. 구축된 로그 회귀 및 CART 예측모델은 AUC가 각각 0.7674 및 0.7231로 예측 정확성이 비교적 높게 나왔다. 또한 수력 사업에서는 온실가스 저감량 대비 투자액, 시간당 발전량 및 내부수익률이 승인여부에 유의한 변수들로 파악되었고, 이에 비해 특정 기술이나 측정 방법론은 영향이 없는 것으로 드러났다. 즉, 특정 기술을 불문하고 온실가스를 투자 대비 가장 효율적으로 저감하는 사업과 수력사업들 중 상대적으로 소규모로 진행되는 사업이 CDM 사업으로 승인될 가능성이 높다는 것으로 해석된다.

공간통계학적 방법에 의한 소나무 재선충 피해의 자연적 확산유형분석 (Natural Spread Pattern of Damaged Area by Pine Wilt Disease Using Geostatistical Analysis)

  • 손민호;이우균;이승호;조현국;이준학
    • 한국산림과학회지
    • /
    • 제95권3호
    • /
    • pp.240-249
    • /
    • 2006
  • 최근, 소나무재선충(Bursaphelenchus xylophilus)에 의한 소나무림의 피해에 대한 사회적 심각성이 크게 대두되고 있다. 소나무 재선충에 의한 산림피해는 피해지 내에서는 매개충인 솔수염하늘소의 자연적인 영역확장에 의해 확산되는 반면, 전국적으로는 감염목의 인위적 반출 및 이동에 의해 확산이 진행되고 있다. 본 연구에서는 부산 대변항의 재선충 피해지내에서 항공사진 및 현지조사에 의해 피해목의 공간적인 위치를 파악하였고, 공간통계학적인 방법을 통하여 피해목의 공간분포유형, 피해발생과 지형인자간의 관계를 분석하였다. 또한, 지형공간자료를 통계학적 Tree 모형에 적용한 CART(Classification and Regression Trees)모형을 이용하여 재선충 피해의 자연적인 확산 예측 지도를 작성하였다. 본 연구를 통해 공간통계학적인 분석과 CART모형이 소나무재선충 피해의 공간분포 및 자연적 확산유형을 파악하는데 유용한 도구로 활용될 수 있음을 확인할 수 있었다.

CART 알고리즘을 이용한 지역별 주택 및 주거환경 만족도 영향 요인의 비교 (Comparison of factors affecting residential and residential environment satisfaction by region using the CART algorithm)

  • 정수은
    • 문화기술의 융합
    • /
    • 제9권4호
    • /
    • pp.707-715
    • /
    • 2023
  • 본 연구는 주택 및 주거환경 만족도 영향 요인의 지역별 특성 비교 분석하기 위해서, 2020년 국토교통부 주거실태조사 데이터를 활용하여 Decision Tree 분석 중 CART 알고리즘을 적용하였다. 연구 결과는 첫째, 주거환경 만족도에서 의료복지시설 만족도, 교육시설 접근성 만족도가 광역시 및 수도권에서 높은 중요도를 보이지만 변의 사고 및 범죄로부터 안전한 환경 만족도 요인이 그 이외의 지역에서 더 높은 중요도를 보여, 권역에 따른 차이가 두드러졌다. 둘째, 주택 만족도에서는 주택 특성 요인이 중요하고 실내 환경 수준 만족도와 실내 안전 및 위생 상태 만족도가 대부분의 시도에서 중요도를 보였지만 주거환경 만족도에서는 주거 외부 정주 환경 특성 요인의 중요도가 더 높고 영향 요인이 상대적으로 균등하게 분포하여 종속변수에 따른 차이를 보였다. 이러한 권역별 특성의 일반화를 위해서는 시계열 데이터를 활용한 연구가 추후에 진행될 필요가 있다.

심혈관질환 위험 예측을 위한 비용민감 학습 모델 (Cost-Sensitive Learning for Cardio-Cerebrovascular Disease Risk Prediction)

  • 이유나;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.161-168
    • /
    • 2021
  • 본 연구에서는 기계 학습을 사용하여 심혈관 질환 예측 모델을 제안한다. 먼저 두 집단간에 다양한 차이를 다차원분석하고 그 결과를 시각화한다. 특히, 질환과 같이 정상집단과 환자집단 간에 높은 클래스 불균형이 존재하는 경우에 대하여 민감도를 향상시킬 수 있는 비용 민감 학습을 사용하는 예측 모델을 제안한다. 본 연구에서는 대표적인 머신러닝 기술인 CART와 XGBoost를 사용하여 예측모델을 개발하고, 심혈관 질환 환자 데이터를 대상으로 예측하고 성능을 비교한다. 연구결과에 따르면 CART가 XGBoost 보다 더 높은 정확도와 특이도를 보였으며, 정확도는 약 70%~74%로 나타났다.

데이터마이닝을 이용한 공군 무기정비병의 조기 숙달을 위한 배속방안 연구 (An Effective Recruits' Assignment Method for Early Job Adaptation of Air-munition Maintenance Airmen Using Datamining Technique)

  • 강규영;윤봉규
    • 한국국방경영분석학회지
    • /
    • 제37권1호
    • /
    • pp.147-159
    • /
    • 2011
  • Recently, the military service period has been shortened continuously. Meanwhile, more skilled airmen are needed as the complexity of weapon systems increase. This phenomenon could lead to a disastrous result such as deteriorating the level of the readiness and the fighting power. We suggest a method to improve recruit's maintenance capability rapidly by assigning airmen to jobs appropriate to their characteristics using Datamining methods (K-menas and CART). We focus on the assigning method for air force's air-munition maintenance airmen since they are requested more skilled than other airmen. Grouping airmen with k-means method and devising classification rule with CART algorithm, we found that airmen's proficiency arrival period could be shortened by 1.79 months when they are assigned in the suggested way.

분류모델의 성과 비교에 관한 연구 (A Study on the Comparison of Classification Models′ Performance)

  • 김신곤;박성용
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.203-214
    • /
    • 1999
  • 본 연구는 A카드 회사에서 현재 실시하고 텔레마케팅 시스템에 데이터마이닝 기법 가운데 하나인 CHAID, CART 알고리즘 및 신경망 기법을 적용하여 모텔을 개발하고 개발된 모델들의 성과를 분석한다. 이를 통하여 어떻게 기업이 데이터베이스와 데이터마이닝 기법을 마케팅에 효과적으로 사용할 수 있는가에 대한 방안을 제시하고 여러 모델들의 성과를 비교 분석하는 방안을 함께 제시한다.

  • PDF

분류모델의 성과 비교에 관한 연구 (A Study on the Comparison of Classification Models Performance)

  • 김신곤;박성용
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.203-214
    • /
    • 1999
  • 본 연구는 A카드 회사에서 현재 실시하고 텔레마케팅 시스템에 데이터마이닝 기법 가운데 하나인 CHAID, CART 알고리즘 및 신경망 기법을 적용하여 모델을 개발하고 개발괸 모델들의 성과를 분석한다. 이를 통하여 어떻게 기업이 데이터베이스와 데이터마이닝 기법을 마케팅에 효과적으로 사용할 수 있는가에 대한 방안을 제시하고 여러 모델들의 성과를 비교 분석하는 방안을 함께 제시한다.

  • PDF