• 제목/요약/키워드: 회귀 나무 분석

검색결과 199건 처리시간 0.033초

옻나무의 암수에 따른 주요인자와 옻채취량의 상관분석 (Correlation Analysis on Several Factors and Collection Amount of Rhus Lacquer by the Sex of Rhus verniciflua)

  • 송병민;이철
    • 한국자원식물학회지
    • /
    • 제18권2호
    • /
    • pp.279-284
    • /
    • 2005
  • 본 연구는 옻나무의 암수구분에 의한 직경, 수고 및 수관폭에 따라 옻채취량의 변화관계를 조사하여 옻나무의 암수별 각인자의 옻채취량에 대한 상관관계와 회귀분석을 실시한 결과 암수구분에 의한 직경과 옻채취량의 관계에서는 암수 모두 직경증가에 따라 옻채취량도 증가하는 경향을 보였으며, 일반적으로 수나무개체들이 암나무 보다 옻채취량에 있어서 높은 수치를 나타내는 경우가 많았다. 암수구분에 의한 수관폭의 변화가 옻채취량에 미치는 영향력은 작게 나타났으나, 수관폭이 증가할수록 옻채취량도 증가하는 추세를 보여주었다. 또한 암수구분에 의한 회귀분석은 수나무보다 암나무의 주요인자들이 옻채취량에 더 많은 영향을 미치는 것으로 나타났으며, 직경, 수고, 수관폭 및 옻채취량의 유의적 차이는 없는 것으로 분석되었다.

돈나무의 내한성 평가 모델링 (Modeling Methodology for Cold Tolerance Assessment of Pittosporum tobira)

  • 김인혜;허근영;정현종;최수민;박재현
    • 원예과학기술지
    • /
    • 제32권2호
    • /
    • pp.241-251
    • /
    • 2014
  • 본 연구는 남부 지방에서 널리 사용되고 있는 상록활엽수인 돈나무의 내한성 예측을 위한 편리하고 신뢰성 있는 평가 모델 개발을 목적으로 전해질 용출법을 통한 내한성 평가에서 나타나는 실험방법 상의 오차를 최소화하는 내한성 평가 모델을 도출하고자 수행되었다. 평가 모델링은 저온 처리된 식물체에 대한 재생검사와 전해질 용출 평가로 구성되었고, 전해질 용출법에서 표본조직 선택, 최대 전해질 용출 측정을 위한 온도 처리법, 치사 온도 예측을 위한 통계 분석법에 의한 방법적 조합들로부터 예측된 치사 온도들이 재생검사 결과와 비교되었다. 재생 검사 결과 돈나무의 저온 치사 온도는 50% 미만의 생존율을 보이는 최고온도인 $^-10{\circ}C{\sim}-5^{\circ}C$로 분석되었고, 이 결과를 바탕으로 전해질 용출법에 의해 예측된 저온 치사 온도를 분석한 결과, 잎을 표본 조직으로 하여 냉각치사법으로 최대 전해질 용출을 측정한 방법적 조합에서 재생 검사 결과와 가장 근접한 예측 저온 치사 온도가 나타났다. 저온 치사온도 예측을 위한 통계 모델 평가에서는 선형보간법이 비선형회귀에 비하여 내한성을 과대평가하는 경향이 상대적으로 높았다. 결론적으로 돈나무 내한성 예측을 위한 내한성 평가 모델은 잎을 표본 조직으로 사용하고, 최대 전해질 용출 측정을 위한 온도 처리 방법으로 냉각치사법을 적용하며, 치사온도 예측을 위한 통계 분석 기법으로 비선형회귀를 활용하는 방법적 구성이 가장 적합한 것으로 나타났다.

산재보험 부정수급 식별모형에 관한 연구 (A Study on the Fraud Detection of Industrial Accident Compensation Insurance)

  • 함승오;홍정식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF

마케팅 데이터를 대상으로 중요 통계 예측 기법의 정확성에 대한 비교 연구 (A Comparative Study on the Accuracy of Important Statistical Prediction Techniques for Marketing Data)

  • 조민호
    • 한국전자통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.775-780
    • /
    • 2019
  • 미래를 예측하는 기법은 통계에 기반을 둔 것과 딥러닝에 기반을 둔 기술로 분류할 수 있다. 그중 통계에 기반을 둔 것이 간단하고 정확성이 높아서 많이 사용된다. 하지만 실무자들은 많은 분석기법의 올바른 사용에 어려움이 많다. 이번 연구에서는 마케팅에 관련된 데이터에 다항로지스틱회귀, 의사결정나무, 랜덤포레스트, 서포트벡터머신, 베이지안 추론을 적용하여 예측의 정확성을 비교하였다. 동일한 마케팅 데이터를 대상으로 하였고, R을 활용하여 분석을 진행하였다. 마케팅 분야의 데이터 특성을 반영한 다양한 기법의 예측 결과가 실무자들에게 좋은 참고가 될 것으로 생각한다.

저온처리에 따른 국내 상록활엽수종의 내한성 비교 평가 (The Comparative Assessment of Cold Tolerance of Broad-leaved Evergreen Trees by Low Temperature Treatment)

  • 진언주;윤준혁;배은지;최명석
    • 한국산림과학회지
    • /
    • 제108권4호
    • /
    • pp.484-492
    • /
    • 2019
  • 본 연구는 기후변화에 대응하여 광범위한 지역에서 가로수 식재에 활용 가능한 상록활엽수를 선발하기 위한 연구의 일환으로서 국내 남부지역에서 생육하는 굴거리나무, 녹나무, 동백나무, 다정큼나무, 종가시나무, 후박나무, 황칠나무 등 7수종에 대하여 내한성을 비교하기 위해 수행되었다. 저온처리에 따른 7종 상록활엽수의 전해질 용출을 측정한 결과 처리 온도가 낮아질수록 값이 증가하였고, 전해질 용출량과 처리 온도와의 관계를 비선형회귀를 통하여 분석한 결과 도출된 함수들은 S자 반응곡선의 형태로 나타났다. 예측치사 온도를 통하여 수종별 내한성을 분석한 결과 동백나무(-11.586℃)> 다정큼나무(-9.348℃)> 종가시나무(-8.719℃)> 후박나무(-8.090℃)> 굴거리나무(-7.409℃)> 황칠나무(-7.085℃)> 녹나무(-6.995℃) 순으로 조사되었다. 앞서 평가한 것처럼 국내 남부지역의 동일한 지역에서 생육하는 7종 상록활엽수들 중에서도 상대적 내한성 차이가 5℃ 이상을 나타냈고 동일한 과에 속하는 종간에서도 녹나무과는 내한성 차이가 2℃ 이상을 나타냈다. 내한성이 강한 우수 수종을 분석한 결과 종가시나무, 동백나무, 다정큼나무이며 이들은 중부지역 도시들에서 외부 온도 조건으로 생존 가능성을 평가할 필요가 있다고 판단된다.

다년도 자료를 이용한 고혈압 유병률의 지역간 변이 분석 (Analysis on Geographical Variations of the Prevalence of Hypertension Using Multi-year Data)

  • 김유미;조대곤;홍성옥;김은주;강성홍
    • 대한지리학회지
    • /
    • 제49권6호
    • /
    • pp.935-948
    • /
    • 2014
  • 고혈압과 같은 만성 질환의 관리는 국가보건정책에서 중요한 사업이다. 본 연구는 지역사회 특성이 고혈압의 유병률에 어떻게 영향을 주는지를 분석하였다. 분석을 위해 237개 시군구 소지역의 건강상태 및 건강 행태를 포함한 다년간의 자료를 수집하였다. 지표는 2009~2011년 질병관리본부의 지역사회건강조사와 국민건강보험공단 등의 자료를 사용하였다. 지역간 변이 분석을 위해 지리적 가중회귀분석과 의사결정나무 모형을 이용하였다. 연구결과 다년간 자료를 이용하는 것이 단년간 자료를 이용하는 것보다 더 적합도가 높았는데 이것은 대부분의 변수에서 연도별 유의한 차이가 있었기 때문이다. 또 고혈압 유병률은 당뇨병 및 비만 유병률과 양의 관련성이 있었으며 인구밀도와는 음의 상관관계를 보였다. 특히 이러한 요인들의 지역적 변이는 지리적 가중회귀분석 결과에서 더욱 뚜렷하였다. 이상의 결과를 바탕으로 분석한 의사결정나무 모형에서는 고혈압 유병률에 영향을 미치는 중요한 변수가 지역별로 매우 상이하다는 것을 확인할 수 있었다. 지역주민의 건강상태, 건강행태, 사회경제적 요인의 지역간 차이를 규명하는 것은 고혈압 유병률을 감소시키기 위한 지역별 맞춤형 보건정책을 수립하는데 매우 중요하다. 본 연구의 결과는 만성질환 관리를 위한 맞춤형 지역보건정책을 수립하는데 기초자료를 제공할 수 있다는 데 의의가 있다.

  • PDF

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구

  • 윤양현;김태경;김수영;박용균
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2021년도 추계학술대회
    • /
    • pp.185-187
    • /
    • 2021
  • 관리종목 지정 제도는 상장 기업 내 기업의 부실화를 경고하여 기업에게는 회생 기회를 주고, 투자자들에게는 투자 위험을 경고하기 위한 시장규제 제도이다. 본 연구는 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 하여 관리종목 지정 예측에 대한 연구를 진행하였다. 분석에 쓰인 분석 방법은 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 소프트 보팅, 랜덤 포레스트, LightGBM이며 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높았다.

  • PDF

매장문화재 예측을 위한 통계적 분류 분석 (Classification Analysis for the Prediction of Underground Cultural Assets)

  • 유혜경;이진영;나종화
    • 한국산업정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.106-113
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 국내 I시 자료를 사용하여 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형에 대한 성능비교와 함께, 새로운 자료에 대한 적용성 평가를 위해 모의실험을 수행하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R 언어를 사용하였으며, 구체적 분석과정을 제시하였다.

보행자통행량이 상가권리금에 미치는 영향의 평가 (Assessing the Impact of Pedestrian Traffic Volumes on Locational Goodwill)

  • 정승영
    • 지적과 국토정보
    • /
    • 제45권1호
    • /
    • pp.225-240
    • /
    • 2015
  • 통행하는 보행자의 특징이 상가권리금에 미치는 효과를 실증적으로 모형을 구축하고 시험 하였다. 이 연구를 위한 이론적 근거는 중심지 이론, 입찰지대, 집적이론, 외부수요 이론이다. 자료에는 서울시 100개 $3.3m^2$당 상권의 상가권리금, $3.3m^2$당 상가보증금, $3.3m^2$당 상가월세 그리고 보행자의 특성과 관련된 정보가 포함되어 있다. 실증분석은 서울시 상가 1,307개를 표본을 사용하여 시험하였다. 그리고 자료집합은 회귀나무 및 회귀방법을 이용하여 분석이 이루어졌다. 이 분석한 결과로서, 각각의 상권에서 상가권리금에 영향을 주는 변수는 평일 오후 2시 보행자의 통행량, 평일 오후 4시 보행자의 통행량, 평일 오후 8시 보행자의 통행량이다. 요약하면, 상권의 경제적 기반을 뿐만 아니라 통행 보행자의 특징은 상가권리금을 결정하기 위해 고려되어야한다.

보행자-차량 충돌사고 특성분석 방법론 비교 연구 (Comparison of Methodologies for Characterizing Pedestrian-Vehicle Collisions)

  • 최새로나;정은비;오철
    • 대한교통학회지
    • /
    • 제31권6호
    • /
    • pp.53-66
    • /
    • 2013
  • 최근 운전자의 보행자-차량 충돌사고 감소를 목적으로 한 다양한 연구가 수행되고 있으며, 본 연구에서는 보행자-차량 사고 발생 특성 및 심각도 영향요인 분석을 위하여 다양한 분석방법론을 활용한 보행자 교통사고 분석을 수행하였다. 통계모형과 휴리스틱모형 적용시 각 기법에 따른 결과를 도출함으로써 보행자 사고분석시 분석목적에 적합한 방법론을 제시하는 것을 목적으로 하였다. 이를 위하여 최근 3년간 발생한 경기도 교통사고자료(2008-2010년)를 활용하여 보행자 교통사고의 발생특성을 분석하였다. 또한, 통계모형인 이항 로지스틱 회귀분석, 순서형 프로빗 모형을 이용하여 보행자 교통사고 심각도 증가에 통계적으로 유의한 영향을 미치는 변수를 도출하였으며, 휴리스틱모형인 서포트 벡터 머신, 의사결정나무를 적용하여 교통사고 심각도 분류를 위한 모형을 개발하고 그 결과를 비교분석 하였다. 본 연구의 분석결과는 보행자 교통안전분석의 기초자료로 활용할 수 있으며 향후 국내 보행자-차량 충돌사고 분석시 유용하게 활용될 수 있을 것으로 기대된다.