• 제목/요약/키워드: 나무모형

검색결과 342건 처리시간 0.024초

의사결정나무를 이용한 개인휴대통신 해지자 분석

  • 최종후;서두성
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1998년도 추계학술대회 논문집
    • /
    • pp.377-380
    • /
    • 1998
  • 본 논문에서는 최근 데이터마이닝의 도구로 활발하게 소개되고 있는 의사결정나무 분석을 이용하여 개인휴대통신의 해지자 분석을 실시한다. 또한 로지스틱 회귀모형을 이용하여 가입고객의 해지 가능성에 대한 점수화를 시도한다.

  • PDF

SWAT REMM Enhanced 모형을 이용하여 수변림 설치에 따른 수질 개선 효과 모의 (Simulation of Water Quality Improvement with Riparian Buffer System using the SWAT-REMM Enhanced Model)

  • 류지철;조재필;문종필;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.596-599
    • /
    • 2010
  • 본 연구에서는 SWAT-REMM Enhanced 모형을 이용하여 총 3개의 수변림 시나리오를 작성하여 도암댐 유역 내 일부 소유역에 적용 하였다. 수변림 시나리오 중 시나리오 1과 2는 수변 폭을 15m로 하고 식생을 나무와 잔디로 각각 다르게 적용하였고, 시나리오 3은 수변폭을 8m로 하고 식생을 나무로 선정하였다. SWAT-REMM Enhanced 모형을 이용하여 수변림 시나리오를 적용 한 결과 지표하유출의 경우, 시나리오 1의 저감효율이 70%이상 큰 것으로 나타났다. 또한 시나리오 1과 2를 비교한 결과 수변 폭이 넓을수록 저감 효율이 큰 것으로 분석 되었다.

  • PDF

의사결정나무모형을 이용한 편마암 지역에서의 급경사지재해 예측기법 개발 (Development to Prediction Technique of Slope Hazards in Gneiss Area using Decision Tree Model)

  • 송영석;채병곤
    • 지질공학
    • /
    • 제18권1호
    • /
    • pp.45-54
    • /
    • 2008
  • 본 연구에서는 기 조사된 편마암 지역에서의 급경사지재해 발생지역 및 미발생지역에 대한 현장조사자료 및 토질시험자료를 토대로 통계적인 분석방법인 의사결정나무모형을 이용하여 급경사지재해 예측기법을 개발하였다. 편마암 지역에서의 조사된 급경사지재해 자료는 서울 및 경기지역에서 1998년 집중호우로 발생된 104개소구간이다. 이 가운데 예측모델 개발에 활용된 자료수는 결측치를 제외한 61개소로서, 급경사지재해 발생구간 34개소와 미발생구간 27개소이다. 의사결정나무모형을 이용한 통계적인 분석은 카이제곱 통계량, 지니 지수 및 엔트로피 지수를 적용하여 실시하였다. 분석결과 사면경사, 포화도 및 사면고도가 분리기준으로 선택되었으며, 엔트로피 지수를 이용한 의사결정나무모형 예측모델이 정확도가 가장 높은 것으로 나타났다. 선정된 급경사지재해 예측모델의 분리기준은 최상위부터 사면경사, 포화도 및 사면고도의 순서로 선택되었으며, 각각의 분리기준치는 사면경사의 경우 $17.9^{\circ}$, 포화도의 경우 52.1%, 사면고도의 경우 320m로 결정되었다.

생명보험사의 개인연금 보험예측 사례를 통해서 본 의사결정나무 분석의 설명변수 축소에 관한 비교 연구 (A study on the comparison of descriptive variables reduction methods in decision tree induction: A case of prediction models of pension insurance in life insurance company)

  • 이용구;허준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권1호
    • /
    • pp.179-190
    • /
    • 2009
  • 금융 산업에서, 의사결정나무 분석은 분류분석을 위해서 널리 사용되는 분석기법이다. 그러나 금융 산업에서 실제로 의사결정나무 분석을 적용할 때, 발생하는 문제점 중 하나는 설명변수의 수가 너무 많다는 점이다. 따라서 모형의 결과에 별 영향을 미치지 않으면서 설명변수의 수를 줄이는 효과적인 방법을 연구할 필요가 있다. 본 연구에서는 의사결정 나무 분석에서 모형의 정확성에 근거한 최선의 변수 선택 방법을 구하기 위하여 다양한 변수 선택방법들을 비교 분석 하였다. 이를 위하여 본 연구에서는 한 보험회사의 연금 보험 상품 자료에 다양한 설명변수 축소방법을 적용하여, 가장 적은 수의 설명변수를 가지고 가장 높은 정확도를 제공하여 주는 설명변수 축소방법을 구하는 실증적인 연구를 시행하였다. 이러한 실험결과, 신경망의 민감도 분석을 이용하여 변수를 축소하고, 그 축소된 변수를 이용하여 의사결정나무 분석 모델을 생성하는 경우가 가장 효율적인 설명변수 축소방법임을 알 수 있었다.

  • PDF

노인장기요양보험 이용지원 상담 대상자 선정모형 개발 (A Target Selection Model for the Counseling Services in Long-Term Care Insurance)

  • 한은정;김동건
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1063-1073
    • /
    • 2015
  • 우리나라 노인장기요양보험에서는 수급자와 그 가족부양자가 수급자의 심신기능 상태와 욕구에 따라 불이익이나 불편함이 없이 비용-효과적으로 장기요양 급여를 이용할 수 있도록 지원하고자 이용지원 상담을 제공하고 있다. 본 연구는 재가급여 이용자의 이용지원 정기상담 대상자 선정시 상담 대상자의 욕구를 반영하지 않아 이용지원 상담의 만족도와 효율성이 낮은 문제를 통계학적 모형을 활용하여 해결하고자 수행되었다. 모형 개발을 위해 2013년 3월 장기요양 재가급여를 이용한 수급자와 가족부양자를 대상으로 이용지원 상담에 대한 욕구와 관련 변수를 조사하였으며, 2,000명이 조사를 완료하였다. 조사 자료를 바탕으로 이용지원 상담 대상자 선정모형을 다양한 데이터마이닝 기법(로지스틱 회귀모형, 의사결정 나무모형, Lasso 모형, 자동 신경망모형, 그래디언트 부스팅, 앙상블 모형)을 통해 개발하였고, 이중 가장 안정적이고 현장 적용이 쉽고 성능이 좋은 Lasso 모형 결과를 최종모형으로 선정하였다. 본 연구가 이용지원 상담의 만족도를 높이고 업무를 효율화 하는데 기여할 것으로 기대된다.

농업용(전작 및 답작용) 지하수 이용량 추정을 위한 회귀나무 모형의 적용 (Application of Regression Tree Model for the Estimation of Groundwater Use at the Agricultural (Dry-field Farming and Rice Farming) Purpose Wells)

  • 김규범;황찬익
    • 지질공학
    • /
    • 제29권4호
    • /
    • pp.417-425
    • /
    • 2019
  • 농업용 지하수 이용은 국내 지하수 이용량의 51.8%를 차지하고 있어 정확한 이용량 산정은 지하수의 효율적 정책 추진을 위하여 중요하다. 본 연구에서는 370개 관정의 이용량 실측 자료를 토대로 회귀나무 모형을 적용한 농업용(전작 및 답작용) 관정의 지하수 이용량의 산정 기법을 개발하고자 하였다. 모델의 입력 변수는 우물의 심도, 토출관 구경, 양수능력 등 3개가 유의한 것으로 평가되었으며, 모델에서의 각 변수의 중요도는 우물의 심도가 75%, 토출관 구경이 17%, 양수능력이 8%로 나타났다. 회귀나무 모형에 의한 농업용(전작 및 답작용) 관정의 일 이용량은 실측 이용량과 매우 유사한 것으로 평가되었으며, 기존의 국토교통부에서 제시한 추정식에 비하여 실측 이용량에 보다 근사한 것으로 나타났다. 향후 추가적인 실측 표본 자료를 확보하여 본 방법을 보완, 적용한다면 지하수 이용량 통계의 신뢰도가 크게 향상될 것으로 기대된다.

로지스틱 회귀분석과 의사결정나무 분석을 이용한 일 대도시 주민의 우울 예측요인 비교 연구 (Comparative Analysis of Predictors of Depression for Residents in a Metropolitan City using Logistic Regression and Decision Making Tree)

  • 김수진;김보영
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.829-839
    • /
    • 2013
  • 본 연구는 로지스틱 회귀분석과 의사결정나무 분석을 활용하여 일 대도시 주민의 우울에 영향을 주는 요인을 예측하고 비교하고자 시도된 서술적 조사연구이다. 연구대상은 20세에서 65세 미만의 일 대도시 주민 462명이었다. 자료 수집은 2011년 10월 7일부터 10월 21일까지이었으며, 자료 분석은 SPSS 18.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 로지스틱 회귀분석, roc curve, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 로지스틱 회귀분석과 의사결정나무 분석에서 공통적으로 나타난 우울 예측요인은 사회부적응, 주관적 신체증상 및 가족 지지이었다. 로지스틱 회귀분석에서 특이도 93.8%, 민감도 42.5%이었고, 본 연구의 모형 적합도를 roc curve 검증 한 결과 AUC=.84으로 본 연구 모형은 적합(p=<.001)하다고 할 수 있다. 우울예측에 대한 의사결정나무 분석은 분류에 대한 예측 정확도에서 특이도 98.3%, 민감도 20.8%이었고, 전체 분류 정확도는 로지스틱 회귀분석은 82.0%, 의사결정나무 분석은 80.5% 이었다. 본 연구 결과 민감성과 분류 정확도와 더 높게 나타난 로지스틱 회귀분석 방법이 지역 주민의 우울 예측 모형을 구축하는데 더 유용한 자료로 사용될 수 있으리라 사료된다.

화장품구매 자료를 통한 고객 구매행태 분석 (A study on the behavior of cosmetic customers)

  • 조대현;김병수;석경하;이종언;김종성;김선화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권4호
    • /
    • pp.615-627
    • /
    • 2009
  • 본 연구의 목적은 효과적인 마케팅전략 수립에 도움이 되는 정보를 제공하는 데 있다. 이를 위하여 화장품구매 자료로부터 고객 구매형태와 재구매 간의 관계를 분석하여 고객충성도 예측모형을 개발하였다. 고객충성도는 재구매 가능성으로 측정하였다. 본 연구에서 사용된 자료는 국내의 한 화장품회사 고객들의 2000년부터 2008년까지 9년간의 구매자료 (432,528명, 2,440,107건)이다. 예측모형의 목표변수는 재구매 유무이고, 설명변수는 구매수량, 구매액, 휴면기간 등의 기본변수와 구매횟수와 거래 일자를 이용한 가공변수들이다. 충성도 예측모형은 데이터마이닝 기법인 로지스틱회귀, 의사결정나무 및 신경망모형을 사용하였다. 예측모형평가의 측도로는 하이드게 점수를 사용하였으며, 최대의 하이드게 점수를 가지는 분계점을 선택하였다. 각예측모형에서 선택된 변수는 유사하며, 모형비교 결과 세 모형의 효율과 평가측도의 차이는 크지 않았다. 정분류율이 다소 높고 해석과 활용이 쉬운 의사결정나무모형을 최종모형으로 선택했다.

  • PDF

데이터마이닝과 다중모형조합기법을 이용한 온라인상점 상품추천시스템 개발

  • 이연경;김경재
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.340-348
    • /
    • 2004
  • 온라인상점의 상품추천시스템은 일대일마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 대부분의 상품추천시스템은 시시각각 변화하는 소비자의 기호에 따라 상품을 어떻게 추천할 것인가에 대한 문제에 직면해 있다. 본 연구에서는 급변하는 온라인상점 환경에 탄력적으로 대응하기 위하여 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 제안하는 상품추천시스템은 현재 운영중인 온라인상점 데이터로 프로토타입을 구축하고 실제 소비자에 대한 적용가능성을 검증하였으며, 그 결과 실제 유용할 것으로 확인되었다.

  • PDF

국민건강보험 청구자료 기반의 결핵환자 분류 고도화 모형 개발 (Development of Advanced TB Case Classification Model Using NHI Claims Data)

  • 박일수;김유미;최연희;김성수;김은주;원시연;강성홍
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.289-299
    • /
    • 2013
  • 본 연구의 목적은 현재 질병관리본부에서 사용하고 있는 건강보험 청구자료 기반의 결핵환자 분류기준을 고도화하여 보다 효과적인 결핵환자감시체계의 토대를 제공하기 위해 수행되었다. 이를 위해 건강보험심사평가원의 2009년 1년간 결핵상병으로 청구된 81,199명 중 10%인 8,118명을 표본추출한 후 실제 결핵환자인지에 대해서 의무기록 조사를 실시하여 조사가 완료되고, 국민건강보험공단 건강보험청구 자료와 매칭이 완료된 7,132명을 최종 분석대상자로 하였다. 결핵환자분류를 위한 모형을 개발하여 평가한 결과 결핵과 관련된 임상전문가 의견과 통계적 분류 알고리즘이 종합적으로 고려된 의사결정나무모형이 가장 우수한 모형으로 평가되었다. 의사결정나무 모형에 따른 결핵분류모형의 주요 독립변수는 연령, 최초 청구시점의 결핵약제 종류수, 최초 청구시점의 이용 의료기관 유형, 최초 청구시점의 청구결핵검사 종류, 2008년 결핵약 투약일수, 최초 청구시점 결핵약제 투약일수, 최초 청구시점 결핵상병 종류로 나타났다. 이 모형의 향상도는 최고 11.8이였으며, 개발된 모형에서 분류된 1~5유형까지 적용하여 청구된 자료 중 결핵이 아님을 예측할 경우, 민감도는 90.6%, 양성예측도는 96.1%, 정분류율은 87.6%로 나타나, 현재 질병관리본부에서 사용하는 청구2회 이상, 약제 2제 이상 모형(민감도 82.6%, 양성예측도 95%, 정분류율 80%)보다 우수한 모형인 것으로 나타났다.