• 제목/요약/키워드: 회귀나무모형

검색결과 110건 처리시간 0.03초

울릉도 섬잣나무-솔송나무림의 구조 및 하층식생의 종 다양성 (Structure and Understory Species Diversity of Pinus parviflora - Tsuga sieboldii Forest in Ulleung Island)

  • 조용찬;홍진기;조현제;배관호;김준수
    • 한국산림과학회지
    • /
    • 제100권1호
    • /
    • pp.34-41
    • /
    • 2011
  • 본 연구에서는 울릉도 태하령의 섬잣나무-솔송나무림에서 10개의 영구방형구($10m{\times}10m$) 및 30개의 소방 형구($1m{\times}3m$)를 설치하여 임분구조, 식생조성 및 종다양성을 밝히며 종다양성 모형을 수립하였다. 섬잣나무-솔송나무 임분의 광량은 평균 $3.7mol{\cdot}m^{-2}{\cdot}day^{-1}$, 수관 열림도는 평균 8.6 %로 분석되었다. Mantel 검정 결과, 임분 상층의 구조가 장기적으로 지속되기 어려울 것으로 나타났다. 하층식생의 조성은 지상부의 구조 및 토양 나출도와 유의한 상관을 나타내었다. 중회귀분석을 통한 종다양성 모형에서 섬잣나무의 양적 요인(단면적 및 밀도) 및 숲 바닥 조건이 유의한 예측변수로 분석되었다. 섬잣나무-솔송나무림의 유지에는 비교적 큰 규모의 교란이 필요할 것으로 생각되며, 종다양성을 유지하기 위해서는 여우꼬리사초 및 큰두루미꽃과 같은 단일 군반을 형성하는 교란지 종의 확장을 제어하는 것이 필요하다.

산재보험 부정수급 식별모형에 관한 연구 (A Study on the Fraud Detection of Industrial Accident Compensation Insurance)

  • 함승오;홍정식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF

KOSDAQ 시장의 관리종목 지정 탐지 모형 개발 (Development of a Detection Model for the Companies Designated as Administrative Issue in KOSDAQ Market)

  • 신동인;곽기영
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.157-176
    • /
    • 2018
  • 관리종목은 상장폐지 가능성이 높은 기업들을 즉시 퇴출하기 보다는 시장 안에서 일정한 제약을 부여하고, 그러한 기업들에게 상장폐지 사유를 극복할 수 있는 시간적 기회를 주는 제도이다. 뿐만 아니라 이를 투자자 및 시장참여자들에게 공시하여 투자의사결정에 주의를 환기시키는 역할을 한다. 기업의 부실화로 인한 부도 예측에 관한 연구는 많이 있으나, 부실화 가능성이 높은 기업에 대한 사회, 경제적 경보체계라 할 수 있는 관리종목에 관한 연구는 상대적으로 매우 부족하다. 이에 본 연구는 코스닥 기업들 가운데 관리종목 지정 기업과 비관리종목 기업을 표본으로 삼아 로지스틱 회귀분석과 의사결정나무 분석을 이용하여 관리종목 지정 예측 모형을 개발하고 검증하였다. 분석결과에 따르면 로지스틱 회귀분석 모형은 ROE(세전계속사업이익), 자기자본현금흐름률, 총자산회전율을 사용하여 관리종목 지정을 예측하였으며, 전체 평균 예측 정확도는 검증용 데이터셋에 대해 86%의 높은 성능을 보여주었다. 의사결정나무 모형은 현금흐름/총자산과 ROA(당기순이익)를 통한 분류규칙을 적용하여 약 87%의 예측 정확도를 보여주었다. 로지스틱 회귀분석 기반의 관리종목 탐지 모형의 경우 ROE(세전계속사업이익)와 같은 구체적인 관리종목 지정 사유를 반영하면서 기업의 활동성에 초점을 맞추어 관리종목 지정 경향성을 설명하는 반면, 의사결정 관리종목 탐지 모형은 기업의 현금흐름을 중심으로 하여 관리종목 지정을 예측하는 것으로 나타났다.

로지스틱회귀모형을 활용한 아동학대 가족의 연구 (Study of child abuse families using logistic regression models)

  • 민대기;최미경
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1327-1336
    • /
    • 2016
  • 우리나라에서 발생하는 아동학대의 대부분은 가정 내에서 부모에 의해 발생하며 해가 갈수록 증가하는 추세이다. 성장기에 있는 아동을 대상으로 한 학대는 아동의 발달전반에 피해를 주며, 그 영향이 장기화되어 청소년기 부적응, 성인기 범죄로까지 이어지기 쉬우므로, 사회의 각별한 주의가 요구된다. 급변하는 사회 환경 속에서 맞벌이, 한 부모 가족 등 다양한 가족형태가 등장했으며, 취약한 경제구조속에서 가장들의 고용형태의 불안정은 가족들을 더욱 불안하게 만들고 있다. 이러한 환경 속에서 힘이 없는 아동은 무방비 상태로 부모로부터 신체적, 정신적 학대를 경험할 위험에 놓인다. 어려운 사회 경제적 환경 속에서 어떤 형태의 가정에서 아동학대가 많이 발생하는지에 대하여 회귀모형을 통하여 연구하였다.

데이터마이닝을 이용한 한우의 우수 지방산합성효소 유전자 조합 선별 (Major gene identification for FASN gene in Korean cattles by data mining)

  • 김병두;김현지;이성원;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1385-1395
    • /
    • 2014
  • 가축의 경제적인 특성은 환경적인 요인과 유전적인 요인의 영향을 받으며, 또한 하나의 유전자가 아닌 여러 유전자의 상호작용의 영향을 받는다고 알려져 있다. 본 논문에서는 선형회귀모형을 활용하여 환경적인 요인을 보정한 자료로 한우의 맛과 육질에 영향을 준다고 밝혀진 지방산합성효소의 단일염기다형성 5개를 이용해 한우의 경제 형질에 영향을 미치는 우수 유전자 조합을 선별하고 우수 유전자형을 밝힌다. 이를 위해 데이터마이닝 기법인 인공신경망, 로지스틱 회귀모형, C5.0, CART 기법을 이용하였다. 공정한 모형 평가를 위해 전체 데이터를 훈련용 데이터 (60%)와 검증용 데이터 (40%)로 나누었고, 훈련용 데이터에서 설정된 모형을 검증용 데이터에 적용시켜 정확도를 비교하였다. 그 결과 C5.0이 최적 모형으로 선정되었으며, C5.0의 의사결정나무를 통해 우수 유전자 조합을 선별하였다.

로지스틱 회귀모형과 의사결정 나무모형을 활용한 청소년 자살 시도 예측모형 비교: 2019 청소년 건강행태 온라인조사를 이용한 2차 자료분석 (Comparison of the Prediction Model of Adolescents' Suicide Attempt Using Logistic Regression and Decision Tree: Secondary Data Analysis of the 2019 Youth Health Risk Behavior Web-Based Survey)

  • 이윤주;김희진;이예슬;정혜선
    • 대한간호학회지
    • /
    • 제51권1호
    • /
    • pp.40-53
    • /
    • 2021
  • Purpose: The purpose of this study was to develop and compare the prediction model for suicide attempts by Korean adolescents using logistic regression and decision tree analysis. Methods: This study utilized secondary data drawn from the 2019 Youth Health Risk Behavior web-based survey. A total of 20 items were selected as the explanatory variables (5 of sociodemographic characteristics, 10 of health-related behaviors, and 5 of psychosocial characteristics). For data analysis, descriptive statistics and logistic regression with complex samples and decision tree analysis were performed using IBM SPSS ver. 25.0 and Stata ver. 16.0. Results: A total of 1,731 participants (3.0%) out of 57,303 responded that they had attempted suicide. The most significant predictors of suicide attempts as determined using the logistic regression model were experience of sadness and hopelessness, substance abuse, and violent victimization. Girls who have experience of sadness and hopelessness, and experience of substance abuse have been identified as the most vulnerable group in suicide attempts in the decision tree model. Conclusion: Experiences of sadness and hopelessness, experiences of substance abuse, and experiences of violent victimization are the common major predictors of suicide attempts in both logistic regression and decision tree models, and the predict rates of both models were similar. We suggest to provide programs considering combination of high-risk predictors for adolescents to prevent suicide attempt.

Prediction of drowning person's route using machine learning for meteorological information of maritime observation buoy

  • Han, Jung-Wook;Moon, Ho-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-12
    • /
    • 2022
  • 해양조난사고 발생 시 해상 익수자의 안전과 생명 보장을 위해 구조자산을 활용한 신속한 탐색 및 구조작전은 매우 중요하다. 본 연구는 해양관측부이에서 수집되는 기상정보에 다중선형회귀분석, 의사결정나무, 서포트벡터머신, 벡터자기회귀, 순환신경망의 LSTM을 활용하여 울릉도 북서해역의 표층해류를 분석하고 유향과 유속에 대한 각각의 예측모형을 구축하여 예측된 유향과 유속정보를 통해 해상 익수자의 이동경로를 예측하는 모형들을 제안한다. 본 연구에서 적용한 다양한 기계학습 모형을 MAE와 RMSE의 성능 평가척도로 비교해 볼 때 LSTM이 가장 우수한 성능을 보였다. 또한, 익수자 이동지점과 예측모형의 예측지점 간 거리 차이에 있어서도 LSTM이 다른 모형들에 비해 탁월한 성능을 나타내었다.

보행자통행량이 상가권리금에 미치는 영향의 평가 (Assessing the Impact of Pedestrian Traffic Volumes on Locational Goodwill)

  • 정승영
    • 지적과 국토정보
    • /
    • 제45권1호
    • /
    • pp.225-240
    • /
    • 2015
  • 통행하는 보행자의 특징이 상가권리금에 미치는 효과를 실증적으로 모형을 구축하고 시험 하였다. 이 연구를 위한 이론적 근거는 중심지 이론, 입찰지대, 집적이론, 외부수요 이론이다. 자료에는 서울시 100개 $3.3m^2$당 상권의 상가권리금, $3.3m^2$당 상가보증금, $3.3m^2$당 상가월세 그리고 보행자의 특성과 관련된 정보가 포함되어 있다. 실증분석은 서울시 상가 1,307개를 표본을 사용하여 시험하였다. 그리고 자료집합은 회귀나무 및 회귀방법을 이용하여 분석이 이루어졌다. 이 분석한 결과로서, 각각의 상권에서 상가권리금에 영향을 주는 변수는 평일 오후 2시 보행자의 통행량, 평일 오후 4시 보행자의 통행량, 평일 오후 8시 보행자의 통행량이다. 요약하면, 상권의 경제적 기반을 뿐만 아니라 통행 보행자의 특징은 상가권리금을 결정하기 위해 고려되어야한다.

데이터마이닝 기법을 활용한 노인장기요양급여 권고모형 개발 (A Recommending System for Care Plan(Res-CP) in Long-Term Care Insurance System)

  • 한은정;이정석;김동건;강임옥
    • 응용통계연구
    • /
    • 제22권6호
    • /
    • pp.1229-1237
    • /
    • 2009
  • 노인장기요양보험에서 가장 중요한 이슈는 급여대상자의 희망, 건강 및 기능상태에 따라 어떤 급여를 제공할 것인가 이다. 이를 해결하고자 노인장기요양보험의 보험자인 국민건강보험 공단은 급여대상자에게 '표준장기요양이용계획서'를 제공하고 있다. 본 연구에서는 표준장기요양이용계획 작성의 효율화 방안을 마련하고자 노인장기요양보험 3차 시범사업 표준이용계획 자료를 활용하여 노인장기요양급여 권고모형을 개발하였다. 모형개발에는 데이터마이닝의 의사결정나무모형, 로지스틱회귀모형, 앙상블 모형의 배깅과 부스팅 기법을 사용하였고, 이 중 실무자가 이해하기 쉬운 의사결정나무를 채택하여 권고모형을 설명 하였다. 본 연구는 노인장기요양보험 제도의 이용계획 수립의 객관성 및 과학성을 확보하고 이용계획 업무를 효율화하는 데에 기여할 것으로 기대된다.

기업도산예측을 위한 이진분류기법의 개발 (Developing a Binary Classification Method for Bankruptcy Prediction)

  • 민재형;정철우
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.619-624
    • /
    • 2007
  • 본 연구는 유전 알고리듬에 기반한 새로운 도산예측기법을 개발하고 그 기법의 타당성 및 예측 우수성을 검증하는데 목적이 있다. 본 연구에서 제안하는 이진분류기법은 도산기업과 비도산기업을 대표할 수 있는 가상기업(virtual company)을 설정하고, 그 가상기업과 분류대상 기업 간의 유사도를 측정하여 도산여부를 분류하는 방법론으로, 가상기업의 변수 값과 각 변수의 가중치는 훈련용 자료의 분류정확도를 극대화할 수 있도록 유전 알고리듬을 이용하여 구하게 된다. 본 연구에서 제안하는 기법의 타당성을 검증하기 위해 기존의 도산예측기법과 예측성과를 실험을 통해 비교한 결과, 본 연구에서 개발한 기법의 예측력이 기존의 다변량판별분석, 로지스틱 회귀모형, 의사결정나무, 인공신경망 모형보다 높은 수준을 보이는 것을 확인하였다.

  • PDF