• 제목/요약/키워드: logistic regression analysis

검색결과 4,322건 처리시간 0.039초

통계 분석을 통한 산사태 토석류 전이규준 모델 (A Statistical Mobilization Criterion for Debris-flow)

  • 윤석;이승래;강신항;박도원
    • 한국지반공학회논문집
    • /
    • 제31권6호
    • /
    • pp.59-69
    • /
    • 2015
  • 최근 들어 집중호우로 인한 산사태 및 토석류 피해가 종종 발생하고 있다. 이에 따라 산사태 재해 예측에 관한 연구 중 산사태 민감도 분석과 토석류 위험도 분석 관련 연구는 활발하게 진행되어 왔지만, 사면 지역에 적용하기 적합한 전이 분석 관련 연구는 부족한 실정이다. 본 연구에서는 판별분석과 로지스틱 회귀 분석과 같은 통계적 방법을 이용하여 실제 토석류가 발생했던 지역에서 추출한 지형학적 인자, 지질학적 인자 등을 토대로 토석류 전이규준을 제시하였다. 10개의 지형학적 및 지질학적 인자가 독립변수로 사용되었으며 실제 466개소(비전이: 228개소, 전이: 238개소)의 토석류 비전이 및 전이 데이터가 수집되었다. 우선, Fisher의 판별 분석이 수행되었으며, 수행 결과 실제경우와 91.6%의 분류 정확도를 보였다. 하지만 전이와 비전이 두 그룹간의 공분산 동질성이 만족되지 않았으며 또한 독립변수들이 정규분포를 보이지도 않았다. 두 번째로 이항 로지스틱 회귀분석이 수행되었으며, 분석 결과 92.3%의 분류 정확도를 나타냈으며 모든 통계적 조건들도 유의하게 나타났다. 따라서 이항 로지스틱 회귀 분석을 이용한 전이 규준은 토석류 재해 발생 여부를 예측하는데 효과적으로 사용될 수 있을 것으로 판단된다.

사전검사를 통한 고립성 폐결절 환자에서의 악성 확률 타당성에 대한 연구 (A Study to Validate the Pretest Probability of Malignancy in Solitary Pulmonary Nodule)

  • 장주현;박성훈;최정희;이창률;황용일;신태림;박용범;이재영;장승훈;김철홍;박상면;김동규;이명구;현인규;정기석
    • Tuberculosis and Respiratory Diseases
    • /
    • 제67권2호
    • /
    • pp.105-112
    • /
    • 2009
  • Background: Solitary pulmonary nodules (SPN) are encountered incidentally in 0.2% of patients who undergo chest X-ray or chest CT. Although SPN has malignant potential, it cannot be treated surgically by biopsy in all patients. The first stage is to determine if patients with SPN require periodic observation and biopsy or resection. An important early step in the management of patients with SPN is to estimate the clinical pretest probability of a malignancy. In every patient with SPN, it is recommended that clinicians estimate the pretest probability of a malignancy either qualitatively using clinical judgment or quantitatively using a validated model. This study examined whether Bayesian analysis or multiple logistic regression analysis is more predictive of the probability of a malignancy in SPN. Methods: From January 2005 to December 2008, this study enrolled 63 participants with SPN at the Kangnam Sacred Hospital. The accuracy of Bayesian analysis and Bayesian analysis with a FDG-PET scan, and Multiple logistic regression analysis was compared retrospectively. The accurate probability of a malignancy in a patient was compared by taking the chest CT and pathology of SPN patients with <30 mm at CXR incidentally. Results: From those participated in study, 27 people (42.9%) were classified as having a malignancy, and 36 people were benign. The result of the malignant estimation by Bayesian analysis was 0.779 (95% confidence interval [CI], 0.657 to 0.874). Using Multiple logistic regression analysis, the result was 0.684 (95% CI, 0.555 to 0.796). This suggests that Bayesian analysis provides a more accurate examination than multiple logistic regression analysis. Conclusion: Bayesian analysis is better than multiple logistic regression analysis in predicting the probability of a malignancy in solitary pulmonary nodules but the difference was not statistically significant.

화물운송수단선택모형을 이용한 영업용화물차량 이용 활성화 방안 연구 (Study on Revitalizing Commercial Freight Vehicles Using Freight Transport Mode Selection)

  • 김민영;강경우
    • 한국ITS학회 논문지
    • /
    • 제6권2호
    • /
    • pp.57-69
    • /
    • 2007
  • 도시 내 물류 활동과 관련하여 직면한 중요한 문제 중 하나는 교통체증 심화에 따른 수송효율성 저하이다. 이러한 교통체증의 심화는 화물차량의 평균 통행속도를 감소시켜 운행효율을 저하시키는 것은 물론 수송비용을 증가시켜 궁극적으로 물류비 증가를 초래하고 있다. 이러한 물류비의 상승은 선진물류체계로 전환하는 과정에 있어서 장애가 되는 주요 원인으로 작용하고 있다. 따라서 본 연구에서는 대부분 자가용 화물차량이 1톤 이하의 소형트럭임을 감안할 때 이러한 자가용 화물차량의 증가가 교통 혼잡의 원인이 되어 수송비 증가와 그에 따른 물류비 상승으로 연결되는 문제를 해결하기 위해 실측 조사된 RP (Revealed Preference)자료를 이용한 로지스틱 회귀분석으로 영업용 화물차량 선택에 영향을 주는 요인을 분석하고자 하였으며, 이에 따른 영업용 화물차량 이용 장려 정책을 제시하고자 한다.

  • PDF

디지털 운행기록에 근거한 시내버스 운전자의 사고발생 예측모형 개발 (Development for City Bus Dirver's Accident Occurrence Prediction Model Based on Digital Tachometer Records)

  • 김정열;금기정
    • 한국ITS학회 논문지
    • /
    • 제15권1호
    • /
    • pp.1-15
    • /
    • 2016
  • 본 연구는 시내버스 운전자의 실제 운행기록 정보를 토대로 사고발생 가능성을 내포한 운전자를 판단할 수 있는 모형개발을 목적으로 하였다. 본 연구를 위하여 사고발생 운전자 및 사고 미발생 운전자의 실제 운행기록 정보에서 교통사고와 관련한 유의변수를 도출하는 한편, 판별분석(Discriminant Analysis) 및 로지스틱회귀분석(Logistic Regression Analysis)을 적용하여 개발된 분류모형에 대한 모형간 정확도를 비교하였다. 또한, 개발된 모형을 다른 운전자들의 운행기록자료에 적용하여 모형의 정확도를 검증하였다. 사고발생 가능성을 내포한 운전자 분류모형을 개발한 결과 감속도($X_{deceleration}$) 및 우측방향 가속도($Y_{right}$)가 동시에 작용할 때 이 변수가 사고발생 운전자 분류의 최적 요인변수로 도출되었으며, 판별분석에 의한 예측모형은 최대 62.8%, 로지스틱회귀분석에 의한 예측모형은 최대 76.7%의 비율로 사고 발생 운전자 분류가 가능한 것으로 나타났다. 또한, 모형 예측력에 대한 검증결과 84.1%의 적중률을 보이는 것으로 나타났다.

건강행위정보기반 고혈압 위험인자 및 예측을 위한 통계분석 (Statistical Analysis for Risk Factors and Prediction of Hypertension based on Health Behavior Information)

  • 허병문;김상엽;류근호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.685-692
    • /
    • 2018
  • 본 연구는 통계분석을 이용한 중년 성인의 고혈압 예측모델 개발이 목적이다. 국민건강영양조사자료(2013년-2016년)를 사용하여 통계분석과 예측모델을 개발하였다. 이진 로지스틱 회귀분석으로 통계적 유의한 고혈압 위험인자를 제시하였으며, Wrapper 변수선택기법을 적용한 로지스틱회귀와 나이브베이즈 알고리즘을 이용하여 예측모델을 개발하였다. 통계분석에서 고혈압에 가장 높은 연관성을 갖는 인자는 남성에서 WHtR (p<0.0001, OR = 2.0242), 여성에서 AGE(p<0.0001, OR = 3.9185)로 나타났다. 예측모델의 성능평가에서, 로지스틱 회귀 모델이 남성(AUC = 0.782)과 여성(AUC = 0.858)에서 가장 좋은 예측력을 보였다. 우리의 연구 결과는 고혈압에 대한 대규모 스크리링 도구를 개발하는데 중요한 정보를 제공하며, 고혈압 연구에 대한 기반정보로 활용할 수 있다.

공공 DB 데이터마이닝 기법을 활용한 국내 청소년 삶의 만족도 분석에 관한 실증연구: 의사결정나무 기법을 중심으로 (Analysis of Korean Adolescents' Life Satisfaction based on Public Database and Data Mining Techniques: Emphasis on Decision Tree)

  • 조현진;고건우;이건창
    • 디지털융복합연구
    • /
    • 제18권6호
    • /
    • pp.297-309
    • /
    • 2020
  • 본 연구는 국내 공공 DB에 데이터마이닝 기법인 로지스틱 회귀분석과 의사결정나무 분석을 적용하여 국내 청소년의 삶의 만족도 증진에 관한 의미 있는 의사결정 규칙을 추출하는 과정을 분석한다. 분석을 위하여 한국아동·청소년패널조사(KYCPS) 중에서 중1 패널데이터의 4~6차연도 자료인 고등학생 학년별 자료를 활용하였다. 로지스틱 회귀분석으로 추출된 영향요인은 1학년은 전체 성적 만족도, 주의집중 문제, 우울, 자아 탄력성, 애정, 과잉간섭, 학습활동, 교사관계, 2학년은 가정의 경제 수준, 건강상태, 전체 성적 만족도, 신뢰, 소외, 학습활동, 학교규칙, 교우관계, 교사 관계, 3학년은 가정의 경제 수준, 전체 성적 만족도, 우울, 자아 탄력성, 애정, 학대, 학교규칙, 교사 관계로 나타났다. 의사결정나무 기법을 적용한 결과 국내 고등학생의 삶의 만족도는 개인의 정서 문제, 학교성적, 가정의 경제적 환경, 학교적응 등에 의하여 복합적으로 영향을 받는 것으로 파악되었다.

로지스틱회귀분석기법과 인공신경망기법을 이용한 제주지역 산사태가능성분석 (The Landslide Probability Analysis using Logistic Regression Analysis and Artificial Neural Network Methods in Jeju)

  • 권혁춘;이병걸;이창선;고정우
    • 대한공간정보학회지
    • /
    • 제19권3호
    • /
    • pp.33-40
    • /
    • 2011
  • 본 연구에서는 제주지역의 산사태가능성을 분석하기 위하여 사람의 발길이 많은 사라봉, 별도봉 지역과 송악산 지역의 지형 및 토질공학적 사면 붕괴 유발 인자들을 이용하여 로지스틱회귀분석기법과 인공신경망기법을 GIS기법과 결합하여 예측지도를 작성하고 비교분석하였다. 산사태 예측지도를 작성하기 위해서 산사태 발생에 영향을 주는 사면경사, 고도, 건조밀도, 투수계수, 간극율을 선택하였으며 선정된 지역을 대상으로 실시한 야외조사와 토양물성시험 결과를 정리한 후 이를 토대로 GIS기법을 적용하여 각 레이어별 주제도를 작성하였다. 생성된 주제도를 각각 로지스틱회귀분석기법과 인공신경망기법으로 작성하여 비교분석한 결과 사면경사와 간극율의 경중률이 가장 높게 나타났고, 예측지도는 로지스틱회귀분석기법이 더욱 정확한 결과를 나타내었으며, 도로변과 산책로를 중심으로 산사태 발생가능성이 높게 분포하고 있음을 알 수 있었다.

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

로지스틱 회귀분석과 판별분석을 활용한 광주광역시의 폭염에 미치는 영향분석 (Analysis of the Impact of Heatwaves in Gwangju using Logistic Regression and Discriminant Analysis)

  • 김윤수;공영선;장인홍
    • 통합자연과학논문집
    • /
    • 제17권2호
    • /
    • pp.33-41
    • /
    • 2024
  • Abnormal climate is a phenomenon in which meteorological factors such as temperature and precipitation are significantly higher or lower than normal, and is defined by the World Meteorological Organization as a 30-year period. However, over the past 30 years, abnormal climate phenomena have occurred more frequently around the world than in the past. In Korea, abnormal climate phenomena such as abnormally high temperatures on the Korean Peninsula, drought, heatwave and heavy rain in summer are occurring in March 2023. Among them, heatwaves are expected to increase in frequency compared to other abnormal climates. This suggests that heatwave should be recognised as a disaster rather than just another extreme weather event. According to several previous studies, greenhouse gases and meteorological factors are expected to affect heatwaves, so this paper uses logistic regression and discriminant analysis on meteorological element data and greenhouse gas data in Gwangju from 2008 to 2022. We analyzed the impact of heatwaves. As a result of the analysis, greenhouse gases were selected as effective variables for heatwaves compared to the past, and among them, chlorofluorocarbons were judged to have a stronger effect on heatwaves than other greenhouse gases. Since greenhouse gases have a significant impact on heatwaves, in order to overcome heatwaves and abnormal climates, greenhouse gases must be minimized to overcome heatwaves and abnormal climates.

태음인 수면의 임상적 특징 (로지스틱 회귀분석을 이용하여) (A Study on the Clinical Features of the Ordinary Sleeping Patterns of Taeumin Using Logistic Regression)

  • 최정락;최재영;이영섭;박성식
    • 사상체질의학회지
    • /
    • 제16권3호
    • /
    • pp.18-24
    • /
    • 2004
  • 1. Objectives This study is for discovering the characteristics of the sleep in ordinary symptoms based on the Sasang Constitution. The result of this study could be helpful to understand and to identify the patients as Taeumin by contrast with non-Taeumin. 2. Methods There were 1,229 patients(529 men), who answered the questionnaire about their ordinary sleep patterns. They had been diagnosed, including their Sasang Constitution, by the Sasang Constitution specialist at Bundang Oriental Hospital of Dongguk university. Applying the binary logistic regression analysis to each item about ordinary sleep patterns and the diagnosed Sasang Constitution, we can measure the characteristics and influence of ordinary sleep patterns to the dependent variable(Sasang Constitution). 3. Results As a result of the binary logistic analysis on the observed questionnaire, we found the similar features of the ordinary sleep patterns on Taeumin by contrast with non-Taeumin. In order of influence that identify Taeumin or non-Taeumin, first, Taeumin has a tendency that he will snore well or frequently. Second, Taeumin has a tendency that he will not dream, when he sleeps by contrast with non-Taeumin. 4. Conclusions This study will be used to identify patients as Taeumin or non-Taeumin by means of a reference tool.

  • PDF