• 제목/요약/키워드: 로지스틱 회귀모델

Search Result 191, Processing Time 0.029 seconds

Susceptibility Mapping of Umyeonsan Using Logistic Regression (LR) Model and Post-validation through Field Investigation (로지스틱 회귀 모델을 이용한 우면산 산사태 취약성도 제작 및 현장조사를 통한 사후검증)

  • Lee, Sunmin;Lee, Moung-Jin
    • Korean Journal of Remote Sensing
    • /
    • v.33 no.6_2
    • /
    • pp.1047-1060
    • /
    • 2017
  • In recent years, global warming has been continuing and abnormal weather phenomena are occurring frequently. Especially in the 21st century, the intensity and frequency of hydrological disasters are increasing due to the regional trend of water. Since the damage caused by disasters in urban areas is likely to be extreme, it is necessary to prepare a landslide susceptibility maps to predict and prepare the future damage. Therefore, in this study, we analyzed the landslide vulnerability using the logistic model and assessed the management plan after the landslide through the field survey. The landslide area was extracted from aerial photographs and interpretation of the field survey data at the time of the landslides by local government. Landslide-related factors were extracted topographical maps generated from aerial photographs and forest map. Logistic regression (LR) model has been used to identify areas where landslides are likely to occur in geographic information systems (GIS). A landslide susceptibility map was constructed by applying a LR model to a spatial database constructed through a total of 13 factors affecting landslides. The validation accuracy of 77.79% was derived by using the receiver operating characteristic (ROC) curve for the logistic model. In addition, a field investigation was performed to validate how landslides were managed after the landslide. The results of this study can provide a scientific basis for urban governments for policy recommendations on urban landslide management.

Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words) (속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구)

  • Eo, Kyun Sun;Lee, Kun Chang
    • Journal of Digital Convergence
    • /
    • v.17 no.2
    • /
    • pp.163-170
    • /
    • 2019
  • Over the past decade, the development of the Web explosively increased the data. Feature selection step is an important step in extracting valuable data from a large amount of data. This study proposes a novel opinion mining model based on combining feature selection (FS) methods with Word embedding to vector (Word2vec) and BOW (Bag-of-words). FS methods adopted for this study are CFS (Correlation based FS) and IG (Information Gain). To select an optimal FS method, a number of classifiers ranging from LR (logistic regression), NN (neural network), NBN (naive Bayesian network) to RF (random forest), RS (random subspace), ST (stacking). Empirical results with electronics and kitchen datasets showed that LR and ST classifiers combined with IG applied to BOW features yield best performance in opinion mining. Results with laptop and restaurant datasets revealed that the RF classifier using IG applied to Word2vec features represents best performance in opinion mining.

Machine Learning Based BLE Indoor Positioning Performance Improvement (머신러닝 기반 BLE 실내측위 성능 개선)

  • Moon, Joon;Pak, Sang-Hyon;Hwang, Jae-Jeong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.467-468
    • /
    • 2021
  • In order to improve the performance of the indoor positioning system using BLE beacons, a receiver that measures the angle of arrival among the direction finding technologies supported by BLE5.1 was manufactured and analyzed by machine learning to measure the optimal position. For the creation and testing of machine learning models, k-nearest neighbor classification and regression, logistic regression, support vector machines, decision tree artificial neural networks, and deep neural networks were used to learn and test. As a result, when the test set 4 produced in the study was used, the accuracy was up to 99%.

  • PDF

Risk Factors for Binge-eating and Food Addiction : Analysis with Propensity-Score Matching and Logistic Regression (폭식행동 및 음식중독의 위험요인 분석: 성향점수매칭과 로지스틱 회귀모델을 이용한 분석)

  • Jake Jeong;Whanhee Lee;Jung In Choi;Young Hye Cho;Kwangyeol Baek
    • Journal of the Korean Applied Science and Technology
    • /
    • v.40 no.4
    • /
    • pp.685-698
    • /
    • 2023
  • This study aimed to identify binge-eating behavior and food addiction in Korean population and to determine their associations with obesity, eating behaviors, mental health and cognitive characteristics. We collected clinical questionnaire scores related to eating problems (e.g. binge eating, food addiction, food cravings), mental health (e.g. depression), and cognitive functions (e.g. impulsivity, emotion regulation) in 257 Korean adults in the normal and the obese weight ranges. Binge-eating and food addiction were most frequent in obese women (binge-eating: 46.6%, food addiction: 29.3%) when we divided the participants into 4 groups depending on gender and obesity status. The independence test using the data with propensity score matching confirmed that binge-eating and food addiction were more prevalent in obese individuals. Finally, we constructed the logistic regression models using forward selection method to evaluate the influence of various clinical questionnaire scores on binge-eating and food addiction respectively. Binge-eating was significantly associated with the clinical scales of eating disorders, food craving, state anxiety, and emotion regulation (cognitive reappraisal) as well as food addiction. Food addiction demonstrated the significant effect of food craving, binge-eating, the interaction of obesity and age, and years of education. In conclusion, we found that binge-eating and food addiction are much more frequent in females and obese individuals. Both binge-eating and food addiction commonly involved eating problems (e.g. food craving), but there was difference in mental health and cognitive risk factors. Therefore, it is required to distinguish food addiction from binge-eating and investigate intrinsic and environmental risk factors for each pathology.

The Effect of Experienced Consumers' Concerns on Willingness to Purchase Battery Electric Vehicles (순수전기차 경험 고객의 우려 요인에 따른 전기차 구매 의사 영향)

  • Jeong, Jikhan
    • Journal of Digital Convergence
    • /
    • v.19 no.6
    • /
    • pp.143-162
    • /
    • 2021
  • Research on consumers' perception and willingness to purchase Battery Electric Vehicles (BEVs) is necessary to simulate BEVs' deployment in South Korea because South Korea's BEVs market is still in the early stage. This paper derives a theoretical framework for consumer segmentation based on consumers' willingness to purchase before and after BEV usage experience. In particular, this study empirically evaluates consumers' willingness to purchase and concerns using the survey data from BEVs users in either Seoul or the Jeju region. The empirical results from logit models show that experienced consumers' concerns about the heater and air conditioning (HAC) in BEVs decreased the consumers' willingness to buy, while greater daily driving distances increased the consumers' willingness to buy. In addition, the empirical findings from ordered probit models show that experienced consumers' concerns about the short driving distance, the availability of maintenance service (i.e., A/S service) during unexpected events, and the difficulties of driving BEVs up-hill increased the degree of concern about HAC. This paper will provide insights related to consumer segmentation, R&D, marketing strategies, and policy design for policymakers and firms.

Consumer Credit Scoring Model with Two-Stage Mathematical Programming (통합 수리계획법을 이용한 개인신용평가모형)

  • Lee, Sung-Wook;Roh, Tae-Hyup
    • The Journal of Information Systems
    • /
    • v.16 no.1
    • /
    • pp.1-21
    • /
    • 2007
  • 신용평점을 위한 부도예측의 분류 문제를 다루는데 있어서 통계적 판별분석 및 인공신경망 및 유전자알고리즘 등을 이용한 데이터 마이닝의 방법들이 일반적으로 고려되어왔다. 이 연구에서는 수리계획법을 응용하여 classification gap을 고려한 이단계 수리계획 접근방법을 신용평가에 적용하는 방법론을 제안하여 수리계획법을 통한 신용평가모형 구축의 가능성을 제시한다. 1단계에서는 선형계획법을 이용해서 대출 신청자에게 대출을 허가할 것 인지의 여부를 결정하게 되는 대출 심사 filtering으로의 적용단계이고, 2단계에서는 정수계획법을 이용하여 오분류 비용이 최소가 되도록 하는 판별점수를 찾는 과정으로 모형을 구성한다. 개인 대출 신청자의 데이터(German Credit Data)에 대하여 피셔의 선형 판별함수, 로지스틱 회귀모형 및 기존의 수리계획 기법들과의 비교를 통해서 제안된 모델의 성능을 평가한다. 이단계 수리계획 접근법의 평가 결과를 통하여 신용평가모형에의 적용가능성을 기존 통계적인 접근방법 및 수리계획 접근법과 비교하여 제시하고 있다.

  • PDF

Churn Prediction Model using Logistic Regression (Logistic Regression을 이용한 이탈고객예측모형)

  • Jeong, Han-Na;Park, Hye-Jin;Kim, Nam-Hyeong;Jeon, Chi-Hyeok;Lee, Jae-Uk
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2008.10a
    • /
    • pp.324-328
    • /
    • 2008
  • 금융산업에서 고객의 이탈비율은 기대수익에 영향을 미친다는 점에서 예측이 필요한 부분이며 최근 들어 정확한 예측을 통한 비용관리가 이루어지면서 고객 이탈을 예측하는 것이 중요한 문제로 떠오르고 있다. 그러나 보험 고객 데이터가 대용량이고 불균형한 출력 값을 갖는 특성으로 인해 기존의 방법으로 예측 모델을 만드는 것이 적합하지 않다. 본 연구에서는 대용량 데이터를 처리하는 데 효과적으로 알려져 있는 Trust-region Newton method를 적용한 로지스틱 회귀분석을 통해 이탈고객을 예측하는 것을 주된 연구로 하며, 불균형한 데이터에서의 예측정확도를 높이기 위해 Oversampling, Clustering, Boosting 등을 이용하여 고객 데이터에 적합한 이탈 고객 예측 모형을 제시하고자 한다.

  • PDF

Altering LCA of dependency parse trees for improving relation extraction from adjective clauses (형용사구에서의 관계추출 개선을 위한 의존구문트리의 최소공동조상 (LCA) 변경)

  • Lee, Dae-Seok;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.552-556
    • /
    • 2018
  • 본 논문에서는 텍스트에서 개체(entity) 간 관계(relation) 추출 문제에서 의존구문트리를 이용하여 자질을 추출할 때 형용사구 내에 관계가 나타나는 경우의 성능을 향상시키는 방법을 제안한다. 일률적으로 의존구문트리의 최소공동조상(LCA: Least Common Ancestor)을 이용하는 일반적인 방법보다 형용사구가 나타날 때는 형용사구의 술어를 대신 이용하는 것이 더 좋은 자질이 된다는 것을 제안하고 로지스틱 회귀분석, SVM(linear), SVM(exponential kernel)을 이용한 실험들을 통해 그 효과를 확인하였다. 이는 트리커널을 이용한 것과 같이 의존구문트리의 최소공동조상이 주요한 역할을 하는 관계추출 모델들의 성능을 높일 수 있음을 보여 준다. 수행한 실험 과정을 통해 관계추출 데이터 셋에서 형용사구 내 관계를 포함하는 문장이 전체에서 차지하는 비율이 낮을 경우 생길 수 있는 문제를 추가적으로 얻을 수 있었다.

  • PDF

Extracting Significant Information from Social Text using Machine Learning (기계학습을 활용한 소셜 텍스트의 주요 정보 추출 기법)

  • Kim, So-Hyeon;Kim, Han-joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.742-745
    • /
    • 2016
  • 빅데이터 시대를 맞이하여 텍스트마이닝과 오피니언마이닝의 활용도가 커지고 있는 시점에서 소셜 네트워크 데이터로부터 유용한 데이터를 추출하는 작업은 매우 중요하다. 이에 본 논문은 블로그 HTML 문서에서 추출한 태그 특징에 로지스틱 회귀 및 앙상블 기법을 적용하여 본문을 포함하는 태그를 분류하는 모델을 구성한 뒤 태그의 깊이 특징을 이용하여 주요 본문을 찾는 방법을 제안한다. 직접 수집한 데이터를 이용한 실험에서 태그 분류 정확도가 0.990, 본문을 찾아낸 문서의 비율이 80.5%로 나왔다.

A Study on the Use Experience of Drug Information Search Site in Korea - Focused on National Search Site and Private Business Search Site - (국내 의약품 정보 검색 사이트 사용 경험 연구 - 국가검색사이트와 사기업검색사이트 중심으로 -)

  • Jang, Jeong-In
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2018.08a
    • /
    • pp.73-77
    • /
    • 2018
  • 본 연구는 국내 의약품 검색 사이트를 국가와 사기업의 두 그룹으로 나누어 사용 경험을 평가하였다. 피터 모빌의 허니콤 모델을 해당 연구에 맞게 수정하여 편리성, 정보접근성의 차이점, 그리고 신뢰도에 대한 설문 조사지를 작성하였다. 일반인을 대상으로 총 18개의 문항으로 설문을 진행하였으며, 구글 설문지를 통해 10대에서 60대까지의 219명에게 답변을 받았다. 분석방법은 다중로지스틱회귀분석으로 사용경험이 재방문 여부에 미치는 영향을 살펴보았다. 설문결과 91%가 사기업 사이트를 더 선호하였다. 본 연구는 향후 개발될 의약품 정보 검색과 앱개발에 기반자료가 될 수 있고 보다 편리한 검색환경의 개선 자료로 활용될 수 있음에 그 의의가 있다.

  • PDF