• 제목/요약/키워드: 로지스틱모델

검색결과 240건 처리시간 0.021초

시프트 시그모이드 분류함수를 가진 로지스틱 회귀를 이용한 신입생 중도탈락 예측모델 연구 (A Study of Freshman Dropout Prediction Model Using Logistic Regression with Shift-Sigmoid Classification Function)

  • 김동형
    • 디지털산업정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.137-146
    • /
    • 2023
  • The dropout of university freshmen is a very important issue in the financial problems of universities. Moreover, the dropout rate is one of the important indicators among the external evaluation items of universities. Therefore, universities need to predict dropout students in advance and apply various dropout prevention programs targeting them. This paper proposes a method to predict such dropout students in advance. This paper is about a method for predicting dropout students. It proposes a method to select dropouts by applying logistic regression using a shift sigmoid classification function using only quantitative data from the first semester of the first year, which most universities have. It is based on logistic regression and can select the number of prediction subjects and prediction accuracy by using the shift sigmoid function as an classification function. As a result of the experiment, when the proposed algorithm was applied, the number of predicted dropout subjects varied from 100% to 20% compared to the actual number of dropout subjects, and it was found to have a prediction accuracy of 75% to 98%.

한국 NPL시장 수익률 예측에 관한 연구 (A study on the prediction of korean NPL market return)

  • 이현수;정승환;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.123-139
    • /
    • 2019
  • 국내 NPL (Non performing loan) 시장은 1998년에 형성되었지만, 본격적으로 활성화 된 시기는 2009년으로 역사가 짧은 시장이다. 이로 인해 NPL 시장에 대한 연구도 아직까지는 활발히 진행되지 않고 있는 상황이다. 본 연구는 NPL 시장의 각 물건 별 기준 수익률 달성 유무를 예측할 수 있는 모델을 제안한다. 모델 구축에 사용되는 종속변수는 물건 별 최종 수익률이 기준 수익률 수치 도달 여부를 나타내는 이항변수를 사용하였고, 독립변수로는 물건의 특성을 나타내는 11개의 변수를 대상으로 one to one t-test와 logistic regression stepwise, decision tree를 수행하여 의미있는 7개의 독립변수를 선별하였다. 그리고 통상적으로 사용되는 기준 수익률 수치(12%)가 의미있는 기준 수치인지 확인하기 위해 수치 값을 조절해가며 종속변수를 산출하여 예측모델을 구축해보았다. 그 결과 12%의 기준 수익률 수치로 산출한 종속변수를 이용하여 구축한 예측모델의 평균 Hit ratio가 64.60%로 가장 우수하다는 결과를 얻었다. 다음으로 선별된 7개의 독립변수들과 12%를 기준으로한 수익률 달성유무 종속변수를 이용하여 판별분석, 로지스틱 회귀분석, 의사결정나무, 인공신경망, 유전자알고리즘 선형 모델의 5가지 방법론을 적용해 예측모델을 구축해보았다. 5가지 방법론으로 도출한 예측 모델 간 Hit ratio를 비교한 결과 인공신경망을 이용하여 구축한 예측모델의 Hit ratio가 67.4%로 가장 우수한 결과를 도출해내었다. 본 연구를 통해 추후 NPL시장 신규 물건 매매에 있어서 7가지의 독립변수들과 인공신경망 예측 모델을 활용하는 것이 효과적임을 증명하였다. 물건의 12% 수익률 달성 여부를 사전에 예측해봄으로써 유동화회사가 투자 의사결정을 하는 데에 도움을 줄 것으로 예상하며, 나아가 NPL 시장의 거래가 적정한 가격 선에서 진행됨으로 인해 유동성이 더욱 높아질 것이라 기대한다.

WebGIS 기반의 시뮬레이션 시스템을 위한 지리공간 시뮬레이션 프레임워크 개발 (Development of Geospatial Simulation Framework for WebGIS-based Simulation System)

  • 이성규;김영섭;최철웅;서용철
    • Spatial Information Research
    • /
    • 제18권5호
    • /
    • pp.119-131
    • /
    • 2010
  • 연구자가 공간자료를 이용하기 위해서는 자료 포맷 분석, 리포맷팅, 지도투영 변환 등의 반복된 작업이 필요하다. 연구자는 이러한 문제를 해결하기 위해 개발자와 함께 웹 기반의 시뮬레이션 시스템을 구축하고 있다. 하지만, 공간자료를 이용하는 웹 기반의 시스템에 적절한 시뮬레이션 프레임워크가 없어 효율적인 개발에 어려움이 있다. 본 연구에서는 웹 기반 시스템에 효율적으로 적용할 수 있는 지리 공간 시뮬레이션 프레임워크를 설계하고 제안하였다. 프레임워크의 모듈은 웹 매핑 서비스, Geographic Information System(GIS) 매핑, 통계, 모델, 프로세싱, 그래픽, 공간 데이터세트 등 7개의 모듈로 구성되었다. 프레임워크의 효율성 평가를 위해 도시 성장을 사례로 검증하였으며, 공간정보분야에 전문지식이 없는 비전문가라도 공간자료를 활용한 웹 기반의 시스템 구축이 쉬울 것으로 생각한다.

신경망을 이용한 초등학생 컴퓨터 활용 능력 예측 (Prediction of Elementary Students' Computer Literacy Using Neural Networks)

  • 오지영;이수정
    • 정보교육학회논문지
    • /
    • 제12권3호
    • /
    • pp.267-274
    • /
    • 2008
  • 신경망은 데이터로부터 반복적인 학습 과정을 통해 숨어 있는 패턴을 찾아내고, 새로운 데이터의 목표값에 대한 정확한 예측에 유용한 모델링 기법이다. 본 논문은 개인적인 특성, 가정 사회적 환경, 타 교과 성적을 이용하여 학생의 컴퓨터 활용 능력 예측을 위한 다층 인식모형(MLP) 신경망을 구축하였다. 신경망의 인식률은 예측 방법으로 널리 활용되고 있는 로지스틱 회귀분석 모델과 비교하였다. 개발한 신경망에 대한 실험 결과, 개인적인 특성이 학생들의 컴퓨터 활용 능력을 가장 잘 설명하는 요소이며, 반면 가정 사회적 환경은 가장 낮은 예측 요소임을 발견하였다. 또한 본 연구의 신경망 모델은 회귀분석보다 더욱 높은 인식률을 나타냈다.

  • PDF

Real-time Laying Hens Sound Analysis System using MFCC Feature Vectors

  • Jeon, Heung Seok;Na, Deayoung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권3호
    • /
    • pp.127-135
    • /
    • 2021
  • 산란계사와 같이 매우 좁은 환경에서 많은 개체를 사육하는 경우 작은 환경 변화에도 큰 피해를 받을 수 있다. 이와 같은 문제를 해결하기 위해 본 연구에서는 끊임없이 소리를 발생하는 산란계의 특성을 이용하여 산란계 발성음 분석 시스템을 제안한다. 기존의 산란계 발성음 시스템은 산란계사의 제한된 상황만을 고려하거나 실제 산란계사에 적용하기에는 어려움을 가지고 있다. 이러한 문제를 극복하기 위하여 본 논문에서는 MFCC 특징 벡터를 이용한 9가지의 산란계 소리 분석을 통해 실제 산란계사 환경에서 발생하는 수 있는 7가지의 상황을 실시간으로 감지할 수 있는 새로운 산란계 발성음 분석 모델을 제안한다. 본 논문에서 제안한 분석 모델을 실제 산란계사에서 성능 평가를 진행한 결과, 평균 AUC 0.93의 분류 성능을 나타내어 기존의 주파수 기반의 특징 분석 방법에 비해 약 43% 향상된 결과를 보여주었다.

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

동적 움직임 변화를 반영한 에이전트 기반 코로나-19 시뮬레이션: 접촉자 발견 수준에 따른 감염 변화 (Agent-Based COVID-19 Simulation Considering Dynamic Movement: Changes of Infections According to Detect Levels)

  • 이종성
    • 한국시뮬레이션학회논문지
    • /
    • 제30권1호
    • /
    • pp.43-54
    • /
    • 2021
  • 2019년 말 코로나19(중증급성 호흡기 증후군 코로나 바이러스 타입 2)가 발견된 이후로 전세계적으로 퍼져나가고 있다. 본 연구에서는 접촉자 발견 수준이 바이러스 전파에 미치는 영향을 파악하기 위해서 현재 대한민국의 코로나19 전파 상황을 반영한 에이전트 기반 시뮬레이션 모델을 소개한다. 본 연구에서는 실제적인 시뮬레이션 모델 개발을 위해 대한민국 내 관련 데이터를 수집하고 그 확률분포를 추정하였다. 감염, 격리, 회복, 사망의 전체 감염 프로세스를 도식화하였으며 사람들의 상호작용을 교통량 데이터를 기반으로 하여 모델링 하였다. 사회적 거리 두기 같은 정부 시책에 대한 사람들의 순응도를 반영하기 위해 합성 로지스틱 함수를 활용하였다. 접촉자 발견 수준에 따른 감염 양상 변화를 파악하기 위해 발견 수준을 0%에서 100%까지 변화 시켰다. 그 결과 적극적인 접촉자 추적이 바이러스 확산을 효과적으로 제한하고 제한의 효과가 접촉자 발견 수준이 증가함에 따라 기하급수적으로 증가하는 것을 확인하였다.

수소차를 포함한 연료유형에 따른 자동차 수요 분석 (Analysis of Vehicle Demand by Fuel Types including Hydrogen Vehicles)

  • 박유현;김지영;이윤
    • 자원ㆍ환경경제연구
    • /
    • 제32권3호
    • /
    • pp.167-190
    • /
    • 2023
  • 본 논문은 서베이 데이터를 이용하여 한국의 연료유형에 따른 자동차의 잠재적 수요를 분석한다. 종속변수는 휘발유, 경유, 하이브리드, 전기, 수소를 포함한 향후 희망 자동차 연료유형이며, 주요 설명변수는 응답자의 인구학적 특성과 희망 자동차 연료 유형 선택 시 고려사항, 주성분분석으로 추출한 환경에 대한 인식이다. 다항로지스틱모델을 이용한 분석결과는 다음과 같다. 연비와 운행편의를 고려하는 응답자들의 하이브리드차에 대한 수요는 높아지는 반면에 전기차와 수소차에 대한 수요는 낮아진다. 환경에 대한 부정적인 인식이 있는 응답자들의 휘발유차와 경유차에 대한 수요는 높아지는 반면 전기차에 대한 수요가 낮아진다. 환경에 대한 우려를 표하는 응답자들의 하이브리드차에 대한 수요는 증가하는 반면에 전기차에 대한 수요는 감소한다. 이와 대조적으로, 환경 친화적인 응답자들의 경유차에 대한 수요는 감소한다.

당동만의 빈산소 발생 예측 (The Prediction of Hypoxia Occurrence in Dangdong Bay)

  • 강훈;권민선;유선재;김종구
    • 해양환경안전학회지
    • /
    • 제26권1호
    • /
    • pp.65-74
    • /
    • 2020
  • 본 연구에서는 당동만을 중심으로 빈산소가 발생하는 물리적 해양환경 특성을 파악하고, 로지스틱 회귀분석을 이용해 빈산소 발생확률을 예측하였다. 관측 자료를 분석한 결과, 브런트-바이살라 주파수는 수심이 깊은 만 입구보다 수심이 얕은 만 내측에서 더 크게 나타났다. 이는 당동만 내측에서 담수 유입으로 인해 표층 염분이 낮아져 강한 밀도 성층이 형성되었기 때문이다. 시간적으로는 6월 ~ 9월까지 리차드슨 수와 브런트 바이살라 주파수가 매우 높게 나타났고, 9월 2일 이후로는 성층이 완화되어 감소하는 경향을 보였다. 당동만에서 관측된 용존산소 및 수온, 염분 자료를 분석한 결과, 저층의 용존산소 농도는 공통적으로 표층과 저층의 수온차에 가장 큰 영향을 받는 것으로 나타났다. 한편, 수심차(dz)를 고정된 변수로 두고, 수온차(dt)의 변화에 의한 빈산소의 발생 확률의 변화를 계산한 결과, 수심차(dz)가 각각 5 m, 10 m, 15 m, 20 m일 경우, 수온차(dt)는 8℃, 7℃, 5℃, 3℃일 때 빈산소 발생확률이 70 %를 상회하는 것으로 나타났다. 이는 당동만에서 수심차(dz)가 커질수록 빈산소 발생에 필요한 수온차(dt)는 작아지게 된다는 것을 뜻하며, 특히 당동만에서 수심차(dz)가 20 m 내외인 지역은 빈산소가 발생하기 매우 쉬운 환경이라는 것을 알 수 있었다.

손해배상액과 무효심판 판례를 이용한 특허 로열티율 산정 회귀모형 (Regression Models for Determining the Patent Royalty Rates using Infringement Damage Awards and Inter-Partes Review Cases)

  • 양동홍;강근석;김성철
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.47-63
    • /
    • 2018
  • 무형자산의 가치평가에 많이 사용되고 있는 수익접근법과 시장접근법의 특성을 모두 가지고 있는 로열티공제법을 사용하여 지식재산권의 경제적 가치를 평가할 때, 로열티공제법의 중요한 투입변수인 로열티율을 객관적으로 산정하는 수리적 모형을 제시한다. 이를 위하여 미국의 특허침해 손해배상액을 로열티율로 산정한 판례를 참고로 하여 로열티율을 종속변수로, 당해 특허권의 특허지표를 독립변수로 하여 로열티율 산정 회귀모형을 적용한다. 또한 미국의 당사자계재심(Inter-Partes Review)판례를 참고로 하여 특허무효거절 결과를 종속변수로 하고 당해 특허권의 특허지표를 독립변수로 하여 로지스틱회귀 모형을 적합시킨다. 최종 로열티율은 위의 로열티율 산정 회귀모형에서 산출된 로열티율과 로지스틱회귀모형에서 산출된 특허무효거절 확률을 결합하여 산정한다. 마지막으로, 본 논문에서 구축된 모형에 의해 산정된 로열티율과 기준 방식에 의해 산정된 로열티율을 비교하여 제안된 모형의 객관성과 신뢰성을 분석한다.