• Title/Summary/Keyword: 로지스틱회귀분석기법

Search Result 155, Processing Time 0.022 seconds

투자대상 벤처기업의 선정을 위한 전문가시스템 개발

  • 김성근;김지혜
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.10a
    • /
    • pp.139-148
    • /
    • 1999
  • 오늘날 기술집약적인 벤처기업들에 대한 관심이 집중되고 있다. 소수의 진취적인 벤처기업들이 기술개발 및 신상품 개발 등 두드러진 활약을 보이고 있기 때문이다. 그러나 실제 이 벤처기업의 성공 가능성은 그렇게 높지 않다. 특히 벤처기업 환경이 아직 미약한 국내의 경우 위험부담이 훨씬 더 크다. 이러한 벤처기업 환경에서 투자대상 벤처기업을 선정하는 것은 매우 전략적인 의사결정이다. 일반적으로 일반 벤처투자가들은 관심이 있는 산업에 해당하는 기업의 사업계획서와 기초적인 관련 정보를 토대로 투자여부를 결정한다. 그렇지만 실제로는 이와 같은 분석에 필수적으로 요구되는 정보가 불확실할 뿐만 아니라 기술분야에 대한 전문적 지식도 부족하기 때문에 투자 여부를 결정하는 것은 매우 복잡하고 어려운 문제이다. 그러므로 투자대상 벤처기업의 선정을 효과적으로 지원해주는 체계적인 접근이 필요하다. 특히 벤처 사업과 관련된 기술 동향 및 수준 등에 관련된 전문 지식과 경험이 체계적으로 제공되어야 하고 또한 벤처 투자가의 개인적 경험과 판단이 평가 프로세스에 직접적으로 반영될 수 있어야 한다. 이에 본 연구에서는 전문가의 지식과 경험을 체계화하고 투자가의 개인적 판단을 효과적으로 수용할 수 있는 전문가시스템의 접근방법을 제시하고자 한다. 투자대상 벤처기업의 선정을 위한 전문가시스템을 구축하기 위해 본 연구에서는 다양한 정보수집 과정을 거쳤다. 우선 벤처 투자와 관련된 기존 문헌을 심층 분석하였으며 아울러 벤처 투자 업계에서 활약중인 전문 벤처캐피탈리스트들과의 수차례 인터뷰를 통해 벤처기업 평가의 주요 요인과 의사결정 과정을 파악할 수 있었다. 이러한 과정을 통하여 본 연구에서는 벤처 투자의 90%를 차지하는 정보통신분야에 속한 기법 중에서 투자대상 벤처기업의 선정을 위한 전문가시스템을 구축중이다.의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.ting LMS according to increasing the step-size parameter $\mu$ in the experimentally computed. learning curve. Also we find that convergence speed of proposed algorithm is increased by (B+1) time proportional to B which B is the number of recycled data buffer without complexity of computation. Adaptive transversal filter with proposed data recycling buffer algorithm could efficiently reject ISI of channel and in

  • PDF

순서형 대설 예보를 위한 통계 모형 개발

  • Son, Geon-Tae;Lee, Jeong-Hyeong;Ryu, Chan-Su
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.11a
    • /
    • pp.101-105
    • /
    • 2005
  • 호남지역에 대한 대설특보 예보를 위한 통계모형 개발을 수행하였다. 일 신적설량에 따라 세법주(0: 비발생, 1: 대설주의보, 2: 대설경보)로 구분되는 순서형 자료 형태를 지니고 있다. 두가지 통계 모형(다등급 로지스틱 회귀모형, 신경회로망 모형)을 고려하였으며, 수치모델 출력자료를 이용한 역학-통계모형 기법의 하나인 MOS(model output statistics)를 적용하여 축적된 수치모델 예보자료와 관측치의 관계를 통계모형식으로 추정하여 예측모형을 개발하였다. 군집분석을 사용하여 훈련자료와 검증자료를 구분하였으며, 예보치 생성을 위하여 문턱치를 고려하였다.

  • PDF

기업부도예측을 위한 통합알고리즘

  • Bae Jae-Gwon;Kim Jin-Hwa
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2006.06a
    • /
    • pp.195-202
    • /
    • 2006
  • 본 연구에서는 보다 효과적인 기업부도예측을 위하여, 동계적 방법과 인공지능 방법을 결합한 통합모형을 제시하였다. 이를 위하여 통계적인 모형 중에서 가장 널리 활용되고 있는 다변량 판별분석, 로지스틱 회귀분석과 인공 지능적인 방법으로서 최근 널리 사용되고 있는 인공신경망, 규칙유도기법, 베이지안 망의 5가지 방법론을 통합한 Voting with Performance & Weights from ANN(WP-ANN) 통합모형을 제시하였다. 실험결과, 본 연구에서 제안한 WP-ANN 통합모형은 다변량 판별분석, 로지스탁 회귀분석, 인공신경망, 규칙유도기법, 베이지안 망 등의 단일모형과 비교한 결과 가장 예측정확성이 유수한 것으로 나타났다. 따라서 본 연구를 통해 기업부도예측에 있어서 WP-ANN 통합모형이 기존의 모형들에 비해 우수한 예측정확성을 나타냄을 알 수 있었다.

  • PDF

Analysis of Horse Races: Prediction of Winning Horses in Horse Races Using Statistical Models (서울 경마 경기 우승마 예측 모형 연구)

  • Choe, Hyemin;Hwang, Nayoung;Hwang, Chankyoung;Song, Jongwoo
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.6
    • /
    • pp.1133-1146
    • /
    • 2015
  • The Horse race industry has the largest proportion of the domestic legal gambling industry. However, there is limited statistical analysis on horse races versus other sports. We propose prediction models for winning horses in horse races using data mining techniques such as logistic regression, linear regression, and random forest. Horse races data are from the Korea Racing Authority and we use horse racing reports, information of racehorses, jockeys, and horse trainers. We consider two models based on ranks and time records. The analysis results show that prediction of ranks is affected by information on racehorses, number of wins of racehorses and jockeys. We place wagers for the last month of races based on our prediction models that produce serious profits.

A Survey on the Critical Success Factors of Knowledge Management Using AHP (AHP 분석을 이용한 지식경영 실천 요소의 중요도에 관한 실증적 연구)

  • 이영수;박준아;정광식;김진우
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.85-94
    • /
    • 1999
  • 지식경영을 효과적으로 수행하기 위해서 기업은 지식경영을 구성하고 있는 요소를 정확히 이해할 필요가 있고, 이러한 중요 요소에 따라 투자가 이루어져야 한다. 본 연구는 지식경영의 중요 요소들을 제시함으로써, 앞으로 지식경영을 계획하고 있는 기업이 효과적으로 지식경영을 추진할 수 있는 활동 지침 및 투자 방향을 제시하고자 한다. 이를 위해, 본 연구에서는 각종 국내외 지식경영 관련 문헌에서 논의된 사항을 중심으로, 지식경영을 구성하는 30개의 중요요소를 추출하고, 분석계층도(AHP)를 이용하여 지식경영을 달성하기 위한 요소들을 위계적 구조로 정리하고, 최종단계에서 238개의 지식경영 구현의 평가기준을 마련하였다. 또한 실제로 지식경영 구현 요소들의 상대적 중요성을 파악하기 위해, 먼저 국내에서 지식경영을 추진하고 있거나 관심을 보이고 있는 48개 기업의 담당자 및 관련 부서원을 대상으로 설문조사를 실시하였고, 동시에 지식경영을 실제로 수행하고 있는 13개 기업의 담당자를 대상으로 각 기업에서 추진하고 있는 지식경영의 현황 파악을 위해 지식경영 실천의 평가기준에 대한 설문을 실시하였다. 이 두 가지 설문 조사 결과를 종합해 볼 때, 기업에서는 지식경영 구현 요소 중에서 인프라 내의 프로세스와 프로세스를 구성하는 지식의 활용과 전파 등이 중요하다고 인식하고 있는 반면, 실제로는 인프라 내의 정보기술과 프로세스를 구성하는 다른 한 축인 지식의 창출과 축적 면에 투자가 이루어진 것으로 나타났다. 이 외에도 지식화, 성과와 가치의 연계 그리고 지식의 가시화 등의 요소들은 상대적 중요도 인식과는 반대로 지식경영 추진에 있어 외면당하고 있는 것으로 나타났다. 따라서 본 연구는 지식 경영의 이러한 불균형을 시정할 수 있는 방향으로 앞으로의 투자가 수행되어야 할 것을 제안하고 있다. 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.(ⅱ) managemental and strategical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projects including scientific and technological effects. Since the HAN projects consists of 18 subprograms, it is difficult In evaluate all the subprograms

  • PDF

Predicting Forest Fires Using Machine Learning Considering Human Factors (인적요인을 고려한 머신러닝 활용 산림화재 예측)

  • Jin-Myeong Jang;Joo-Chan Kim;Hwa-Joong Kim;Kwang-Tae Kim
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.28 no.5
    • /
    • pp.109-126
    • /
    • 2023
  • Early detection of forest fires is essential in preventing large-scale forest fires. Predicting forest fires serves as a vital early detection method, leading to various related studies. However, many previous studies focused solely on climate and geographic factors, overlooking human factors, which significantly contribute to forest fires. This study aims to develop forest fire prediction models that take into account human, weather and geographical factors. This study conducted a comparative analysis of four machine learning models alongside the logistic regression model, using forest fire data from Gangwon-do spanning 2003 to 2020. The results indicate that XG Boost models performed the best (AUC=0.925), closely followed by Random Forest (AUC=0.920), both of which are machine learning techniques. Lastly, the study analyzed the relative importance of various factors through permutation feature importance analysis to derive operational insights. While meteorological factors showed a greater impact compared to human factors, various human factors were also found to be significant.

Inconsistent Pattern Model for Improving the Performance of Supervised Learning in Data Mining (데이터 마이닝의 지도학습 기법 성능향상을 위한 불일치 패턴 모델)

  • Heo, Jun;Kim, Jong-U
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2007.11a
    • /
    • pp.288-305
    • /
    • 2007
  • 본 논문은 데이터 마이닝의 기법 중 가장 잘 알려진 지도학습 기법의 성능 향상을 위한 새로운 Hybrid 및 Combined 기법인 불일치 패턴 모델(오차 패턴 모델)에 대한 연구 논문이다. 불일치 패턴 모델이란 2개 이상의 기법 중 향후 더 레코드별로 더 잘 맞출 수 있는 기법을 메타 분류하는 불일치 패턴 모델을 개발하여, 최종적으로는 기존의 기법보다 더 좋은 분류 정확도 및 예측 향상율을 기대하기 위한 기법을 의미한다. 본 논문에서는 의사 결정나무 추론 기법인 C5.0과 C&RT 그리고 신경망 분석, 그리고 로지스틱 회귀분석과 같은 대표적인 데이터 마이닝의 지도학습 기법을 이용하여 불일치 패턴 모델을 생성하여 보고, 이들이 기존 단일 기법과 기존의 Combined 모델인 Bagging, Boosting 그리고 Stacking 기법보다 성능이 우수함을 23개의 실제 데이터 및 공신력 있는 공개 데이터를 이용하여 증명하여 보였다. 또한 데이터의 특성에 따라서 불일치 패턴 모델의 성능의 변화 및 더 우수해 지는지를 알아보기 위한 연구포 같이 수행을 하여 본 모델의 활용성을 높이고자 하였다.

  • PDF

Wild Boar (Sus scrofa corranus Heude ) Habitat Modeling Using GIS and Logistic Regression (GIS와 로지스틱 회귀분석을 이용한 멧돼지 서식지 모형 개발)

  • 서창완;박종화
    • Spatial Information Research
    • /
    • v.8 no.1
    • /
    • pp.85-99
    • /
    • 2000
  • Accurate information on habitat distribution of protected fauna is essential for the habitat management of Korea, a country with very high development pressure. The objectives of this study were to develop a habitat suitability model of wild boar based on GIS and logistic regression, and to create habitat distribution map, and to prepare the basis for habitat management of our country s endangered and protected species. The modeling process of this restudyarch had following three steps. First, GIS database of environmental factors related to use and availability of wild boar habitat were built. Wild boar locations were collected by Radio-Telemetry and GPS. Second, environmental factors affecting the habitat use and availability of wild boars were identified through chi-square test. Third, habitat suitability model based on logistic regression were developed, and the validity of the model was tested. Finally , habitat assessment map was created by utilizing a rule-based approach. The results of the study were as folos. First , distinct difference in wild boar habitat use by season and habitat types were found, however, no difference in wild boar habiat use by season and habitat types were found , however, ho difference by sex and activity types were found. Second, it was found, through habitat availability analysis, that elevation , aspect , forest type, and forest age were significant natural environmental factors affecting wild boar hatibate selection, but the effects of slope, ridge/valley, water, and solar radiation could not be identified, Finally, the habitat at cutoff value of 0.5. The model validation showed that inside validation site had the classification accuracy of 73.07% for total habitat and 80.00% for cover habitat , and outside validation site had the classification accuracy of 75.00% for total habitat.

  • PDF

A Study for Improving the Performance of Data Mining Using Ensemble Techniques (앙상블기법을 이용한 다양한 데이터마이닝 성능향상 연구)

  • Jung, Yon-Hae;Eo, Soo-Heang;Moon, Ho-Seok;Cho, Hyung-Jun
    • Communications for Statistical Applications and Methods
    • /
    • v.17 no.4
    • /
    • pp.561-574
    • /
    • 2010
  • We studied the performance of 8 data mining algorithms including decision trees, logistic regression, LDA, QDA, Neral network, and SVM and their combinations of 2 ensemble techniques, bagging and boosting. In this study, we utilized 13 data sets with binary responses. Sensitivity, Specificity and missclassificate error were used as criteria for comparison.

Preparation of Probabilistic Liquefaction Hazard Map Using Liquefaction Potential Index (액상화 가능 지수를 활용한 확률적 액상화 재해도)

  • Chung, Jae-won;Rogers, J. David
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.34 no.6
    • /
    • pp.1831-1836
    • /
    • 2014
  • Probabilistic liquefaction hazard map is now widely needed for engineering practice. Based on the Liquefaction Potential Index (LPI) calculated from liquefied and non-liquefied cases, we attempted to estimate probabilities of liquefaction induced ground failures using logistic regression. We then applied this approach for the regional area. LPIs were calculated based on 273 Standard Penetration Tests in the floodplains in the St. Louis area, USA and then interpolated using cokriging with the covariable of peak ground acceleration. Our result shows that some areas of $LPI{\geq}5$, due to soft soil layers and shallow groundwater table, appear probabilities of ground $failure{\geq}0.5$.