• Title/Summary/Keyword: 통계예측모델

Search Result 529, Processing Time 0.059 seconds

창업연구 실증연구 분석방법론

  • Lee, Il-Han
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2017.04a
    • /
    • pp.17-17
    • /
    • 2017
  • 구조방정식모델(Structural Equation Modeling: SEM)은 변수들 간의 인관관계 및 상관관계를 검증하기 위한 통계기법으로 사회학 및 심리학 분야에서 개발되었지만 현재는 경영학, 광고학, 교육학, 생물학, 체육학, 의학, 정치학 등 여러 학문분야에서 광범위하게 사용되고 있다. Amos는 기본적으로 그래픽(Amos graphics)과 베이직(Amos basic)을 제공하기 때문에 정확한 프로그램의 작성이나 행렬에 대한 지식이 없는 초보자들도 아이콘을 이용하여 복잡한 연구모델이나 다중집단분석모델을 분석할 수 있다. PLS(Partial Least Square)는 모형 추정과정에서 발생하는 잔차 또는 예측오차를 최소화하여 예측력을 극대화하기 위한 프로그램이며, 즉, PLS-SEM는 표본 수가 적고 자료가 정규분포를 보이지 않거나 조형지표 모델이거나 복잡한 연구모델 분석에 유용하다. 최근 빅데이터의 열풍으로 자료들을 분석을 위한 도구로 R이 실무 현장에서 인기를 끌고 있다. R은 통계 프로그래밍 언어이자 오픈 소프트웨어 환경으로 통계, 그래픽, 데이터마이닝 등의 다양하고 방대한 양의 패키지들을 지원한다. R에서 제공되는 패키지들이 오픈 소스이고 선형 및 비선형 모델링, 고전적인 통계분석, 시 계열 분석, 분류 및 군집분석 등의 다양한 통계 패키지들을 제공한다는 측면에서 R은 실무는 물론 학문적인 측면에서도, 특히 통계를 기반으로 실증분석을 수행하는 사회과학연구들에서 중요한 역할을 할 수 있을 것으로 기대된다.

  • PDF

Crime Prediction and Factor Analysis of Incheon Metropolitan City Using Explainable Artificial Intelligence (설명 가능 인공지능 기술을 적용한 인천광역시 범죄 예측 및 요인 분석)

  • Kim, Da-Hyun;Kim, You-Kyung;Kim, Hyon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.513-515
    • /
    • 2022
  • 본 연구는 범죄를 발생시키는데 관련된 여러가지 요인들을 기반으로 범죄 예측 모델을 생성하고 설명 가능 인공지능 기술을 적용하여 인천 광역시를 대상으로 범죄 발생에 영향을 미치는 요인들을 분석하였다. 범죄 예측 모델 생성을 위해 XG Boost 알고리즘을 적용하였으며, 설명 가능 인공지능 기술로는 Shapley Additive exPlanations (SHAP)을 사용하였다. 기존 관련 사례들을 참고하여 범죄 예측에 사용된 변수를 선정하였고 변수에 대한 데이터는 공공 데이터를 수집하였다. 실험 결과 성매매단속 현황과 청소년 실종 가출 신고 현황이 범죄 발생에 큰 영향을 미치는 주요 요인으로 나타났다. 제안하는 모델은 범죄 발생 지역, 요인들을 미리 예측하여 제시함으로써 범죄 예방에 사용되는 인력자원, 물적자원 등을 용이하게 쓸 수 있도록 활용할 수 있다.

Statistical Analysis for Risk Factors and Prediction of Hypertension based on Health Behavior Information (건강행위정보기반 고혈압 위험인자 및 예측을 위한 통계분석)

  • Heo, Byeong Mun;Kim, Sang Yeob;Ryu, Keun Ho
    • Journal of Digital Contents Society
    • /
    • v.19 no.4
    • /
    • pp.685-692
    • /
    • 2018
  • The purpose of this study is to develop a prediction model of hypertension in middle-aged adults using Statistical analysis. Statistical analysis and prediction models were developed using the National Health and Nutrition Survey (2013-2016).Binary logistic regression analysis showed statistically significant risk factors for hypertension, and a predictive model was developed using logistic regression and the Naive Bayes algorithm using Wrapper approach technique. In the statistical analysis, WHtR(p<0.0001, OR = 2.0242) in men and AGE (p<0.0001, OR = 3.9185) in women were the most related factors to hypertension. In the performance evaluation of the prediction model, the logistic regression model showed the best predictive power in men (AUC = 0.782) and women (AUC = 0.858). Our findings provide important information for developing large-scale screening tools for hypertension and can be used as the basis for hypertension research.

Design of short-term forecasting model of distributed generation power for wind power (풍력 발전을 위한 분산형 전원전력의 단기예측 모델 설계)

  • Song, Jae-Ju;Jeong, Yoon-Su;Lee, Sang-Ho
    • Journal of Digital Convergence
    • /
    • v.12 no.3
    • /
    • pp.211-218
    • /
    • 2014
  • Recently, wind energy is expanding to combination of computing to forecast of wind power generation as well as intelligent of wind powerturbine. Wind power is rise and fall depending on weather conditions and difficult to predict the output for efficient power production. Wind power is need to reliably linked technology in order to efficient power generation. In this paper, distributed power generation forecasts to enhance the predicted and actual power generation in order to minimize the difference between the power of distributed power short-term prediction model is designed. The proposed model for prediction of short-term combining the physical models and statistical models were produced in a physical model of the predicted value predicted by the lattice points within the branch prediction to extract the value of a physical model by applying the estimated value of a statistical model for estimating power generation final gas phase produces a predicted value. Also, the proposed model in real-time National Weather Service forecast for medium-term and real-time observations used as input data to perform the short-term prediction models.

LSTM-based crop leaf weight prediction model for efficient crop cultivation (효율적인 작물 재배를 위한 LSTM 기반 작물 잎 중량 예측 모델)

  • Lee Min Seo;Chang Hye Won;Lee Ye Ram;Kim Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.415-416
    • /
    • 2023
  • 지구온난화와 농업 활동 감소로 인해 농작물 생산량이 줄어드는 추세이다. 4차 산업혁명 시대를 맞아 농업 분야에서도 인공지능 기술을 활용하여 효율적인 작물 재배가 가능해지고 있다. 작물의 수확량을 최고로 끌어올릴 수 있는 시간대별 최적 환경을 알아낼 수 있다면 식물 재배와 관련한 제반 사업에 도움이 될 것이다. 본 연구에서는 LSTM 알고리즘을 이용하여 상추의 일별 중량을 예측하는 인공지능 모델을 생성하였다. 제안하는 AI 예측 모델을 통해, 보다 효율적인 작물 재배가 가능해질 수 있을 것으로 보인다.

Prediction of English Premier League Game Using an Ensemble Technique (앙상블 기법을 통한 잉글리시 프리미어리그 경기결과 예측)

  • Yi, Jae Hyun;Lee, Soo Won
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.5
    • /
    • pp.161-168
    • /
    • 2020
  • Predicting outcome of the sports enables teams to establish their strategy by analyzing variables that affect overall game flow and wins and losses. Many studies have been conducted on the prediction of the outcome of sports events through statistical techniques and machine learning techniques. Predictive performance is the most important in a game prediction model. However, statistical and machine learning models show different optimal performance depending on the characteristics of the data used for learning. In this paper, we propose a new ensemble model to predict English Premier League soccer games using statistical models and the machine learning models which showed good performance in predicting the results of the soccer games and this model is possible to select a model that performs best when predicting the data even if the data are different. The proposed ensemble model predicts game results by learning the final prediction model with the game prediction results of each single model and the actual game results. Experimental results for the proposed model show higher performance than the single models.

Predictive Model for Real Estate Prices Using Sentiment Index of news articles based on Generative AI (생성 AI 기반 뉴스 기사 심리지수를 활용한 부동산 가격 예측 모델)

  • Kim Sua;Kwon Miju;Cho Soobin;Kim Eunsoo;Hyon Hee Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.1198-1199
    • /
    • 2023
  • 부동산 시장은 다양한 요인에 의해 가격이 결정되며 거시경제 변수뿐 만 아니라 뉴스 기사, SNS 등 다양한 비정형 데이터의 영향을 받는다. 특히 뉴스 기사는 국민들이 느끼는 경제 심리를 반영하고 있어 부동산 가격에 영향을 크게 미치는 변수라고 판단된다. 본 연구에서는 뉴스 기사의 세분화된 감정 분석을 통해 전통적인 분석 방법보다 더 의미 있는 결과를 얻을 수 있는 부동산 가격 예측 모델을 생성하였으며 뉴스 기사로부터 심리 지수를 산출하기 위해 생성 AI 를 활용하였다. 제안하는 매매가격지수 예측 모델을 통해 부동산 시장과 뉴스 기사와의 관계성에 대해 파악할 수 있으며, 사회/경제적 동향을 반영한 부동산 가격 변동을 예측할 수 있을 것으로 보인다.

Object Size Prediction based on Statistics Adaptive Linear Regression for Object Detection (객체 검출을 위한 통계치 적응적인 선형 회귀 기반 객체 크기 예측)

  • Kwon, Yonghye;Lee, Jongseok;Sim, Donggyu
    • Journal of Broadcast Engineering
    • /
    • v.26 no.2
    • /
    • pp.184-196
    • /
    • 2021
  • This paper proposes statistics adaptive linear regression-based object size prediction method for object detection. YOLOv2 and YOLOv3, which are typical deep learning-based object detection algorithms, designed the last layer of a network using statistics adaptive exponential regression model to predict the size of objects. However, an exponential regression model can propagate a high derivative of a loss function into all parameters in a network because of the property of an exponential function. We propose statistics adaptive linear regression layer to ease the gradient exploding problem of the exponential regression model. The proposed statistics adaptive linear regression model is used in the last layer of the network to predict the size of objects with statistics estimated from training dataset. We newly designed the network based on the YOLOv3tiny and it shows the higher performance compared to YOLOv3 tiny on the UFPR-ALPR dataset.

Graph-based modeling for protein function prediction (단백질 기능 예측을 위한 그래프 기반 모델링)

  • Hwang Doosung;Jung Jae-Young
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.209-214
    • /
    • 2005
  • The use of protein interaction data is highly reliable for predicting functions to proteins without function in proteomics study. The computational studies on protein function prediction are mostly based on the concept of guilt-by-association and utilize large-scale interaction map from revealed protein-protein interaction data. This study compares graph-based approaches such as neighbor-counting and $\chi^2-statistics$ methods using protein-protein interaction data and proposes an approach that is effective in analyzing large-scale protein interaction data. The proposed approach is also based protein interaction map but sequence similarity and heuristic knowledge to make prediction results more reliable. The test result of the proposed approach is given for KDD Cup 2001 competition data along with those of neighbor-counting and $\chi^2-statistics$ methods.

KISS Korea Computer Congress 2005 (DNA 컴퓨팅 연산 과정의 통계 물리적 예측)

  • Kim J.S.;Kim J.C.;Noh Y.K.;Lee D.Y.;Zhang B.T.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.253-255
    • /
    • 2005
  • DNA 연산 과정의 열역학적 통계 물리학적 예측 모델을 기술한다. 온도를 천천히 내리는 시험관에서의 DNA string 들의 결합은 Metropolis 알고리즘과 진화 연산의 일종인 simulated annealing 알고리즘으로 설명될 수 있다 본 논문에서는 정리 증명 문제를 통해 위의 통계 물리학적 모델이 DNA 연산에 적용될 수 있음을 보인다. 여섯 종류의 DNA 가닥들의 시뮬레이션 결과와 온도에 대한 실험적인 fluorescence intensity의 비교를 통해 이 모델이 유효함을 보인다. 또한 목표 DNA 개수를 시뮬레이션으로 예측하고 그 결과를 electrophoresis gel image 와 비교하였다.

  • PDF