• Title/Summary/Keyword: 회귀분석 모델

Search Result 1,503, Processing Time 0.026 seconds

Software Development Effort Estimation Using Function Point (기능점수를 이용한 소프트웨어 개발노력 추정)

  • Lee, Sang-Un;Gang, Jeong-Ho;Park, Jung-Yang
    • The KIPS Transactions:PartD
    • /
    • v.9D no.4
    • /
    • pp.603-612
    • /
    • 2002
  • Area of software measurement in software engineering is active more than thirty years. There is a huge collection of researches but still no concrete software development effort and cost estimation model. If we want to measure the effort and cost of a software project, we need to estimate the size of the software. A number of software metrics are identified in the literature; the most frequently cited measures are LOC (line of code) and FPA (function point analysis). The FPA approach has features that overcome the major problems with using LOC as a measure of system size. This paper presents simple linear regression model that related software development effort to software size measured in FP. The model is derived from the plotting of the effort and FP relation. The experimental data are collected from 789 software development projects that were recently developed under the various development environments and development methods. Also, the model is compare with other regression analysis model. The presented model has the best estimation ability among the software effort estimation models.

Estimation of Individual Leaf Area, Fresh and Dry Weights of Cucumber by Regression Model and Neural Network (회귀모델과 신경회로망에 의한 오이 개개 엽면적, 생체중 및 건물중 예측)

  • 조영렬;손정익
    • Proceedings of the Korean Society for Bio-Environment Control Conference
    • /
    • 2001.11a
    • /
    • pp.178-180
    • /
    • 2001
  • 작물의 엽면적 등 다양한 생육정보를 간편하고 비파괴적으로 추정할 수 있다면 작물의 생리 생태학적 모델에의 적용을 통하여 다양한 작물 연구에 중요한 공헌을 할 수 있다. 본 연구에서는 오이 개개 잎의 형태정보를 이용하여 오이의 개개 엽면적, 생체중 및 건물중 예측하는 것을 목적으로 하였고, 이를 위하여 엽면적은 5가지 모델을 사용하였고, 생체중 및 건물중은 6가지의 모델을 사용하여 분석하였다. 또한 신경회로망은 3 layer의 back propagation method를 사용하여 분석하였다. 각 모델들은 독립변수로는 Robinson & Pharr이 사용한 개개 잎의 폭 및 길이를 사용하였다. 회귀모델에 의한 추정 결과, 모델의 정확성 및 정밀성은 엽면적 > 생체중 > 건물중 순 이었지만, 특히 건물중의 경우는 상대적으로 낮은 상관관계를 가지는 것으로 나타났다. 회귀모델을 사용하여 건물중 추정하는 것에는 한계가 있는 것으로 생각되며, 신경회로망도 이와 유사한 관계를 나타냈지만 다양한 변수 수정을 통하여 상관계수를 증가시킬 수 있을 것이라고 생각된다.

  • PDF

Practical Model to Estimate Road User Cost for Bridge Maintenance Strategy (교량 유지관리 전략 수립을 위한 실용적 도로이용자비용 추정 모델)

  • Park, Kyung-Hoon;Sun, Jong-Wan;Lee, Sang-Yoon;Lee, Jong-Soon;Cho, Hyo-Nam
    • Journal of the Korea institute for structural maintenance and inspection
    • /
    • v.11 no.6
    • /
    • pp.131-142
    • /
    • 2007
  • The road user cost in indirect costs as well as direct costs such as the inspection/ diagnosis cost and the repair/reinforcement cost should be considered as one of the important items in the life-cycle cost-effective design and maintenance of the bridges. To estimate the road user cost, this paper formulates the road user cost as a sum of the user delay cost and the vehicle operating cost considering the detour effect. A numerical traffic simulation and a regression analysis are performed to develop a regression model due to a time delay. The proposed regression model is applied to the generation of the maintenance strategy based on the life-cycle cost and performance, and its effectiveness and applicability is investigated. The road user cost has a great influence on establishing the maintenance strategy, and the proposed regression model could be successfully utilized to estimate the road user cost of a bridge.

The Data-based Prediction of Police Calls Using Machine Learning (기계학습을 활용한 데이터 기반 경찰신고건수 예측)

  • Choi, Jaehun
    • The Journal of Bigdata
    • /
    • v.3 no.2
    • /
    • pp.101-112
    • /
    • 2018
  • The purpose of the study is to predict the number of police calls using neural network which is one of the machine learning and negative binomial regression, by using the data of 112 police calls received from Chungnam Provincial Police Agency from June 2016 to May 2017. The variables which may affect the police calls have been selected for developing the prediction model : time, holiday, the day before holiday, season, temperature, precipitation, wind speed, jurisdictional area, population, the number of foreigners, single house rate and other house rate. Some variables show positive correlation, and others negative one. The comparison of the methods can be summarized as follows. Neural network has correlation coefficient of 0.7702 between predicted and actual values with RMSE 2.557. Negative binomial regression on the other hand shows correlation coefficient of 0.7158 with RMSE 2.831. Neural network has low interpretability, but an excellent predictability compared with the negative binomial regression. Based on the prediction model, the police agency can do the optimal manpower allocation for given values in the selected variables.

Fine-Grain Weighted Logistic Regression Model (가중치 세분화 기반의 로지스틱 회귀분석 모델)

  • Lee, Chang-Hwan
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.53 no.9
    • /
    • pp.77-81
    • /
    • 2016
  • Logistic regression (LR) has been widely used for predicting the relationships among variables in various fields. We propose a new logistic regression model with a fine-grained weighting method, called value weighted logistic regression, by assigning different weights to each feature value. A gradient approach is utilized to obtain the optimal weights of feature values. We conduct experiments on several data sets and the experimental results show that the proposed method shows meaningful improvement in prediction accuracy.

A Model for Predicting Horse Racing Ranking by Regression Analysis (회귀 분석을 통한 경마 순위 예측 모형)

  • Hur, Tai-sung;Song, Min Seob;Ko, Dong Su
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.15-16
    • /
    • 2022
  • 본 논문에서는 국내 합법 사행산업의 가장 큰 비중을 차지하는 경마에 대한 데이터 분석 모델을 제공하여 건전한 국민 여가 스포츠로 인식 개선을 제안한다. 고배당을 강조하는 경마 예측론이 성행하며 경마가 스포츠가 아닌 도박에 가깝다는 부정적 이미지를 개선하고자 부모마의 수득 상금을 이용한 순위 분석 모델을 제공한다. 현재 국내 경마 경기는 서울, 부산, 제주에서 개최되며, 이 중 서울 지역 경마 데이터를 분석 데이터로 하였다. 분석에 이용한 데이터는 2019년 3월부터 2022년 3월까지의 경주 성적, 경주마 정보, 부모마 수득상금을 이용하였다. 분석에는 선형 회귀 모형, 랜덤 포레스트 회귀 모형 (Breiman, 2001)을 이용하였다. 분석은 Python 을 이용하였으며, Python에서 제공하는 다양한 라이브러리를 이용하여 크롤링, 전처리, 분석하였다.

  • PDF

Analysis of Eunpyeong New Town Land Price Using Geographically Weighted Regression (지리가중회귀분석을 이용한 은평뉴타운 지가 분석)

  • Jung, Hyo-jin;Lee, Jiyeong
    • Spatial Information Research
    • /
    • v.23 no.5
    • /
    • pp.65-73
    • /
    • 2015
  • Newtown Business of Seoul had been performed to reduce deterioration of Gangbuk and economic inequality between Gangnam and Gangbuk. According to this, Eunpyeong-gu was set as test-bed for Newtown business and Newtown business had been completed until 2013. This study aims to analyze the influence of social and economical factors which affect land price using GWR (Geographically Weighted Regression) considered spatial effect. As a result of analysis, GWR model demonstrated a better goodness-of-fit than OLS (Ordinary least square) model typically used in most study. Furthermore, AIC value and Moran's I of residual prove that GWR model is more suitable than OLS model. GWR model enable to explain more detailed than global regression model as coefficient and sign show different value locally. In future, this research will be helpful to develop Eunpyeong-gu considering spatial characters and strength effectiveness of development.

A new regression analysis method in network model (네트워크 모델을 이용한 새로운 회귀분석방법)

  • 김기복;인치호;김희석
    • Proceedings of the IEEK Conference
    • /
    • 2003.07a
    • /
    • pp.410-413
    • /
    • 2003
  • 본 논문에서는 네트워크가 막연히 무작위적이라고 하기에는 사회나 세포, 인터넷 등이 어떤 법칙에 따라 짜연진 것처럼 보인다. 하지만 복잡한 네트워크의 모습이 네트워크의 모델과 실제로 똑같은지를 비교하기는 그리 쉬운 문제가 아니다. 무작위적 네트워크의 경우는 수학적으로 엄밀히 말하자면 쁘아송분포를 따른다. 쁘아송분포에서는 모든 점들이 동일한 확률로 여러 점들에 연결되는 기회를 갖는다. 즉 균일한 분포이다. 따라서 상당히 적거나 반대로 상당히 많은 수의 연결선을 가진 점은 극히 드물다. 이 경우 연결선 분포가 종 모양이 된다. 대부분의 점들이 곡선에 해당하는 연결선 수를 갖게 된다. 본 논문에서 쁘아송분포와 회귀분석을 통하여 하나 또는 둘 이상의 변수들 사이에 어떤 관계를 함수관계로 나타내어 분석하는 방법을 보이고 회귀분석 방법에 의해서 미래를 예측하고자 한다.

  • PDF

Driving Video Stabilization using Region based Histogram Matching and Linear Regression (영역별 투영 히스토그램 매칭 및 선형 회귀모델 기반의 차량 운행 영상의 안정화 기술 개발)

  • Heo, Yu-Jung;Choi, Min-Kook;Lee, Hyun-Gyu;Lee, Sang-Chul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.28-31
    • /
    • 2014
  • 본 논문에서는 블랙박스 혹은 운전석에 장착된 카메라로부터 얻어진 차량 영상에 대한 영역별 수직 히스토그램 매칭 및 선형 회귀분석 모델(linear regression model)을 활용한 강건한 차량 운행 동영상의 안정화(video stabilization) 기법을 제안한다. 동영상 안정화 기법은 영상의 흔들림 보정뿐 아니라 동영상 내 강건한 특징점 추적 및 매칭을 위한 이전의 전처리 과정으로 적용된다. 일반적으로 촬영 과정에서 많은 떨림이 포함될 수 있는 야외 CCTV 영상이나 손으로 들고(hand-held) 촬영된 동영상에 대한 흔들림 보정 등에 적용되고 있으나 영상 내 특징점이 지속적으로 변하고 영상의 변화 정도가 매우 심한 차량 운행 동영상에서는 적용된 사례가 드물다. 본 연구에서는 일반적인 비디오 안정화 기술이 적용되기 어려운 차량 운행 동영상에 대하여 수직 투영 히스토그램 매칭 및 선형 회귀분석 모델 기반의 안정화 기법을 제안한다. 제안된 기법은 입력영상에 대한 영역별 수직 투영 히스토그램 매칭을 수행하고 선형 회귀모델을 통해 영상에 나타나는 수직 및 회전이동 변환을 선형 근사하여 시간 영역 상의 입력 영상에 대한 안정화를 달성한다. 제안 방법의 검증을 위해 블랙박스로 촬영된 실제 동영상에 동영상 안정화 기술을 적용하였으며, 운행 중 불규칙한 노면으로 인한 영상의 흔들림이 효과적으로 제거되는 것을 확인할 수 있었다.

  • PDF

Frequent Items Mining based on Regression Model in Data Streams (스트림 데이터에서 회귀분석에 기반한 빈발항목 예측)

  • Lee, Uk-Hyun
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.1
    • /
    • pp.147-158
    • /
    • 2009
  • Recently, the data model in stream data environment has massive, continuous, and infinity properties. However the stream data processing like query process or data analysis is conducted using a limited capacity of disk or memory. In these environment, the traditional frequent pattern discovery on transaction database can be performed because it is difficult to manage the information continuously whether a continuous stream data is the frequent item or not. In this paper, we propose the method which we are able to predict the frequent items using the regression model on continuous stream data environment. We can use as a prediction model on indefinite items by constructing the regression model on stream data. We will show that the proposed method is able to be efficiently used on stream data environment through a variety of experiments.