• Title/Summary/Keyword: 회귀분석 모델

Search Result 1,503, Processing Time 0.025 seconds

Software Development Effort Estimation Using Neural Network Model (신경망 기반의 소프트웨어 개발노력 추정모델 구축에 관한 연구)

  • Kim, Byung-Gwan;Baek, Seung
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2005.05a
    • /
    • pp.372-380
    • /
    • 2005
  • 소프트웨어 개발노력 추정에 대한 연구는 소프트웨어가 복잡해지고 범위가 크게 증가함에 따라서 그 중은 지속적으로 부각되고 있다. 관련 프로젝트를 발주하는 업체나, 이를 수주하고 개발을 진행하는 업체에게 원가를 고려하는 측면에서 매우 중요한 부분을 차지하고 있다. 이러한 개발노력 추정을 위하여 다양한 접근 방식들이 고려되어지고 있는데, 그중에서 많이 활용되어지고 있는 방식은 소프트웨어 규모에 기반을 둔 LOC(Line Of Code) 기반 COCOMO (Constructive Cost Model) 모델이나 기능점수(Function Point)를 기반으로 한 회귀분석 모델, 인공지능(Artificial Intelligence)을 활용한 신경망(Neural Network) 모델, 사례분석기법 (CBR, Case Based Reasoning) 등이 있다. 이중에서 최근에 기능점수를 활용한 개발노력 추정에 관한 연구들이 활발히 진행되고 있으나 개발노력 추정에는 소프트웨어 규모의 척도인 기능점수 뿐만 아니라, 개발환경을 구성하는 여러 가지 측면에 대한 고려가 추가되어져야 한다. 이에 본 논문은 최신의 소프트웨어 개발 사례들에 대하여 기능점수 및 추가적인 개발환경 요소들을 면밀히 분석하고, 분석한 내용에 대해서 전문가들의 설문을 통한 빈도분석 및 로지스틱 회귀분석, 데이터마이닝 기법인 신경망 분석 등을 활용하여 개발노력 추정 모델을 구축함으로써, 소프트웨어 개발의 다양한 측면의 중요성을 강조하고, 정확한 추정의 방안을 제시 하고자 노력 하였다.

  • PDF

Comparison of Prediction Accuracy Between Regression Analysis and Deep Learning, and Empirical Analysis of The Importance of Techniques for Optimizing Deep Learning Models (회귀분석과 딥러닝의 예측 정확성에 대한 비교 그리고 딥러닝 모델 최적화를 위한 기법들의 중요성에 대한 실증적 분석)

  • Min-Ho Cho
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.18 no.2
    • /
    • pp.299-304
    • /
    • 2023
  • Among artificial intelligence techniques, deep learning is a model that has been used in many places and has proven its effectiveness. However, deep learning models are not used effectively in everywhere. In this paper, we will show the limitations of deep learning models through comparison of regression analysis and deep learning models, and present a guide for effective use of deep learning models. In addition, among various techniques used for optimization of deep learning models, data normalization and data shuffling techniques, which are widely used, are compared and evaluated based on actual data to provide guidelines for increasing the accuracy and value of deep learning models.

A Study on Crash Causations for Railroad-Highway Crossings (철도건널목 사고요인 분석에 관한 연구)

  • O, Ju-Taek;Sin, Seong-Hun;Seong, Nak-Mun;Park, Dong-Ju;Choe, Eun-Su
    • Journal of Korean Society of Transportation
    • /
    • v.23 no.1
    • /
    • pp.33-44
    • /
    • 2005
  • Railroad crossing crashes are fewer than road crashes, but with regard to crash severity, they can be serious injury crashes. There should be, therefore, enormous efforts to increase the safety of railroad crossings. The objective of this paper is to identify and understand factors associated with railroad crossing crashes. Statistical models are used to examine the relationships between crossing accidents and geometric elements of crossings. The results show the Poisson model is the most appropriate method for the crossing accidents, because overdispersion was not observed. This study identifies seven significant factors associated with railroad crossing crashes through the main and variant models. With regard to explanatory factors on crossing safety, the total traffic volume, daily train volume, presence of commercial area around crossings, distance of train detector from crossings, time duration between the activation of warning signals and gates, crossing types, and speed hump were found to affect the safety of railroad crossings.

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management & Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

Development of a Logistic Regression Model for Probabilistic Prediction of Debris Flow (토석류 산사태 예측을 위한 로지스틱 회귀모형 개발)

  • 채병곤;김원영;조용찬;김경수;이춘오;최영섭
    • The Journal of Engineering Geology
    • /
    • v.14 no.2
    • /
    • pp.211-222
    • /
    • 2004
  • In this study, a probabilistic prediction model for debris flow occurrence was developed using a logistic regression analysis. The model can be applicable to metamorphic rocks and granite area. order to develop the prediction model, detailed field survey and laboratory soil tests were conducted both in the northern and the southern Gyeonggi province and in Sangju, Gyeongbuk province, Korea. The seven landslide triggering factors were selected by a logistic regression analysis as well as several basic statistical analyses. The seven factors consist of two topographic factors and five geological and geotechnical factors. The model assigns a weight value to each selected factor. The verification results reveal that the model has 90.74% of prediction accuracy. Therefore, it is possible to predict landslide occurrence in a probabilistic and quantitative manner.

Estimation of surface nitrogen dioxide mixing ratio in Seoul using the OMI satellite data (OMI 위성자료를 활용한 서울 지표 이산화질소 혼합비 추정 연구)

  • Kim, Daewon;Hong, Hyunkee;Choi, Wonei;Park, Junsung;Yang, Jiwon;Ryu, Jaeyong;Lee, Hanlim
    • Korean Journal of Remote Sensing
    • /
    • v.33 no.2
    • /
    • pp.135-147
    • /
    • 2017
  • We, for the first time, estimated daily and monthly surface nitrogen dioxide ($NO_2$) volume mixing ratio (VMR) using three regression models with $NO_2$ tropospheric vertical column density (OMIT-rop $NO_2$ VCD) data obtained from Ozone Monitoring Instrument (OMI) in Seoul in South Korea at OMI overpass time (13:45 local time). First linear regression model (M1) is a linear regression equation between OMI-Trop $NO_2$ VCD and in situ $NO_2$ VMR, whereas second linear regression model (M2) incorporates boundary layer height (BLH), temperature, and pressure obtained from Atmospheric Infrared Sounder (AIRS) and OMI-Trop $NO_2$ VCD. Last models (M3M & M3D) are a multiple linear regression equations which include OMI-Trop $NO_2$ VCD, BLH and various meteorological data. In this study, we determined three types of regression models for the training period between 2009 and 2011, and the performance of those regression models was evaluated via comparison with the surface $NO_2$ VMR data obtained from in situ measurements (in situ $NO_2$ VMR) in 2012. The monthly mean surface $NO_2$ VMRs estimated by M3M showed good agreements with those of in situ measurements(avg. R = 0.77). In terms of the daily (13:45LT) $NO_2$ estimation, the highest correlations were found between the daily surface $NO_2$ VMRs estimated by M3D and in-situ $NO_2$ VMRs (avg. R = 0.55). The estimated surface $NO_2$ VMRs by three modelstend to be underestimated. We also discussed the performance of these empirical modelsfor surface $NO_2$ VMR estimation with respect to otherstatistical data such asroot mean square error (RMSE), mean bias, mean absolute error (MAE), and percent difference. This present study shows a possibility of estimating surface $NO_2$ VMR using the satellite measurement.

Cost Prediction Model for Building Demolition Work by Using Regression Analysis (회귀분석을 이용한 건축물 해체공사비 예측모델)

  • Kim, Taehoon;Kim, Young Hyun;Cho, Kyuman
    • Journal of the Korea Institute of Building Construction
    • /
    • v.21 no.2
    • /
    • pp.105-112
    • /
    • 2021
  • While the scale of the domestic market for demolition work is steadily increasing, research on cost prediction for demolition work is insufficient. Thus, this study proposes a cost prediction model for demolition work that reflects various attributes influecing the fluctuation of demolition cost. 13 influencing factors and historical cost data were collected based on literature review and experts' advice, and two prediction models were constructed through regression analysis and the prediction accuracy was evaluated. As a result, it showed an average error rate of about 6 to 12%, and it was possible to explore the possibility of use as a reliable prediction model. The results of this study can contribute to estimating appropriate construction cost and improving related standards for domestic demolition works in the future.

Kernel Regression Model based Gas Turbine Rotor Vibration Signal Abnormal State Analysis (커널회귀 모델기반 가스터빈 축진동 신호이상 분석)

  • Kim, Yeonwhan;Kim, Donghwan;Park, SunHwi
    • KEPCO Journal on Electric Power and Energy
    • /
    • v.4 no.2
    • /
    • pp.101-105
    • /
    • 2018
  • In this paper, the kernel regression model is applied for the case study of gas turbine abnormal state analysis. In addition to vibration analysis at the remote site, the kernel regression model technique can is useful for analyzing abnormal state of rotor vibration signals of gas turbine in power plant. In monitoring based on data-driven techniques correlated measurements, the fault free training data of shaft vibration obtained during normal operations of gas turbine are used to develop a empirical model based on auto-associative kernel regression. This data-driven model can be used to predict virtual measurements, which are compared with real-time data, generating residuals. Any faults in the system may cause statistically abnormal changes in these residuals and could be detected. As the result, the kernel regression model provides information that can distinguish anomalies such as sensor failure in a shaft vibration signal.

Performance Improvement of Regression Neural Networks by Using PCA and Zero-Mean Normalization (영평균 정규화와 PCA를 이용한 회귀 신경망의 성능개선)

  • Park, Yong-Soo;Cho, Yong-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.515-518
    • /
    • 2001
  • 본 논문에서는 전처리단계로 영평균 정규화 기법과 주요성분분석 기법을 도입하여 다층신경망을 이용한 고신뢰성의 회귀분석 모델을 제안한다. 영평균 정규화 기법은 데이터의 1차적 통계성을 고려하여 알고리즘을 간략화시키며, 주요성분분석 기법은 입력 데이터의 2차적 통계성을 고려하여 독립인 특징들의 집합으로 변환시켜 학습데이터의 차원을 감소시킬 수 있어 고차원의 학습데이터에 따른 회귀분석 모델의 제약을 해결할 수 있었다. 제안된 기법의 신경망을 3개의 독립변수를 가진 암모니아 제조공정문제와 10개의 독립변수를 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 단순정규화나 PCA를 적용하지 않는 경우보다 제안된 기법의 학습속도와 회귀성능이 더욱 더 우수함을 확인할 수 있었다.

  • PDF

Moisture Content Measurement Technique for Powdered Food using NIR Reflectance Spectroscopy (근적외선 반사스펙트럼을 이용한 분말식품의 저함수율 측정 기술)

  • 모창연;노상하
    • Proceedings of the Korean Society for Agricultural Machinery Conference
    • /
    • 2002.02a
    • /
    • pp.444-449
    • /
    • 2002
  • 1. 시료의 흡광도는 입도가 커짐에 따라 전체 파장 영역에 걸쳐 증가하는 경향을 보였다. 가시광 영역에서는 입도 보다도 색상의 영향이 큰 것으로 나타났다. 2. 시료의 함수율과 각 파장에서의 흡광도 사이의 상관관계는 550~950nm 영역에서는 상관계수가 0.53이하로 작았으며, 물의 흡수파장대역인 1430 nm 부근에서는 0.85~0.87로 높게 나타났다. 3. 각 시료들의 반사 스펙트럼을 이용하여 세 가지 파장 영역에 대해 PLS회귀모델과 MLR 모델에 의한 함수율 예측 모델을 개발하였다. 모든 시료에서 PLS회귀모델이 MLR 회귀 모델보다 예측성능이 우수하였다. 4. PLS회귀 모델에서 전처리 효과를 분석한 결과, 시료의 입도에 따른 흡광도의 차이를 보정하기 위해 평활화, 미분, MSC, SNV 등의 전처리가 필요한 것으로 판단되었다. 5. 전체시료에 대해 함수율 예측을 위한 PLS회귀모델을 개발한 결과 400~2500nm영역에서의 개발된 모델의 예측성능은 $R^2$=0.9986, SEP=0.2166, 900~1700nm영역에서의 모델은 $R^2$=0.9985, SEP=0.2233이었으며 550~950nm 영역에서의 모델은 $R^2$=0.9838, SEP=0.7405로 나타났다. 각 시료의 종류별로 회귀모델을 개발할 경우 상기 결과보다 SEP가 더욱 작게 나타났다. 6. 이 연구 결과에 의하면 현재 시판되고 있는 실시간 분광기를 이용할 경우 시료의 입도에 무관한 온라인 함수율 측정장치의 개발이 가능할 것으로 판단된다.

  • PDF