• Title/Summary/Keyword: 회귀 모델

Search Result 1,933, Processing Time 0.032 seconds

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management & Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

Regression Model With High Reliability by Using Neural Networks (신경망을 이용한 고신뢰성의 회귀분석 모델)

  • Jo, Yong-Hyeon
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

Estimation of Individual Leaf Area, Fresh and Dry Weights of Cucumber by Regression Model and Neural Network (회귀모델과 신경회로망에 의한 오이 개개 엽면적, 생체중 및 건물중 예측)

  • 조영렬;손정익
    • Proceedings of the Korean Society for Bio-Environment Control Conference
    • /
    • 2001.11a
    • /
    • pp.178-180
    • /
    • 2001
  • 작물의 엽면적 등 다양한 생육정보를 간편하고 비파괴적으로 추정할 수 있다면 작물의 생리 생태학적 모델에의 적용을 통하여 다양한 작물 연구에 중요한 공헌을 할 수 있다. 본 연구에서는 오이 개개 잎의 형태정보를 이용하여 오이의 개개 엽면적, 생체중 및 건물중 예측하는 것을 목적으로 하였고, 이를 위하여 엽면적은 5가지 모델을 사용하였고, 생체중 및 건물중은 6가지의 모델을 사용하여 분석하였다. 또한 신경회로망은 3 layer의 back propagation method를 사용하여 분석하였다. 각 모델들은 독립변수로는 Robinson & Pharr이 사용한 개개 잎의 폭 및 길이를 사용하였다. 회귀모델에 의한 추정 결과, 모델의 정확성 및 정밀성은 엽면적 > 생체중 > 건물중 순 이었지만, 특히 건물중의 경우는 상대적으로 낮은 상관관계를 가지는 것으로 나타났다. 회귀모델을 사용하여 건물중 추정하는 것에는 한계가 있는 것으로 생각되며, 신경회로망도 이와 유사한 관계를 나타냈지만 다양한 변수 수정을 통하여 상관계수를 증가시킬 수 있을 것이라고 생각된다.

  • PDF

Development of Forest Volume Estimation Model Using Airborne LiDAR Data - A Case Study of Mixed Forest in Aedang-ri, Chunyang-myeon, Bonghwa-gun - (항공 LiDAR 자료를 이용한 산림재적추정 모델 개발 - 봉화군 춘양면 애당리 혼효림을 대상으로 -)

  • CHO, Seung-Wan;KIM, Yong-Ku;PARK, Joo-Won
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.20 no.3
    • /
    • pp.181-194
    • /
    • 2017
  • This study aims to develop a regression model for forest volume estimation using field-collected forest inventory information and airborne LiDAR data. The response variable of the model is forest stem volume, was measured by random sampling from each individual plot of the 30 circular sample plots collected in Bonghwa-gun, Gyeong sangbuk-do, while the predictor variables for the model are Height Percentiles(HP) and Height Bin(HB), which are metrics extracted from raw LiDAR data. In order to find the most appropriate model, the candidate models are constructed from simple linear regression, quadratic polynomial regression and multiple regression analysis and the cross-validation tests were conducted for verification purposes. As a result, $R^2$ of the multiple regression models of $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, and $HBgt_{25}$ among the estimated models was the highest at 0.509, and the PRESS statistic of the simple linear regression model of $HP_{25}$ was the lowest at 122.352. $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, and $HBgt_{25}-based$ models, thus, are comparatively considered more appropriate for Korean forests with complicated vertical structures.

Decommissioning Cost Estimation of Kori Unit 1 Using a Multi-Regression Analysis Model (회귀 분석 모델을 이용한 고리 1호기 해체 비용 추정)

  • Joo, Han Young;Kim, Jae Wook;Jeong, So Yun;Moon, Joo Hyun
    • Journal of Nuclear Fuel Cycle and Waste Technology(JNFCWT)
    • /
    • v.18 no.2_spc
    • /
    • pp.247-260
    • /
    • 2020
  • A multi-regression model was developed to estimate the decommissioning cost for Kori unit 1 using foreign nuclear power plant (NPP) decommissioning cost data. First, the decommissioning cost data were collected for 13 boiling water reactors and 16 pressurized water reactors and converted into the values as of November 2019. Then, for the regression model, the decommissioning cost was chosen as the dependent variable, and two variables were selected as independent variables: a contamination factor that was designed to reflect the operational characteristics of the decommissioned NPP and the decommissioning period. A statistical package in the R language was used to derive the regression model. Finally, the regression model was applied to estimate the decommissioning cost for Kori unit 1. The estimated decommissioning cost for Kori unit 1 was 663.40~928.32 million US dollars (782,812~1,095,418 million Korean won).

Regression Tree based Modeling of Segmental Durations For Text-to-Speech Conversion System (Text-to-Speech 변환 시스템을 위한 회귀 트리 기반의 음소 지속 시간 모델링)

  • Pyo, Kyung-Ran;Kim, Hyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.191-195
    • /
    • 1999
  • 자연스럽고 명료한 한국어 Text-to-Speech 변환 시스템을 위해서 음소의 지속 시간을 제어하는 일은 매우 중요하다. 음소의 지속 시간은 여러 가지 문맥 정보에 의해서 변화하므로 제어 규칙에 의존하기 보다 방대한 데이터베이스를 이용하여 통계적인 기법으로 음소의 지속 시간에 변화를 주는 요인을 찾아내려고 하는 것이 지금의 추세이다. 본 연구에서도 트리기반 모델링 방법중의 하나인 CART(classification and regression tree) 방법을 사용하여 회귀 트리를 생성하고, 생성된 트리에 기반하여 음소의 지속 시간 예측 모델과, 자연스러운 끊어 읽기를 위한 휴지 기간 예측 모델을 제안하고 있다. 실험에 사용한 음성코퍼스는 550개의 문장으로 구성되어 있으며, 이 중 428개 문장으로 회귀 트리를 학습시켰고, 나머지 122개의 문장으로 실험하였다. 모델의 평가를 위해서 실제값과 예측값과의 상관관계를 구하였더니 음소의 지속 시간을 예측하는 회귀 트리에서는 상관계수가 0.84로 계산되었고, 끊어 읽는 경계에서의 휴지 기간을 예측하는 회귀 트리에서는 상관계수가 0.63으로 나타났다.

  • PDF

Estimation of software project effort with genetic algorithm and support vector regression (유전 알고리즘 기반의 서포트 벡터 회귀를 이용한 소프트웨어 비용산정)

  • Kwon, Ki-Tae;Park, Soo-Kwon
    • The KIPS Transactions:PartD
    • /
    • v.16D no.5
    • /
    • pp.729-736
    • /
    • 2009
  • The accurate estimation of software development cost is important to a successful development in software engineering. Until recent days, the model using regression analysis based on statistical algorithm and machine learning method have been used. However, this paper estimates the software cost using support vector regression, a sort of machine learning technique. Also, it finds the best set of optimized parameters applying genetic algorithm. The proposed GA-SVR model outperform some recent results reported in the literature.

Development of Approximate Cost Estimate Model for Aqueduct Bridges Restoration - Focusing on Comparison between Regression Analysis and Case-Based Reasoning - (수로교 개보수를 위한 개략공사비 산정 모델 개발 - 회귀분석과 사례기반추론의 비교를 중심으로 -)

  • Jeon, Geon Yeong;Cho, Jae Yong;Huh, Young
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.33 no.4
    • /
    • pp.1693-1705
    • /
    • 2013
  • To restore old aqueduct in Korea which is a irrigation bridge to supply water in paddy field area, it is needed to estimate approximate costs of restoration because the basic design for estimation of construction costs is often ruled out in current system. In this paper, estimating models of construction costs were developed on the basis of performance data for restoration of RC aqueduct bridges since 2003. The regression analysis (RA) model and case-based reasoning (CBR) model for the estimation of construction costs were developed respectively. Error rate of simple RA model was lower than that of multiple RA model. CBR model using genetic algorithm (GA) has been applied in the estimation of construction costs. In the model three factors like attribute weight, attribute deviation and rank of case similarity were optimized. Especially, error rate of estimated construction costs decreased since limit ranges of the attribute weights were applied. The results showed that error rates between RA model and CBR models were inconsiderable statistically. It is expected that the proposed estimating method of approximate costs of aqueduct restoration will be utilized to support quick decision making in phased rehabilitation project.

Damage Monitoring in Foundation-Structure Interface of Harbor Caisson Using Vibration-based Autoregressive Model (진동기반 자기회귀모델을 통한 항만케이슨 지반-구조 경계부의 손상 모니터링)

  • Lee, So-Ra;Lee, So-Young;Kim, Jeong-Tae;Park, Woo-Sun
    • Journal of Korean Society of Coastal and Ocean Engineers
    • /
    • v.23 no.1
    • /
    • pp.18-25
    • /
    • 2011
  • This study presents the damage monitoring method in foundation-structure interface of harbor caisson using vibration-based autoregressive (AR) model. In order to achieve the objective, the following approaches are implemented. Firstly, vibration-based AR model is selected to monitor the damage in foundation-structure interface of caisson structure. Secondly, finite element analysis on a caisson structure model is implemented to evaluate the vibration-based damage monitoring method. Finally, vibration test on a caisson structure model is performed to evaluate applicability of vibration-based AR model method for foundation-structure interface of caisson structure.

Computational analysis of the reentrant wave propagation in three-dimensional cardiac tissue (3차원 심근조직에서의 회귀성 파동에 대한 수치적 해석)

  • Kim, Hun-Young;Leem, Chae-Hun;Shim, Eun-Bo
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2004.11a
    • /
    • pp.57-63
    • /
    • 2004
  • 본 연구에서는 3차원 심근조직에서의 회귀성파동에 대한 수치적 해석결과를 제시한다. 심근 조직에서의 회귀성파동은 심실세동(ventricular fibrillation)의 원인으로 지목되고 있으며 심근세포 이온채널 또는 전기전도시스템 등과 같은 여러 가지 요소들이 관련된 복합적 현상으로 생각되고 있다. 지금까지 이에 관한 많은 연구가 전기생리학적 모델을 이용하여 이루어진바 있으며, 주로 동물 심근세포모델에 기반으로 균일한 2차원 또는 3차원 모델에서의 전기전도 현상 해석을 한 바 있다. 그러나 실제 심장조직의 경우, 두께를 가진 3차원적 형상을 지니고 있으며 층을 따라서 전기생리학적으로 상이한 특성을 가진 세포들로 구성된다. 즉 심근은 층을 가로질러 Epi-cardiac, mid-cardiac, endo-cardiac cell들로 구성되며 각기 다른 APD(action potential duration)을 가지고 있다. 따라서 본 연구에서는 이러한 세가지 종류의 인체 심근세포모델을 사용한 3차원 심근조직에서의 활동전위 전도현상에 대한 결과를 제시한다. 이를 위하여 기존의 인체 3가지 종류의 심근세포 모델을 구현하여 그 타당성을 검토한다. 그리고 이를 바탕으로 3차원 조직모델을 구현하는데, simplified bidomain방법을 사용하였다. 3차원 공간상에서 심근세포에 의한 활동전위 전달현상을 해석하기 위하여 유한요소법을 도입한다. 최종적으로는 3가지의 심근세포층을 가진 3차원 심근조직을 구성하고, 여기에 회귀성 파동을 유도한다. 그리고 단일층으로 이루어진 3차원조직에서의 결과와 비교 분석하여 다세포층에 의한 불균일 효과를 분석하였다.

  • PDF