• Title/Summary/Keyword: 회귀분석 방법

Search Result 3,596, Processing Time 0.04 seconds

A Bayesian Regression Model to Estimate the Deterioration Rate of Track Irregularities (궤도틀림 진전율 추정을 위한 베이지안 회귀분석 모형 연구)

  • Park, Bum Hwan
    • Journal of the Korean Society for Railway
    • /
    • v.19 no.4
    • /
    • pp.547-554
    • /
    • 2016
  • This study considered how to estimate the deterioration rate of the track quality index, which represents track geometric irregularity. Most existing studies have used a simple linear regression and regarded the slope of the regression equation as the progress rate. In this paper, we present a Bayesian approach to estimate the track irregularity progress. This Bayesian approach has many advantages, among which the biggest is that it can formally include the prior distribution of parameters which can be derived from historic data or from expert experiences; then, the rate can be expressed as a probability distribution. We investigated the possibility of applying the Bayesian method to the estimation of the deterioration rate by comparing our bayesian approach to the conventional linear regression approach.

A new regression analysis method in network model (네트워크 모델을 이용한 새로운 회귀분석방법)

  • 김기복;인치호;김희석
    • Proceedings of the IEEK Conference
    • /
    • 2003.07a
    • /
    • pp.410-413
    • /
    • 2003
  • 본 논문에서는 네트워크가 막연히 무작위적이라고 하기에는 사회나 세포, 인터넷 등이 어떤 법칙에 따라 짜연진 것처럼 보인다. 하지만 복잡한 네트워크의 모습이 네트워크의 모델과 실제로 똑같은지를 비교하기는 그리 쉬운 문제가 아니다. 무작위적 네트워크의 경우는 수학적으로 엄밀히 말하자면 쁘아송분포를 따른다. 쁘아송분포에서는 모든 점들이 동일한 확률로 여러 점들에 연결되는 기회를 갖는다. 즉 균일한 분포이다. 따라서 상당히 적거나 반대로 상당히 많은 수의 연결선을 가진 점은 극히 드물다. 이 경우 연결선 분포가 종 모양이 된다. 대부분의 점들이 곡선에 해당하는 연결선 수를 갖게 된다. 본 논문에서 쁘아송분포와 회귀분석을 통하여 하나 또는 둘 이상의 변수들 사이에 어떤 관계를 함수관계로 나타내어 분석하는 방법을 보이고 회귀분석 방법에 의해서 미래를 예측하고자 한다.

  • PDF

Fuzzy Theil regression Model (Theil방법을 이용한 퍼지회귀모형)

  • Yoon, Jin Hee;Lee, Woo-Joo;Choi, Seung-Hoe
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.23 no.4
    • /
    • pp.366-370
    • /
    • 2013
  • Regression Analysis is an analyzing method of regression model to explain the statistical relationship between explanatory variable and response variables. This paper introduce Theil's method to find a fuzzy regression model which explain the relationship between explanatory variable and response variables. Theil's method is a robust method which is not sensive to outliers. Theil's method use medians of rate of increment based on randomly chosen pairs of each components of ${\alpha}$-level sets of fuzzy data in order to estimate the coefficients of fuzzy regression model. We propose an example to show Theil's estimator is robust than the Least squares estimator.

A new approach to estimate the link travel time by using AVL technology (AVL을 이용한 구간통행시간 산출기법 개발)

  • 김성인;이영호;남기효
    • Journal of Korean Society of Transportation
    • /
    • v.17 no.2
    • /
    • pp.91-103
    • /
    • 1999
  • 이 연구는 자동 차량위치 측정기법(Automatic Vehicle Location, AVL)을 이용해서 수집한 교통상황자료를 가지고 구간 통행시간을 산출하는 알고리즘을 개발한다. AVL기법을 이용하는 경우, 처리해야 할 자료량이 많아서 실시간에 정보를 산출하는 것이 힘들다. 따라서 이 연구는 처리해야 할 자료량을 가능한 한 줄이고 자료량이 적은 경우에도 효율적인 구간통행시간을 산출하는 알고리즘을 제시한다. 이 연구의 방법론은 크게 4가지인데, 첫째, 해석 기법, 둘째, 회귀분석, 셋째, 인공지능 및 전문가 시스템, 넷째, 통계분석이다. 이 방법론을 이용해서 세 단계 알고리즘을 개발하는데, 첫째는 실시간 분석통계 알고리즘, 둘째는 과거자료분석 알고리즘, 셋째는 자료응합 알고리즘이다. 이 알고리즘 가운데 자료융합 알고리즘 결과가 산출하고자 하는 구간 통행시간이다. 실시간 분석통계 알고리즘은 연속하는 세 개 구간의 통행 패턴을 이용해서 가운데 구간의 통행시간을 산출하는 방법을 제시한다. 또 실시간 분석통계 알고리즘으로 산출하지 못한 구간은 인접구간 상관도 정보를 이용해서 구간통행시간을 추정한다. 과거자료분석 알고리즘은 회귀분석을 이용해서 시간대별 통행시간 평균과 분산을 구하고, 이 결과를 바탕으로 인접구간 상관도 정보를 오프라인으로 구하는 알고리즘이다. 자료융합 알고리즘은 2가지 단계를 거치는데, 그것은 실시간 자료융합과 최종 자료융합이다. 실시간 자료융합은 실시간에 가까운 자료원의 실시간 분석통계 알고리즘 결과 패턴과 인접구간 상관도 정보를 이용한 구간통행시간 추정 결과를 이용해서 패턴에 따라 다른 방법으로 융합을 하는 알고리즘을 개발한다. 최종 자료융합은 실시간 자료융합 결과와 회귀분석 결과의 패턴을 이용해서 구간 통행시간을 산출한다. 이 연구를 기존 연구와 비교할 때, 세 가지 독차성이 있다. 첫째는 연속하는 세 구간 통행 패턴을 분석하였기 때문에 기존의 노드의존 방식을 탈피하였다는 점이다. 따라서 자료량이 적은 경우도 믿을만한 통행시간을 산출할 수 있다는 것이다. 둘째는 인접구간 상관도 정보를 구간통행시간 산출에 이용하였기 때문에 자료를 효율적으로 이용할 수 있다는 점이다. 셋째는 자료원 패턴을 분류하고 전문가 시스템을 이용하여 자료융합 하였기 때문에 수행속도가 빠르고, 신뢰성있는 정보를 제공한다는 점이다. 이 연구는 개발한 알고리즘 정확도를 검증하기 위해서 두 가지 검증방법을 이용하였다. 첫째는 시뮬레이션을 이용한 것이고, 둘째는 실제 주행조사 분석을 이용한 것이다. 두 가지 검증 결과는 알고리즘 정확도를 보여준다.

  • PDF

A study of statistical analysis method of monitoring data for freshwater lake water quality management (담수호 수질관리를 위한 측정자료의 통계적 분석방법 연구)

  • Chegal, Sundong;Kim, Jin
    • Journal of Korea Water Resources Association
    • /
    • v.57 no.1
    • /
    • pp.9-19
    • /
    • 2024
  • As using public monitoring data, analysing a trends of water quality change, establishing a criteria to determine abnormal status and constructing a regression model that can predict Chlorophyll-a, an indicator of eutrophication, was studied. Accordingly, the three freshwater lakes were selected, approximately 20 years of water quality monitoring data were analyzed for periodic changes in water quality each year using regression analysis, and a method for determining abnormalities was presented by the standard deviation at confidence level 95%. By calculating the temporal change rate of Chlorophyll-a from irregular observed data, analyzing correlations between the rate and other water quality items, and constructing regression models, a method to predict changes in Chlorophyll-a was presented. The results of this study are expected to contribute to freshwater lake water quality management as an approximate water quality prediction method using the statistical model.

A Study on the Estimation Method of Hemoglobin Based on Linear and Multiple Regression Analysis Using Health Examination Big Data (건강검진 빅데이터를 이용한 선형 및 다중회귀분석 기반 헤모글로빈 추정 방법에 관한 연구)

  • Hong, Sang-Hoon;Hong, Kwang-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.553-555
    • /
    • 2021
  • 빈혈의 유병률은 매년 증가하고 있으나 이를 가벼운 질병으로 인식해 치료 시기를 놓치는 환자들이 존재한다. 빈혈의 발생원인으로 혈액 내 헤모글로빈 및 헤모글로빈 내 철 부족이 있으며, 헤모글로빈 측정기술의 경우 채혈 이외에 사람의 신체 및 건강 정보를 적용한 사례는 찾아보기 어렵다. 본 논문에서는 신체(키, 몸무게 및 허리둘레) 및 건강 정보(혈청지오티, 이완기 혈압 및 감마지티피 등)가 포함된 건강검진 빅데이터를 이용하여 단일 특징에 대해 선형회귀분석을 수행하고, 다중 특징에 대해 다중회귀분석을 수행하여 회귀분석 식을 산출, 산출된 회귀분석 식을 통해 헤모글로빈을 추정하여 실제 헤모글로빈값과 오차율을 계산하고 비교한다. 실험 결과, 선형회귀분석 식을 통해 헤모글로빈을 추정하였을 때 평균 8.124%의 오차율이 계산되었으며, 다중회귀분석의 경우 선형회귀분석보다 낮은 6.767%의 오차율이 계산되었다.

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management & Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

The methods of forecasting for the number of student based on promotion proportion (학년진급률에 따른 학생수 예측방법)

  • Kim, Jong-Tae
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.5
    • /
    • pp.857-867
    • /
    • 2009
  • The purpose of this paper is to suggest the methods of forecasting for the number of the elementary, middle and high-school student based on the proportion of promotion until 2026 year. The suggested methods are the proportion of promotion, mov baseverage, Holt-W bters model, SARIMA, regression fit. As the result, the abilities of forecasting by the method of moving average are better than those of other methods.

  • PDF

Trend in Fuzzy Regression Model

  • 최승회;김해경;정은경
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.73-77
    • /
    • 2004
  • 종속변수와 독립변수 사이의 통계적인 관계를 설명하기 위해 사용되는 회귀모형을 분석하는 방법을 회귀분석이라 한다. 독립변수와 종속변수가 퍼지수인 퍼지회귀모형을 추정하기 위해 최소전대편차추정량을 제시하고. 예제를 이용하여 퍼지최소절대편차회귀모형과 퍼지최소자 승회귀모형의 효율성을 평가한다.

  • PDF

기업부도예측을 위한 통합알고리즘

  • Bae Jae-Gwon;Kim Jin-Hwa
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2006.06a
    • /
    • pp.195-202
    • /
    • 2006
  • 본 연구에서는 보다 효과적인 기업부도예측을 위하여, 동계적 방법과 인공지능 방법을 결합한 통합모형을 제시하였다. 이를 위하여 통계적인 모형 중에서 가장 널리 활용되고 있는 다변량 판별분석, 로지스틱 회귀분석과 인공 지능적인 방법으로서 최근 널리 사용되고 있는 인공신경망, 규칙유도기법, 베이지안 망의 5가지 방법론을 통합한 Voting with Performance & Weights from ANN(WP-ANN) 통합모형을 제시하였다. 실험결과, 본 연구에서 제안한 WP-ANN 통합모형은 다변량 판별분석, 로지스탁 회귀분석, 인공신경망, 규칙유도기법, 베이지안 망 등의 단일모형과 비교한 결과 가장 예측정확성이 유수한 것으로 나타났다. 따라서 본 연구를 통해 기업부도예측에 있어서 WP-ANN 통합모형이 기존의 모형들에 비해 우수한 예측정확성을 나타냄을 알 수 있었다.

  • PDF