• 제목/요약/키워드: Regression estimator

검색결과 311건 처리시간 0.025초

BLS 무응답 보정법을 이용한 대체법과 이월대체법에 관한 연구 (A Comparison of BLS Non-Response Adjustment and Cross-Wave Regression Imputation Methods)

  • 이상은;신기일
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.909-921
    • /
    • 2010
  • 패널 자료에서 무응답이 발생한 경우에는 횡시점회귀대체법(cross-wave regression imputation) 등과 같은 대체법을 이용하여 무응답 문제를 해결한다. 최근 표본 틀(sampling frame) 자료를 이용하여 무응답 가중치 보정을 하는 BLS 무응답 보정법은 패널 자료에도 적용 가능한 방법으로 알려져있다. 본 논문에서는 패널자료에서 BLS 무응답 보정법을 이용한 대체법을 연구하였으며 자료가 경향이 있는 비정상시계열(nonstationary process with drift)을 따른 다는 조건하에서 BLS 무응답 보정법과 횡시점회귀대체법의 하나인 이월대체법(carry-over imputation)과의 이론적 관계를 살펴보았다. 모의실험을 통하여 이론적인 결과를 확인하였으며, 2007년 매월노동통계 자료를 이용하여 두 방법의 우수성을 비교하였다.

주성분회귀분석에서 주성분선정을 위한 새로운 방법 (Procedure for the Selection of Principal Components in Principal Components Regression)

  • 김부용;신명희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.967-975
    • /
    • 2010
  • 데이터마이닝 분야에서의 회귀모형에는 연관성이 높은 설명변수들이 포함되어 다중공선성을 유발하는 경우가 많은데, 다중공선성이 야기하는 문제를 해결하기 위하여 주성분회귀분석을 적용할 수 있다. 이 분석에서는 적절한 주성분을 선정하는 과정이 핵심인데, 기존의 선정방법들은 다중공선성을 잘 해결하지 못하거나 모형의 적합성을 저하시킨다는 지적을 받고 있다. 따라서 본 논문에서는 다중공선성 문제와 적합성 저하 현상을 동시에 해결할 수 있는 새로운 선정방법을 제안하였다. 다중공선성에 의해 최소제곱추정량의 분산이 팽창되는 문제를 주성분회귀에 의해 해결할 수 있지만, 주성분의 일부를 선정함에 따라 발생하는 편의도 동시에 통제해야 한다. 따라서 주성분회귀추정량의 평균제곱오차를 최소가 되게 하는 상태지수를 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준 모형을 구축하였다. 선정기준의 상한과 하한을 설정하고, 상태지수가 상한을 초과하면 해당 주성분을 제외시키고, 하한에 미달하면 해당 주성분을 포함시킨다. 그리고 상한과 하한 사이의 상태지수에 대응하는 주성분들에 대해서는 일반화선형검정을 순차적으로 적용하여 주성분을 선정하는 방법이다.

로버스트추정에 바탕을 둔 주성분로지스틱회귀 (Principal Components Logistic Regression based on Robust Estimation)

  • 김부용;강명욱;장혜원
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.531-539
    • /
    • 2009
  • 로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.

대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형 (Divide and conquer kernel quantile regression for massive dataset)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.569-578
    • /
    • 2020
  • 분위수 회귀모형은 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 특히 커널 분위수 회귀모형은 비선형 관계식을 고려하기 위하여 양정치 커널함수(kernel function)에 의해 만들어지는 재생 커널 힐버트 공간(reproducing kernel Hilbert space)에서 비선형 조건부 분위수 함수를 추정한다. 그러나 KQR은 이차계획법으로 공식화되어 많은 계산비용을 필요로 하므로 컴퓨터 메모리 능력의 제한으로 대용량 자료의 분석은 불가능하다. 이러한 문제점을 해결하기 위하여 본 논문에서는 분할정복(divide and conquer) 알고리즘을 활용한 KQR 추정법(DC-KQR)을 제안한다. DC-KQR은 먼저 전체 훈련자료를 몇 개의 부분집합으로 무작위로 분할(divide)한 후, 각각의 부분집합에 대하여 KQR 분위수 함수를 추정하고 이들의 산술 평균을 이용하여 최종적인 추정량으로 통합(conquer)하는 기법이다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DC-KQR의 효율적인 성능과 활용 가능성을 확인하였다.

영상의 노출 보정을 고려한 공간 정합 알고리듬 연구 (On the Spatial Registration Considering Image Exposure Compensation)

  • 김동식;이기륭
    • 대한전자공학회논문지SP
    • /
    • 제44권2호
    • /
    • pp.93-101
    • /
    • 2007
  • 정합과 노출 보정을 동시에 최적화하기 위하여 반복적인 정합 알고리듬인 Lucas-Kanade 알고리듬을 히스토그램 변환에 기초한 노출 보정 알고리듬과 접목하였다. 단순 회귀 모델에 기초하여 비매개변수 추정인 실험적 조건 평균과 그의 다항식 근사를 이용하여 노출 보정을 시도하였다. 제안한 동시 최적화 알고리듬은 각 최적화 과정의 분리화가 가능하므로 기존의 Mann이나 Candocia의 동시 최적화 알고리듬에 비하여 구현의 융통성 측면에서 유리하다. 투사 공간 변환 관계를 가지는 실영상 들을 가지고 모의실험을 수행한 결과에서 보면 노출 보정을 고려하지 않은 경우에 비하여 좋은 성능을 얻음을 확인할 수 있었다.

Stability of Construction Cost-variability Factor Rankings from Professionals' Perspective: Evidence from Dar es Salaam -Tanzania

  • Shabani, Neema;Mselle, Justine;Sanga, Samwel Alananga;Kanuti, Arbogasti Isidori
    • Journal of Construction Engineering and Project Management
    • /
    • 제8권2호
    • /
    • pp.17-33
    • /
    • 2018
  • This study investigates the stability of professionals' cost variability factor-rankings across different levels of cost-variability and response scenarios. Descriptive statistics are used to examine the stability of factor-ranking for 20 cost variability factors and a Multinomial Logistic (MNL) regression model was implemented to examine the stability of cost variability factors across three cost variability levels. The finding on the descriptive statistics indicated that professionals' factors-rankings are stable only for external factors. The MNL regression results on factor-stability suggested that 8 out of the 20 evaluated factors were unstable determinant of lower cost variability levels. These factors are "risk associated with the project", "personal bias and poor professionalism of the estimators", "limited time available to complete the project", "lack of skills and experience by estimator" "geographical location of projects", "incomplete & rush designs for estimate", "unforeseen or unexpected site constraints", "high class bidders for the contractors". Similarly lack of experience and large size projects were observed to be unstable as well. These observations suggest that professionals' view on pre-tender cost variability factor-ranking yields unstable factor rankings hence should not be relied upon as the only mechanisms to mitigate cost related risks in construction projects.

한국청소년패널조사(KYPS) 가중치 부여 방법 연구: 중학교 2학년 패널의 경우 (A Study on the Construction of Weights for KYPS)

  • 박민규;이경상;박현수;강현철
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.173-186
    • /
    • 2011
  • 본 연구에서는 2003년 시작된 한국청소년패널조사 중학교 2학년 패널자료 분석을 위해 필수적인 각 연도별 횡단면, 종단면 가중치 산출방안을 소개하고 있다. 패널 모집 당시 추출된 표본이 대표하는 모집단의 종단면적 변화 분석을 위한 종단면 가중치는 로지스틱 회귀분석을 이용한 무응답 보정과 사후 층화를 통해 산출되었으며, 조사 연도의 표본 대응 모집단 분석을 위해 필수적인 횡단면 가중치는 전년도 대비 응답률과 사후 층화를 통해 산출되었다.

  • PDF

민감도 분석을 이용한 겹치기 필릿용접부 비드형상 예측에 관한 연구 (A Study on the Prediction of Bead Geometry for Lab Joint Fillet Welds Using Sensitivity Analysis)

  • 정재원;김일수;김학형;김인주;방홍인
    • 한국공작기계학회논문집
    • /
    • 제17권6호
    • /
    • pp.49-55
    • /
    • 2008
  • Arc welding process is one of the most important technologies to join metal plates. Robotic welding offers the reduced manufacturing cost sought, but its widespread use demands a means of sensing and correcting for inaccuracies in the part, the fixturing and the robot. A number of problems that need to be addressed in robotic arc welding processes include sensing, joint tracking, and lack of adequate models for process parameter prediction and quality control. Problems with parameter settings and quality control occur frequently in the GMA(Gas Metal Arc) welding process due to the large number of interactive process parameters that must be set and accurately controlled. The objectives of this paper are to realize the mapping characteristics of bead width using a sensitivity analysis and develop the neural network and multiple regression method, and finally select the most accurate model in order to control the weld quality(bead width) for fillet welding. The experimental results show that the proposed neural network estimator can predict bead width with reasonable accuracy, and guarantee the uniform weld quality.

생존분석을 이용한 디스플레이 FAB의 반송시간 예측모형 (Prediction Model on Delivery Time in Display FAB Using Survival Analysis)

  • 한바울;백준걸
    • 대한산업공학회지
    • /
    • 제40권3호
    • /
    • pp.283-290
    • /
    • 2014
  • In the flat panel display industry, to meet production target quantities and the deadline of production, the scheduler and dispatching systems are major production management systems which control the order of facility production and the distribution of WIP (Work In Process). Especially the delivery time is a key factor of the dispatching system for the time when a lot can be supplied to the facility. In this paper, we use survival analysis methods to identify main factors of the delivery time and to build the delivery time forecasting model. To select important explanatory variables, the cox proportional hazard model is used to. To make a prediction model, the accelerated failure time (AFT) model was used. Performance comparisons were conducted with two other models, which are the technical statistics model based on transfer history and the linear regression model using same explanatory variables with AFT model. As a result, the mean square error (MSE) criteria, the AFT model decreased by 33.8% compared to the statistics prediction model, decreased by 5.3% compared to the linear regression model. This survival analysis approach is applicable to implementing the delivery time estimator in display manufacturing. And it can contribute to improve the productivity and reliability of production management system.

Determinants of Voluntary Audit of Small and Medium Sized Enterprises: Evidence from Vietnam

  • HA, Hanh Hong;NGUYEN, Anh Huu
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제7권5호
    • /
    • pp.41-50
    • /
    • 2020
  • The paper investigates the factors that affect the demand for a voluntary audit of small and medium-sized enterprises (SMEs) in Vietnam. A structured questionnaire survey of 284 SMEs was employed, preceded by in-depth interviews with auditors and SMEs' managers. The research used logistic regression estimator to address econometric issues and to improve the accuracy of the regression coefficients. The results show that the degree of director's view on voluntary audit, related stakeholder, degree of recommendation, and firm size have a statistically significant positive effect on audit decisions of SMEs while degree of audit fee has a statistically significant negative effect, and degree of subjective norm does not affect. This indicated that SMEs are more likely to have an external audit if they have some typical features: it is becoming larger in terms of size, and the directors consider that the audit has a relative benefit outweighing its cost. The research results suggested that Vietnam Government should make a statutory audit of SMEs' financial statements rather than make it an option for SMEs. The auditing firms were also recommended to actively take their audit services to SMEs rather than waiting for the SMEs' managers to contact them for their services.