• 제목/요약/키워드: rank regression

검색결과 275건 처리시간 0.029초

An improvement of estimators for the multinormal mean vector with the known norm

  • Kim, Jaehyun;Baek, Hoh Yoo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.435-442
    • /
    • 2017
  • Consider the problem of estimating a $p{\times}1$ mean vector ${\theta}$ (p ${\geq}$ 3) under the quadratic loss from multi-variate normal population. We find a James-Stein type estimator which shrinks towards the projection vectors when the underlying distribution is that of a variance mixture of normals. In this case, the norm ${\parallel}{\theta}-K{\theta}{\parallel}$ is known where K is a projection vector with rank(K) = q. The class of this type estimator is quite general to include the class of the estimators proposed by Merchand and Giri (1993). We can derive the class and obtain the optimal type estimator. Also, this research can be applied to the simple and multiple regression model in the case of rank(K) ${\geq}2$.

Marginal Likelihoods for Bayesian Poisson Regression Models

  • Kim, Hyun-Joong;Balgobin Nandram;Kim, Seong-Jun;Choi, Il-Su;Ahn, Yun-Kee;Kim, Chul-Eung
    • Communications for Statistical Applications and Methods
    • /
    • 제11권2호
    • /
    • pp.381-397
    • /
    • 2004
  • The marginal likelihood has become an important tool for model selection in Bayesian analysis because it can be used to rank the models. We discuss the marginal likelihood for Poisson regression models that are potentially useful in small area estimation. Computation in these models is intensive and it requires an implementation of Markov chain Monte Carlo (MCMC) methods. Using importance sampling and multivariate density estimation, we demonstrate a computation of the marginal likelihood through an output analysis from an MCMC sampler.

Unsupervised feature selection using orthogonal decomposition and low-rank approximation

  • Lim, Hyunki
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.77-84
    • /
    • 2022
  • 본 논문에서는 새로운 비지도 특징 선별 기법을 제안한다. 기존 비지도 방식의 특징 선별 기법들은 특징을 선별하기 위해 가상의 레이블 데이터를 정하고 주어진 데이터를 이 레이블 데이터에 사영하는 회귀 분석 방식으로 특징을 선별하였다. 하지만 가상의 레이블은 데이터로부터 생성되기 때문에 사영된 공간이 비슷하게 형성될 수 있다. 따라서 기존의 방법들에서는 제한된 공간에서만 특징이 선택될 수 있었다. 이를 해소하기 위해 본 논문에서는 직교 사영과 저랭크 근사를 이용하여 특징을 선별한다. 이 문제를 해소하기 위해 가상의 레이블을 직교 사영하고 이 공간에 데이터를 사영할 수 있도록 한다. 이를 통해 더 주요한 특징 선별을 기대할 수 있다. 그리고 사영을 위한 변환 행렬에 저랭크 제한을 두어 더 효과적으로 저차원 공간의 특징을 선별할 수 있도록 한다. 이 목표를 달성하기 위해 본 논문에서는 비용 함수를 설계하고 효율적인 최적화 방법을 제안한다. 여섯 개의 데이터에 대한 실험 결과는 제안된 방법이 대부분의 경우 기존의 비지도 특징 선별 기법보다 좋은 성능을 보여주었다.

A Comparison of Construction Cost Estimation Using Multiple Regression Analysis and Neural Network in Elementary School Project

  • Cho, Hong-Gyu;Kim, Kyong-Gon;Kim, Jang-Young;Kim, Gwang-Hee
    • 한국건축시공학회지
    • /
    • 제13권1호
    • /
    • pp.66-74
    • /
    • 2013
  • In the early stages of a construction project, the most important thing is to predict construction costs in a rational way. For this reason, many studies have been performed on the estimation of construction costs for apartment housing and office buildings at early stage using artificial intelligence, statistics, and the like. In this study, cost data held by a provincial Office of Education on elementary schools constructed from 2004 to 2007 were used to compare the multiple regression model with an artificial neural network model. A total of 96 historical data were classified into 76 historical data for constructing models and 20 historical data for comparing the constructed regression model with the artificial neural network model. The results of an analysis of predicted construction costs were that the error rate of the artificial neural network model is lower than that of the multiple regression model.

EB기법을 이용한 사고잦은 곳 개선사업 우선순위 판정기법 개발 (Development of Evaluation Model for Black Spot Improvement Priorities by using Emperical Bayes Method)

  • 정성봉;황보희;성낙문;이선하
    • 대한교통학회지
    • /
    • 제27권3호
    • /
    • pp.81-90
    • /
    • 2009
  • 도로 네트워크의 안전 관리는 기본적으로 교통안전 조사를 위한 사이트(교통사고 잦은 지점) 선정, 안전문제에 대한 진단, 잠재적 위험요소들에 대한 가능한 대안 선정, 주어진 예산 제약 하에 대안간의 우선순위 결정과 같은 순서로 이루어진다(Persaud, 2001). 효율적인 안전 조사를 위해 요구되는 지점(교통사고 잦은 지점) 선정에 대한 과정은 매우 중요하다. 이에, 본 연구는 인천시 4지 신호 교차로 중 교통사고 잦은 지점으로 선정된 지점의 3년간(2004~2006년) 사고 자료와 기하구조 자료를 이용하여 EB 기법 이용 시 필요한 사고예측모델을 개발하였다. 또한, 교통사고 잦은 지점을 선정하는데 있어 현재 우리나라에서 적용되고 있는 단순사고건수와 심각도를 고려하여 선정된 우선순위와 단순사고건수 대신 EB 기법을 이용하여 예측된 사고건수를 이용하여 선정된 우선순위 비교를 통해 기존 방법의 한계를 제시하고 합리적인 예측모형 개발 필요성을 보여주고자 하였다. 분석 결과, 총 사고건수 추정 시 기존의 사고 예측 방법인 비선형 회귀모형과 EB 기법의 결과 값 모두 예측력이 높은 것으로 나타났지만 지점별 사고건수 예측력을 함께 고려할 경우엔 EB 기법이 비선형 회귀 모형(포아송)의 결과보다 예측력이 좋은 것으로 나타났다. 또한, 도출된 우선순위 비교 결과 대부분의 지점의 우선순위는 크게 변동이 없었으나, 서해4거리 등 몇 개 지점의 개선우선순위에는 상당한 변동이 발생하는 것으로 나타났다. 이는 실제 사고건수를 이용할 경우 발생하는 RTM문제를 본 연구에서 제안한 기법을 사용할 경우 해결가능하다는 것을 시사한다.

IFRS 전후 이익조정과 신용평가등급의 관계 (Relationship of earnings and credit rating before and after IFRS)

  • 안수경;김광용
    • 디지털융복합연구
    • /
    • 제12권11호
    • /
    • pp.99-112
    • /
    • 2014
  • 본 연구에서는 기업의 신용평가등급(RANK) 변화(하락,상승)가 실물이익조정에 미치는 영향을 살펴보았다. 가설검증을 위해 2008년부터 2013년까지 한국거래소에 상장되어 있는 기업을 대상으로 총 6년 동안 기업-연도 2,583개의 표본을 사용하여 연구를 진행하였으며 실증분석한 연구결과는 다음과 같다. 첫째, 신용평가등급(RANK)과 실물이익조정의 측정치인 비정상영업현금흐름(ACFO)과 비정상재량적비용(ADE)간에는 양(+)의 관련성이 나타났으며, 비정상제조원가(AMC) 간에는 음(-)의 관련성이 나타났다. 둘째, IFRS 도입과 비정상재량적비용(ADE) 간에는 양(+)의 관련성이 나타났으며, 비정상제조원가(AMC) 간에는 음(-)의 관련성이 나타났다. 셋째, 신용평가등급(RANK)이 상승한 경우 비정상영업현금흐름(ACFO)과는 1%수준에서 유의한 양(+)의 관련성이 나타났고, 비정상재량적비용(ADE)과는 유의하지 않은 음(-)의 관련성이 나타났고, 비정상제조원가(AMC)는 10%수준에서 유의한 양(+)의 관련성이 나타났다. 넷째, 신용평가등급이 하락한 경우 비정상영업현금흐름(ACFO)과는 음(-)의 관련성이 나타났고, 비정상제조원가(AMC)와는 양(+)의 관련성이 나타나 신용평가등급이 하락한 기업은 자본조달비용을 감소시키기 위해 미래의 현금흐름을 포기하더라도 양(+)의 실물이익조정을 행하는 것으로 나타났다.

DEA를 이용한 의료기관의 효율성 벤치마킹 (Efficiency Benchmarking of Hospitals Using DEA)

  • 서수경;권순만
    • 한국병원경영학회지
    • /
    • 제5권1호
    • /
    • pp.84-104
    • /
    • 2000
  • This paper analyzes the technical efficiency of thirty two hospitals in Korea using DEA(Data Envelopment Analysis). DEA provides an efficiency measure for each hospital compared to the most efficient one. The amount and sources of inefficiency that are identified by the DEA are useful for benchmarking to improve efficiency. The results from multiple regression analysis and Wilcoxon Rank Sum test show that bed turnover, hospital size, and average length of stay are related to hospital efficiency.

  • PDF

변수선택 편향이 없는 회귀나무를 만들기 위한 알고리즘 (Regression Trees with. Unbiased Variable Selection)

  • 김진흠;김민호
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.459-473
    • /
    • 2004
  • 본 논문에서는 Breiman 등(1984)의 전체탐색법이 갖고 있는 변수선택 편향을 극복할 수 있는 알고리즘을 제안하였다. 제안한 알고리즘은 노드의 분리 변수를 선택하는 단계와 그 선택된 변수에 대해서만 이진분리를 위한 분리점을 찾는 단계로 나뉘어져 있다. 예측변수가 연속형 일 때는 스피어만의 순위상관계수에 의한 검정을 수행하고, 범주형일 때는 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 통계적으로 가장 유의한 변수를 분리변수로 선택하였고 Breiman 등(1984)의 전체탐색법을 그 변수에만 적용하여 노드의 분리기준을 정하였다 모의실험 연구를 통해 Breiman등(19히)의 CART와 제안한 알고리즘을 변수선택 편의, 변수선택력파 평균제곱오차 측면에서 서로 비교하였다. 아울러 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

A cautionary note on the use of Cook's distance

  • Kim, Myung Geun
    • Communications for Statistical Applications and Methods
    • /
    • 제24권3호
    • /
    • pp.317-324
    • /
    • 2017
  • An influence measure known as Cook's distance has been used for judging the influence of each observation on the least squares estimate of the parameter vector. The distance does not reflect the distributional property of the change in the least squares estimator of the regression coefficients due to case deletions: the distribution has a covariance matrix of rank one and thus it has a support set determined by a line in the multidimensional Euclidean space. As a result, the use of Cook's distance may fail to correctly provide information about influential observations, and we study some reasons for the failure. Three illustrative examples will be provided, in which the use of Cook's distance fails to give the right information about influential observations or it provides the right information about the most influential observation. We will seek some reasons for the wrong or right provision of information.

Nonparametric Method using Placement in an Analysis of a Covariance Model

  • Hwang, Dong-Min;Kim, Dong-Jae
    • Communications for Statistical Applications and Methods
    • /
    • 제19권5호
    • /
    • pp.721-729
    • /
    • 2012
  • Various methods control the influence of a covariate on a response variable. These methods are analysis of covariance(ANCOVA), RANK ANCOVA, ANOVA of (covariate-adjusted) residuals, and Kruskal-Wallis tests on residuals. Covariate-adjusted residuals are obtained from the overall regression line fit to the entire data set that ignore the treatment levels or factors. It is demonstrated that the methods on covariate-adjusted residuals are only appropriate when the regression lines are parallel and covariate means are equal for all treatments. In this paper, we proposed the new nonparametric method on the ANCOVA model, as applying joint placement in a one-way layout on residuals as described in Chung and Kim (2007). A Monte Carlo simulation study is adapted to compare the power of the proposed procedure with those of the previous procedure.