• 제목/요약/키워드: Count Data Model

검색결과 229건 처리시간 0.039초

관리도 성능평가모형을 통한 관리한계선 갱신주기 탐지기법 (Update Cycle Detection Method of Control Limits using Control Chart Performance Evaluation Model)

  • 김종우;박정술;김준석;김성식;백준걸
    • 대한산업공학회지
    • /
    • 제40권1호
    • /
    • pp.43-51
    • /
    • 2014
  • Statistical process control (SPC) is an important technique for monitoring and managing the manufacturing process. In spite of its easiness and effectiveness, some problematic sides of application exist such that the SPC techniques are hardly reflect the changes of the process conditions. Especially, update of control limits at the right time plays an important role in acquiring a reasonable performance of control charts. Therefore, we propose the control chart performance evaluation index (CPEI) based on count data model to monitor and manage the performance of control charts. The CPEI could indicate the degree of control chart performance and be helpful to detect the proper update cycle of control limits in real time. Experiments using real manufacturing data show that the proper update intervals are made by proposed method.

Joint Modeling of Death Times and Counts Using a Random Effects Model

  • Park, Hee-Chang;Klein, John P.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.1017-1026
    • /
    • 2005
  • We consider the problem of modeling count data where the observation period is determined by the survival time of the individual under study. We assume random effects or frailty model to allow for a possible association between the death times and the counts. We assume that, given a random effect, the death times follow a Weibull distribution with a rate that depends on some covariates. For the counts, given the random effect, a Poisson process is assumed with the intensity depending on time and the covariates. A gamma model is assumed for the random effect. Maximum likelihood estimators of the model parameters are obtained. The model is applied to data set of patients with breast cancer who received a bone marrow transplant. A model for the time to death and the number of supportive transfusions a patient received is constructed and consequences of the model are examined.

  • PDF

중소기업 청년인턴 이직횟수 결정요인 분석 (The study on the determinants of the number of job changes)

  • 박성익;류장수;김종한;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.387-397
    • /
    • 2015
  • 본 연구에서는 청년인턴 DB와 고용보험 DB를 사용하여 중소기업 청년인턴의 이직횟수에 영향을 미치는 요인을 분석하였다. 이직횟수는 음수가 아닌 정수 값만 가지는 계수 데이터 (count data)이므로 일반적인 선형회귀모형을 적용하는 것은 문제가 있다. 따라서 계수 데이터에 적합한 회귀모형으로 포아송 회귀모형, 영과잉 포아송 회귀모형, 음이항 회귀모형, 영과잉 음이항 회귀모형 등 4개의 회귀모형을 적용하였다. 분석결과 최적모형으로 영과잉 음이항 회귀모형이 선택되었다. 주요 분석결과를 정리하면 다음과 같다. 첫째, 통제집단 (비인턴집단)에 비해서 처리집단 (인턴집단)이 통계적으로 유의하게 이직경험이 낮게 나타났다. 둘째, 연령이 작을수록 통계적으로 유의하게 이직경험이 낮게 나타났다. 셋째, 여자에 비해서 남자가 유의하게 이직횟수가 높게 나타났다. 마지막으로 기업규모가 클수록 이직횟수가 유의하게 감소하는 것으로 나타났다.

혼합모드 잠재범주모형을 통한 텍스트 자료의 분석 (Latent class model for mixed variables with applications to text data)

  • 신현수;서병태
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.837-849
    • /
    • 2019
  • 일종의 혼합다항분포 모형이라고 볼 수 있는 잠재범주모형은 범주형 자료에서 직접 관측되지 않은 중요한 정보를 얻어낼 수 있는 유용한 도구이다. 하지만 자료에 범주형 변수 뿐 아니라 연속형 변수 혹은 빈도형 변수가 함께 포함되어 있을 경우 이 모형을 직접적으로 사용할 수 없다. 본 논문에서는 특히 범주형 변수와 빈도형 변수가 함께 포함되어 있는 경우에 잠재범주모형인 혼합모드 잠재범주모형을 사용하여 텍스트 후기와 범주형 응답문항이 모두 포함된 의약품 사용 후기자료를 분석하였다. 이 분석을 통해 범주형 응답만을 사용한 보통의 잠재범주 모형에 비해 텍스트 자료를 함께 사용한 혼합모드 잠재범주모형을 사용했을때 잠재범주에 대한 보다 자세한 정보를 얻을 수 있는 것을 확인하였다.

Random Parameter를 이용한 지방부 무신호교차로 교통사고 예측모형개발 (A Development of Traffic Accident Prediction Model at Rural Unsignalized Intersections Using Random Parameter)

  • 이규훈;오주택;박정순
    • 한국ITS학회 논문지
    • /
    • 제16권4호
    • /
    • pp.64-75
    • /
    • 2017
  • 기존의 고정모수를 이용한 가산모형은 관측되지 않은 이질성을 고려할 수 없으며, 계수값의 표준오차가 과소추정됨에 따라 과도한 t-값이 도출되어 모형의 신뢰성이 감소하게 된다. 또한 무신호교차로의 경우 자료 수집의 어려움과 정확한 분석과정의 통계적 한계로 신호교차로에 비해 연구가 미비한 실정이다. 본 연구에서는 Random Parameter를 이용한 가산모형을 구축하여 교통사고에 영향을 미치는 요인들을 분석하고자 하였으며, 지방부 무신호교차로를 대상으로 하여 기존 연구들과의 차별성을 두고자 하였다. 분석 결과, 총 7개의 변수가 유의한 변수로 나타났고, 이 중 2개의 변수(횡단보도 유무, 제한 속도)가 확률적 변수로 나타났다.

생태하천복원사업 전후 경제적 가치 비교분석 (Ex-ante and Ex-post Economic Value Analysis on Ecological River Restoration Project)

  • 이윤;장훈;윤태연;정영근;박희영
    • 지역연구
    • /
    • 제31권3호
    • /
    • pp.39-54
    • /
    • 2015
  • 본 연구는 서울시에서 추진한 청계천 복원사업에 대한 경제적 가치를 평가하기 위해 심층출구면접조사 방식으로 수집된 자료를 바탕으로 여행비용법(Travel Cost Method, TCM)을 적용하였다. 가산자료의 특성을 감안하여 분석모형은 포아송모형(Poisson Model, PM), 음이항모형(Negative Binomial, NB), 절단된 포아송모형(Zero-truncated Poisson, ZTP), 그리고 절단된 음이항모형(Zero-truncated Negative Binomial, ZTNB)을 사용하였다. 분석결과 추정계수들은 통계적으로 유의하게 나타났고 일반적인 소비자경제이론에 부합하는 결과가 도출되었다. 조사된 자료에서 과산포현상(Over-dispersion)이 발견되었으며 모형적합도검정을 통해서 절단된 음이항모형(Zero-truncated Negative Binomial, ZTNB)이 청계천 방문객의 수요를 추정하는 데 최적모형으로 선정되었다. 생태하천복원사업인 청계천복원사업의 경제적 가치를 추정하기 위해 방문객의 연평균 방문횟수와 최적모형에서 추정된 계수를 통해서 분석한 결과 청계천의 경제적 가치는 2013년 기준으로 연간 약 1,902 원으로 추정되었다.

온라인 리뷰의 감성과 독해 용이성이 리뷰 유용성에 미치는 영향: 가산형 리뷰 유용성 정보 활용 (The Effects of Sentiment and Readability on Useful Votes for Customer Reviews with Count Type Review Usefulness Index)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.43-61
    • /
    • 2016
  • 온라인 쇼핑몰의 상품에 대한 고객 리뷰는 구매자들의 구매 의사결정에 영향을 미치고 있으며 중요한 구전효과의 원천과 의사결정의 정보 원천의 역할을 하고 있다. 한 제품에 대한 리뷰가 무척 많기에 온라인 쇼핑몰들은 고객 리뷰 평가 방안을 도입하였고, 이를 통해 고객들에게 유용하리라고 판단되는 리뷰들을 걸러서 보여주거나 강조할 수 있게 되었다. 리뷰 평가 방안은 해당 리뷰가 도움이 되었는지 혹은 도움이 되지 않았는 지를 리뷰를 읽은 고객이 평가하게 하는 방안이다. Amazon.com은 고객 평가를 바탕으로 총 투표 수 중에서 유용하다는 투표 수의 비율을 리뷰 유용성 지표로 삼고 있으며, Yelp.com은 유용하다는 투표 수 자체를 유용성 지표로 삼고 있다. 본 연구는 고객 리뷰의 감성과 독해 용이성이 리뷰의 유용성에 미치는 영향을 파악하고자 한다. Amazon.com의 고객 리뷰 자료를 활용하여 비율형 유용성 지표를 종속변수로 하는 유사한 연구들이 수행되어 왔다. 본 연구에서는 Yelp.com의 리뷰 자료를 활용하여 가산형 리뷰 유용성 지표인 경우에도 동일한 효과가 존재하는지를 검토하고자 한다. Yelp.com의 음료와 음식 카테고리에 해당하는 업종에 대한 리뷰를 자료로 활용하였으며, 점포의 명성과 인기도 데이터를 파악할 수 있는 170,294개의 리뷰를 분석에 활용하였다. 분석결과는 리뷰의 긍정 정도는 유용 투표수를 늘리는데 음의 영향을 미쳤다. 평가가 긍정적인 리뷰에서는 음의 영향관계가 유의 하였으나, 평가가 부정적인 리뷰에서는 리뷰의 긍정 정도가 유용 투표 수에 미치는 영향은 유의하지 않았다. 독해 용이성은 리뷰가 읽기 어려울 수록 높은 값을 갖으며, 독해의 어려운 정도는 유용 투표수 획득에 음의 영향을 미쳤다. 독해 용이성은 긍정 리뷰, 부정 리뷰 관계없이 모두 음의 영향을 미치는 것으로 분석되었다. 이 결과는 유용 투표수가 0인 리뷰를 포함하여 영과잉 음이항 회귀분석을 수행한 경우와 유용 투표수가 0인 리뷰를 제외하고 음이항 회귀분석을 수행한 경우 모두 동일하게 파악되었다.

프로브 검사 결점 수 데이터를 이용한 패키지 칩 품질 예측 방법론 (Predicting Package Chip Quality Through Fail Bit Count Data from the Probe Test)

  • 박진수;김성범
    • 대한산업공학회지
    • /
    • 제41권4호
    • /
    • pp.408-413
    • /
    • 2015
  • The quality prediction of the semiconductor industry has been widely recognized as important and critical for quality improvement and productivity enhancement. The main objective of this paper is to predict the final quality of semiconductor chips based on fail bit count information obtained from probe tests. Our proposed method consists of solving the data imbalance problem, non-parametric variable selection, and adjusting the parameters of the model. We demonstrate the usefulness and applicability of the proposed procedure using a real data from a semiconductor manufacturing.

Bayesian analysis for the bivariate Poisson regression model: Applications to road safety countermeasures

  • Choe, Hyeong-Gu;Lim, Joon-Beom;Won, Yong-Ho;Lee, Soo-Beom;Kim, Seong-W.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.851-858
    • /
    • 2012
  • We consider a bivariate Poisson regression model to analyze discrete count data when two dependent variables are present. We estimate the regression coefficients as sociated with several safety countermeasures. We use Markov chain and Monte Carlo techniques to execute some computations. A simulation and real data analysis are performed to demonstrate model fitting performances of the proposed model.

일반화된 선형 혼합 모형(GENERALIZED LINEAR MIXED MODEL: GLMM)에 관한 최근의 연구 동향 (A Study for Recent Development of Generalized Linear Mixed Model)

  • 이준영
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.541-562
    • /
    • 2000
  • 일반화된 선형 혼합 모형(GLMM)은 자료가 계수의 형태로 나타나는 범주형 자료의 경우, 혹은 집락의 형태나 과산포된 비정규 자료, 또는 비선형 모형에 따르는 자료를 다루기 위한 모형 설정에 사용된다. 본 연구에서는 이에 대한 개요와 더불어, 이 모형의 적합을 위해 제시된 통계적 기법들중 의사가능도(quasi-likelihood: QL)를 이용한 추정 방법 및 Monte-Carlo 기법을 이용한 추정 방법들에 대해 조사하였다. 또한 GLMM에 대한 현재의 연구 방향 및 앞으로의 연구 가능 주제들에 대해서도 언급하였다.

  • PDF