• 제목/요약/키워드: categorical data

검색결과 373건 처리시간 0.03초

순차 범주형 데이타의 최적 모수 설계를 위한 분석법 개발 (Development of Analysis Method of Ordered Categorical Data for Optimal Parameter Design)

  • 전태준;박호일;홍남표;최성조
    • 대한산업공학회지
    • /
    • 제20권1호
    • /
    • pp.27-38
    • /
    • 1994
  • Accumulation analysis is difficult to analyze the ordered categorical data except smaller-the-better type problem. The purpose of this paper is to develop the statistic and method that can be easily applied to general type of problem, including nominal-the-best type problem. The experimental data of contact window process is analyzed and new procedure is compared with accumulation analysis.

  • PDF

Sensitivity Analysis for Ordered Categorical Data

  • Cho, Il-Hyun;Park, Taesung
    • Communications for Statistical Applications and Methods
    • /
    • 제6권2호
    • /
    • pp.375-382
    • /
    • 1999
  • Linear-by-linear association models are commonly used to analyze ordered categorical data. To fit these models appropriate scores need to be chosen. In this paper we perform sensitivity analyses in two-way contingency tables to investigate the effect of scores on goodness-of-fits and on tests of significance. In addition we show that the best score which yields the best fit of data can be selected based on the sensitivity analysis results.

  • PDF

다형질 Threshold 개체모형에서 Missing 기록을 포함한 이산형 자료에 대한 Bayesian 분석 (Bayesian Analysis for Categorical Data with Missing Traits Under a Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제44권2호
    • /
    • pp.151-164
    • /
    • 2002
  • 한우의 근내지방도 또는 임신 여부 등과 같이 이산형 분포의 성질을 갖는 다수의 형질들에 대한 유전모수 및 종축의 유전능력을 평가하기 위한 방법으로써 Threshold 모형하에서 Bayesian 추론방법의 일종인 Gibbs sampling방법을 모의실험을 통하여 알아보았으며 기록이 누락된 다수의 형질을 포함하는 다형질 Threshold 개체모형에서의 종축평가 방법론을 제시하였다. 이산형 형질의 관측치에 대응하는 임의의 잠재변수는 기록을 갖고 있는 형질들에 대한 사전정보를 고려한 사후조건확률분포에서 Gibbs sampling을 할 때 모수에 근접하는 확률분포를 얻을 수 있었으며 이러한 이산형 기록들에 대한 육종가 추정치는 선형모형에서 보다 Threshold 모형에서의 추정치가 실제 모수에 더욱 근접하는 것을 알 수 있었다. 따라서 기록이 누락된 개체들에 대한 이산형 분포를 갖는 형질들에 대하여 선형분포를 갖는 형질들과 함께 동시 유전분석할 때 Threshod 모형이 일반 선형모형 보다 적합함을 알 수 있었다.

특징 래핑을 통한 숫자형 특징과 범주형 특징이 혼합된 데이터의 클래스 분류 성능 향상 기법 (Improving Classification Performance for Data with Numeric and Categorical Attributes Using Feature Wrapping)

  • 이재성;김대원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1024-1027
    • /
    • 2009
  • 본 논문에서는 혼합형 데이터에 대한 특징 선별 기법의 효율성을 비교하기 위해 특징 필터링과 특징 래핑을 통한 특징 선별 후, 클래스 분류 성능을 측정하였다. 혼합형 데이터는 숫자형 특징과 범주형 특징이 함께 혼합되어 있으므로, 숫자형 특징을 범주형 특징으로 이산화를 하여 단일형 데이터로 변환한 뒤 특징 선별 기법 등을 적용할 수 있다. 본 연구에서는 혼합형 데이터를 전처리하여 단일형 데이터로 변환하고, 널리 활용되는 특징 필터링 기법과 특징 래핑 기법을 통해 클래스 분류 성능을 높일 수 있는 특징 집합을 선별하였다. 선별된 특징 집합을 통한 클래스 분류 성능을 비교한 결과, 특징 필터링에 비해 특징 래핑을 통해 선별한 특징 집합을 활용하여 클래스 분류를 하였을 때 분류 정확도가 높은 것을 확인할 수 있었다.

범주형 품질특성의 최적설계 사례연구 (Case Studies on the Optimal Parameter Design with Respect to Categorial Characteristics)

  • 박종인;배석주;김만수
    • 산업경영시스템학회지
    • /
    • 제32권3호
    • /
    • pp.135-141
    • /
    • 2009
  • A variety of statistical methods are applied to model and optimize responses, related to product or system's quality, in terms of control and noise factors at design and manufacturing stages. Most of them assume continuous response variables but, assessing the performance of a product or system often involves categorical observations, such as ratings and scores. Although most previous works to deal with the categorical data provide sorhisticated response models and ensure unbiased outcomes, they require heavy computation to estimate the model parameters, as well as enough replications. In this study, we present some practical approaches for optimal parameter design with ordered categorical response when only a few or no replication is available. Two real-life examples are given to illustrate the presented methods.

유사상관계수의 개념을 도입한 범주형 변수의 축약에 관한 연구 (A Method for Reduction of Categorical Variables Based on a Concept of Pseudo-Correlation Coefficient)

  • 권철신;홍순욱
    • 산업공학
    • /
    • 제14권1호
    • /
    • pp.79-83
    • /
    • 2001
  • In this paper, we propose a simple method to reduce categorical variables into smaller, but significant numbers, and also demonstrate how the proposed method can be applied to the problem of reduction that empirical research often faces in the course of data processing. For the purpose, we introduce a concept of pseudo-correlation coefficient to make it possible to use factor analysis (FA) as a tool for reducing variables. The main idea of the concept is to deal with the measures of association of categorical variables in the sense of the concept of Pearson's correlation coefficient in order to meet the input requirement of FA. Upon examination of existing measures that could play as pseudo-correlation coefficients, Cramer's V coefficient is selected for the best result among them. To show the detailed procedure of the proposed method, a specific demonstration with the data from 329 R&D projects conducted in 18 private laboratories in electric and electronics industry is presented.

  • PDF

GOODNESS OF FIT TESTS BASED ON DIVERGENCE MEASURES

  • Pasha, Eynollah;Kokabi, Mohsen;Mohtashami, Gholam Reza
    • Journal of applied mathematics & informatics
    • /
    • 제26권1_2호
    • /
    • pp.177-189
    • /
    • 2008
  • In this paper, we have considered an investigation on goodness of fit tests based on divergence measures. In the case of categorical data, under certain regularity conditions, we obtained asymptotic distribution of these tests. Also, we have proposed a modified test that improves the rate of convergence. In continuous case, we used our modified entropy estimator [10], for Kullback-Leibler information estimation. A comparative study based on simulation results is discussed also.

  • PDF

On the Categorical Variable Clustering

  • Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권2호
    • /
    • pp.219-226
    • /
    • 1996
  • Basic objective in cluster analysis is to discover natural groupings of items or variables. In general, variable clustering was conducted based on some similarity measures between variables which have binary characteristics. We propose a variable clustering method when variables have more categories ordered in some sense. We also consider some measures of association as a similarity between variables. Numerical example is included.

  • PDF

순차 범주형 데이타분석을 위한 최적모수설계에 관한 연구 (A study on the optimal parameter design by analyzing the ordered categorical data)

  • 전태준;홍남표;박호일
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1992년도 춘계공동학술대회 발표논문 및 초록집; 울산대학교, 울산; 01월 02일 May 1992
    • /
    • pp.188-197
    • /
    • 1992
  • 제품 개발에 관한 응용 연구 혹은 개발 연구의 실험 결과가 품질특성의 본질적인 성격이나 측정시의 편의때문에 순차 범주형 자료(ordered categorical data)로 분류되는 경우가 있다. 본 논문에서는 망목 특성 문제(nominal-the-best type problem)를 분석하는데 있어서 기존의 다구찌 누적법이 순차 범주형 자료분석법이 안고 있는 문제점들을 고찰하고, 이를 개선하기 위해 품질손실에 근거한 목표 누적법을 제시한다. 본 논문에서 제시한 기법을 post-etch contact window데이타에 적용해 본 결과 인자의 최적수준을 결정하는데 용이하였다.

  • PDF

범주형 데이터의 인과관계분석에 관한 기초적 연구 (A Study on the Analysis of Causal Relation about Categorical Data)

  • 노형진
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.143-151
    • /
    • 2000
  • 질적 데이터의 수량화를 통하여 통계분석이 가능한 수량화이론 중 인과관계분석을 위한 수량화 이론 I류와 II류에 대한 기초개념과 알고리즘을 소개한다. 또한 이들 두 기법을 Excel에 의해 처리할 수 있는 방법론을 제시함으로써 그 활용성을 시사하고자 한다.

  • PDF