• Title/Summary/Keyword: 범주형 자료 분석

Search Result 177, Processing Time 0.036 seconds

Maximum Trimmed Likelihood Estimator for Categorical Data Analysis (범주형 자료분석을 위한 최대절사우도추정)

  • Choi, Hyun-Jip
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.2
    • /
    • pp.229-238
    • /
    • 2009
  • We propose a simple algorithm for obtaining MTL(maximum trimmed likelihood) estimates. The algorithm finds the subset to use to obtain the global maximum in the series of eliminating process which depends on the likelihood of cells in a contingency table. To evaluate the performance of the algorithm for MTL estimators, we conducted simulation studies. The results showed that the algorithm is very competitive in terms of computational burdens required to get the same or the similar results in comparison with the complete enumeration.

Multidimensional scaling of categorical data using the partition method (분할법을 활용한 범주형자료의 다차원척도법)

  • Shin, Sang Min;Chun, Sun-Kyung;Choi, Yong-Seok
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.1
    • /
    • pp.67-75
    • /
    • 2018
  • Multidimensional scaling (MDS) is an exploratory analysis of multivariate data to represent the dissimilarity among objects in the geometric low-dimensional space. However, a general MDS map only shows the information of objects without any information about variables. In this study, we used MDS based on the algorithm of Torgerson (Theory and Methods of Scaling, Wiley, 1958) to visualize some clusters of objects in categorical data. For this, we convert given data into a multiple indicator matrix. Additionally, we added the information of levels for each categorical variable on the MDS map by applying the partition method of Shin et al. (Korean Journal of Applied Statistics, 28, 1171-1180, 2015). Therefore, we can find information on the similarity among objects as well as find associations among categorical variables using the proposed MDS map.

범주형 자료에서 연관성 측도들의 비교 분석

  • 홍종선;임한승
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.3
    • /
    • pp.645-661
    • /
    • 1997
  • 연속형 변수들의 상관관계와 범주형 변수들의 연관성 측도들을 비교 연구하였다. 이 연구를 위하여 연속형 변수들이며 +1에서 -1까지 완벽한 상관관계를 갖고 있는 2 변량 정규분포를 이용하여 2$\times$2 분할표와 확장하여 일반적인 I$\times$J 분할표를 대신하는 3$\times$3 분할표를 생성하였다. 2 차원 분할표에서 정의된 연관성 측도들을 구하여 논의하였는데 2$\times$2 분할표에서는 교차적비 $\alpha$ 통계량과 교차적비의 함수로 표현되는 Yule [1912]의 Q와 Y의 통계량 그리고 상관계수 R 통계량과 R 통계량의 함수인 P 통계량을 설명하고 생성된 분할표에서 구한 통계량값을 분석하였으며, 3$\times$3 분할표에서는 Pearson의 독립성 검정통계량 $X^2$의 함수로 표현되는 P. T. V 통계량과 Goodman과 Kruskal [1954]의 $\lambda_{C/R}$통계량과 Light와 Margolin [1971]의 $\tau_{R/C}$ 통계량을 설명하고 그 값들을 Pearson의 상관계수와 비교 분석하였다.

  • PDF

Collapsibility Criteria using Raindrop Plots

  • 홍종선;김범준
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.175-178
    • /
    • 2004
  • 범주형 자료분석에서 차원축소(collapsibility)는 오즈비로 설명되었다. 실제의 $2\times2\timesK$ 분할표 자료를 이 이론에 적용시켰을 때 오즈비의 값으로 차원축소가 가능한지의 여부를 판단하기는 어렵다. 오즈비를 시각적으로 표현하는 방법 중에서 Doi, Nakamura와 Yamamoto(2001)가 제안한 Contour plot을 통해서 분할표 자료를 설명하는 것은 가능하지만 차원축소의 가능성을 결정하기에는 한계가 있다. 본 연구에서는 오즈비의 신뢰구간을 시각적으로 표현할 수 있는 방법으로 Barrowman과 Myers(2003)가 제안한 Raindrop plot을 이용하여 $P_{\lambda,;,T}^M-policy$ 분할표 자료를 설명할 수 있으며 동시에 차원축소의 가능성을 판단할 수 있는 방법을 제안하고자 한다.

  • PDF

Ordered Probit Model Of Speed Selection Behavior (순서형 프로빗모형을 이용한 속도선택행태에 관한 연구)

  • 강경우;백병성
    • Journal of Korean Society of Transportation
    • /
    • v.16 no.3
    • /
    • pp.93-100
    • /
    • 1998
  • 지난 30여년간 운전자의 속도선택의 행태에 대하여 많은 연구가 이루어졌다. 그러 나, 과거 대부분의 연구는 운전자의 개별적인 특성과 제한속도에 대한 운전자의 인지 정도 를 고려하지 않고, 다만 운전자의 속도선택과 도로 및 차량간의 상호 관련성에 중점을 두고 있다. 본 연구는 운전자, 차량 및 통행특성 등의 요인을 고려하여 운전자의 속도 선택에 대 한 행태를 분석하고자 하였다. 이를 위하여 운전자의 속도 자료와 설문자료를 조사한 수, 두 가지 자료를 범주형 자료로 구분하여 Ordered Probit Model을 적용하여 분석하였다. 분 석결과 i) 고소득의 남성운전자가 고속의 주행 행태를 보였으며, 운전경력이 많은 운전자일 수록 높은 속도를 선택하는 것으로 나타났다. ii) 차량에 관해서는 배기량이 높은 차량일수 록 고속의 속도를 나타낸 반면에 안전장치가 많은 차량의 경우에는 저속의 주행속도를 보이 는 것으로 나타났다. iii) 통행 특성 면에서는 일일통행거리가 중요 변수인 것으로 나타났다. iv) 운전자의 심리적 측면에서는 운전자가 인식하고 있는 제한 속도가 또한 중요변수로 분 석되었다.

  • PDF

Measurement of Association of Categorical Data Using The Overlapped Mosaic Plot : Dynamic Graphics Approach for $2{\times}2$ Contingency Table ($2{\times}2$ 분할표에서 동적 그래픽스로 구현된 겹쳐진 모자익 그림을 이용한 범주형 자료의 연관성 측정)

  • Yoon, Yeo-Chang;Oh, Min-Gweon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.10 no.2
    • /
    • pp.457-464
    • /
    • 1999
  • In this paper, we propose an overlapped mosaic plot which proposed by Hartigan and Kleiner(1981) represents the counts in $2{\times}2$ contingency table directly by tiles whose area is proportional to the cell frequency. Overlapped mosaic plot provides some measurements of association including dynamic graphics for mosaic plots. Dynamic graphics for mosaic plots give some useful informations when one gets some measurements of association and selects a model, and current statistical software does not provide this feature. We can see the deviations between observation and estimate of independence from overlapped mosaic plot. This dynamic graphics give some useful informations how far this data are apart from independence.

  • PDF

A Bayesian Threshold Model for Ordered Categorical Traits (순서범주형자료 분석을 위한 베이지안 분계점 모형)

  • Choi Byangsu;Lee Seung-Chun
    • The Korean Journal of Applied Statistics
    • /
    • v.18 no.1
    • /
    • pp.173-182
    • /
    • 2005
  • A Bayesian threshold model is considered to analyze binary or ordered categorical traits. Gibbs sampler for making full Bayesian inferences about the category probability as well as the regression coefficients is described. The model can be regarded as an alternative to the ordered logit regression model. Numerical examples are shown to demonstrate the efficiency of the model.

A Geostatistical Block Simulation Approach for Generating Fine-scale Categorical Thematic Maps from Coarse-scale Fraction Data (저해상도 비율 자료로부터 고해상도 범주형 주제도 생성을 위한 지구통계학적 블록 시뮬레이션)

  • Park, No-Wook;Lee, Ki-Won
    • Journal of the Korean earth science society
    • /
    • v.32 no.6
    • /
    • pp.525-536
    • /
    • 2011
  • In any applications using various types of spatial data, it is very important to account for the scale differences among available data sets and to change the scale to the target one as well. In this paper, we propose to use a geostatistical downscaling approach based on vaiorgram deconvloution and block simulation to generate fine-scale categorical thematic maps from coarse-scale fraction data. First, an iterative variogram deconvolution method is applied to estimate a point-support variogram model from a block-support variogram model. Then, both a direct sequential simulation based on area-to-point kriging and the estimated point-support variogram are applied to produce alternative fine-scale fraction realizations. Finally, a maximum a posteriori decision rule is applied to generate the fine-scale categorical thematic maps. These analytical steps are illustrated through a case study of land-cover mapping only using the block fraction data of thematic classes without point data. Alternative fine-scale fraction maps by the downscaling method presented in this study reproduce the coarse-scale block fraction values. The final fine-scale land-cover realizations can reflect overall spatial patterns of the reference land-cover map, thus providing reasonable inputs for the impact assessment in change of support problems.

Design and Implementation of Packet Analysis System for a Realtime Network Management (실시간 망 관리를 위한 패킷 분석 시스템의 설계 및 구현실시간 망 관리를 위한 패킷 분석 시스템의 설계 및 구현)

  • 정상준;최혁수;이정협;김종근;권영헌
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.270-273
    • /
    • 2001
  • 본 논문에서는 실시간 성능 관리를 위해 패킷 분석 시스템을 설계하고 구현하였다. 기존의 MIB 정보를 이용한 망 관리에서는 관리국의 주기적인 요청으로 각 에이전트의 MIB 정보를 가져와 분석하는 방식으로, 실시간 감시에는 적합하지 않은 단점이 있다. 따라서, 본 논문에서는 실시간 트래픽 감시를 위해 시스템을 설계하고 구현하였다. 제안된 시스템은 트래픽 상태를 감시하는 모니터링 시스템과 관측된 트래픽을 보여주는 인터페이스 부분으로 나눌 수 있다. 모니터링 시스템은 각 노드의 트래픽을 감시하여 각 패킷별로 구분하여 사용자 인터페이스에 넘겨주게 되며, 이를 사용자 인터페이스에서는 수치형 자료로 표시하거나, 범주형 자료인 그래프로 나타내게 된다. 이 시스템은 각 노드의 부하 여부를 감시하여, 비정상적인 트래픽의 폭주를 발견하게 되면 분석 모듈의 작동에 의해 해킹을 비롯한 네트워크 장애를 감지할 수 있다. 이는 실시간 망 관리의 중요한 기본 기술로 여러 분야에 활용할 수 있다.

  • PDF

Comparing Accuracy of Imputation Methods for Categorical Incomplete Data (범주형 자료의 결측치 추정방법 성능 비교)

  • 신형원;손소영
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.1
    • /
    • pp.33-43
    • /
    • 2002
  • Various kinds of estimation methods have been developed for imputation of categorical missing data. They include category method, logistic regression, and association rule. In this study, we propose two fusions algorithms based on both neural network and voting scheme that combine the results of individual imputation methods. A Mont-Carlo simulation is used to compare the performance of these methods. Five factors used to simulate the missing data pattern are (1) input-output function, (2) data size, (3) noise of input-output function (4) proportion of missing data, and (5) pattern of missing data. Experimental study results indicate the following: when the data size is small and missing data proportion is large, modal category method, association rule, and neural network based fusion have better performances than the other methods. However, when the data size is small and correlation between input and missing output is strong, logistic regression and neural network barred fusion algorithm appear better than the others. When data size is large with low missing data proportion, a large noise, and strong correlation between input and missing output, neural networks based fusion algorithm turns out to be the best choice.