• 제목/요약/키워드: Categorical Information

검색결과 219건 처리시간 0.025초

Bayesian approach for categorical Table with Nonignorable Nonresponse

  • Choi, Bo-Seung;Park, You-Sung
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 추계 학술발표회 논문집
    • /
    • pp.59-65
    • /
    • 2005
  • We propose five Bayesian methods to estimate the cell expectation in an incomplete multi-way categorical table with nonignorable nonresponse mechanism. We study 3 Bayesian methods which were previously applied to one-way categorical tables. We extend them to multi-way tables and, in addition, develop 2 new Bayesian methods for multi-way categorical tables. These five methods are distinguished by different priors on the cell probabilities: two of them have the priors determined only by information of respondents; one has a constant prior; and the remaining two have priors reflecting the difference in the response mechanisms between respondent and non-respondent. We also compare the five Bayesian methods using a categorical data for a prospective study of pregnant women.

  • PDF

베이지안 네트워크를 이용한 다차원 범주형 분석 (Multi-dimension Categorical Data with Bayesian Network)

  • 김용철
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.169-174
    • /
    • 2018
  • 일반적으로 자료의 효과 연속형인 경우 분산분석과 이산형인 경우 분할표 카이제곱 검정을 통계적 분석방법으로 사용한다. 다차원의 자료에서는 계층적 구조의 분석이 요구되어지며 자료간의 인과관계를 나타내기 위해 통계적 선형모형을 채택하여 분석한다. 선형모형의 구조에서는 자료의 정규성이 요구되어지며 일부 자료에서는 비 선형모형을 채택할 수도 있다. 특히, 설문조사 자료 구조는 문항의 특성상 이산형 자료의 형태가 많아 모형의 조건에 만족하지 않는 경우가 종종 발생한다. 자료구조의 차원이 높아질수록 인과관계, 교호작용, 연관성분석 등에 다차원 범주형 자료 분석 방법을 사용한다. 본 논문에서는 확률분포의 계산을 이용한 베이지안 네트워크 모형이 범주형 자료 분석에서 분석절차를 줄이고 교호작용 및 인과관계를 분석할 수 있다는 것을 제시하였다.

Predictive Spatial Data Fusion Using Fuzzy Object Representation and Integration: Application to Landslide Hazard Assessment

  • Park, No-Wook;Chi, Kwang-Hoon;Chung, Chang-Jo;Kwon, Byung-Doo
    • 대한원격탐사학회지
    • /
    • 제19권3호
    • /
    • pp.233-246
    • /
    • 2003
  • This paper presents a methodology to account for the partial or gradual changes of environmental phenomena in categorical map information for the fusion/integration of multiple spatial data. The fuzzy set based spatial data fusion scheme is applied in order to account for the fuzziness of boundaries in categorical information showing the partial or gradual environmental impacts. The fuzziness or uncertainty of boundary is represented as two kinds of fuzzy membership functions based on fuzzy object concept and the effects of them are quantitatively evaluated with the help of a cross validation procedure. A case study for landslide hazard assessment demonstrates the better performance of this scheme as compared to traditional crisp boundary representation.

Bayesian pooling for contingency tables from small areas

  • Jo, Aejung;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1621-1629
    • /
    • 2016
  • This paper studies Bayesian pooling for analysis of categorical data from small areas. Many surveys consist of categorical data collected on a contingency table in each area. Statistical inference for small areas requires considerable care because the subpopulation sample sizes are usually very small. Typically we use the hierarchical Bayesian model for pooling subpopulation data. However, the customary hierarchical Bayesian models may specify more exchangeability than warranted. We, therefore, investigate the effects of pooling in hierarchical Bayesian modeling for the contingency table from small areas. In specific, this paper focuses on the methods of direct or indirect pooling of categorical data collected on a contingency table in each area through Dirichlet priors. We compare the pooling effects of hierarchical Bayesian models by fitting the simulated data. The analysis is carried out using Markov chain Monte Carlo methods.

The Distinction of Argument and Adjunct as a Gradient Notion

  • Choi, Hye-Won
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권1호
    • /
    • pp.25-48
    • /
    • 2010
  • The distinction of argument and adjunct has been an important notion in linguistic theories, especially at the interface of syntax and semantics, and this distinction has been believed to be binary and categorical. However, there are some gray-area cases such as instruments and participant locations, for which the distinction does not appear to be so clear. In this paper, I will explore whether the argument/adjunct distinction is categorical by examining the controversial cases, particularly the instrumental PPs. I will review the syntactic, semantic, and psychological criteria and evidence that have been proposed in literature and see if instruments can be categorized as either arguments or adjuncts by those criteria. By showing that different criteria yield contradictory results, I conclude that roles like instruments have characteristics of both arguments and adjuncts, which seems to suggest that the argument/adjunct distinction is not categorical.

  • PDF

On the Categorical Variable Clustering

  • Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권2호
    • /
    • pp.219-226
    • /
    • 1996
  • Basic objective in cluster analysis is to discover natural groupings of items or variables. In general, variable clustering was conducted based on some similarity measures between variables which have binary characteristics. We propose a variable clustering method when variables have more categories ordered in some sense. We also consider some measures of association as a similarity between variables. Numerical example is included.

  • PDF

범주형 데이터의 인과관계분석에 관한 기초적 연구 (A Study on the Analysis of Causal Relation about Categorical Data)

  • 노형진
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.143-151
    • /
    • 2000
  • 질적 데이터의 수량화를 통하여 통계분석이 가능한 수량화이론 중 인과관계분석을 위한 수량화 이론 I류와 II류에 대한 기초개념과 알고리즘을 소개한다. 또한 이들 두 기법을 Excel에 의해 처리할 수 있는 방법론을 제시함으로써 그 활용성을 시사하고자 한다.

  • PDF

범주형 다변량 데이터의 상관관계분석에 관한 기초적 연구(II) (A Study on the Correlation Analysis about Categorical Multivariate Data(II))

  • 노형진
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.142-150
    • /
    • 2000
  • 범주형 다변량 데이터의 상관관계분석을 위하여 개발한 수량화이론 III류나 대응분석 등의 기법은 다차원 공간상에서 점간의 거리로써 두 요소집합간의 관련성을 설명하는 데 있어서 매우 유용하다. 본 연구에서는 상관관계분석을 위한 대응분석의 특성을 수량화이론 III류와 비교하여 설명하고 그 유용성을 논하기로 한다. 이 기법은 사회과학 분야의 상관관계분석에 널리 활용될 것으로 기대된다.

  • PDF

분할법을 활용한 범주형자료의 다차원척도법 (Multidimensional scaling of categorical data using the partition method)

  • 신상민;천선경;최용석
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.67-75
    • /
    • 2018
  • 다차원척도법은 개체간의 비유사성을 저차원 공간에 기하적으로 표현하기 위한 다변량 자료의 탐색적 분석기법이다. 그러나 일반적인 다차원척도그림에서는 개체들의 유사성 정보만이 표현될 뿐 변수와 관련된 정보가 나타나지 않기 때문에 그림의 해석 상에 한계점이 존재한다. 본 연구에서는 범주형 자료를 다중표시행렬로 변환하고 Torgerson (1958)의 알고리즘에 의한 다차원척도법을 적용하여 개체들의 군집화 성향과 군집들의 상대적 크기를 다차원척도그림으로 시각화하였다. 그리고 Shin 등 (2015)의 분할법을 적용하여 범주형변수의 범주수준별 정보를 다차원척도그림 상에 투영하여 추가적인 정보를 표현하였다. 따라서 본 연구에서 제안하고자 하는 다차원척도그림을 이용하면 개체들의 유사성 정보와 함께 범주형변수들 사이의 연관성도 탐색할 수 있는 장점이 있다.

현장 조사 자료의 공간 보간을 위한 다변량 크리깅을 이용한 범주형 자료의 통합 (Integration of Categorical Data using Multivariate Kriging for Spatial Interpolation of Ground Survey Data)

  • 박노욱
    • Spatial Information Research
    • /
    • 제19권4호
    • /
    • pp.81-89
    • /
    • 2011
  • 이 논문에서는 공간적으로 소수의 지점에서 획득된 현장 조사 자료의 공간 보간 과정에 범주형 자료를 결합하는 다변량 크리깅 기법을 제안하고자 한다. 범주형 자료를 결합하는 과정에서 기존 범주형 자료의 속성별로 대푯값을 할당하는 단일 지역 평균 기반의 단순 크리깅 방식 대신에, 영역-점 변환 크리깅을 이용하여 원하는 해상도로 상세화시킨 추정값을 가변적 지역 평균으로 이용하였다. 지화학 원소 구리의 공간 보간에 지질도를 이용하는 사례연구를 통해 제안 기법을 예시하였다. 교차 검증 결과, 제안 기법이 단변량 정규 크리깅과 기존 단일 지역 평균 기반의 단순 크리깅 기법에 비해 각각 15%와 25%의 예측 능력의 향상을 나타내었다. 따라서 범주형 자료를 부가 자료로 이용하는 공간 보간에 이 논문에서 제안한 기법이 효율적으로 적용될 수 있을 것으로 기대된다.