• 제목/요약/키워드: Polytomous Data

검색결과 18건 처리시간 0.02초

다항판별지수와 검정통계량 제안 (Proposition of polytomous discrimination index and test statistics)

  • 최진수;홍종선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.337-351
    • /
    • 2016
  • 현실세계의 예측 문제에서 세 범주 이상의 결과로 예측되는 경우가 많다. 이러한 경우에 대한 기존의 문헌연구에서는 부합성을 짝 접근방법으로 활용한 통계량은 범주의 뚜렷한 구분 없이 표현되었다. 최근 새롭게 표현한 평가자료와 이를 바탕으로 부합성을 재표현하여 통계량들을 새롭게 정의함으로써 직관적으로 의미 파악이 가능해졌지만 통계량들의 판단기준이 구체적이지 않은 문제점을 갖고 있다. 또한 이 통계량들은 가능한 부합성의 짝으로 구성되었지만 실제범주들간에서 예측범주들의 부합성을 추가적으로 고려할 수 있기에 이를 포함한 두 가지 통계량을 제안하였다. 제안한 통계량은 선택된 두 범주로부터 모든 가능한 경우들 사이를 판별하는 장점이 있다. 본 연구에서 제안한 두 가지 통계량은 지시함수로 표현되므로 비모수적 통계량으로 변환할 수 있다. 그러므로 부합성 통계량을 가설검정 방법으로 사용할 수 있음을 제안한다.

Two-stage imputation method to handle missing data for categorical response variable

  • Jong-Min Kim;Kee-Jae Lee;Seung-Joo Lee
    • Communications for Statistical Applications and Methods
    • /
    • 제30권6호
    • /
    • pp.577-587
    • /
    • 2023
  • Conventional categorical data imputation techniques, such as mode imputation, often encounter issues related to overestimation. If the variable has too many categories, multinomial logistic regression imputation method may be impossible due to computational limitations. To rectify these limitations, we propose a two-stage imputation method. During the first stage, we utilize the Boruta variable selection method on the complete dataset to identify significant variables for the target categorical variable. Then, in the second stage, we use the important variables for the target categorical variable for logistic regression to impute missing data in binary variables, polytomous regression to impute missing data in categorical variables, and predictive mean matching to impute missing data in quantitative variables. Through analysis of both asymmetric and non-normal simulated and real data, we demonstrate that the two-stage imputation method outperforms imputation methods lacking variable selection, as evidenced by accuracy measures. During the analysis of real survey data, we also demonstrate that our suggested two-stage imputation method surpasses the current imputation approach in terms of accuracy.

범주형 반복측정자료를 위한 일반화 추정방정식의 소표본 특성 (Small Sample Characteristics of Generalized Estimating Equations for Categorical Repeated Measurements)

  • 김동욱;김재직
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.297-310
    • /
    • 2002
  • Liang과 Zeger는 이산형 혹은 연속형 반복측정자료를 분석하기 위한 일반화 추정방정식 (GEE)을 제안하였다 GEE모형은 범주형 반복측정자료의 모형으로 확장될 수 있으며, 이 GEE추정량은 대표본인 경우 다변량 정규분포를 따른다. 그러나 GEE는 대표본근사이론에 기초한다. 본 논문에서는 소표본인 경우 반복 측정된 순서자료에 대한 GEE추정량의 성질을 연구한다. 우리는 두가지 방법을 사용하여 두그룹의 반복 측정된 순서자료를 생성하며 모의실험을 통하여 소표본인 경우 여러 개 범주를 갖는 순서반응 자료에 대하여 GEE추정량의 1종 오류율, 검정력, 상대효율, 두 그룹의 표본크기가 다를 경우 효과, 그리고 분산 추정량의 성질등을 연구한다.

몬테칼로깁스표본기법을 이용한 누적로짓 모형의 베이지안 분석 (Bayesian analysis of cumulative logit models using the Monte Carlo Gibbs sampling)

  • 오만숙
    • 응용통계연구
    • /
    • 제10권1호
    • /
    • pp.151-161
    • /
    • 1997
  • 순서적 다항자료의 누적로짓 모형에 대한 베이지안 사후추론을 위하여 몬테칼로 깁스표본기법을 제안하였다. 원래의 모형에서는 깁스표본기법 적용에 필수적으로 요구되는 각 원소모수의 조건부 확률분포가 난수생성에 편리한 형태로 주어지지 않으므로 Albert and Chib(1993)과 Oh(1997)에서 이항 로짓모형에 사용한 바와 같이 적절한 잠재변수를 도입하여 깁스표본기법 적용에 매우 편리한 형태를 갖도록 한다.

  • PDF

Phylogenetic study of trichaptum inferred from nuclear ribosomal DNA sequences

  • Ko, Kwon-Soo;Hong, Soon-Gyu;Jung, Hack-Sung
    • Journal of Microbiology
    • /
    • 제35권2호
    • /
    • pp.79-86
    • /
    • 1997
  • For the phylogenetic study of the genus Trichaptum, nuclear ribosomal DNA sequences from eight strains of four Trichaptium species were examined. Phylogenetic trees were constructed using molecular data on 18 rDNA and 5.8S rDNA and thei ITSs. Parsimony analyses of the Trichaptum species showed that T. biforme and T. laricinum made a monophyletic group respectively, suggesting that each species is phylogenetically independent. However, T. abietum represented a polyphyletic group and T. fusco-violaceum formed a polytomous group, suggesting that these species could be in the process of evolutionary differentiation. Examination of base substitutions of the 18S rRNA gene reveals that the C-T transition is most predominant and that there is a stronger transition bias between closely related organisms rather than between distantly related ones.

  • PDF

On Combining MOS and Histogram in a Subjective Evaluation Method

  • Sehyug Kwon
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.176-183
    • /
    • 1995
  • Mean opinion score (MOS) method has been used in many areas to quantify opinions of respondents not only in survey research but in evaluating the parameters of population that are not measurable of are technically hard to be measured. Histogram is an important graphical technique because of the role it plays in describing categorical data as well as quantitative. In MOS method, subjective opinions of respondents are quantified by opinion scores and the arithmetic means of opinion scores have been used to describe the interesting population. Since opinion scores are polytomous, the values of arithmetic means have little meanings. In this paper, cumulative percentage curves as a function of the means of opinion scores are derived by combining means of opinion scores and histograms. It is proposed for better interpretation to opinion scores in MOS method, one of subjective evaluation methods.

  • PDF

우리 나라 재가노인의 신체적 기능상태별 관련 요인 (Factors Associated with Physical Functioning among Community-Dwelling Older Adults)

  • 최귀숙;이윤환
    • Journal of Preventive Medicine and Public Health
    • /
    • 제32권3호
    • /
    • pp.325-332
    • /
    • 1999
  • Objectives: The aim of this study is to identify major factors associated with physical functioning among the Korean elderly. Methods: Data come from a survey of a nationally representative sample of 2,058 older people aged 60 years or elder living in the community. A hierarchical functioning scale was constructed, using upper and lower body mobility, IADLs, and ADLs. Socioeconomic characteristics, chronic conditions, measures of health status, health service use, and social support were analyzed to explore their influence on functioning. Polytomous logistic regression analysis was conducted to identify major contributing factors to different levels of functioning. Results: Persons of older age, female, with chronic diseases (heart disease, stroke, fracture/dislocation) were consistently more likely to show a higher degree of functional limitation. There were variations, however, among other factors; e.g., those with arthritis were more likely to be only mildly impaired, but not moderately or severely impaired. Conclusions: Older Korean adults living in the community with impaired functioning constitute persons with diverse characteristics. Policy and program activities need to address specific needs of older people in different functioning states.

  • PDF

잠재집단분석방법을 통한 공과대학 학생들의 성별, 학년별, 공학인증제 프로그램 선택에 따른 공학 창의성 유형 탐색 (Exploring the Patterns of Engineering College Students' Engineering-Related Creativity by Gender, Academic Year, and Engineering Education Accreditation Program through Latent Class Analysis)

  • 이준기;신세인;아리프 라흐마툴라흐;하민수
    • 과학교육연구지
    • /
    • 제41권1호
    • /
    • pp.16-35
    • /
    • 2017
  • 이 연구에서는 공과대학생들의 공학 창의성이 성별, 학년, 공학교육인증 참여 여부와의 관련성을 살펴보고자 하였다. 구체적인 연구목적을 살펴보면 첫째, Rasch 분석을 사용하여 연구에 사용된 공학 창의성 검사도구의 타당도와 신뢰도를 확인하였으며, 둘째, 삼원분산분석을 사용하여 성별, 학년별, 공학교육인증 참여 유부별로 공학 창의성의 수준을 비교하였다. 셋째, 공학 창의성 요소간의 상관관계를 확인하였으며, 넷째, 잠재집단분석(poLCA)을 활용하여 공학 창의성에 따라 구분되는 잠재집단들을 규명하고, 규명된 잠재집단과 성별, 학년별, 공학교육인증 참여가 관계가 있는지 살펴보았다. 연구에는 2098명의 공과대학 재학생이 참여하였으며, 4개의 하위 구인으로 이루어진 공학 창의성 검사도구를 활용하여 자료를 수집하였다. 라쉬 분석결과 공학 창의성 검사도구의 타당성과 신뢰성을 확인할 수 있었다. 또한 삼원분산분석 결과 공학창의성은 성별에 따라 유의미한 차이를 나타냈으며, 학년의 경우 창의적 인지 외의 모든 구인에서 유의미한 차이가 나타났으며, 공학교육인증제 프로그램은 공학 창의성의 선택 여부는 유의미한 차이가 타나나지 않았다. 상관관계 분석 결과 공학 창의성 요소들은 상호 통계적으로 유의미한 관계가 있는 것으로 확인되었다. 마지막으로 공학 창의성 요소를 근거로 잠재집단을 확인한 결과, 공과대학 학생들에게는 3가지의 공학 창의성 잠재집단이 발견되었으며, 1학년과 여학생일수록 공학 창의성이 가장 낮은 잠재집단에 소속될 확률이 높았다. 이러한 연구 결과를 바탕으로 공과대학생들의 창의성 교육에 대해 논의해보고자 한다.