Journal of the Korean Data and Information Science Society
/
v.16
no.3
/
pp.609-620
/
2005
In the secondary data analysis for categorical data, situations often arise in which the estimated cell variances are available, but not the full matrix of variances. In this case researchers are often inclined to use Pearson-type test statistics for homogeneity. However, for a complex sample observed cell proportions are not distributed as multinomial and Pearson-type test statistic generally is not distributed asymptotically as chi-square distribution. This paper evaluates powers for Wald test and Pearson-type test and the first order corrected test of Pearson-type test for homogeneity. The resulting power curves indicate that as the misspecification effect increases, the amount of inflation of significance level and the loss of power Pearson-type test are getting more severe.
The present study investigates the effect of Accentual Phrase on F0 using a subset of large-scale corpus of Seoul Korean. Four syllable words which were neither preceded nor followed by silent pauses were presumed to be canonical exemplars of Accentual Phrases in Korean. These four syllable words were extracted from female speakers' speech samples. Growth curve analyses, combination of regression and polynomial curve fitting, were applied to the four syllable words. Four syllable words were divided into four groups depending on the categorical status of the initial segment: voiceless obstruents, voiced obstruents, sonorants, and vowels. Results of growth curve analyses indicate that initial segment types have an effect on the F0 (in semitone) in the nucleus of the initial syllable, and the cubic polynomial term revealed that some of the medial low tones in the 4 syllable words may be guided by the principle of contrast maximization, while others may be governed by the principle of ease of articulation.
KSII Transactions on Internet and Information Systems (TIIS)
/
v.14
no.10
/
pp.4007-4024
/
2020
It is tremendously important to construct decision trees to use as a tool for knowledge representation from a given decision table. However, the usual algorithms may split the decision table based on each value, which is not efficient for numerical attributes. The methodology of this paper is to split the given decision table into binary groups as like the CART algorithm, that uses binary split to work for both categorical and numerical attributes. The difference is that it uses split for each attribute established by the directed acyclic graph in a dynamic programming fashion whereas, the CART uses binary split among all considered attributes in a greedy fashion. The aim of this paper is to study the effect of binary splits in comparison with each value splits when building the decision trees. Such effect can be studied by comparing the number of nodes, local and global misclassification rate among the constructed decision trees based on three proposed algorithms.
Genetic parameters for birth weights (BWT), calving ease scores observed from calves born by heifers (CEH), and calving ease scores observed from calves born by cows (CEC) were estimated using Bayesian methodology with Gibbs sampling in different threshold animal models. Data consisted of 77,458 records for calving ease scores and birth weights in Gelbvieh cattle. Gibbs samplers were used to obtain the parameters of interest for the categorical traits in two univariate threshold animal models, a bivariate threshold animal model, and a three-trait linear-threshold animal model. Samples of heritabilities and genetic correlations were calculated from the posterior means of dispersion parameters. In a univariate threshold animal model with CEH (model 1), the posterior means of heritabilities for calving ease was 0.35 for direct genetic effects and 0.18 for maternal genetic effects. In the other univariate threshold model with CEC (model 2), the posterior means of heritabilities of CEC was 0.28 for direct genetic effects and 0.18 for maternal genetic effects. In a bivariate threshold model with CEH and CEC (model 3), heritability estimates were similar to those in unvariate threshold models. In this model, genetic correlation between heifer calving ease and cow calving ease was 0.89 and 0.87 for direct genetic effect and maternal genetic effects, respectively. In a three-trait animal model, which contained two categorical traits (CEH and CEC) and one continuous trait (BWT) (model 4), heritability estimates of CEH and CEC for direct (maternal) genetic effects were 0.40 (0.23) and 0.23 (0.13), respectively. In this model, genetic correlation estimates between CEH and CEC were 0.89 and 0.66 for direct genetic effects and maternal effects, respectively. These estimates were greater than estimates between BWT and CEH (0.82 and 0.34) or BWT and CEC (0.85 and 0.26). This result indicates that CEH and CEC should be high correlated rather than estimates between calving ease and birth weight. Genetic correlation estimates between direct genetic effects and maternal effects were -0.29, -0.31 and 0.15 for BWT, CEH and CEC, respectively. Correlation for permanent environmental effects between BWT and CEC was -0.83 in model 4. This study can provide genetic evaluation for calving ease with other continuous traits jointly with assuming that calving ease from first calving was a same trait to calving ease from later parities calving. Further researches for reliability of dispersion parameters would be needed even if the more correlated traits would be concerned in the model, the higher reliability could be obtained, especially on threshold model with property that categorical traits have little information.
Journal of Korean Society of Industrial and Systems Engineering
/
v.40
no.2
/
pp.78-91
/
2017
In this study, we conducted a comparative study on user's perception and behavior on public system service (PSS) using institutionalism theory and MGA (multi-group analysis) methodology. In particular, this study focuses on how institutional isomorphism is applied to public system services and how MGA can be implemented correctly in a variance based SEM (structural equation model) such as PLS (partial least square). A data set of 496 effective responses was collected from pubic system users and an empirical research was conducted using three segmented models categorized by public proximity theory (public firms = 113, government contractors = 210, private contractors = 173). For rigorous group comparisons, each model was estimated by the same indicators and approaches. PLS-SEM was used in testing research hypotheses, followed by parametric and non-parametric PLS-MGA procedures in testing categorical moderation effects. This study applied novel procedures for testing composite measurement invariance prior to multi-group comparisons. The following main results and implications are drawn : 1) Partial measurement invariance was established. Multi-group analysis can be done by decomposed models although data can not be pooled for one integrated model. 2) Multi-group analysis using various approaches showed that proximity to public sphere moderated some hypothesized paths from quality dimensions to user satisfaction, which means that categorical moderating effects were partially supported. 3) Careful attention should be given to the selection of statistical test methods and the interpretation of the results of multi-group analysis, taking into account the different outcomes of the PLS-MGA test methods and the low statistical power of the moderating effect. It is necessary to use various methods such as comparing the difference in the path coefficient significance and the significance of the path coefficient difference between the groups. 4) Substantial differences in the perceptions and behaviors of PSS users existed according to proximity to public sphere, including the significance of path coefficients, mediation and categorical moderation effects. 5) The paper also provides detailed analysis and implication from a new institutional perspective. This study using a novel and appropriate methodology for performing group comparisons would be useful for researchers interested in comparative studies employing institutionalism theory and PLS-SEM multi-group analysis technique.
Communications for Statistical Applications and Methods
/
v.21
no.2
/
pp.169-181
/
2014
Marginalized random effects models (MREM) are commonly used to analyze longitudinal categorical data when the population-averaged effects is of interest. In these models, random effects are used to explain both subject and time variations. The estimation of the random effects covariance matrix is not simple in MREM because of the high dimension and the positive definiteness. A relatively simple structure for the correlation is assumed such as a homogeneous AR(1) structure; however, it is too strong of an assumption. In consequence, the estimates of the fixed effects can be biased. To avoid this problem, we introduce one approach to explain a heterogenous random effects covariance matrix using a modified Cholesky decomposition. The approach results in parameters that can be easily modeled without concern that the resulting estimator will not be positive definite. The interpretation of the parameters is sensible. We analyze metabolic syndrome data from a Korean Genomic Epidemiology Study using this method.
Communications for Statistical Applications and Methods
/
v.30
no.1
/
pp.49-63
/
2023
A lot of studies on the summary measures of predictive strength of categorical response models consider the likelihood ratio index (LRI), also known as the McFadden-R2, a better option than many other measures. We propose a simple modification of the LRI that adjusts for the effect of the number of response categories on the measure and that also rescales its values, mimicking an underlying latent measure. The modified measure is applicable to both binary and ordinal response models fitted by maximum likelihood. Results from simulation studies and a real data example on the olfactory perception of boar taint show that the proposed measure outperforms most of the widely used goodness-of-fit measures for binary and ordinal models. The proposed R2 interestingly proves quite invariant to an increasing number of response categories of an ordinal model.
The present study investigates how consumers' construal level affects their variety seeking behavior when choosing multiple items simultaneously. Especially the authors focus on the perceptual level at which variety seeking takes place and propose that variety seeking can take place not only at brand level but also at category or subcategory level. Categorical variety seeking refers to diversification of one's choices over multiple brands not within the same category but across multiple categories. Building on construal level theory, the authors expected that people engaging in higher-level construals tend to subcategorize the choice set and distribute their choices across more subcategories and designed four experiments to test the related hypotheses. The experimental results showed that consumers' construal level can affect the level at which variety seeking takes place and those with higher construal level tend to choose options seemingly more dissimilar to each other.
The purpose of this study was using a meta-analysis to estimate effect size ACT intervention program. Using a statistical method, meta-analysis has advantages that prove intervention's amount and direction. Meta-analysis facilitates comprehensive analysis. Through the data collection, 43studies were selected and 183 effect size were calculated as analysis objects. Using a 183 effect size, the overall effect size, Effect Size of categorical Factor, meta-regression result were suggested. The overall effect size of ACT program was 0.704. In the effect area of ACT, the affective domain had the largest effect size. Next were the cognitive domain, the behavioral domain. Analysis on gender of participant, mixed group had the largest effect size. Next were the female grouop, male group. Analysis on age of participant, adult group had the largest effect size. Next were the undergraduate grouop, adolescent group. Based on the findings, implications for future study were discussed.
The purpose of this study was to develop age-biomass model in Chungnam region containing random effect. To develop the biomass model by species and tree component, data for Pinus densiflora in central region is collected to 30 plots (150 trees). The mixed model were used to fixed effect in the age-biomass relation for Pinus densiflora, with random effect representing correlation of survey area were obtained. To verify the evaluation of the model for random effect, the akaike information criterion (abbreviated as, AIC) was used to calculate the variance-covariance matrix, and residual of repeated data. The estimated variance-covariance matrix, and residual were -1.0022, 0.6240, respectively. The model with random effect (AIC=377.2) has low AIC value, comparison with other study relating to random effects. It is for this reason that random effect associated with categorical data were used in the data fitting process, the model can be calibrated to fit the Chungnam region by obtaining measurements. Therefore, the results of this study could be useful method for developing biomass model using random effects by region.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.