• 제목/요약/키워드: categorical effect

검색결과 80건 처리시간 0.026초

k-모집단 동질성검정에서 피어슨검정의 오차성분 분석에 관한 연구 (Error cause analysis of Pearson test statistics for k-population homogeneity test)

  • 허순영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.815-824
    • /
    • 2013
  • 국가단위의 조사와 같은 대규모 표본조사에서는 표본의 대표성을 확보하기 위해 층화, 집락, 계통, 불균등확률추출 등을 종합적으로 사용하는 복합표본설계가 일반화되어 있다. 이러한 복합표본설계에 기초한 범주형 자료분석에서는 자료의 독립성과 다항분포를 가정하는 전통적인 피어슨검정이 왜곡된 검정결과를 가져올 수 있다. 본 연구는 복합표본설계에 의한 범주형조사자료의 k-모집단 동질성검정에서 설계기반 일치통계량인 Wald 검정통계량을 유도하고, 전통적인 피어슨검정통계량을 사용할 경우 발생할 수 있는 오차요인을 항목별로 분해하여, 분산의 편의에 의한 영향, 추정량의 편의에 의한 영향, 기타 분산의 편의와 추정량의 편의가 교락되어 미치는 영향으로 각각 분해하는 식을 도출하였다. 또한, 도출된 식의 각 항목이 피어슨 카이제곱검정통계량에 미치는 상대적 크기를 경험적으로 확인하기 위해 국민건강영양조사 제4기 2차년도 자료를 이용해 경험분석 하였다. 분석결과, 변수에 따른 차이는 있지만 대체로 분산의 편의가 미치는 영향이 추정량의 편의가 미치는 영향보다 크다는 것을 명확히 확인할 수 있었다.

CTR 예측을 위한 비전 트랜스포머 활용에 관한 연구 (A Study on Utilization of Vision Transformer for CTR Prediction)

  • 김태석;김석훈;임광혁
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.27-40
    • /
    • 2021
  • Click-Through Rate(CTR) 예측은 추천시스템에서 후보 항목의 순위를 결정하고 높은 순위의 항목들을 추천하여 고객의 정보 과부하를 줄임과 동시에 판매 촉진을 통한 수익 극대화를 달성할 수 있는 핵심 기능이다. 자연어 처리와 이미지 분류 분야는 심층신경망(deep neural network)의 활용을 통한 괄목한 성장을 하고 있다. 최근 이 분야의 주류를 이루던 모델과 차별화된 어텐션(attention) 메커니즘 기반의 트랜스포머(transformer) 모델이 제안되어 state-of-the-art를 달성하였다. 본 연구에서는 CTR 예측을 위한 트랜스포머 기반 모델의 성능 향상 방안을 제시한다. 자연어와 이미지 데이터와는 다른 이산적(discrete)이며 범주적(categorical)인 CTR 데이터 특성이 모델 성능에 미치는 영향력을 분석하기 위해 임베딩의 일반화(regularization)와 트랜스포머의 정규화(normalization)에 관한 실험을 수행한다. 실험 결과에 따르면, CTR 데이터 입력 처리를 위한 임베딩 과정에서 L2 일반화의 적용과 트랜스포머 모델의 기본 정규화 방법인 레이어 정규화 대신 배치 정규화를 적용할 때 예측 성능이 크게 향상됨을 확인하였다.

반복측정자료 분석을 위한 혼합모형의 적용성 검토: 강원지역 굴참나무 임분을 대상으로 (Applicability Evaluation of a Mixed Model for the Analysis of Repeated Inventory Data : A Case Study on Quercus variabilis Stands in Gangwon Region)

  • 표정기;이상태;서경원;이경재
    • 한국산림과학회지
    • /
    • 제104권1호
    • /
    • pp.111-116
    • /
    • 2015
  • 본 연구의 목적은 임의효과(random effect)를 포함하는 혼합모형(mixed model)을 이용하여 흉고직경과 수고의 변화량을 평가하는데 있다. 강원도 굴참나무 임분을 대상으로 흉고직경과 수고를 조사하고 3년 후 동일 임분을 재조사하였다. 혼합모형에서 굴참나무의 흉고직경-수고 관계는 고정효과(fixed effect)이고 초기측정과 반복측정의 흉고직경과 수고 차이를 임의효과로 설정하였다. 임의효과에 따른 모형의 적합도를 검정하기 위하여 아카이케의 정보기준(akaike information criterion, AIC)을 참고하고 반복 측정에 따른 분산-공분산 행렬과 오차항을 산정하였다. 추정된 공분산은 -0.0291이고 오차항은 0.1007을 나타내었다. 분산-공분산 행렬을 이용한 임의효과가 포함된 모형의 AIC(=-215.5)는 고정효과를 고려한 모형의 AIC(=-154.4)에 비해 낮은 수치를 나타내었다. 이러한 결과는 범주형 자료의 임의효과가 모형 개발에 반영되는 결과인 것으로 조사되었다. 그러므로, 본 연구에서 적용된 혼합모형은 반복 측정 자료를 이용한 모형 개발에 활용이 가능한 것으로 판단된다.

사주적 범부의 암묵적 표상 구조: 성별 고정관념의 비대칭적 점화효과 (Implicit Representations of Social Categories: Asymmetrical Priming Effects on Gender Stereotype)

  • 이재호;조긍호;오경기;김미라
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.43-54
    • /
    • 2001
  • 본 연구는 사회범주인 성별 고정관념의 암묵적 표상 구조의 특성을 살펴보기위해서 실시되었다. 사회 범주는 일반대상이나 행위의 범주에 비해서 속성의 비중이크며, 그 표상 구조도 분명하지 않다는 연구들이 있었다. 세 개의 실험에서 성별 고정관념의 평가적 속성을 통제하여 암묵적 표상의 구조를 확인하고자 하였다. 각 실험은 점화-목표 자극쌍의 SOA 조건을 변화시켰다. 그 결과 짧은 SOA(250-500ms, 실험 1과 실험 3)에서의 여성-여성 단어쌍의 남성-남성 단어쌍이나 교차 자극쌍에 비해서 점화효과가 크게 나타났다. 반면에 긴 SOA(1000ms, 실험 2)에서는 단어쌍 조건간의 점화효과의 차이가 사라졌다. 사회 범주로의 성별 고정관념은 암묵적 수준에서는 여성과 남성의 범주 대비가 분명하지 않았으며, 여성 범주가 남성범주에 비해서 속성간 점화효과가 크지 않았다. 이는 두 범주가 비대칭적으로 표상될 가능성을 시사하였다.

  • PDF

디지털 콘텐츠 사용자의 만족에 영향을 주는 서비스 품질 요인 및 유통 채널 탐색에 관한 연구 (An Exploration of Factor's of Service Quality influencing at User's Satisfaction and Distribution Channel of the Digital Contents)

  • 서정한;배순한;김영국;최재영
    • 디지털산업정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.183-198
    • /
    • 2011
  • With the recent development of IT technology, the existing contents have been digitalized through various distribution channels. Accordingly, a lot of studies have been done in order to figure out the distribution and features of digital contents, In these studies, however, categorical characteristics of digital contents were not considered ; most of the previous researchers saw digital contents as only a single item or focused on some contents within particular part such as movie, music, etc. So, this study divides digital contents into movies, music and texts. I was going to study which factors affect Customer Satisfaction in relation with the kind of contents. With SERVQUAL as independent variables, which affect the Customer satisfaction, I used five factors :Design Quality, Information Quality, Security Quality, Communication Quality and Transaction Quality. As for the detailed items, I corrected them with Open-End Question and Pre Survey Research, which are more fit into the features of digital contents. This research conducted Principle Component Analysis, Reliability Test, Correlation Analysis and Regression Analysis. I verified that each factor of Service Qualities has a positive effect on Customer Satisfaction. Moreover, the factors of the effect are different according to the kind of digital contents. This paper was added Exploratory Study to find the best distribute channel. For the study, I search the possible distribute channel in each digital contents and their characteristic.

Electromyographic evidence for a gestural-overlap analysis of vowel devoicing in Korean

  • Jun, Sun-A;Beckman, M.;Niimi, Seiji;Tiede, Mark
    • 음성과학
    • /
    • 제1권
    • /
    • pp.153-200
    • /
    • 1997
  • In languages such as Japanese, it is very common to observe that short peripheral vowel are completely voiceless when surrounded by voiceless consonants. This phenomenon has been known as Montreal French, Shanghai Chinese, Greek, and Korean. Traditionally this phenomenon has been described as a phonological rule that either categorically deletes the vowel or changes the [+voice] feature of the vowel to [-voice]. This analysis was supported by Sawashima (1971) and Hirose (1971)'s observation that there are two distinct EMG patterns for voiced and devoiced vowel in Japanese. Close examination of the phonetic evidence based on acoustic data, however, shows that these phonological characterizations are not tenable (Jun & Beckman 1993, 1994). In this paper, we examined the vowel devoicing phenomenon in Korean using data from ENG fiberscopic and acoustic recorders of 100 sentences produced by one Korean speaker. The results show that there is variability in the 'degree of devoicing' in both acoustic and EMG signals, and in the patterns of glottal closing and opening across different devoiced tokens. There seems to be no categorical difference between devoiced and voiced tokens, for either EMG activity events or glottal patterns. All of these observations support the notion that vowel devoicing in Korean can not be described as the result of the application of a phonological rule. Rather, devoicing seems to be a highly variable 'phonetic' process, a more or less subtle variation in the specification of such phonetic metrics as degree and timing of glottal opening, or of associated subglottal pressure or intra-oral airflow associated with concurrent tone and stricture specifications. Some of token-pair comparisons are amenable to an explanation in terms of gestural overlap and undershoot. However, the effect of gestural timing on vocal fold state seems to be a highly nonlinear function of the interaction among specifications for the relative timing of glottal adduction and abduction gestures, of the amplitudes of the overlapped gestures, of aerodynamic conditions created by concurrent oral tonal gestures, and so on. In summary, to understand devoicing, it will be necessary to examine its effect on phonetic representation of events in many parts of the vocal tracts, and at many stages of the speech chain between the motor intent and the acoustic signal that reaches the hearer's ear.

  • PDF

복합표본자료에서 동질성검정을 위한 피어슨 검정통계량의 효과 (Effect of complex sample design on Pearson test statistic for homogeneity)

  • 허순영;정영애
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.757-764
    • /
    • 2012
  • 복합표본설계에 기초한 범주형 조사자료는 통상적인 피어슨 카이제곱검정에 필요한 조건을 만족하지 못한다. 그러나 많은 조사연구에서 복잡한 표본설계 방법을 적용하고 있지만, 종래의 피어슨 검정결과를 제시하고 있다. 본 연구는 복합표본설계에 의한 범주형자료의 동질성검정에 대한 실증분석을 통해, 종래의 피어슨 검정과 불편검정인 왈드검정, 표본설계를 반영한 비율추정치를 사용하는 피어슨 검정을 비교하였다. 분석결과, 종래의 피어슨검정은 표본설계를 반영하는 검정들에 비해 통계량 값이 매우 크고, 유의확률이 심각하게 작게 나타나는 것을 확인하였다. 복합표본설계를 반영하되 추정량의 분산을 아는 경우와 모르는 경우의 비교에서는 범주수, 설계효과행렬의 고유치들의 평균과 표준편차에 영향을 받는 것을 확인하였다.

지열 히트펌프 시스템의 데이터 마이닝 기반 성능 예측 기술 (Data Mining-Based Performance Prediction Technology of Geothermal Heat Pump System)

  • 황민혜;박명규;전인기;손병후
    • 대한기계학회논문집 C: 기술과 교육
    • /
    • 제4권1호
    • /
    • pp.27-34
    • /
    • 2016
  • 지열 시스템을 대상으로 데이터 마이닝 기반 성능 예측 모델을 구축하였다. 지열 시스템의 실시간 성능 분석과 예측에 필요한 데이터의 기본 조건을 검토한 후, 데이터베이스의 구조를 설계하였다. 먼저 시스템 성능계수(COP)와 전력 소비량을 분석 대상으로 설정한 후, 이들 물리량의 추출 주기(1분 5분 10분 30분 60분 간격)가 예측 결과에 미치는 영향을 분석하였다. 이어서 범주형과 수치형 의사결정나무 모델을 적용하여 시스템의 성능을 예측하였다. 범주형 의사결정나무 모델을 적용했을 때, 10분 주기의 예측 결과의 정확도는 97.7%로 가장 높았다. 또한 수치형 의사결정나무 분석 결과를 통해 COP가 변하는 순간의 임계값을 찾을 수 있었다. 본 논문에서 제안한 방법은 지열 시스템의 실시간 성능 분석과 운전 상태 등에 적용할 수 있을 것으로 판단된다.

Isokinetic Muscle Strength and Muscle Endurance by the Types and Size of Rotator Cuff Tear in Men

  • Kim, In Bo;Kim, Do Keun
    • Clinics in Shoulder and Elbow
    • /
    • 제17권4호
    • /
    • pp.166-174
    • /
    • 2014
  • Background: Our study was to determine the effect on shoulder isokinetic muscle strength and muscle endurance in isolated full-thickness supraspinatus tendon tear and combined other rotator cuff tear. Methods: Total of 81 male patients (mean age $57.8{\pm}7.4$ years) who were diagnosed as a full-thickness supraspinatus tendon tear were included. They were classified into isolated or combined tear. The isokinetic muscle strength and muscle endurance were measured using the Biodex multi-joint system $PRO^{(R)}$ (Biodex Medical Systems, Shirley, NY, USA) in following movements: shoulder abduction, adduction, flexion, extension, external rotation, and internal rotation. Then, the difference in muscle function according to the type of tears were assessed. Fifty-seven patients had isolated supraspinatus tendon (mean age $56.9{\pm}7.3$ years). They were classified into either anteroposterior tear or modified mediolateral tear. The size were measured using T2-weighted magnetic resonance imaging scans in sagittal plane. Results: Between subjects categorized into the type of tear, we found significant inter-categorical differences in isokinetic muscle strength during abduction, adduction, flexion, extension, and internal rotation, and in muscle endurance during flexion, extension, and internal rotation. Anteroposterior diameter tear, we did not show significant differences in either isokinetic muscle strength or muscle endurance during any movements. However, with modified mediolateral diameter, we found significant differences with isokinetic muscle strength during adduction, and in muscle endurance the external rotation and internal rotation. Conclusions: We found that a supraspinatus tendon tear associated with more numbers of rotator cuff tears has lower isokinetic muscle strength and muscle endurance than a tear found alone.

Causality between climatic and soil factors on Italian ryegrass yield in paddy field via climate and soil big data

  • Kim, Moonju;Peng, Jing-Lun;Sung, Kyungil
    • Journal of Animal Science and Technology
    • /
    • 제61권6호
    • /
    • pp.324-332
    • /
    • 2019
  • This study aimed to identify the causality between climatic and soil variables affecting the yield of Italian ryegrass (Lolium multiflorum Lam., IRG) in the paddy field by constructing the pathways via structure equation model. The IRG data (n = 133) was collected from the National Agricultural Cooperative Federation (1992-2013). The climatic variables were accumulated temperature, growing days and precipitation amount from the weather information system of Korea Meteorological Administration, and soil variables were effective soil depth, slope, gravel content and drainage class as soil physical properties from the soil information system of Rural Development Administration. In general, IRG cultivation by the rice-rotation system in paddy field is important and unique in East Asia because it contributes to the increase of income by cultivating IRG during agricultural off-season. As a result, the seasonal effects of accumulated temperature and growing days of autumn and next spring were evident, furthermore, autumnal temperature and spring precipitation indirectly influenced yield through spring temperature. The effect of autumnal temperature, spring temperature, spring precipitation and soil physics factors were 0.62, 0.36, 0.23, and 0.16 in order (p < 0.05). Even though the relationship between soil physical and precipitation was not significant, it does not mean there was no association. Because the soil physical variables were categorical, their effects were weakly reflected even with scale adjustment by jitter transformation. We expected that this study could contribute to increasing IRG yield by presenting the causality of climatic and soil factors and could be extended to various factors.