• 제목/요약/키워드: categorical data analysis

검색결과 195건 처리시간 0.034초

Associations Between Compliance With Non-pharmaceutical Interventions and Social-distancing Policies in Korea During the COVID-19 Pandemic

  • Hwang, Yu Seong;Jo, Heui Sug
    • Journal of Preventive Medicine and Public Health
    • /
    • 제54권4호
    • /
    • pp.230-237
    • /
    • 2021
  • Objectives: This study explored changes in individuals' behavior in response to social distancing (SD) levels and the "no gatherings of more than 5 people" (NGM5) rule in Korea during the coronavirus disease 2019 (COVID-19) pandemic. Methods: Using survey data from the COVID-19 Behavior Tracker, exploratory factor analysis extracted 3 preventive factors: maintenance of personal hygiene, avoiding going out, and avoiding meeting people. Each factor was used as a dependent variable. The chisquare test was used to compare differences in distributions between categorical variables, while binary logistic regression was performed to identify factors associated with high compliance with measures to prevent transmission. Results: In men, all 3 factors were significantly associated with lower compliance. Younger age groups were associated with lower compliance with maintenance of personal hygiene and avoiding meeting people. Employment status was significantly associated with avoiding going out and avoiding meeting people. Residence in the capital area was significantly associated with higher compliance with personal hygiene and avoiding venturing out. Increasing SD levels were associated with personal hygiene, avoiding going out, and avoiding meeting people. The NGM5 policy was not significantly associated with compliance. Conclusions: SD levels, gender, age, employment status, and region had explanatory power for compliance with non-pharmaceutical interventions (NPIs). Strengthening social campaigns to inspire voluntary compliance with NPIs, especially focused on men, younger people, full-time workers, and residents of the capital area is recommended. Simultaneously, efforts need to be made to segment SD measures into substrategies with detailed guidance at each level.

범주형 자료 분석을 활용한 사회경제적 가뭄 피해 발생확률 산정 : 충청북도의 적용사례를 중심으로 (Estimation of Occurrence Probability of Socioeconomic Damage Caused by Meteorological Drought Using Categorical Data Analysis)

  • 유지수;유지영;김민지;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.348-348
    • /
    • 2021
  • 가뭄 연구의 궁극적 목표는 가뭄 발생의 메커니즘에 대한 이해를 높이고, 예측기술을 향상시켜 선제적 대응이 가능하도록 하는 것이다. 일반적으로 가뭄분석에 활용되는 가뭄지표는 연속형 변수로 간주하여 확률모형을 구축하지만, 가뭄상태와 가뭄피해 자료는 순서형 및 이산형 변수이므로 범주형 자료 분석 기법을 적용하는 것이 더 적절하다. 따라서 본 연구에서는 기상학적 가뭄과 피해발생 사이의 관계를 규명하기 위해 범주형 자료 분석 방법 중 로그선형(log-linear) 모형과 로지스틱(logistic) 회귀모형을 활용하였다. 가뭄피해 예측을 위한 가뭄 피해 정보를 수집하는 것은 매우 어려운 일이다. 가뭄의 영향으로 인해 발생할 수 있는 피해의 종류가 다양하며, 여러 분야의 이해관계자가 받아들이는 가뭄의 피해 양상이 다르기 때문이다. 본 연구에서는 국가가뭄정보포털(drought.go.kr)에서 충청북도의 가뭄피해현황 자료를 수집하였다. 30년(1991~2020년)동안 238개 읍면동 중 34개 행정구역에서 총 272건의 가뭄피해가 발생한 것으로 확인되었다. 표준강수지수(SPI)를 이용하여 분석된 지역별 연평균 가뭄발생횟수는 약 8.44회이며, 가뭄이 가장 많이 발생한 해는 2001년(평균 가뭄발생 18.7회)이었다. 강수의 부족으로 인해 발생하는 기상학적 가뭄이 사회경제적 피해를 야기하는 수문학적 가뭄으로 전이되기까지 몇 주에서 몇 달까지 시간이 소요된다. 이러한 관계를 파악하기 위해 가뭄피해 발생 여부를 예측변수, 가뭄피해 발생 이전의 가뭄상태를 설명변수로 설정하여 기상학적 가뭄 발생에 따른 가뭄피해 발생 확률을 산정하였다. 그 결과 가뭄피해 발생 당시의 가뭄상태보다 그 이전에 연속된 가뭄상태가 있을 경우 가뭄피해 발생 확률이 약 2.5배 상승하는 것으로 나타났다.

  • PDF

반복측정자료 분석을 위한 혼합모형의 적용성 검토: 강원지역 굴참나무 임분을 대상으로 (Applicability Evaluation of a Mixed Model for the Analysis of Repeated Inventory Data : A Case Study on Quercus variabilis Stands in Gangwon Region)

  • 표정기;이상태;서경원;이경재
    • 한국산림과학회지
    • /
    • 제104권1호
    • /
    • pp.111-116
    • /
    • 2015
  • 본 연구의 목적은 임의효과(random effect)를 포함하는 혼합모형(mixed model)을 이용하여 흉고직경과 수고의 변화량을 평가하는데 있다. 강원도 굴참나무 임분을 대상으로 흉고직경과 수고를 조사하고 3년 후 동일 임분을 재조사하였다. 혼합모형에서 굴참나무의 흉고직경-수고 관계는 고정효과(fixed effect)이고 초기측정과 반복측정의 흉고직경과 수고 차이를 임의효과로 설정하였다. 임의효과에 따른 모형의 적합도를 검정하기 위하여 아카이케의 정보기준(akaike information criterion, AIC)을 참고하고 반복 측정에 따른 분산-공분산 행렬과 오차항을 산정하였다. 추정된 공분산은 -0.0291이고 오차항은 0.1007을 나타내었다. 분산-공분산 행렬을 이용한 임의효과가 포함된 모형의 AIC(=-215.5)는 고정효과를 고려한 모형의 AIC(=-154.4)에 비해 낮은 수치를 나타내었다. 이러한 결과는 범주형 자료의 임의효과가 모형 개발에 반영되는 결과인 것으로 조사되었다. 그러므로, 본 연구에서 적용된 혼합모형은 반복 측정 자료를 이용한 모형 개발에 활용이 가능한 것으로 판단된다.

분류 트리 기법을 이용한 국내 일괄사육 양돈장의 차단방역 수준에 영향을 미치는 기여 요인 평가 (Classification Tree Analysis to Assess Contributing Factors Influencing Biosecurity Level on Farrow-to-Finish Pig Farms in Korea)

  • 김규욱;박선일
    • 한국임상수의학회지
    • /
    • 제33권2호
    • /
    • pp.107-112
    • /
    • 2016
  • The objective of this study was to determine potential contributing factors associated with biosecurity level of farrow-to-finish pig farms and to develop a classification tree model to explore how these factors related to each other based on prediction model. To this end, the author analyzed data (n = 193) extracted from a cross-sectional study of 344 farrow-to-finish farms which was conducted between March and September 2014 aimed to explore swine disease status at farm level. Standardized questionnaires with information about basic demographical data and management practices were collected in each farm by on-site visit of trained veterinarians. For the classification of the data sets regarding biosecurity level as a dependent variable and predictor variables, Chi-squared Automatic Interaction Detection (CHAID) algorithm was applied for modeling classification tree. The statistics of misclassification risk was used to evaluate the fitness of the model in terms of prediction results. Categorical multivariate input data (40 variables) was used to construct a classification tree, and the target variable was biosecurity level dichotomized into low versus high. In general, the level of biosecurity was lower in the majority of farms studied, mainly due to the limited implementation of on-farm basic biosecurity measures aimed at controlling the potential introduction and transmission of swine diseases. The CHAID model illustrated the relative importance of significant predictors in explaining the level of biosecurity; maintenance of medical records of treatment and vaccination, use of dedicated clothing to enter the farm, installing fence surrounding the farm perimeter, and periodic monitoring of the herd using written biosecurity plan in place. The misclassification risk estimate of the prediction model was 0.145 with the standard error of 0.025, indicating that 85.5% of the cases could be classified correctly by using the decision rule based on the current tree. Although CHAID approach could provide detailed information and insight about interactions among factors associated with biosecurity level, further evaluation of potential bias intervened in the course of data collection should be included in future studies. In addition, there is still need to validate findings through the external dataset with larger sample size to improve the external validity of the current model.

국내 식물 형태 연구에 사용된 다변량분석 논문에 대한 재고 (A Review of Multivariate Analysis Studies Applied for Plant Morphology in Korea)

  • 장계선;오하나;김휘;이흥수;장진성
    • 한국산림과학회지
    • /
    • 제98권3호
    • /
    • pp.215-224
    • /
    • 2009
  • 최근 10여년간(1997-2008년) 국내 식물 형태관련 연구논문중 주요 3개 학회지(한국임학회지, 한국식물분류학회지, 한국육종학회지)와 기타학회지(한국자원식물학회지, 생명과학학회지, 약용작물학회지, 한국양봉학회지, 원예과학기술지, 원예학회지) 등에 발표된 다변량 분석 54개 논문을 재검토하였다. 이들 논문에서 주성분 분석(PCA), 유집분석(CA)이 가장 많이 사용되었는데 본 연구는 이와 관련된 분석방법과 기초 통계 분석의 문제점을 검토하였다. 주성분 분석의 문제점은 기존 표본에 추출과 자료의 정규분포성에 대한 가설을 무시하는 것으로서 분산과 공분산을 구할 수 없는 정성형질을 섞어 사용하여 주성분 분석의 결과를 왜곡하여 분석하는 것이었다. 또한, 유집분석은 분석방법론에 따라 상당한 차이를 보여 정량적 형질 보다는 정성적 형질로 계수화하여 분석함을 권장하지만 대부분 정량적 형질로 분석하여 실제 상호 분석 대상군 간의 관계가 형성되지 않는 계단상 모양을 보였다. 또한, 일부 연구논문에서는 통계적 가설을 무시하고 임의로 자료를 해석하는 것도 자주 발견되는 문제점 중 하나였다. 주성분분석에서 주의해야 할 점은 주로 정량적 형질 사용이 권장되며, 이외 일정 수 이상의 변량(20여개 이상)과 적절한 개체수(40-50개 이상)가 필요하다는 것이다. 유집분석(혹은 군집분석)은 분석 대상을 강제로 유집시키는 성향이 있어 통계적 검증 방법을 사용하지 않고 단순히 거리 계산법 혹은 알고리즘 분석 방법에 의해 결과에 상당한 차이를 보이기 때문에 정량적 형질만을 근간으로 한 유집분석은 자제할 필요가 있다. 모든 자료를 쉽게 분석하기 위해서 단순히 통계적 방법론에 의존하기 보다는 연구목적과 일치한 분석 방법론을 적용하고자 하는 노력이 필수적이다.

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발 (Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining)

  • 윤승진;김수환;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.1-17
    • /
    • 2015
  • 최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.

COMS 위성의 가시 및 적외 영상 채널로부터 복원된 대류운의 강우강도 향상과 검증 (Improvement and Validation of Convective Rainfall Rate Retrieved from Visible and Infrared Image Bands of the COMS Satellite)

  • 문윤섭;이강열
    • 한국지구과학회지
    • /
    • 제37권7호
    • /
    • pp.420-433
    • /
    • 2016
  • 본 연구의 목적은 2011년 4월 22일부터 10월 22일까지 우리나라에서 강수가 있는 총 75일 동안 COMS 위성의 적외 채널 $10.8{\mu}m$ 휘도 온도(IR), 적외 채널 $10.8{\mu}m$와 수증기 채널 $6.7{\mu}m$의 휘도 온도차(IR-WV), 정규화 된 가시반사도(VIS)와 기상 레이더의 강우강도를 이용하여 2-D와 3-D 대류운의 강우강도 (CRR) 조견표를 향상시키는 것이다. 특별히 한국형 2-D와 3-D CRR 조견표를 검증하기 위해 2011년 강수가 있는 24일 동안의 기상 레이더 강우강도 자료가 사용된다. 2-D와 3-D CRR 조견표는 각 채널의 등급 범주별 강우 총수와 비강우 총수의 행렬을 이용하여 구한 강우 확률에 평균 누적강우강도와 최대 강우강도를 각각 곱함으로써 2-D (IR, IR-WV)와 3-D (IR, IR-WV, VIS) 조견표의 기본과 최대 행렬을 얻을 수 있다. 최종적으로 새로운 2-D와 3-D의 CRR 조견표는 경험적으로 기본과 최대 강우강도 행렬의 회귀 분석으로 얻어진다. 그 결과 새로운 CRR 조견표는 기존보다 낮은 IR 휘도 온도, 낮은 IR-WV 휘도 온도차일 때에도 비교적 많은 강우 현상을 나타내며, $10mm\;h^{-1}$ 이상의 강우강도 영역이 확대되어 나타난다. 정확도와 범주별 통계가 주어진 기간 동안 발생했던 CRR 자료에 대해 계산된다. 새로운 2-D와 3-D CRR 조견표의 평균 오차, 평균절대 오차, 제곱근평균 오차가 기존 조견표보다 작게 나타나며, 예측 거짓경고비율은 감소하고, 탐지확률은 증가하며, 임계성공지수는 개선된다. 태풍과 뇌우와 같은 기상 이변에서의 강한 호우를 고려하기 위해서 습윤 보정 계수를 교정한다. 이 인자는 수치모델이나 COMS에서 복원한 지면에서 500 hPa까지 평균한 총가강수량과 상대습도의 곱 (PW RH)으로 정의된다. 이 연구에서는 PW RH에 근거하여 IR 운정 휘도 온도가 210 K 이하일 때, 상대습도가 40% 이상일 때 1에서 2사이를 경험적으로 정한다. 새로운 2-D와 3-D CRR 조견표를 적용한 결과 평균 오차, 평균 절대 오차, 제곱근 평균 오차가 줄어든다.

Comparative Analysis of Spontaneous Infectious Spondylitis : Pyogenic versus Tuberculous

  • Lee, Yangwon;Kim, Bum-Joon;Kim, Se-Hoon;Lee, Seung-Hwan;Kim, Won-Hyung;Jin, Sung-Won
    • Journal of Korean Neurosurgical Society
    • /
    • 제61권1호
    • /
    • pp.81-88
    • /
    • 2018
  • Objective : Spondylitis is often chemotherapy resistant and requires long-term treatment. Without adequate chemotherapy, the outcome can be fatal or result in severe neurologic damage. Therefore, differentiating the etiology of spondylitis is very important, particularly in spontaneous cases. As the prevalence of tuberculosis in Korea has decreased in recent years, updated clinical research about spondylitis is warranted. Methods : From April 2010 to March 2016, data from spondylitis patients were collected retrospectively. In total, 69 patients (51 with pyogenic spondylitis and 18 with tuberculous spondylitis) were included. Clinical data, laboratory findings including erythrocyte sedimentation rate (ESR) and C-reactive protein (CRP) level, measurements of Cobb angles at the initial and final follow-up, and radiologic features on magnetic resonance imaging (MRI) scans were evaluated. To test differences between the pyogenic and tuberculous groups, numerical data were compared using the student's t-test and Mann-Whitney U test, and categorical data were compared using the chi-square test and Fisher's exact test. Results : The patients' mean age was 60.0 years. Male sex was slightly predominant (56.5%). There was no difference in mean age and sex between the two groups. The pyogenic group had a relatively higher proportion of immunocompromised patients. The peak CRP value was higher in the pyogenic group than in the tuberculous group (14.08 mg/dL and 8.50 mg/dL, respectively, p=0.009), whereas the ESR was not significantly different between the groups (81.5 mm/h and 75.6 mm/h, respectively, p=0.442). Radiologically, the presence of disc space sparing and vertebral body collapse differed between the groups. In the tuberculous group, the disc was more commonly preserved on contrast-enhanced MRI (50% and 23.5%, respectively, p=0.044), and vertebral body collapse was more common (66.6% and 15.7%, respectively, p<0.001). The mean length of hospitalization was longer in the pyogenic group (56.5 days and 41.2 days, respectively, p=0.001). Four mortality cases were observed only in the pyogenic group. The most commonly isolated microorganism in the pyogenic group was Staphylococcus aureus(S. aureus) (methicillin susceptible S. aureus and methicillin resistant S. aureus [MRSA] in 8 and 4 cases, respectively). Conclusion : The clinical and radiological manifestations of spontaneous spondylitis differ based on the causative organism. Pyogenic spondylitis patients tend to have a higher CRP level and a more severe clinical course, whereas tuberculous spondylitis patients present with destruction of the vertebral body with disc sparing more frequently. The presence of MRSA is increasing in community-acquired spondylitis cases.

대응분석을 이용한 은행 채널전략 수립연구 : 고객의 은행채널 선택요인을 바탕으로 (Establishment of Bank Channel Strategy using Correspondence Analysis : Based on the Customer's Choice Factors of Bank Channel)

  • 박운학;박영배
    • 한국산업정보학회논문지
    • /
    • 제28권6호
    • /
    • pp.151-171
    • /
    • 2023
  • 본 연구의 목적은 은행의 효율적인 채널전략 수립을 위해 채널을 유형별로 분류하고, 분류된 유형에 따라 대응분석을 실시하여 채널모형을 제안하는 것이다. 이를 위해 은행원 대상 설문조사를 실시하여 범주형 자료를 시각화하고 포지셔닝 맵을 작성하였다. 그 결과 첫째, 12개 은행채널을 업무처리 주체와 장소를 기준으로 4개 유형으로 분류하고, 이를 다시 풀뱅킹과 셀프뱅킹으로 그룹화 하였다. 둘째, 분류된 유형에 따라 대응분석을 실시하여 점포형은 상품설명과 고객관리에 적합하고, 뱅킹형은 시·공간 제약 없이 효율적인 업무처리에 적합하며, 기기형과 뱅킹형은 고객관리에 부적합하고, 이동형은 인식부족으로 운영효과가 낮은 상태라는 결과를 도출하였다. 이는 은행업무의 특성을 반영하고 채널간 부족한 부분을 보완하는 하이브리드형 융합채널이 필요함을 의미한다. 셋째, 업무처리주체와 장소로 구성된 2×2모형위에 공통분면이 추가된 채널모형을 도출하였다. 따라서 본 연구는 고객의 은행채널 선택요인을 바탕으로 채널 다각화와 채널유형 별 역할분담 요소를 고찰함에 기여하고, 미래채널 전략수립과 효율적인 채널운영을 위한 기초연구 결과를 제시하였다는 점에서 연구의 의의를 가진다.

유아용 그림책에 나타난 유아과학교육 내용분석 (The Analysis of Young Children Science Educational Content Shown in the Child Picture Book)

  • 윤은경;이미나
    • 한국콘텐츠학회논문지
    • /
    • 제15권8호
    • /
    • pp.588-597
    • /
    • 2015
  • 본 연구는 유아용 그림책에 나타난 5세 누리과정 유아과학교육 내용의 범주별 분포를 알아보고, 유아과학교육 내용의 범주별 분포는 국내 외 그림책과 장르에 따라서 어떤 차이를 보이는지 파악하는데 그 목적이 있다. 연구 대상은 2012, 2013년 어린이도서연구회에서 발간한 <어린이 권장도서 목록>에 수록되어 있는 만 4세~7세 유아용 그림책 219권이었다. 연구도구는 유아용 그림책의 유아과학교육 내용분석을 위하여 5세 누리과정 자연탐구 영역의 내용체계로 제시되어 있는 항목을 사용하였다. 내용분석 범주는 2개의 상위범주와 7개의 하위범주로 설정하였다. 연구 자료는 내용분석 방법으로 분석준거에 의한 각 분석 항목에 해당하는 범주의 빈도와 백분율을 산출하였다. 연구결과는 첫째, 219권의 그림책에 나타난 유아과학교육 내용 상위범주 분석결과 '호기심을 유지하고 확장하기', '생명체와 자연환경 알아보기', '탐구기술 활용하기', '탐구과정 즐기기', '간단한 도구와 기계 활용하기', '물체와 물질 알아보기', '자연현상 알아보기' 순으로 나타났다. 둘째, 국내 외 그림책과 그림책의 장르에 따라서 살펴본 결과, '탐구하는 태도 기르기'보다 '과학적 탐구하기' 내용이 더 높게 분포 되어 있는 것으로 나타났다.