• 제목/요약/키워드: 범주형 자료

검색결과 223건 처리시간 0.034초

인공지능 세대 제 1형 당뇨 학생 인슐린 투약 지원 경험 (A study on the experiences of insulin medication support for the type 1 diabetes mellitus AI-generation students)

  • 강희경
    • 융합정보논문지
    • /
    • 제8권4호
    • /
    • pp.37-43
    • /
    • 2018
  • 본 연구의 목적은 인공지능세대인 제 1형 당뇨 학생들을 관리하는 간호사의 인슐린 투약지원 경험을 확인하는데 있다. 본 연구는 현상학적 질적 연구로, 자료는 제 1형 당뇨 학생의 투약지원을 맡고 있는 당뇨교실 간호사와 보건교사 5명을 대상으로 2018년 6월 17일~24일까지 인터뷰를 통해 수집하였으며, 자료의 의미는 Colaizzi(1978) 방법을 사용하여 분석하였다. 연구 결과 '첫걸음마를 응원', '치료적 관계유지', '도약을 위한 발판 마련'과 같은 3개의 범주와 그에 따른 7개의 주제를 도출하였다. 본 연구의 결과는 제 1형 당뇨 학생들의 투약지원과 관련된 학교보건법 개정에 따른 보건교사의 업무지침을 인공지능 세대 학생-보호자의 요구에 맞춰 실질적으로 구성하는데 기초자료를 제공할 것이다.

고차원 범주형 자료를 위한 비지도 연관성 기반 범주형 변수 선택 방법 (Association-based Unsupervised Feature Selection for High-dimensional Categorical Data)

  • 이창기;정욱
    • 품질경영학회지
    • /
    • 제47권3호
    • /
    • pp.537-552
    • /
    • 2019
  • Purpose: The development of information technology makes it easy to utilize high-dimensional categorical data. In this regard, the purpose of this study is to propose a novel method to select the proper categorical variables in high-dimensional categorical data. Methods: The proposed feature selection method consists of three steps: (1) The first step defines the goodness-to-pick measure. In this paper, a categorical variable is relevant if it has relationships among other variables. According to the above definition of relevant variables, the goodness-to-pick measure calculates the normalized conditional entropy with other variables. (2) The second step finds the relevant feature subset from the original variables set. This step decides whether a variable is relevant or not. (3) The third step eliminates redundancy variables from the relevant feature subset. Results: Our experimental results showed that the proposed feature selection method generally yielded better classification performance than without feature selection in high-dimensional categorical data, especially as the number of irrelevant categorical variables increase. Besides, as the number of irrelevant categorical variables that have imbalanced categorical values is increasing, the difference in accuracy between the proposed method and the existing methods being compared increases. Conclusion: According to experimental results, we confirmed that the proposed method makes it possible to consistently produce high classification accuracy rates in high-dimensional categorical data. Therefore, the proposed method is promising to be used effectively in high-dimensional situation.

MTDFREML 방법과 Gibbs Sampling 방법에 의한 한우의 육질형질 유전모수 추정 (Estimation of Genetic Parameter for Carcass Traits According to MTDFREML and Gibbs Sampling in Hanwoo(Korean Cattle))

  • 김내수;이중재;주종철
    • Journal of Animal Science and Technology
    • /
    • 제48권3호
    • /
    • pp.337-344
    • /
    • 2006
  • 본 연구는 Gibbs sampler와 MTDFREML 방법에 의해서 한우 도체형질의 유전력 및 유전(공)분산을 단형질 및 다형질 개체모형을 가지고 추정하고 비교 하였다. 배장근단면적(longissimus dorsi area), 등지방 두께(backfat thickness), 상강도(marbling score)의 유전 모수를 추정하였으며, 분석에 이용된 자료는 총 1,941두 이고, 혈연계수를 구하기 위한 혈통 자료는 23,058두를 이용하였다. 도체형질에 대한 유전력 추정 시 단형질과 다형질 개체모형에 의한 편차는 크게 나타나지 않았다. 단형질 개체모형에서 Gibbs sampler 방법을 이용한 추정에서는 LDA, BF 및 MS에서 각각 0.52, 0.59 및 0.42로서 고도의 유전력을 보였다. MTDFREML 방법을 통한 추정 시에는 LDA 0.41, BF 0.52로서 고도의 유전력을 보였으며, MS는 0.32로서 중도의 유전력을 보였다. 분석 방법에 의한 유전력 추정은 Gibbs sampler에 의한 방법이 MTDFREML에 의한 방법에 비해서 0.1정도 높게 추정되었다. MTDFREML 방법과 Gibbs Sampler 방법에 의한 도체 형질간의 유전상관은 LDA와 BF, MS 간에는 모두 부의 상관을 보였고, BF과 MS에서는 정의 상관을 보였다. MTDFREML과 Gibbs Sampler에서 이들의 분석 방법 간에 육종가 추정치에 대한 상관계수는 LDA와 BF에서는 0.989 이상의 높은 추정치를 보였으나, MS에 대해서는 이보다 다소 낮은 0.985를 나타내었다. 그리하여, 상강도(marbling score)와 같은 범주형 자료에 대한 유전분석은 기존의 선형의 정규분포를 가정한 REML방법에 의한 것 보다 범주형 모형을 설정하여 Gibbs sampling algorithm을 응용한 분석방법이 더 적합할 것으로 사료된다.

산사태 취약성 분석을 위한 GIS 기반 확률론적 추정 모델과 모수적 모델의 적용 (Application of GIS-based Probabilistic Empirical and Parametric Models for Landslide Susceptibility Analysis)

  • 박노욱;지광훈;;권병두
    • 자원환경지질
    • /
    • 제38권1호
    • /
    • pp.45-55
    • /
    • 2005
  • 산사태 취약성 분석을 위해 적용된 기존 GIS 기반 확률론적 공간 통합 모델은 범주형과 연속형 자료와 같이 서로 다른 형태의 자료의 처리를 위한 이론적 배경과 효율적인 방법론을 제시하지 못하였다. 이 논문에서는 우도비의 틀 안에서 연속형 자료를 직접적으로 사용할 수 있도록 비모수적 경험적 추정 모델과 모수적 예측적 판별 분석 모델을 적용하였다. 그리고 유사율과 예측비율곡선을 계산함으로써 두 모델을 정량적으로 비교하고자 하였다. 제안 모델을 비 교하기 위해 1998년 여름 산사태로 많은 피해를 입은 장흥 지역과 보은 지역을 대상으로 사례연구를 수행하였다. 장 흥 지역에서는 두 모델이 유사한 예측 능력을 나타내었으나, 보은 지역에서는 모수적 예측적 판별 분석 모델이 보다 높은 예측 능력을 나타내었다. 결론적으로 제안한 두 모델은 산사태 취약성 분석을 위한 연속형 자료 표현에 효율적 으로 적용될 수 있으며, 두 모델이 개별적인 연속형 자료 표현의 특성을 가지고 있기 때문에 다른 사례 연구를 통한 검증 작업이 병행되어야 할 것으로 생각된다.

초등교사의 과학학습부진학생 지도경험에 관한 근거이론적 연구 (A Study on Elementary School Teachers' Experiences in Teaching Students with Low Achievement in Science based on Grounded Theory)

  • 강지훈
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제41권1호
    • /
    • pp.44-64
    • /
    • 2022
  • 본 연구는 근거이론 분석 방법을 바탕으로 초등교사의 과학학습부진학생 지도경험을 탐색하였다. 과학학습부진학생을 최근 3년 이내에 지도한 경험이 있고, 5년 이상의 현장 경험을 가진 교사 13명을 대상으로 과학학습부진학생 지도경험에 대한 자료가 이론적 포화상태에 도달할 때까지 심층면담과 분석을 진행하였다. 분석 결과는 다음과 같다. 첫째, 초등교사의 과학학습부진학생 지도경험은 119개의 개념과 41개의 하위범주 및 17개의 범주로 도출하였다. 도출된 범주들을 패러다임 모형에 근거하여 '과학학습부진학생 지도의 어려움'이라는 중심현상을 바탕으로 인과적 조건, 맥락적 조건, 중재적 조건, 작용/상호작용 전략 및 결과로 구조화하여 제시하였다. 둘째, 초등교사의 과학교과 학습부진학생 지도의 핵심범주는 '어려움을 극복하며 과학학습부진학생 지도하기'로 상정하였다. 그리고 핵심범주의 속성과 차원에 따라 과학학습부진학생을 지도하는 교사유형은 '현실타협형', '현실극복형', '현실수용형', '현실갈등형'의 네 유형으로 구분되었다. 셋째, 초등교사의 과학학습부진학생 지도경험을 교사-학교-교육청 차원의 교육공급자 측면과 학생-가정 차원의 교육수요자 측면으로 구분하여 본 연구의 결과를 요약하고 통합할 수 있는 상황모형을 제시하였다. 이러한 결과를 바탕으로 과학교과 부진학생 지도에 대한 교육적 시사점을 논하였다.

중학생의 자유 탐구 보고서에 나타난 특징과 탐구 수행에 대한 학생들의 인식 (Characteristics of Middle School Students' Open-Inquiry Report and Their Perceptions of Conducting Inquiry)

  • 박미현;차정호;김인환
    • 대한화학회지
    • /
    • 제56권3호
    • /
    • pp.371-377
    • /
    • 2012
  • 이 연구에서는 대구 지역 중학교 2학년 165명이 작성한 자유 탐구 보고서를 주제 영역, 탐구 가설, 그리고 탐구 변인의 측면에서 분석하였다. 여름방학이 시작되기 전 2시간 동안 오리엔테이션을 진행하면서 탐구 과정에 대해 소개하고, 주제를 탐색하도록 하였다. 여름방학 동안 학생들은 주제 선정, 실험설계 및 수행, 자료 수집 및 분석, 결과 보고서 작성 등의 과정을 스스로 진행하였다. 여름방학 후, 결과보고서를 제출받으면서 학생들이 주제 선정에서 활용한 자료의 출처, 가설의 정의, 그리고 탐구 과정에서 가장 어려운 단계에 대한 인식도 조사하였다. 보고서의 주제 영역은 물리, 화학, 생물, 지구과학, 생활 영역으로, 보고서에 기술된 가설은 예측 가설과 설명 가설로 분류하였고 가설의 정의에 대한 학생들의 인식과 비교하였다. 탐구 주제, 탐구 가설, 실험 설계 부분에 제시된 탐구 변인을 분석하여 범주형, 연속형, 불확실 유형으로 분류하였다. 연구 결과, 주제 영역 중 화학 영역의 보고서가 가장 많았고, 다음으로 생물과 생활 영역이 많았다. 전체 165개 보고서 중 130개에 탐구 가설을 포함하고 있었는데, 이들 중 대부분은 예측 가설에 해당하였다. 보고서에 제시된 탐구 변인을 분석한 결과, 탐구 주제와 탐구 가설에 기술된 독립 변인과 종속 변인은 불확실 유형이 많았다. 그러나 실험 설계 부분에 기술된 변인들은 불확실 유형이 많이 줄어들었고, 범주형 변인이 증가하였다. 탐구 수행 과정에서 가장 어려운 단계에 대한 질문에 학생들은 주제 선정 단계를 가장 많이 선택하였다.

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

coin 패키지를 이용한 독립성 검정 (Independence tests using coin package in R)

  • 김진흠;이정동
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1039-1055
    • /
    • 2014
  • 검정통계량의 영가설 분포는 모집단 분포에 의존하는데 모집단의 분포를 모를 때 영가설 분포를 검정통계량의 조건부 분포로 대체하여 검정하는 방법을 순열 검정이라고 한다. Strasser와 Weber (1999)는 순열 검정을 통합하는 이론을 마련하였고, Hothorn 등 (2006, 2008)은 그 이론을 R에 내장된 coin 패키지에 구현하였다. coin 패키지에서 조건부 독립성 검정은 총괄적인 형태의 함수인 independence test를 통해서 할 수 있지만 대표적인 독립성 검정은 사용자가 편리하도록 간편한 함수를 별도로 제공하고 있다. 본 논문에서는 Strasser와 Weber (1999)의 순열 검정 방법에 대해 소개하고, coin 패키지에 내장된 15개의 간편 함수에 대해 independence test 함수로 변환하는 절차를 설명하고자 한다. 또한, 정의한 independence test 함수를 써서 실제 자료의 점근 분포와 순열 검정, 정확 검정에 기초한 p-값을 서로 비교하고자 한다.

한국 프로야구 경기결과에 관한 통계적 연구 (A Statistical Study on Korean Baseball League Games)

  • 최영근;김형문
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.915-930
    • /
    • 2011
  • 경기의 결과를 모형 화하는 것은 다양한 방법을 통하여 이루어져 왔다. 특히 두 개의 팀만이 경기를 하는 경우에는 더욱 다양한 방법이 제안되었다. 그 중에서 Bradley-Terry 모형은 짝지어진 자료로부터 선호하는 크기의 특성을 얻을 수 있는 가장 넓게 사용되어지고 있는 모형이다. Bradley-Terry 모형은 스포츠 경기결과의 분석과 심리학에 관련된 분야들에서 다양하게 적용되어진다. 본 연구자는 한국 프로야구 자료에 Bradley-Terry 모형을 적용하였다. 그 결과 연속형 공변량의 경우 평균자책점과 세이브를 포함하는 모형이 최적으로 나타났고 관심의 대상이 되는 몇 가지 범주형 분석의 결과 동군과 서군, 골든글러브, 다승왕, 그리고 홈경기의 이점이 승부에 영향을 주는 것으로 나타났다. 하지만 이들의 조합은 단순히 연속형 변수만을 포함한 모형이 분석 결과 더 적절한 것으로 고려되어졌다. 제안된 모형은 경기의 승패를 예측하는 데도 유용하게 사용될 수 있다. 한 예로 한국시리즈에서 우승할 확률들의 순서가 2008년도의 결과와 정확히 일치하였다.

순서 범주형 자료해석법의 비교 연구 (A Study on Comparison with the Methods of Ordered Categorical Data of Analysis)

  • 김홍준;송서일
    • 산업경영시스템학회지
    • /
    • 제20권44호
    • /
    • pp.207-215
    • /
    • 1997
  • This paper deals with a comparison between Taguchi's accumulation analysis method and Nair test on the ordered categorical data from an industrial experiment for quality improvement. a result of Taguchi's accumulation analysis method is shown to have reasonable power for detecting location effects, while Nair test identifies the location and dispersion effects separately, Accordingly, Taguchi's accumulation analysis needs to develop methods for detecting dispersion effects as well as location effects. In addition this paper rewmmends models for analyzing ordered categorical data, for examples, the cumulative legit model, mean response model etc Successively simple, reasonable methods should be introduced more likely to be used by the practitioners.

  • PDF