• 제목/요약/키워드: latent class 모델

검색결과 20건 처리시간 0.021초

잠재집단회귀모델(LCRM)을 통한 학생의 수학적 신념에 대한 교사의 수학적 신념 영향분석 (Analysis of the Effect in Mathematics Teachers Beliefs on their Students Beliefs by Latent Class Regression Model)

  • 강성권;홍진곤
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제34권4호
    • /
    • pp.485-506
    • /
    • 2020
  • 본 연구는 교사의 수학적 신념이 학생의 수학적 신념에 주는 영향을 잠재집단회귀모델(Latent Class Regression Model; LCRM)을 통해 분석하였다. 분석을 위해 본 연구는 잠재집단분석(Latent Class Analysis; LCA)을 통해 교사 60명과 그 교사에게 배우는 학생 1850명의 수학적 신념을 각각 분류한 강성권, 홍진곤(2020)의 연구결과를 활용하였다. 분석결과, '수학의 본질'에 대한 교사의 신념은 학생의 '수학교과', '수학문제해결', '수학학습' 신념에 영향을 주었다. 또한, '수학의 교수'와 '수학적 능력'에 관한 교사의 신념은 학생의 '수학교과', '수학문제해결', '자아개념' 신념에 영향을 주었다. 이를 통해 본 연구는 교사의 수학적 신념이 학생의 수학적 신념에 실질적인 영향을 끼친다는 것을 통계적으로 실증하였다. 이러한 연구결과는 교사들의 연수와 관련한 목표와 내용의 설정에 도움을 줄 수 있을 것이다.

잠재그룹 포아송 모형을 이용한 전립선암 환자의 베이지안 그룹화 (Bayesian Clustering of Prostate Cancer Patients by Using a Latent Class Poisson Model)

  • 오만숙
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.1-13
    • /
    • 2005
  • 최근 많은 연구자와 실무자들이 모집단에 내재해 있는 여러 다른 그룹(class, segment)간의 이질성을 밝혀내고 객체들을 그룹별로 세분화하는 방법 중 하나로 잠재그룹 모델(Latent class model)을 고려하고 있다. 이 논문에서는 2000년도에 국립 암 센터에 접수된 한국 내 연령별 전립선암 사망자수 자료를 기반으로, 잠재그룹 포아송 모형을 이용하여 전립선암 환자의 연령에 따른 그룹화를 시도한다. 최우추정법 등 고전적 추론방법의 한계를 극복하기 위하여 Markov Chain Monte Carlo (MCMC) 방법을 도구로 한 베이지안 추정 방법을 제안한다. 제안된 베이지안 방법의 장점은 용이한 모수추정과 추정오차의 제공, 그리고 각 객체의 소속그룹의 판정과 이에 따르는 오차, 즉, 객체의 각 군집에 속할 확률, 도 구할 수 있다는 것이다. 또한 주어진 자료들에 대해 가장 적합한 그룹의 수를 결정하는 방법을 제시하여 그룹의 수나 세분화의 근거를 사전에 제공하지 않아도 자료가 주는 정보로부터 이들을 자동으로 결정하는 방법을 제시한다.

고려상품군을 반영한 준거가격효과의 모형화: Empirical Bayes & Latent Class Approach (Modeling the Effect of Consideration Set-Based Reference Price: Empirical Bayes & Latent Class Approach)

  • 장광필
    • Asia Marketing Journal
    • /
    • 제8권1호
    • /
    • pp.1-17
    • /
    • 2006
  • 다양한 선행연구에서 준거가격효과는 실증적 지지를 받아온 것이 사실이다. 그러나 대부분의 선행연구에서 간과된 부분은 설명되지 않은 소비자 반응의 이질성이 준거가격에 반영되어 실재하지 않는 효과가 마치 유의한 것으로 나타날 수도 있다는 것이다(Chang, Siddarth, and Weinberg 1999; Bell and Lattin 2000). 또 다른 차원의 이질성으로서, 고려상표군의 이질성이 반영되지 않을 경우 모델에 포함된 변수의 모수추정치에 왜곡현상이 나타날 수 있음을 Meyer and Kahn(1991)이 지적한 바 있다. 이러한 선행연구의 문제점을 고려하여 이 연구에서는 반응의 이질성과 고려상표군의 이질성을 모두 반영한 모델을 적용함으로써 보다 정확한 준거가격효과의 추정을 시도하였다. 또한 소비자별 고려상표군의 이질성을 반영한 준거가격 측정치를 새롭게 제안하여 검증하고자 하였다. 실증분석결과, 제안된 준거가격 측정치가 선행연구에서 사용한 측정치에 비해 모델적합도와 예측타당성을 향상시키는 것으로 나타났다. 이 결과는 준거가격 형성과정에도 고려상표군의 이질성이 반영됨을 실증하는 것이다. 고려상표군의 이질성이 반영될 경우, 선행연구의 준거가격 측정치에 비해서, 제안된 준거가격 측정치의 평균이 높게 나타났으며, 표준편차는 감소한 것으로 나타났다. 이 연구에서 제안된 측정치의 실제적인 적용 측면을 본다면, Greenleaf(1995)의 연구에서처럼, 최적의 가격정책이 손실회피(loss aversion)의 크기, 즉, 준거의존(reference-dependent) 모델상의 준거가격에 의존한다면 제안된 측정치가 유용하게 사용될 수 있을 것으로 판단된다. 최대화해야 할 이익함수에 포함된 준거가격 측정치의 정확성이 최적가격결정을 좌우하기 때문이다. 따라서, 준거가격모델에 근거하여 최적가격을 추정할 경우, 모델자체에 고려상표군과 반응의 이질성을 반영할 뿐만 아니라, 준거가격 측정치 또한 고려상표군의 이질성을 반영하는 것이 바람직할 것으로 판단된다.

  • PDF

잠재계층분석을 활용한 관상동맥질환 위험요인의 유형화 (Identifying Latent Classes of Risk Factors for Coronary Artery Disease)

  • 주은실;최지선
    • 대한간호학회지
    • /
    • 제47권6호
    • /
    • pp.817-827
    • /
    • 2017
  • Purpose: This study aimed to identify latent classes based on major modifiable risk factors for coronary artery disease. Methods: This was a secondary analysis using data from the electronic medical records of 2,022 patients, who were newly diagnosed with coronary artery disease at a university medical center, from January 2010 to December 2015. Data were analyzed using SPSS version 20.0 for descriptive analysis and Mplus version 7.4 for latent class analysis. Results: Four latent classes of risk factors for coronary artery disease were identified in the final model: 'smoking-drinking', 'high-risk for dyslipidemia', 'high-risk for metabolic syndrome', and 'high-risk for diabetes and malnutrition'. The likelihood of these latent classes varied significantly based on socio-demographic characteristics, including age, gender, educational level, and occupation. Conclusion: The results showed significant heterogeneity in the pattern of risk factors for coronary artery disease. These findings provide helpful data to develop intervention strategies for the effective prevention of coronary artery disease. Specific characteristics depending on the subpopulation should be considered during the development of interventions.

스포츠 이미지 분류를 위한 희소 부호화 기법을 이용한 공간 피라미드 매칭 LDA 모델 (A Spatial Pyramid Matching LDA Model using Sparse Coding for Classification of Sports Scene Images)

  • 전진;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.35-36
    • /
    • 2016
  • 본 논문에서는 기존 Bag-of-Visual words (BoW) 접근법에서 반영하지 못한 이미지의 공간 정보를 활용하기 위해서 Spatial Pyramid Matching (SPM) 기법을 Latent Dirichlet Allocation (LDA) 모델에 결합하여 이미지를 분류하는 모델을 제안한다. BoW 접근법은 이미지 패치를 시각적 단어로 변환하여 시각적 단어의 분포로 이미지를 표현하는 기법이며, 기존의 방식이 이미지 패치의 위치정보를 활용하지 못하는 점을 극복하기 위하여 SPM 기법을 도입하는 연구가 진행되어 왔다. 또한 이미지 패치를 정확하게 표현하기 위해서 벡터 양자화 대신 희소 부호화 기법을 이용하여 이미지 패치를 시각적 단어로 변환하였다. 제안하는 모델은 BoW 접근법을 기반으로 위치정보를 활용하는 SPM 을 LDA 모델에 적용하여 시각적 단어의 토픽을 추론함과 동시에 multi-class SVM 분류기를 이용하여 이미지를 분류한다. UIUC 스포츠 데이터를 이용하여 제안하는 모델의 분류 성능을 검증하였다.

  • PDF

희소 부호화 기법과 토픽 모델링을 통한 이미지 분류 모델

  • 전진;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.49-50
    • /
    • 2015
  • 본 논문에서는 이미지를 시각적 단어로 표현하여 분석하는 기법인 bag-of-visual words (BoW) 모델을 기반으로 latent dirichlet allocation (LDA) 모델을 결합하여 시각적 단어의 구조를 파악하여 이미지를 분류할 수 있는 모델을 제안한다. 우선 이미지를 시각적 단어로 기존의 방법보다 정확하게 표현하기 위해서 희소 부호화(sparse coding) 기법을 적용한다. 기존의 BoW 모델은 하나의 이미지 패치를 하나의 단어로 표현하였지만, 희소 부호화 기법을 통해 하나의 이미지 패치를 여러 개의 단어로 표현할 수 있다. 제안하는 모델을 이용하여 이미지를 분류하기 위해서 분류 성능 측정에 많이 쓰이는 multi-class SVM 기법을 이용한다. UIUC 스포츠 데이터를 이용한 성능 측정을 통해 제안한 기법의 클래스 분류 성능을 검증하였다.

  • PDF

범이론적 모델에 기반을 둔 흡연자의 금연행동 변화단계에 대한 탐색적 연구 (Longitudinal Patterns of Stages of Changes in Smoking Behaviors among Korean Adult Smokers: Applying the Transtheoretical Model of Change)

  • 박현용;전진아;손선주
    • 사회복지연구
    • /
    • 제49권1호
    • /
    • pp.5-28
    • /
    • 2018
  • 개인의 건강에 부정적인 영향을 미치고 높은 사회경제적 비용 부담을 초래하는 흡연은 예방이 가능하다는 측면에서 중요한 사회문제로 인식되고 있지만, 성인 흡연자의 금연의도에서 행동으로의 종단적인 변화 패턴을 살펴보는 연구는 매우 제한적이다. 따라서 본 연구는 3~11차의 한국복지패널 자료를 활용하여 한국 성인 흡연자 4,968명의 금연행동의 변화 패턴을 반복측정 잠재계층 모형을 사용하여 확인하였다. 반복측정 잠재계층 분석 결과, 본 연구는 (1) 지속적으로 금연 실행/유지 단계에 있는 집단(33.6%) (2) 금연 숙고/준비 단계에서 금연 실행/유지 단계로 변화하는 집단(14.8%), (3) 지속적으로 숙고/준비 단계에 머무르는 집단(29.6%), (4) 지속적으로 숙고이전 단계에 머무를 집단(22.1%)의 4개의 잠재적 집단을 확인하였다. 또한 다항로지스틱 분석을 통하여 금연행동 변화 패턴과 인구사회학적 요인 및 임상적 특성(우울수준 및 음주행동) 간 연관성을 살펴보았다. 다항로지스틱 회귀분석 결과 높은 우울수준과 음주를 하는 흡연자의 경우 지속적 금연 실행/유지 단계의 집단보다는 지속적 숙고 이전 단계에 속할 가능성이 높은 것으로 나타났다. 본 연구의 결과는 금연을 전혀 고려하지 않고 있는 숙고 이전 단계의 사람들과 지속적으로 숙고/준비 단계에 머무를 사람들에 대한 타켓화된 접근이 필요함을 시사한다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

점진적 중심 갱신을 이용한 deep support vector data description 기반의 온라인 비정상 탐지 알고리즘 (Online anomaly detection algorithm based on deep support vector data description using incremental centroid update)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.199-209
    • /
    • 2022
  • 일반적인 비정상 탐지 알고리즘은 사전 데이터를 이용하여 학습된다. 따라서 시간에 따른 정상 데이터의 특징이 변화되는 경우에 기존의 배치 학습 기반 알고리즘의 성능 저하가 불가피하다. 본 논문에서는 정상 데이터의 점진적 특징 변화를 고려할 수 있는 온라인 비정상 탐지 알고리즘을 제안한다. 제안하는 알고리즘은 단일 클래스 분류 모델에 기반하며 오프라인 및 온라인 단계의 학습 과정을 포함한다. 제안된 알고리즘의 오프라인 학습 단계에서는 사전 데이터가 잠재 공간의 중심에 근접하도록 학습하고, 이후 온라인 학습단계에서는 신규 데이터에 의한 점진적 잠재 공간의 중심을 갱신하고, 갱신된 중심을 기준으로 계속 학습을 진행한다. 공개된 수중 음향 데이터를 이용한 실험결과 제안된 온라인 비정상 탐지 알고리즘은 점진적 중심 갱신 및 학습을 위해 단지 2 % 정도의 추가 학습시간이 소요되는 것으로 확인되었다. 반면에 시변 정상데이터가 수신되는 경우에 오프라인 학습 모델과 비교하여 19.10 % 개선된 Area Under the receiver operating characteristic Curve(AUC) 성능을 보였다.

아동발달시기별 아동학대 변화궤적 유형 비교 연구 (Identifying latent classes about the changing trajectories of child maltreatment by child developmental period)

  • 한지현;최옥채
    • 한국아동복지학
    • /
    • 제59호
    • /
    • pp.183-208
    • /
    • 2017
  • 본 연구는 KCYPS의 초1학년과 4학년 패널의 2차 년도에서 6차 년도 자료를 활용하여 아동 발달시기별 학대경험의 변화궤적이 어떻게 유형화되는지를 살펴보는 데 그 목적이 있다. 초1학년 패널은 2,300명, 초4학년 패널은 2,325명이 최종 분석대상이 되었다. 아동학대 변화궤적 유형을 식별하기 위해 잠재계층성장모형을 적용하여 분석을 실시하였다. 연구결과, 신체학대에서 초2~6학년에 이르는 아동기는 감소형, 낮은유지형, 증가형, 비학대형의 4개 집단으로 분류되었으며, 초5~중3학년에 이르는 초기청소년기도 같은 유형으로 분류되었다. 정서학대에서는 아동기는 감소형, 증가형, 비학대형의 3개 집단으로 분류되었으며, 초기청소년기는 감소형, 낮은유지형, 증가형, 비학대형의 4개 집단으로 분류되었다. 방임에서 아동기는 유지형, 낮은감소형, 낮은증가형, 비학대형의 4개 집단으로 분류되었으며, 초기청소년기는 유지형, 낮은증가형, 비학대형의 3개 집단으로 분류되었다. 아동의 발달시기별 학대의 증감 추이를 살펴보면 아동기에서 초기 청소년기로 신체학대가 지속되며 아동기에 비해 초기청소년기에 정서학대와 방임이 증가하는 경향을 알 수 있었다. 본 연구는 학대 유형에 따라 잠재계층분류를 시도하였다는 데 의의가 있다. 분석결과 중심으로 논의를 진행하였으며 이론적, 실천적 제언을 하였다.