• 제목/요약/키워드: Latent class model

검색결과 69건 처리시간 0.022초

토픽 모형을 이용한 텍스트 데이터의 단어 선택 (Feature selection for text data via topic modeling)

  • 장우솔;김예은;손원
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.739-754
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 변수를 포함하고 있으며 변수들 사이의 연관성도 높아 통계 분석의 정확성, 효율성 등에서 문제가 생길 수 있다. 이러한 문제점에 대처하기 위해 목표 변수가 주어진 지도 학습에서는 목표 변수를 잘 설명할 수 있는 단어들을 선택하여 이 단어들만 통계 분석에 이용하기도 한다. 반면, 비지도 학습에서는 목표 변수가 주어지지 않으므로 지도 학습에서와 같은 단어 선택 절차를 활용하기 어렵다. 이 연구에서는 토픽 모형을 이용하여 지도 학습에서의 목표 변수를 대신할 수 있는 토픽을 생성하고 각 토픽별로 연관성이 높은 단어들을 선택하는 단어 선택 절차를 제안한다. 제안된 절차를 실제 텍스트 데이터에 적용한 결과, 단어 선택 절차를 이용하면 많은 토픽에서 공통적으로 자주 등장하는 단어들을 제거함으로써 토픽을 더 명확하게 식별할 수 있었다. 또한, 군집 분석에 적용한 결과, 군집과 범주 사이에 높은 연관성을 가지는 군집 분석 결과를 얻을 수 있는 것으로 나타났다. 목표 변수에 대한 정보없이 토픽 모형을 이용하여 선택한 단어들을 분류 분석에 적용하였을 때 목표 변수를 이용하여 단어들을 선택한 경우와 비슷한 분류 정확성을 얻을 수 있음도 확인하였다.

산림휴양복지 수요자에 대한 시장 세분화 연구 (Market Segmentation to Identify Forest Recreation Welfare Consumers)

  • 변승연;허성윤;구자춘
    • 한국산림과학회지
    • /
    • 제112권2호
    • /
    • pp.248-257
    • /
    • 2023
  • 최근 소득수준 향상, 유연근무제 확산 등 다양한 이슈로 인하여 산림휴양복지에 대한 수요 및 이용 패턴의 변화가 발생하고 있다. 이에, 산림휴양·복지 시장 전반에 대한 세분화를 통해 각 유형별로 어떤 특성이 있는지 규명하고, 이에 따른 유형별 차별화된 정책 마련이 필요한 시점이다. 본 연구는 잠재계층분석을 통하여 산림휴양·복지 활동 경험 유형을 4개의 그룹(소극적 이용형, 보통형, 적극적 애호가형, 무관심형)으로 세분화하고, 다항로짓모형을 이용하여 그룹 간 차이의 원인을 인구사회경제학적 특성을 통해 살펴본다. 연구 결과에 기반하여 3가지 정책적 시사점을 도출하였다. 첫째, 산림휴양 복지를 경험하는 그룹이 세분화되어있다는 것이다. 둘째, 산림활동 경험 유형별 그룹을 구분 짓는 사회경제적 특성이 규명되었다는 것이다. 셋째, 산림휴양복지 경험을 높일 수 있는 정책적 대상 및 특성을 규명하였다는 것이다. 본 연구는 그룹별 차별화된 정책을 제시하고, 바람직한 그룹으로 이동할 수 있도록 정책수단을 제시한다는 점에서 의의가 있다.

온라인 소셜네트워크를 통한 한국인의 정치성향 예측 기법의 연구 (A Study on Political Attitude Estimation of Korean OSN Users)

  • 무하마드 에카 위자야;안희준
    • 한국산업정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.1-11
    • /
    • 2016
  • 본 연구는 Facebook 사용자들의 Like활동 정보를 사용하여 정치성향을 예측하기 위한 분석 모델과 프로그램를 개발하였다. Facebook의 Ajax사용 특성 을 반영한 Facebook 크로울러를 개발하였으며, 이를 사용하여 수집된 성기고 방대한 데이터의 상관 매트릭스 정보를 효과적의 축소하기 위한 카테고리 레벨 필터링 기법을 개발하였다. 대한민국 사용자들을 대상으로 LCA (Latent class analysis) 분석한 결과 28 개의 기준 (전체 대상페이지의 3% 미만) 으로 사용자의 정치적인 극성을 상당히 정확하게 (AUC of 0.82) 예측할 수 있음을 확인하였다.

고객만족경영을 위한 만족고객 재분류 방법의 비교 연구 (A Comparison Study on Satisfied Customer Reclassification Methods for Customer Satisfaction Management)

  • 송기정;서광규
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.139-144
    • /
    • 2013
  • 본 논문은 고객만족도 조사가 지니고 있는 현실적인 문제점의 개선 방법에 관한 탐색적 연구다. 고객만족도 수준이 높아질수록 만족고객의 비율이 높아지는 것은 당연한 현상이라 할 수 있는데, 실제 조사 측면에서는 만족응답으로의 쏠림현상이 두드러져, 데이터 분석의 구조적 한계와 함께 고객만족 개선안 도출의 유용성이 낮아지고 있다. 이러한 문제점을 해결하기 위해서는 만족고객을 재분류하여 보다 전략적인 의미를 도출하고 만족 고객의 불만족 요인을 찾아내기 위한 연구가 필요하다. 본 연구에서는 만족고객을 재분류를 위한 3가지 방법인 세부속성의 복합점수를 이용하는 방법, 만족/불만족 2차원 모형을 적용하는 방법, 만족 고객을 세분화하는 방법을 사례연구를 통하여 서로 비교분석하였다. 사례연구결과, 본 연구결과는 향후 고객만족도 조사가 다양하고 입체적으로 분석되어 고객만족조사의 활성화는 물론, 고객만족경영 향상을 위한 유용한 자료로 활용되리라 기대한다.

외국인 학부 유학생의 유학생활만족에 관한 탐색적 연구 -다차원적 접근을 중심으로- (An Exploratory Study on International Undergraduate Students' Satisfaction with Life of Studying Abroad -Focusing on Multidimensional Approach-)

  • 황동진
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.415-424
    • /
    • 2021
  • 유학생활은 학교에서 뿐만 아니라 경제, 사회적 관계, 문화 등 다양한 영역에서 이루어지기 때문에 각 영역별로 만족수준은 개인마다 상이하게 나타날 수 있다. 따라서 유학생활의 질적인 수준을 제고하기 위해서는 이를 고려하여 다차원적으로 접근할 필요가 있다. 이에 본 연구는 외국인 유학생의 유학생활만족도를 다차원적으로 접근하여 탐색하였다. 이를 분석하기 위해 잠재집단분석을 적용하여 하위집단을 식별하였으며, 집단분류에 영향요인을 검증하기 위해 다항로지스틱회귀모형을 적용하였다. 분석결과는 크게 2가지로 정리된다. 하나는 유학생활만족도가 상이한 하위집단이 식별되었다. 하위집단은 주거, 경제, 사회적 관계, 학업, 문화 등 5가지 영역별로 상이한 만족수준을 보였으며, 단일차원에서는 발견되지 않는 집단들을 식별해냈다. 두 번째는 집단분류에 영향을 미친 요인은 학업적 요인, 심리·정서적 요인, 환경적 요인이 복합적으로 작용하였다. 특히, 하위집단별로 예측요인은 상이하게 영향을 미치는 것으로 나타났다. 이상의 연구결과를 바탕으로 외국인 유학생의 유학생활만족수준을 제고하기 위한 실천적, 정책적 제언을 모색하고자 한다.

노인 의료비 변화궤적의 잠재계층 유형: 예측요인과 주관적 건강에 대한 영향 (Predictors of Latent Class of Longitudinal Medical Expenses of Older People and the Effects on Subjective Health)

  • 송시영;전혜정;최봄이
    • 한국노년학
    • /
    • 제39권3호
    • /
    • pp.467-484
    • /
    • 2019
  • 본 연구는 한국의료패널(Korea Health Panel: KHP)의 2008년(1, 2차)부터 2016(10차)년 자료를 사용하여 노인이 사용한 의료비 궤적에 따른 잠재계층을 탐색하고 잠재계층을 예측하는 특성과, 의료비 잠재계층이 주관적 건강에 미치는 영향을 살펴보았다. 이를 위해 65세 이상 노인이 9개년에 걸쳐 지출한 의료비 변화 궤적이 서로 다른 하위집단을 구분하기 위해 성장혼합모형 분석을 수행하였다. 이어 의료비 변화의 잠재계층을 예측하는 요인을 탐색하기 위해 다항 로지스틱 회귀분석을 실시하였으며 의료비 잠재계층이 주관적 건강에 미치는 영향을 분석하기 위해 다중 회귀분석을 실시하였다. 분석 결과 노인 의료비의 종단적 변화궤적은 4개의 하위 집단으로 분류하는 것이 적합한 것으로 나타났으며, 이를 고의료비 유지 집단, 의료비 증가 집단, 저의료비 유지 집단, 의료비 감소 집단으로 명명하였다. 다항 로지스틱 회귀분석 결과, 배우자 유무와 경제활동 유무, 만성 질환 개수와 의료보장 형태가 의료비 변화궤적의 하위유형을 예측하였다. 특히 보유 만성질환 개수가 많을수록 고의료비 유지 집단에 속할 가능성이 높았다. 또한 의료급여 수급자는 건강보험 가입자에 비해 저의료비 유지, 의료비 감소 집단에 속할 가능성이 높았다. 다중 회귀분석 결과 낮은 수준의 의료비를 유지하거나 의료비가 감소하는 집단은 높은 수준의 의료비를 유지하는 집단보다 주관적 건강 수준이 유의하게 높았다. 본 연구의 결과는 의료비 지출 궤적에 따른 노인 집단 내 이질성을 확인하고 이러한 이질성을 예측하는 특성을 탐색하였으며 의료비 지출 궤적이 주관적 건강과 유의한 관계가 있음을 확인하였다는 데 의의가 있다. 이러한 결과는 노인 의료비와 관련된 보건·건강 정책 수립의 기초자료를 제공할 수 있을 것으로 기대된다.

범죄 용의자의 거짓말탐지검사의 신뢰도와 타당도에 대한 일관성 채점기준의 효과 (Effects of Consistency Criterion for Scoring on the Reliability and the Validity of Polygraph Test for Crime Suspects)

  • 한유화;정재영;박광배
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.557-564
    • /
    • 2009
  • 현재 한국에서는 거짓말탐지검사의 채점과정에서 '일관성' 기준을 사용하고 있다. 본 연구에서는 현재 한국에서 사용하고 있는 거짓말탐지검사 기법의 채점 기준 중 '일관성' 기준의 실증적 타당성을 검증하고자 하였다. 구체적으로는 한국에서 이루어지고 있는 거짓말탐지검사의 채점과정에서 '일관성'을 실제로 고려하고 있는지의 여부를 검증한 후 '일관성'을 고려하여 채점하는 경우와 그렇지 않은 경우에서 거짓말탐지검사 결과의신뢰도(Cronbach' $\alpha$)와 정확성이 어떻게 달라지는지를 파악하였다. 본 연구는 실제 현장에서 '일관성'을 고려하여 채점 한 원채점자료와 '일관성'을 고려할 수 없도록 가공하여 채점한 실험채점자료를 분석하였다. 원채점자료와 실험채점자료는 동일한 검사관들이 채점하도록 하였다. 그 결과 현재 한국에서는 거짓말탐지검사의 채점과정에서 '일관성'을 고려하고 있는 것이 확인되었다. 신뢰도는 원채점자료가 .93, 실험채점자료가 .91로 비슷한 수준이었다. 정확성은 검찰의 기소 여부와 거짓말탐지검사 점수에 의한 판정을 지표로 사용한 잠재계층분석(N=182)의 결과를 실제 거짓말 여부를 판단하는 기준으로 사용했을 때 원채점자료에서 76.9%, 실험채점자료에서 61.5%로 나타났다. 논의에서는 이러한 결과가 나타난 원인과 한국에서 사용하고 있는 '일관성' 기준이 거짓말탐지검사 채점에서 갖는 유용성에 대하여 논의하였다.

  • PDF

일부 지역 남자 고등학생들의 스트레스와 구강악습관과의 관련성 연구 (A Study of the Relation of Stress to Oral Parafunctional Habits of Male High School Students)

  • 정유연;홍진태
    • 치위생과학회지
    • /
    • 제13권4호
    • /
    • pp.471-479
    • /
    • 2013
  • 본 연구는 남자 고등학생들의 스트레스와 구강악습관, 학업 수준과 경제수준에 따른 스트레스와 구강악습관에 대한 연관성을 파악하여 구강악습관에 대한 교육 필요성을 강조하며 구강악안면 부위의 구강건강까지 올바르게 이루어지도록 기초자료를 제공하고자 한다. 2013년 5월부터 7월까지 충남에 위치한 2개 고등학교 1, 2학년을 대상으로 편의표본추출 법에 의한 자기기입식으로 설문조사를 실시하여 다음과 같은 결과를 얻었다. 1. 5개 영역 스트레스 중 학교생활 스트레스가 2.11점으로 가장 높았고, 가정문제 스트레스가 1.51점으로 가장 낮게 나타났다. 2. 학년별 스트레스는 2학년이 1학년보다 모든 영역에서 높았으며, 학교생활 스트레스(p<0.01), 대인관계 스트레스(p<0.01), 자신 문제 스트레스(p<0.05)에서 유의한 차이를 보였다. 3. 잠재변수 스트레스에 따른 5가지 영역의 스트레스와 구강악습관과의 유의성 분석 결과 모두 유의한 것으로(p<0.001)로 나타났으며, 스트레스와 구강악습관의 상관관계는 -0.30의 약한 음의 상관관계를 보였고 학교생활 스트레스와 자신 문제 스트레스, 환경문제 스트레스와 대인관계 스트레스와는 0.7 이상의 매우 높은 양의 상관관계를 보였다. 4. 스트레스, 학업 수준, 가정경제수준 모델의 적합도 검정 결과는 GFI, AGFI, NFI에서 모두 0.9 이상을 보였으며, RMR과 RMSEA 값이 모두 0.1보다 작은 값이 추정되어 양호한 모형이다. 이상의 연구결과를 보면 스트레스와 구강악습관과의 연관성이 있다고 볼 수 있다. 또한 학생의 성적수준, 경제수준과도 구강악습관 발생과 연관성이 있음을 확인되었으며, 본인의 구강건강을 스스로 책임져야 할 시기인 고등학생들이 구강건강을 위하여 바람직한 습관 형성을 위한 구강보건교육이 시행돼야 할 것이다.

전국 고등학교 학생의 학업중단에 대한 종단적 분석 -학업중단 변화양상에 따른 유형탐색, 학교폭력 및 학교상담의 변화추이를 중심으로- (A longitudinal analysis of high school students' dropping out: Focusing on the change pattern of dropout, changes in school violence and school counseling.)

  • 권재기;나우열
    • 한국아동복지학
    • /
    • 제59호
    • /
    • pp.209-234
    • /
    • 2017
  • 본 연구는 학업중단의 원인을 학교로 보고, 고등학생의 학업중단이 학교마다 학교특성과 학업중단의 영향요인이 다를 것으로 보았다. 이에 학교에 초점을 맞춰 전국 고등학교의 학업중단 추세를 확인하고, 고등학교 학업중단의 변화양상에 따른 유형을 종단적으로 탐색하였다. 그리고 도출된 유형별로 학교의 일반적 특성을 예측하고, 학업중단에 영향을 미치는 주요 요인(학교폭력, 학교상담)의 변화 추이를 살펴보면서 학업중단에 대한 학교의 장기간의 노력과 결과를 되짚어 보았다. 이를 위하여 KERIS EDSS의 "중등학교 정보공시데이터"를 활용하였고, 연구에서는 2012년부터 2016년까지 전국 고등학교의 5년 간 자료를 최종 모형에 투입 분석하였다. 연구는 네 가지 목적에 의해 수행되었고, 그에 따른 결과는 다음과 같다. 첫째, 고등학교의 학업중단에 대한 종단적인 변화양상을 탐색하기 위하여 잠재성장모형으로 분석한 결과, 시간이 지날수록 전국 고등학교의 학업중단은 감소하는 추세를 보였다. 둘째, 고등학교의 학업중단 변화양상에 따른 유형을 성장혼합모형으로 분석한 결과, 학업유지형, 학업중단감소형, 학업중단지속형과 같은 3가지 유형이 도출되었다. 셋째, 도출된 유형별 학교의 일반적 특성을 다항로지스틱 분석으로 예측한 결과에서는 국공립일수록, 전문계고일수록, 국영수 기초학력미달 학생 수가 많을수록 학업중단지속형에 속할 확률이 높았고, 전체학생 수가 많을수록 학업유지형이나 학업중단감소형에 속할 가능성이 높은 것으로 나타났다. 마지막으로 도출된 세 유형별로 학교폭력과 학교상담의 변화추이를 다 집단 성장혼합모형으로 분석한 결과에서 특히 학업중단감소형의 추이가 주목된다. 학업중 단감소형은 초기에 높았던 학교폭력 심의건수와 가해학생 수가 시간이 지날수록 매년 감소하는 양상을 보였고, 이와 함께 학교의 전문상담교사 배치수를 매년 늘리고, 또래상담을 지속적으로 활성화시켰음을 확인하였다. 이러한 점이 초기 학업중단이 가장 높았던 고등학교가 학업중단감소형 학교가 된 이유일 것으로 사료된다.