• 제목/요약/키워드: Latent Class Model

검색결과 69건 처리시간 0.028초

Learning Probabilistic Kernel from Latent Dirichlet Allocation

  • Lv, Qi;Pang, Lin;Li, Xiong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권6호
    • /
    • pp.2527-2545
    • /
    • 2016
  • Measuring the similarity of given samples is a key problem of recognition, clustering, retrieval and related applications. A number of works, e.g. kernel method and metric learning, have been contributed to this problem. The challenge of similarity learning is to find a similarity robust to intra-class variance and simultaneously selective to inter-class characteristic. We observed that, the similarity measure can be improved if the data distribution and hidden semantic information are exploited in a more sophisticated way. In this paper, we propose a similarity learning approach for retrieval and recognition. The approach, termed as LDA-FEK, derives free energy kernel (FEK) from Latent Dirichlet Allocation (LDA). First, it trains LDA and constructs kernel using the parameters and variables of the trained model. Then, the unknown kernel parameters are learned by a discriminative learning approach. The main contributions of the proposed method are twofold: (1) the method is computationally efficient and scalable since the parameters in kernel are determined in a staged way; (2) the method exploits data distribution and semantic level hidden information by means of LDA. To evaluate the performance of LDA-FEK, we apply it for image retrieval over two data sets and for text categorization on four popular data sets. The results show the competitive performance of our method.

잠재성장모형과 성장혼합모형을 이용한 도서관 대출권수의 종단적 분석 (A Longitudinal Analysis of the Number of Checked-out Books Using Latent Growth Model and Growth Mixture Modeling)

  • 박희진;박성재
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.45-68
    • /
    • 2023
  • 본 연구의 목적은 도서관 이용에 영향을 미치는 요인을 종단적으로 분석하는 것이다. 도서관 이용의 지표 중의 하나인 대출권수의 통계적 분석을 위해 잠재성장모형과 성장혼합모형을 적용하였다. 국가도서관통계시스템에서 제공하는 2014년부터 2019년까지의 공공도서관 통계정보를 수집하고 846개 도서관을 대상으로 분석을 수행했다. 분석결과, 대출권수는 감소하는 경향이 나타났지만 감소세는 점차 완화되고 있었다. 다음으로 대출권수에 영향을 미치는 요인들을 통제한 상태에서 분석한 결과, 장서수와 독서프로그램 참여자수가 중요한 요인으로 나타났다. 마지막으로 성장혼합모형을 적용하여 분석된 5개의 계층들에서 사서수의 증가는 감소 계층에 비해 증가 계층에 속할 가능성을 높이는 것으로 나타났다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

취업장애인의 보조공학기기 사용의 변화형태 분석 (Analysis of Change Patterns in Assistive Technology Device Use of the Workers with Disabilities)

  • 전영환
    • 재활복지공학회논문지
    • /
    • 제6권1호
    • /
    • pp.83-87
    • /
    • 2012
  • 본 연구는 취업장애인의 보조공학기기 사용형태의 변화에 따른 잠재계층을 분류하고 그에 대한 영향요인을 탐색하는데 그 목적이 있다. 분석에는 장애인고용패널조사 1-3차년도 자료가 사용되었다. 분석방법은 준모수적 집단 중심 접근방법(semi-parametric group based approach)을 적용하였다. 분석모형은 종속변수가 보조공학기기 사용여부를 나타내는 이분형 척도(dichotomous scale)라는 특성을 고려해 로짓모형을 적용하였다. 보조공학기기 사용 변화 형태에 따라 3개의 잠재계층이 도출되었으며 이들은 보조기기 지속사용 집단, 보조기기 중간사용 집단, 보조기기 사용 급감소 집단으로 구분되었다. 다항로짓분석으로 영향요인을 검증한 결과, 학력, 장애유형, ICF, 주관적 사회경제적 지위, 일상생활만족도가 잠재계층을 결정하는 데 유의미한 변수로 나타났다. 마지막으로 분석결과에 따른 시사점을 제시하였다.

  • PDF

전구 모델의 물리과정에 따른 태풍 모의 민감도 (Sensitivity of Typhoon Simulation to Physics Parameterizations in the Global Model)

  • 김기병;이은희;설경희
    • 대기
    • /
    • 제27권1호
    • /
    • pp.17-28
    • /
    • 2017
  • The sensitivity of the typhoon track and intensity simulation to physics schemes of the global model are examined for the typhoon Bolaven and Tembin cases by using the Global/Regional Integrated Model System-Global Model Program (GRIMs-GMP) with the physics package version 2.0 of the Korea Institute of Atmospheric Prediction Systems. Microphysics, Cloudiness, and Planetary boundary Layer (PBL) parameterizations are changed and the impact of each scheme change to typhoon simulation is compared with the control simulation and observation. It is found that change of microphysics scheme from WRF Single-Moment 5-class (WSM5) to 1-class (WSM1) affects to the typhoon simulation significantly, showing the intensified typhoon activity and increased precipitation amount, while the effect of the prognostic cloudiness and PBL enhanced mixing scheme is not noticeable. It appears that WSM1 simulates relatively unstable and drier atmospheric structure than WSM5, which is induced by the latent heat change and the associated radiative effect due to not considering ice cloud. And WSM1 results the enhanced typhoon intensity and heavy rainfall simulation. It suggests that the microphysics is important to improve the capability for typhoon simulation of a global model and to increase the predictability of medium range forecast.

범이론적 모델에 기반을 둔 흡연자의 금연행동 변화단계에 대한 탐색적 연구 (Longitudinal Patterns of Stages of Changes in Smoking Behaviors among Korean Adult Smokers: Applying the Transtheoretical Model of Change)

  • 박현용;전진아;손선주
    • 사회복지연구
    • /
    • 제49권1호
    • /
    • pp.5-28
    • /
    • 2018
  • 개인의 건강에 부정적인 영향을 미치고 높은 사회경제적 비용 부담을 초래하는 흡연은 예방이 가능하다는 측면에서 중요한 사회문제로 인식되고 있지만, 성인 흡연자의 금연의도에서 행동으로의 종단적인 변화 패턴을 살펴보는 연구는 매우 제한적이다. 따라서 본 연구는 3~11차의 한국복지패널 자료를 활용하여 한국 성인 흡연자 4,968명의 금연행동의 변화 패턴을 반복측정 잠재계층 모형을 사용하여 확인하였다. 반복측정 잠재계층 분석 결과, 본 연구는 (1) 지속적으로 금연 실행/유지 단계에 있는 집단(33.6%) (2) 금연 숙고/준비 단계에서 금연 실행/유지 단계로 변화하는 집단(14.8%), (3) 지속적으로 숙고/준비 단계에 머무르는 집단(29.6%), (4) 지속적으로 숙고이전 단계에 머무를 집단(22.1%)의 4개의 잠재적 집단을 확인하였다. 또한 다항로지스틱 분석을 통하여 금연행동 변화 패턴과 인구사회학적 요인 및 임상적 특성(우울수준 및 음주행동) 간 연관성을 살펴보았다. 다항로지스틱 회귀분석 결과 높은 우울수준과 음주를 하는 흡연자의 경우 지속적 금연 실행/유지 단계의 집단보다는 지속적 숙고 이전 단계에 속할 가능성이 높은 것으로 나타났다. 본 연구의 결과는 금연을 전혀 고려하지 않고 있는 숙고 이전 단계의 사람들과 지속적으로 숙고/준비 단계에 머무를 사람들에 대한 타켓화된 접근이 필요함을 시사한다.

아동발달시기별 아동학대 변화궤적 유형 비교 연구 (Identifying latent classes about the changing trajectories of child maltreatment by child developmental period)

  • 한지현;최옥채
    • 한국아동복지학
    • /
    • 제59호
    • /
    • pp.183-208
    • /
    • 2017
  • 본 연구는 KCYPS의 초1학년과 4학년 패널의 2차 년도에서 6차 년도 자료를 활용하여 아동 발달시기별 학대경험의 변화궤적이 어떻게 유형화되는지를 살펴보는 데 그 목적이 있다. 초1학년 패널은 2,300명, 초4학년 패널은 2,325명이 최종 분석대상이 되었다. 아동학대 변화궤적 유형을 식별하기 위해 잠재계층성장모형을 적용하여 분석을 실시하였다. 연구결과, 신체학대에서 초2~6학년에 이르는 아동기는 감소형, 낮은유지형, 증가형, 비학대형의 4개 집단으로 분류되었으며, 초5~중3학년에 이르는 초기청소년기도 같은 유형으로 분류되었다. 정서학대에서는 아동기는 감소형, 증가형, 비학대형의 3개 집단으로 분류되었으며, 초기청소년기는 감소형, 낮은유지형, 증가형, 비학대형의 4개 집단으로 분류되었다. 방임에서 아동기는 유지형, 낮은감소형, 낮은증가형, 비학대형의 4개 집단으로 분류되었으며, 초기청소년기는 유지형, 낮은증가형, 비학대형의 3개 집단으로 분류되었다. 아동의 발달시기별 학대의 증감 추이를 살펴보면 아동기에서 초기 청소년기로 신체학대가 지속되며 아동기에 비해 초기청소년기에 정서학대와 방임이 증가하는 경향을 알 수 있었다. 본 연구는 학대 유형에 따라 잠재계층분류를 시도하였다는 데 의의가 있다. 분석결과 중심으로 논의를 진행하였으며 이론적, 실천적 제언을 하였다.

코로나 팬데믹 초기 한국인의 스트레스 대처 양상에 따른 잠재계층 분류와 영향요인 검증 (A Latent Profile Analysis of Stress Coping Strategies among Korean Adults at the Early Stage of the Coronavirus Pandemic(COVID-19) and Verification of Influencing Factors)

  • 남슬기;이동훈
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제28권3호
    • /
    • pp.483-512
    • /
    • 2022
  • 본 연구는 잠재프로파일분석을 통해 코로나 팬데믹 초기 한국인의 스트레스-대처 양상을 확인하고, 잠재계층구분에 영향을 미칠 것으로 예상되는 인구사회학적 정보(성별, 연령, 가구형태, 경제수준), 코로나로 인한 비일상성(코로나로 인한 두려움, 코로나로 인한 스트레스, 외출 및 일정제약, 코로나로 인한 수입 감소)을 살펴보고, 잠재계층에 따른 심리적 안녕감(삶의 만족감, 우울, 불안)의 차이를 확인하였다. 본 연구는 세계보건기구(WHO)가 코로나 팬데믹을 선언하고, 국내에서 대구·경북지역이 특별재난지역으로 선정된 시기인 2020년 4월 13일 부터~21일까지 성인 600명을 대상으로 온라인 설문을 실시했다. 대처 양상에 따라 모형을 분류한 결과, 4계층('낮은 대처관여 집단 1', '보통 수준의 적응적 대처집단 2', '높은 수준의 적응적 대처집단 3', '적응-부적응 대처 관여집단 4')의 모형적합도가 가장 양호하였다. 또한 인구사회학적 정보에서는 성별, 연령, 경제수준이 잠재계층을 유의하게 구분하였으며, 코로나로 인한 비일상성에서는 두려움, 스트레스, 외출 및 일정제약과 수입 감소가 잠재계층을 유의하게 구분하였다. 또한 잠재계층 간 심리적 안녕감 차이를 확인한 결과, '높은 수준의 적응적 대처집단 3'이 가장 높은 삶의 만족감을 경험하는 것으로 나타났으며, '적응-부적응 대처 관여집단 4'이 가장 높은 우울, 불안을 경험하는 것으로 나타났다. 이를 토대로 논의 및 시사점이 제시되었다.

점진적 중심 갱신을 이용한 deep support vector data description 기반의 온라인 비정상 탐지 알고리즘 (Online anomaly detection algorithm based on deep support vector data description using incremental centroid update)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.199-209
    • /
    • 2022
  • 일반적인 비정상 탐지 알고리즘은 사전 데이터를 이용하여 학습된다. 따라서 시간에 따른 정상 데이터의 특징이 변화되는 경우에 기존의 배치 학습 기반 알고리즘의 성능 저하가 불가피하다. 본 논문에서는 정상 데이터의 점진적 특징 변화를 고려할 수 있는 온라인 비정상 탐지 알고리즘을 제안한다. 제안하는 알고리즘은 단일 클래스 분류 모델에 기반하며 오프라인 및 온라인 단계의 학습 과정을 포함한다. 제안된 알고리즘의 오프라인 학습 단계에서는 사전 데이터가 잠재 공간의 중심에 근접하도록 학습하고, 이후 온라인 학습단계에서는 신규 데이터에 의한 점진적 잠재 공간의 중심을 갱신하고, 갱신된 중심을 기준으로 계속 학습을 진행한다. 공개된 수중 음향 데이터를 이용한 실험결과 제안된 온라인 비정상 탐지 알고리즘은 점진적 중심 갱신 및 학습을 위해 단지 2 % 정도의 추가 학습시간이 소요되는 것으로 확인되었다. 반면에 시변 정상데이터가 수신되는 경우에 오프라인 학습 모델과 비교하여 19.10 % 개선된 Area Under the receiver operating characteristic Curve(AUC) 성능을 보였다.

학교연계 서비스를 위한 사회복지실천 전략 개발 - 청소년기 경비행행동의 차별적 발달궤적에 대한 잠재계층성장분석 - (Development of Social Work Strategies for School-linked services - Based on Latent Class Growth Analysis of Delinquent Behaviors in adolescence -)

  • 이상균
    • 사회복지연구
    • /
    • 제40권3호
    • /
    • pp.377-406
    • /
    • 2009
  • 청소년의 비행예방을 위한 사회복지실천전략 개발을 목적으로 종단자료를 통한 청소년 비행행동의 잠재집단유형을 확인하고자 하였다. 비행행동의 차별적 발달궤적을 갖는 잠재집단유형의 확인은 이들 집단의 특성을 고려한 맞춤형 실천전략의 수립을 가능케 한다. 이를 위해 본 연구에서는 청소년패널조사의 1-4차년도 종단자료를 이용하여 비행행동의 수준과 변화율이 상이한 잠재집단이 존재할 것으로 가정하는 잠재계층 성장분석을 수행하였다. 그 결과 비행행동의 수준과 변화율이 상이한 4개의 잠재집단을 확인할 수 있었다. 비행행동의 경험수준이 적고 변화율이 거의 없는 규범집단, 측정기간 내내 높은 비행행동수준을 유지하고 있는 비행지속집단, 측정초기에는 높은 비행행동수준을 보이다 점차 감소하는 경향을 보이는 비행감소집단, 낮은 비행행동 수준에서 점차 비행경험이 증가하는 비행증가집단 등 4개의 잠재계층집단을 발견하였다. 잠재계층집단에 대해 청소년 비행행동의 보호 및 위험요인이 미치는 영향력을 확인하기 위해 다항로지스틱분석을 실시한 결과, 부모의 지도감독, 자기통제력, 비행친구와의 교류, 부정적 낙인 등이 잠재계층집단의 분류와 밀접한 관련성이 있는 것으로 나타났다. 최초측정시점인 중학교 2학년시기에서 부모의 지도감독을 많이 받고, 자기통제력이 높으며, 비행친구와의 교류가 적고, 부정적 낙인이 적을수록 비행행동을 경험하지 않는 규범집단에 속할 가능성이 높았다. 가족구조결손, 빈곤가족, 남자청소년의 인구학적 특성과 비행친구와의 교류증가는 비행증가집단과 비행지속집단에 속할 가능성을 높이는 것으로 나타났다. 종단자료를 통해 청소년기 비행행동의 이질적인 성장궤적을 갖는 잠재계층집단을 확인한 연구결과에 기반하여 청소년의 비행행동 예방 및 개입을 위한 사회복지 실천전략을 제시하였다.