• 제목/요약/키워드: latent variable

검색결과 197건 처리시간 0.033초

Combining Ridge Regression and Latent Variable Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권1호
    • /
    • pp.51-61
    • /
    • 2007
  • Ridge regression (RR), principal component regression (PCR) and partial least squares regression (PLS) are among popular regression methods for collinear data. While RR adds a small quantity called ridge constant to the diagonal of X'X to stabilize the matrix inversion and regression coefficients, PCR and PLS use latent variables derived from original variables to circumvent the collinearity problem. One problem of PCR and PLS is that they are very sensitive to overfitting. A new regression method is presented by combining RR and PCR and PLS, respectively, in a unified manner. It is intended to provide better predictive ability and improved stability for regression models. A real-world data from NIR spectroscopy is used to investigate the performance of the newly developed regression method.

  • PDF

Bayesian Analysis for Neural Network Models

  • Chung, Younshik;Jung, Jinhyouk;Kim, Chansoo
    • Communications for Statistical Applications and Methods
    • /
    • 제9권1호
    • /
    • pp.155-166
    • /
    • 2002
  • Neural networks have been studied as a popular tool for classification and they are very flexible. Also, they are used for many applications of pattern classification and pattern recognition. This paper focuses on Bayesian approach to feed-forward neural networks with single hidden layer of units with logistic activation. In this model, we are interested in deciding the number of nodes of neural network model with p input units, one hidden layer with m hidden nodes and one output unit in Bayesian setup for fixed m. Here, we use the latent variable into the prior of the coefficient regression, and we introduce the 'sequential step' which is based on the idea of the data augmentation by Tanner and Wong(1787). The MCMC method(Gibbs sampler and Metropolish algorithm) can be used to overcome the complicated Bayesian computation. Finally, a proposed method is applied to a simulated data.

Non-Simultaneous Sampling Deactivation during the Parameter Approximation of a Topic Model

  • Jeong, Young-Seob;Jin, Sou-Young;Choi, Ho-Jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권1호
    • /
    • pp.81-98
    • /
    • 2013
  • Since Probabilistic Latent Semantic Analysis (PLSA) and Latent Dirichlet Allocation (LDA) were introduced, many revised or extended topic models have appeared. Due to the intractable likelihood of these models, training any topic model requires to use some approximation algorithm such as variational approximation, Laplace approximation, or Markov chain Monte Carlo (MCMC). Although these approximation algorithms perform well, training a topic model is still computationally expensive given the large amount of data it requires. In this paper, we propose a new method, called non-simultaneous sampling deactivation, for efficient approximation of parameters in a topic model. While each random variable is normally sampled or obtained by a single predefined burn-in period in the traditional approximation algorithms, our new method is based on the observation that the random variable nodes in one topic model have all different periods of convergence. During the iterative approximation process, the proposed method allows each random variable node to be terminated or deactivated when it is converged. Therefore, compared to the traditional approximation ways in which usually every node is deactivated concurrently, the proposed method achieves the inference efficiency in terms of time and memory. We do not propose a new approximation algorithm, but a new process applicable to the existing approximation algorithms. Through experiments, we show the time and memory efficiency of the method, and discuss about the tradeoff between the efficiency of the approximation process and the parameter consistency.

부모의 결혼만족도 변화 유형에 따른 자녀의 문제행동 차이 (Trajectories of Marital Satisfaction of Parent: Relatedness to Behavior Problems of Children)

  • 연은모;최효식
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.375-384
    • /
    • 2020
  • 본 연구의 목적은 자녀 출생 이후 5년 동안의 부모의 결혼만족도 변화 궤적에 기초한 잠재계층이 어떤 형태로 존재하는지 확인하고, 잠재계층에 따라 자녀의 문제행동(만 5세, 만 6세, 초1, 초3 시기)에 차이가 있는지 확인하는 것이다. 이를 위해 한국아동패널의 1차(2008년)~8차(2015년), 10차(2017) 자료를 활용하여 잠재계층성장분석, BCH 방법(BCH method) 분석을 하였다. 분석 결과 첫째, 어머니의 결혼만족도 변화 양상은 '최저수준 유지형 집단', '중간수준 유지형 집단', '일시 증가-지속 감소형 집단', '상수준 유지형 집단', '최상수준 유지형 집단', 아버지의 결혼만족도 변화 양상은 '상승형 집단', '중간 수준-소폭 감소형 집단', '상 수준-소폭 감소형 집단' '최상수준 유지형 집단'으로 구분되었다. 둘째, 어머니의 결혼만족도 잠재계층에 따라 만 5세-만 6세, 초1에서 최저수준 유지형, 중간수준 유지형 집단이 최상수준 유지형 집단보다 내재화 문제행동 수준이 더 높은 경향성이 확인되었으며, 만 5세-만 6세, 초1, 초3에서 대체로 최저수준 유지형, 중간수준 유지형, 일시 증가-지속 감소형 집단이 최상수준 유지형 집단보다 외현화 문제행동 수준이 높은 경향성이 확인되었다. 아버지의 결혼만족도 잠재계층에 따라 만 5세-만 6세, 초1, 초3에서 내재화, 외현화 문제행동에 차이가 있는 것으로 나타났으며, 대체로 중간 수준-소폭 감소형 집단이 상 수준-소폭 감소형, 최상수준 유지형 집단보다 자녀의 문제행동 수준이 높은 경향성이 확인되었다. 본 연구는 자녀 출생 이후 5년 동안의 부모의 결혼만족도가 자녀의 문제행동(만 5세, 만 6세, 초1, 초3 시기)에 영향을 미치는 중요 변인임을 시사한다.

자동차 소유가구의 대중교통비 지출비율에 대한 영향요인 연구 (An Analysis on a Share of Public Transportation Expenditure in Car-Owning Household - Focused on the Seoul Metropolitan Area -)

  • 장성만;이창효
    • 지역연구
    • /
    • 제31권3호
    • /
    • pp.19-37
    • /
    • 2015
  • 본 연구는 자동차 소유가구를 대상으로 가구의 교통비 지출 중 대중교통비의 지출비율에 영향을 미치는 요인들의 구조적 관계를 분석하는 데 목적이 있다. 이를 위하여, 2010년 도시가구에 대해 심층 면접조사를 수행한 한국노동패널 자료를 기초로, 가구/주택 특성과 활동특성에 대한 자료를 수집하였으며, 조사 가구가 거주하는 지역의 토지이용 및 교통 여건 관련 분석 자료를 수집 가공하였다. 수집된 정보에 대한 인자분석을 통하여 대중교통비 지출비율에 영향을 미치는 요인에 대한 구조방정식모형을 구축하였다. 분석 결과, "계획된 도시지역"특성과 "보편적 가구특성"에 대한 잠재변수는 대중교통비 지출비율에 정(+)의 영향을 미치는 것으로 확인되었으며, "가구생활비 지출"은 부(-)의 영향 관계를 나타냈다. 본 연구는 자동차 소유가구의 대중교통 이용 증진을 위해서는 가구활동에 대한 대중교통의 이용 편리성 확충과 토지이용/교통 여건의 개선이 필요함을 시사한다.

대학생의 학업스트레스와 스마트폰 중독 경향성에 따른 잠재집단탐색 및 관련 변인들의 영향력 검증 (Identifying the Latent Group in the Patterns of Academic Stress and Smartphone Addiction Tendency with the Factors Affecting the Group Identification)

  • 이채연;엄정호;강한별;이상민
    • 한국융합학회논문지
    • /
    • 제11권1호
    • /
    • pp.221-235
    • /
    • 2020
  • 본 연구는 대학생의 학업스트레스와 스마트폰 중독 경향성을 중심으로 잠재집단을 분류하고, 잠재집단구분에 영향을 주는 개인 및 학업성취 요인들을 탐색하였다. 잠재계층분석 결과, 대학생의 학업 스트레스와 스마트폰 중독 경향성에 따른 잠재집단은 총 3개로 분류되었다. 첫 번째 집단은 '학업스트레스 없는 중간수준 스마트폰 몰입집단'으로 학업 스트레스의 모든 하위영역이 낮은 점수를 보였으며 스마트폰 중독 척도의 하위영역에서 평균 수준의 수치를 나타냈다. 두 번째 집단은 '중간수준 학업스트레스와 스마트폰 몰입집단'으로 학업 스트레스와 스마트폰 중독의 모든 하위영역에서 상대적으로 평균보다 약간 높은 점수를 보였다. 세 번째 집단은 '중간수준 학업스트레스와 스마트폰 비몰입집단'으로 학업스트레스의 하위영역에서 평균보다는 높은 점수를 보였으나, 스마트폰 중독 경향성은 다른 집단보다 월등히 낮은 점수를 보였다. 이러한 잠재집단에 영향을 미치는 요인을 로지스틱 분석으로 검증한 결과 성별과 학년만이 유의한 영향을 미쳤다. 본 연구는 두가지 다른 요소라고 볼 수 있는 학업 관련 변인인 학업 스트레스와 정신보건 관련 변인인 스마트폰 중독 경향성을 융합적으로 연관시켜 분석을 통해 집단의 특성을 분류하고 차별적 개입을 제시한데 의의가 있다.

관계발전에 따른 서비스 고객참여의 변화 - 잠재성장모형의 적용 - (The Change of Customer Participation in Service by the Development of Relationship : Application of Latent Growth Modeling)

  • 안진우;박세정
    • 경영과정보연구
    • /
    • 제38권1호
    • /
    • pp.121-139
    • /
    • 2019
  • 본 연구는 고객-종업원 간 관계의 발전에 따라 서비스 산업에서 필수적으로 요구되는 고객참여(CP)의 변화를 종단자료에 의해 잠재성장모형으로 분석하여 고객참여의 변화를 확인하고자 하였다. CP가 관계속에서 이해될 필요가 있다는 사실에 기초하여 본 연구에서는 관계의 발전에 따른 CP의 변화를 확인하고자 하였다. 관계의 역동성을 고려하여 CP가 관계속에서 변화하는 궤적을 종단자료를 통해 밝힘으로써 기존의 횡단적 연구의 한계를 극복하고자 하였다. 또한 관계속에서 어떤 변수들이 고객참여의 변화를 촉진할 수 있는 지에 대해 살펴보고자 하였다. 연구의 결과, 잠재성장모형을 통해 분석한 CP는 관계의 발전에 따라 유의하게 변화하는 것으로 나타났다. 이것은 CP가 관계속에서 이해될 필요가 있다는 사실을 확인한 것이라고 말할 수 있다. 또한, 관계지향성과 의존성은 CP의 초기값에는 긍정적으로 유의하게 영향을 미치지만, CP의 변화를 촉진하는 것으로는 규명되지 못하였다. 결론적으로, 관계의 역동성을 고려한다면, CP 역시 역동적이라는 사실을 인지해야 한다. 본 연구는 횡단적이고 조각적인 CP에 대한 이해에서 벗어나 CP가 역동성을 지니고 있음을 이해하고 이를 통해 서비스기업의 고객관리 프로그램이 운영될 필요가 있음을 지적하고자 하였다. 관계의 변화와 발전에 따라 CP를 유도하는 전략이 달라져야 하며, 이를 통해 관계발전단계별 적절한 CP의 수준이 달성될 수 있는 서비스접점의 성공을 이끌어낼 수 있게 되는 것이다.

LDA 기반 은닉 토픽 추론을 이용한 TV 프로그램 자동 추천 (Automatic TV Program Recommendation using LDA based Latent Topic Inference)

  • 김은희;표신지;김문철
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-283
    • /
    • 2012
  • 다채널 TV, IPTV 및 Smart TV 서비스의 등장으로 인해 수많은 방송 채널과 방대한 TV 프로그램 콘텐츠가 시청자 단말로 제공됨으로써 시청자들은 자신이 원하는 콘텐츠를 쉽게 찾고 소비하는 것이 어려운 TV 시청 환경을 맞게 되었다. 따라서 TV 사용자들에게 자신이 선호하는 콘텐츠를 자동 추천해 줌으로써 원하는 콘텐츠로의 접근성을 증대시키는 것은 미래의 지능형 TV 서비스에 있어서 주요한 이슈이다. 이에 본 논문에서는 사용자의 선호 취향과 대중의 선호취향을 모두 고려한 협업필터링 개념의 통계적 기계학습 기반 TV 프로그램 추천 모델을 제시한다. 이를 위해 시청한 TV 콘텐츠에 대한 선호 토픽을 사용자의 시청 선호도로 보고, 최근 널리 활용되고 있는 LDA(Latent Dirichlet Allocation)모델을 TV 프로그램 추천 모델에 적용하였다. LDA 기반 TV 프로그램 추천 성능을 개선하기 위해 본 논문에서는 TV시청 이용내역 데이터를 기반으로, TV 사용자들의 관심 토픽을 은닉 변수로 하고, TV 사용자들의 관심 토픽에 대한 다양성을 반영하기 위해 은닉 변수의 확률분포 특성을 비대칭 디리클레(Dirichlet) 분포로 모형화하여 실험에 적용하였다. 제안된 LDA 기반 TV 프로그램 자동 추천 방법의 성능을 검증하기 위해, 유사 시청 특성을 갖는 사용자 그룹에 대해 상위 5개의 TV 프로그램을 일주일 단위로 추천하였을 경우 평균 66.5%, 2개월 단위의 추천에 대해서는 평균 77.9%의 precision 추천 성능을 확인할 수 있었다.

A Hierarchical Bayesian Model for Survey Data with Nonresponse

  • Han, Geunshik
    • Journal of the Korean Statistical Society
    • /
    • 제30권3호
    • /
    • pp.435-451
    • /
    • 2001
  • We describe a hierarchical bayesian model to analyze multinomial nonignorable nonresponse data. Using a Dirichlet and beta prior to model the cell probabilities, We develop a complete hierarchical bayesian analysis for multinomial proportions without making any algebraic approximation. Inference is sampling based and Markove chain Monte Carlo methods are used to perform the computations. We apply our method to the dta on body mass index(BMI) and show the model works reasonably well.

  • PDF

A Multivariate Mixture of Linear Failure Rate Distribution in Reliability Models

  • EI-Gohary A wad
    • International Journal of Reliability and Applications
    • /
    • 제6권2호
    • /
    • pp.101-115
    • /
    • 2005
  • This article provides a new class of multivariate linear failure rate distributions where every component is a mixture of linear failure rate distribution. The new class includes several multivariate and bivariate models including Marslall and Olkin type. The approach in this paper is based on the introducing a linear failure rate distributed latent random variable. The distribution of minimum in a competing risk model is discussed.

  • PDF