• 제목/요약/키워드: bayesian predictive model

검색결과 77건 처리시간 0.026초

추천 시스템의 성능 안정성을 위한 예측적 군집화 기반 협업 필터링 기법 (Predictive Clustering-based Collaborative Filtering Technique for Performance-Stability of Recommendation System)

  • 이오준;유은순
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.119-142
    • /
    • 2015
  • 사용자의 취향과 선호도를 고려하여 정보를 제공하는 추천 시스템의 중요성이 높아졌다. 이를 위해 다양한 기법들이 제안되었는데, 비교적 도메인의 제약이 적은 협업 필터링이 널리 사용되고 있다. 협업 필터링의 한 종류인 모델 기반 협업 필터링은 기계학습이나 데이터 마이닝 모델을 협업 필터링에 접목한 방법이다. 이는 희박성 문제와 확장성 문제 등의 협업 필터링의 근본적인 한계를 개선하지만, 모델 생성 비용이 높고 성능/확장성 트레이드오프가 발생한다는 한계점을 갖는다. 성능/확장성 트레이드오프는 희박성 문제의 일종인 적용범위 감소 문제를 발생시킨다. 또한, 높은 모델 생성 비용은 도메인 환경 변화의 누적으로 인한 성능 불안정의 원인이 된다. 본 연구에서는 이 문제를 해결하기 위해, 군집화 기반 협업 필터링에 마르코프 전이확률모델과 퍼지 군집화의 개념을 접목하여, 적용범위 감소 문제와 성능 불안정성 문제를 해결한 예측적 군집화 기반 협업 필터링 기법을 제안한다. 이 기법은 첫째, 사용자 기호(Preference)의 변화를 추적하여 정적인 모델과 동적인 사용자간의 괴리 해소를 통해 성능 불안정 문제를 개선한다. 둘째, 전이확률과 군집 소속 확률에 기반한 적용범위 확장으로 적용범위 감소 문제를 개선한다. 제안하는 기법의 검증은 각각 성능 불안정성 문제와 확장성/성능 트레이드오프 문제에 대한 강건성(robustness)시험을 통해 이뤄졌다. 제안하는 기법은 기존 기법들에 비해 성능의 향상 폭은 미미하다. 또한 데이터의 변동 정도를 나타내는 지표인 표준 편차의 측면에서도 의미 있는 개선을 보이지 못하였다. 하지만, 성능의 변동 폭을 나타내는 범위의 측면에서는 기존 기법들에 비해 개선을 보였다. 첫 번째 실험에서는 모델 생성 전후의 성능 변동폭에서 51.31%의 개선을, 두 번째 실험에서는 군집 수 변화에 따른 성능 변동폭에서 36.05%의 개선을 보였다. 이는 제안하는 기법이 성능의 향상을 보여주지는 못하지만, 성능 안정성의 측면에서는 기존의 기법들을 개선하고 있음을 의미한다.

우리나라 소비자물가상승률 예측 (Forecasting Korean CPI Inflation)

  • 강규호;김정성;신세림
    • 경제분석
    • /
    • 제27권4호
    • /
    • pp.1-42
    • /
    • 2021
  • 우리나라 소비자물가상승률에 대한 예측은 한국은행의 물가안정목표제 운용, 채권시장 참가자의 만기 포트폴리오 최적화, 부동산 시장 및 민간의 소비와 투자 등 경제 전반에 지대한 영향을 미친다. 본 연구는 향후 3년간 우리나라 소비자물가상승률 예측결과를 제시한다. 이를 위해 우선 자기회귀시차(Autoregressive Distributed Lag, ADL) 모형, AR 모형, 소규모 벡터자기회귀(VAR) 모형, 대규모 VAR 모형의 표본외 예측력을 기준으로 모형선택을 실시한다. 물가상승률에는 다수의 잠재적인 예측변수가 존재하기 때문에 12개의 거시변수를 대상으로 ADL 모형에 베이지안 변수선택기법을 도입하고, 예측력 향상을 위한 정밀한 튜닝과정을 고안하고 적용하였다. VAR 모형에는 미네소타 사전분포를 설정하여 차원의 저주 문제를 극복하고자 하였다. 최근 5년을 대상으로 한 장단기 표본외 예측결과, ADL 모형이 점예측과 분포예측 모두에서 여타 경쟁모형에 비해 전반적으로 우월하였다. 예측조합을 통한 예측결과, 우리나라 소비자물가상승률이 2022년 하반기까지는 현재 비슷한 2% 내외의 수준을 유지할 것으로 보이며, 2023년 상반기부터는 1% 내외로 하락할 것으로 전망된다. 80% 신용구간은 예측치의 대략 ±1%p이다.

베이지안 확률 기반 범죄위험지역 예측 모델 개발 (Crime Incident Prediction Model based on Bayesian Probability)

  • 허선영;김주영;문태헌
    • 한국지리정보학회지
    • /
    • 제20권4호
    • /
    • pp.89-101
    • /
    • 2017
  • 범죄는 장소나 건축물 용도에 따라 발생빈도와 유형이 다르고, 그 장소를 이용하는 사람들의 특성 및 공간 구조 차이에 의해 다양하게 발생한다. 따라서 공간 및 지역특성을 포함한 공간 빅데이터를 활용하여 지역을 분석해 보면 범죄예방 전략을 마련할 수 있다. 아울러 빅데이터와 지능 정보화시대의 도래에 따라 예측적 경찰활동이 새로운 경찰활동의 패러다임으로 등장하고 있다. 이에 보편적인 지방도시 J시를 대상으로 3개년 동안의 7,420건의 실제 범죄사례를 바탕으로 도시공간의 물리 환경적인 특성을 분석하여 범죄발생공간을 규명하고, 위험지역을 예측해 보고자 하였다. 분석에는 다양한 빅데이터 중 범죄를 유발하는 도시 공간 내 물리 환경적 요소에 한하여 공간 빅데이터를 구축하여 공간회귀분석을 실시하였다. 다음으로 분석결과 도출된 가로폭, 평균 층수, 용적율, 1층 사용용도(제2종 근린생활시설, 상업시설, 유흥시설, 주거시설)을 변수로 베이지안확률 기반 범죄발생 위험성 예측 모형(CIPM: Crime Incident Prediction Model)을 개발하였다. 개발된 모델은 실제 범죄발생 지역과의 중첩분석 및 모델의 정확도를 판단하는 Roc curve 분석을 통해 AUC 값이 0.8로 모델이 적합한 것으로 나타났다. 개발된 모델을 토대로 사례지역의 범죄 위험도를 분석한 결과 범죄발생은 상업 및 유흥시설이 밀집된 지역과 건물층수가 높은 지역, 그리고 상업 및 유흥시설과 주거가 혼재해 있는 블록이 범죄발생 확률이 높은 것으로 나타났다. 본 연구는 단순히 범죄의 공간적 분포와 범죄발생 영향요인을 탐색하는 기존의 연구와 달리 범죄발생 예측모델을 확률론적 관점에서 개발하는 영역으로 한 단계 진전되었다는 점에 의의가 있다.

주택가격이 센서스에 기반한 박탈지수의 대안이 될 수 있는가?: 다수준 모델에 기반한 평가 (Can Housing Prices Be an Alternative to a Census-based Deprivation Index? An Evaluation Based on Multilevel Modeling)

  • 손철;나카야 토모키
    • 지적과 국토정보
    • /
    • 제48권2호
    • /
    • pp.197-211
    • /
    • 2018
  • 본 연구에서는 건강에 대한 공간적 연구에서 통상적으로 사용되는 센서스에 기반한 지역 박탈지수의 대안으로 지역 주택가격이 사용될 수 있는지 평가하였다. 평가를 위해 개인을 1수준으로, 수도권의 보건소 구역을 2수준으로 하는 다수준 로지스틱 모델이 추정되었다. 다수준 모델에는 개인의 점심식사후 칫솔질과 치간실 사용을 설명하기 위한 개인수준의 변수들과 보건소 구역을 대표하는 사회적 박탈지수 및 지역주택가격 수준이 포함되었다. 추정된 모델들의 설명력은 Akaike Information Criterion (AIC)와 Bayesian Information Criterion (BIC)를 이용하여 평가되었다. 모델의 추정결과는 사회적 박탈지수 및 지역 주택가격이 모두 개인의 치아관리 행동을 설명하는 데 기여하나 지역 주택가격을 사용한 모델의 AIC 및 BIC가 통상적인 센서스 기반 지역 박탈지수를 사용한 경우 보다 낮은 것을 보여 주었다. 본 연구결과는 센서스에 기반한 박탈지수를 생성하는 데 사용된 센서스 변수가 시점의 차이 등의 이유로 적절하지 않을 경우 지역 주택가격이 지역의 사회경제적 수준을 대표하기 위해 대안적으로 사용될 수 있음을 보여준다.

낙동강 유역에서 하천 TP 농도의 공간적 변동성에 영향을 미치는 주요 유역특성 (Major Watershed Characteristics Influencing Spatial Variability of Stream TP Concentration in the Nakdong River Basin)

  • 서지유;원정은;최정현;김상단
    • 한국물환경학회지
    • /
    • 제37권3호
    • /
    • pp.204-216
    • /
    • 2021
  • It is important to understand the factors influencing the temporal and spatial variability of water quality in order to establish an effective customized management strategy for contaminated aquatic ecosystems. In this study, the spatial diversity of the 5-year (2015 - 2019) average total phosphorus (TP) concentration observed in 40 Total Maximum Daily Loads unit-basins in the Nakdong River watershed was analyzed using 50 predictive variables of watershed characteristics, climate characteristics, land use characteristics, and soil characteristics. Cross-correlation analysis, a two-stage exhaustive search approach, and Bayesian inference were applied to identify predictors that best matched the time-averaged TP. The predictors that were finally identified included watershed altitude, precipitation in fall, precipitation in winter, residential area, public facilities area, paddy field, soil available phosphate, soil magnesium, soil available silicic acid, and soil potassium. Among them, it was found that the most influential factors for the spatial difference of TP were watershed altitude in watershed characteristics, public facilities area in land use characteristics, and soil available silicic acid in soil characteristics. This means that artificial factors have a great influence on the spatial variability of TP. It is expected that the proposed statistical modeling approach can be applied to the identification of major factors affecting the spatial variability of the temporal average state of various water quality parameters.

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.

Prospective validation of a novel dosing scheme for intravenous busulfan in adult patients undergoing hematopoietic stem cell transplantation

  • Cho, Sang-Heon;Lee, Jung-Hee;Lim, Hyeong-Seok;Lee, Kyoo-Hyung;Kim, Dae-Young;Choe, Sangmin;Bae, Kyun-Seop;Lee, Je-Hwan
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제20권3호
    • /
    • pp.245-251
    • /
    • 2016
  • The objective of this study was to externally validate a new dosing scheme for busulfan. Thirty-seven adult patients who received busulfan as conditioning therapy for hematopoietic stem cell transplantation (HCT) participated in this prospective study. Patients were randomized to receive intravenous busulfan, either as the conventional dosage (3.2 mg/kg daily) or according to the new dosing scheme based on their actual body weight (ABW) ($23{\times}ABW^{0.5}mg\;daily$) targeting an area under the concentration-time curve (AUC) of $5924{\mu}M{\cdot}min$. Pharmacokinetic profiles were collected using a limited sampling strategy by randomly selecting 2 time points at 3.5, 5, 6, 7 or 22 hours after starting busulfan administration. Using an established population pharmacokinetic model with NONMEM software, busulfan concentrations at the available blood sampling times were predicted from dosage history and demographic data. The predicted and measured concentrations were compared by a visual predictive check (VPC). Maximum a posteriori Bayesian estimators were estimated to calculate the predicted AUC ($AUC_{PRED}$). The accuracy and precision of the $AUC_{PRED}$ values were assessed by calculating the mean prediction error (MPE) and root mean squared prediction error (RMSE), and compared with the target AUC of $5924{\mu}M{\cdot}min$. VPC showed that most data fell within the 95% prediction interval. MPE and RMSE of $AUC_{PRED}$ were -5.8% and 20.6%, respectively, in the conventional dosing group and -2.1% and 14.0%, respectively, in the new dosing scheme group. These findings demonstrated the validity of a new dosing scheme for daily intravenous busulfan used as conditioning therapy for HCT.