• 제목/요약/키워드: Bayesian model

검색결과 1,321건 처리시간 0.029초

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

메소코즘을 이용한 지각류, 요각류 및 패충류의 섭식 성향 분석; 탄소, 질소 안정동위원소비의 믹싱모델 (R package SIAR)을 이용한 정량 분석 (Feeding Behavior of Crustaceans (Cladocera, Copepoda and Ostracoda): Food Selection Measured by Stable Isotope Analysis Using R Package SIAR in Mesocosm Experiment)

  • 장광현;서동일;고순미;;남귀숙;최종윤;김민섭;정광석;나긍환;김현우
    • 생태와환경
    • /
    • 제49권4호
    • /
    • pp.279-288
    • /
    • 2016
  • 탄소와 질소 안정동위원소비를 이용한 먹이망 구조 해석 기법은 수생태계 연구에서 폭 넓게 활용되고 있으며, 먹이원의 정량적 기여율을 분석하는 믹싱모델에 적용될 수 있다. 본 연구에서는 Bayesian 모델을 이용한 믹싱모델의 적용이 가능한 통계 패키지(R, SIAR package)의 사용방법을 제시하고, 사용 예로 저수지 및 메소코즘 배양조에서의 동물플랑크톤과 먹이원의 탄소, 질소 안정동위원소비를 이용한 섭식 성향 분석 방법 및 결과를 제시하였다. 분석 결과, 국내 저수지 및 대형하천 등에서 주로 우점하는 Daphnia galeata는 소형의 POM (<$50{\mu}m$)을 주로 섭식하는 것으로 나타나, 부영양화된 환경에서 녹조 발생시 먹이로의 활용이 용이하지 않은 것으로 나타났다. 논 생태계 등에서 빈번히 출현하는 패충류의 경우 D. galeata와 유사한 섭식 성향을 나타내었다. 반면 습지 등에서 주로 출현하는 Simocephalus vetulus의 경우, 부착성 POM이 아닌 부유성 POM을 주로 섭식하며 Microcystis를 포함하는 대형의 POM (>$50{\mu}m$)을 섭식하는 것으로 분석되었다.

선거(選擧)의 거시경제적(巨視經濟的) 충격(衝擊)과 파급효과(波及效果) (The Macroeconomic Impacts of Korean Elections and Their Future Consequences)

  • 심상달;이항용
    • KDI Journal of Economic Policy
    • /
    • 제14권1호
    • /
    • pp.147-165
    • /
    • 1992
  • 본고(本稿)는 선거가 선거기간을 전후해서 어떻게 경제에 충격을 주고 이러한 충격의 여파로 경제는 선거후에 어떻게 영향을 받는지를 "베이지안" 벡터자기회귀모형(自己回歸模型)을 이용하여 분석하였다. 계수(係數)를 수정하면서 선거기간에 대해 예측을 할 경우의 예측오차의 평균으로 선거의 충격효과를 계산해 보면 선거는 선거전, 선거분기 및 선거후분기에 본원통화(本源通貨), 물가(物價), 생산(生産), 이자율(利子率), 투자(投資) 등에 상당한 충격을 주는 것으로 나타났다. 과거의 선거(選擧), 특히 80년대 이후 선거중에는 대체로 현금통화(現金通貨) 및 본원통화(本源通貨)가 선거 기간중 증가하고 선거후 환수된다. 이에 따른 유동성(流動性)의 변화(變化)로 금리(金利)는 선거기간중 약간 하락하고 선거후 다시 증가하는 양상을 보였다. 선거기간중(選擧期間中) 생산(生産) 및 고용(雇傭)은 선거에 따른 운동원차출(運動員差出) 및 조업감소(操業減少) 등의 영향으로 감소하나, 선거후에는 선거중의 생산감소(生産減少)를 상쇄(相殺)할 만큼 증대(增大)하는 것으로 나타났다. 선거(選擧)에 따른 물가(物價)의 충격(衝擊)은 주로 선거전분기에 나타났다. 이러한 과거의 선거기간중의 양태가 1992년의 각 선거에서 되풀이되고 총선과 대통령선거가 실시될 경우를 가상해서 그 효과를 시산(試算)해 보면 선거(選擧)로 인한 상당한 유동성증대(流動性增大)가 본원통화를 중심으로 예상되는 가운데, 소비자물가(消費者物價)가 1992년중 약 2%포인트, 1993년에 2.5%포인트 상승할 것으로 나타났다. 반면 선거로 인한 소비증대(消費增大)나 생산감소(生産減少) 등의 효과는 상대적으로 작을 것으로 예상되는 한편, 자금흐름의 왜곡이 발생하여 유동성이 증가했음에도 불구하고 생산자금은 압박을 받게 되어 투자(投資)가 부진해질 것으로 나타났다. 또한 이러한 선거의 효과는 1992년중 지방자치단체장선거가 실시될 경우 크게 확대된다.

  • PDF

실내 항온과 온실 변온조건에서 목화진딧물의 온도 발육비교 (Comparison of Temperature-dependent Development Model of Aphis gossypii (Hemiptera: Aphididae) under Constant Temperature and Fluctuating Temperature)

  • 김도익;고숙주;최덕수;강범용;박창규;김선곤;박종대;김상수
    • 한국응용곤충학회지
    • /
    • 제51권4호
    • /
    • pp.421-429
    • /
    • 2012
  • 목화진딧물 (Aphis gossypii)의 온도에 따른 발육시험을 실내 15, 18, 21, 24, 27, $30^{\circ}C$의 6개 항온, 광주기 14L:10D, 상대습도 50~60% 조건과 오이 비닐하우스에서 3월 23일부터 8월 20일까지 6회 접종하여 수행하였다. 실내사망률은 저온에서는 2~3령충의 사망률이 높았고 온도가 증가할수록 3~4령충의 사망률이 높았으며 고온에서 전체 사망률이 높았다. 전체 약충의 발육기간은 실내에서 $15^{\circ}C$에서 12.2일로 가장 짧았으며 변온의 $28.5^{\circ}C$에서 4.09일로 가장 짧았다. 온도와 발육율과의 관계를 보기위해 선형 및 3개의 비선형 모형(Briere 1, Lactin 2, Logan 6)을 이용하여 분석한 결과, 선형모형을 이용하여 전체약충의 발육영점온도는 $6.8^{\circ}C$였으며 발육유효적산온도는 각각 111.1DD였다. 3가지 비선형 모형중 Logan-6 모형이 전약충, 후약충 전체약충 단계에서 AIC와 BIC 값이 가장 적어 온도와 발육율과의 관계를 잘 설명하였으며, 발육단계별 발육완료분포는 3-parameter Weibull 함수를 사용하였으며 전약충, 후약충, 전체약충에서 $r^2$값이 0.88~0.91로 높은 값을 보여 양호한 모형 적합성을 보였으며 정식시기별 성충 발생 예측치와 포장 조사치가 일치하여 방제적기 추정에 유용하게 사용할 수 있을 것이다.

충전 전압 특성을 이용한 리튬 이온 배터리의 잔존 수명 예측 (Remaining Useful Life Prediction of Li-Ion Battery Based on Charge Voltage Characteristics)

  • 심성흠;강진혁;안다운;김선일;김진영;최주호
    • 대한기계학회논문집B
    • /
    • 제37권4호
    • /
    • pp.313-322
    • /
    • 2013
  • 배터리는 최근 여러 분야에서 중요한 에너지원 역할을 하고 있는데, 사용 중 충방전을 거듭하면 용량이 점차 저하되며 초기 대비 80% 이하로 떨어지면 고장으로 간주되므로, 이를 예측하기 위한 수명 예측 기법이 활발히 개발되고 있다. 본 연구에서는 사용중인 배터리에 대해 충전곡선 기울기를 이용하여 배터리의 용량을 평가하고 이를 바탕으로 잔존수명을 예측하는 새로운 방법을 제안하였다. 이 과정에서 발생하는 여러 불확실성을 고려하기 위해 베이지안 접근법에 기반한 파티클 필터 방법을 활용하였고 그 결과 잔존수명을 확률분포로 구하였다. 개발된 방법을 미국 NASA Ames 연구소와 본 연구실에서 직접 수행한 배터리 충방전 시험 데이터에 대해 각각 적용한 결과 충전곡선 기울기가 용량 열화를 잘 나타내며 파티클 필터로 예측된 잔존수명 신뢰구간은 실제 수명을 잘 포함함을 확인할 수 있었다.

Prospective validation of a novel dosing scheme for intravenous busulfan in adult patients undergoing hematopoietic stem cell transplantation

  • Cho, Sang-Heon;Lee, Jung-Hee;Lim, Hyeong-Seok;Lee, Kyoo-Hyung;Kim, Dae-Young;Choe, Sangmin;Bae, Kyun-Seop;Lee, Je-Hwan
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제20권3호
    • /
    • pp.245-251
    • /
    • 2016
  • The objective of this study was to externally validate a new dosing scheme for busulfan. Thirty-seven adult patients who received busulfan as conditioning therapy for hematopoietic stem cell transplantation (HCT) participated in this prospective study. Patients were randomized to receive intravenous busulfan, either as the conventional dosage (3.2 mg/kg daily) or according to the new dosing scheme based on their actual body weight (ABW) ($23{\times}ABW^{0.5}mg\;daily$) targeting an area under the concentration-time curve (AUC) of $5924{\mu}M{\cdot}min$. Pharmacokinetic profiles were collected using a limited sampling strategy by randomly selecting 2 time points at 3.5, 5, 6, 7 or 22 hours after starting busulfan administration. Using an established population pharmacokinetic model with NONMEM software, busulfan concentrations at the available blood sampling times were predicted from dosage history and demographic data. The predicted and measured concentrations were compared by a visual predictive check (VPC). Maximum a posteriori Bayesian estimators were estimated to calculate the predicted AUC ($AUC_{PRED}$). The accuracy and precision of the $AUC_{PRED}$ values were assessed by calculating the mean prediction error (MPE) and root mean squared prediction error (RMSE), and compared with the target AUC of $5924{\mu}M{\cdot}min$. VPC showed that most data fell within the 95% prediction interval. MPE and RMSE of $AUC_{PRED}$ were -5.8% and 20.6%, respectively, in the conventional dosing group and -2.1% and 14.0%, respectively, in the new dosing scheme group. These findings demonstrated the validity of a new dosing scheme for daily intravenous busulfan used as conditioning therapy for HCT.

베이지안 선택 모형을 이용한 영화흥행 예측 (Predicting Financial Success of a Movie Using Bayesian Choice Model)

  • 이경재;장우진
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1851-1856
    • /
    • 2006
  • 영화는 대표적인 경험재로 가치판단이 주관적이고 제품 수명주기가 매우 짧아 예측의 불확실성이 높기 때문에 이를 정량적인 방법으로 모형화하기는 쉽지 않다. 이러한 한계점에도 불구하고 한 영화의 상업적 성공을 예측하는 것은 영화 제작자나 배급사, 극장 등 모든 주체에게 수익과 직결되는 중요한 문제이기 때문에 지금까지 다양한 통계 모형이 제시되었다. 그러나 이들 모형의 대부분은 영화흥행에는 영향을 미치나 측정할 수 없는 효과를 반영하지 못한다거나, 추정 모수의 효과가 모든 영화에 대해서 같다는 동일성 가정으로 인해 영화간 이질성을 고려하지 못하고 있다. 따라서, 본 연구에서는 추정 모수의 사전분포를 모호사전분포로 정의함으로써 변수들의 불확실성을 반영할 수 있고, 영화간 이질성을 고려할 수 있는 베이지안 선택 모형을 제안하였다. 모수의 사후분포는 마코프체인 몬테카를로 기법인 깁스 샘플러를 이용하여 추정하였다. 또한, 감독, 배우, 장르 등의 영화 별 속성 변수뿐만 아니라, 입소문에 의한 영화관람 결정 등의 구전효과와 경쟁영화의 개봉으로 인한 효과를 반영할 수 있는 변수를 추가하여 모형의 정확성을 높였다. 2005년과 2006년 상반기에 상영된 영화를 바탕으로 모형을 구축하고 인공신경망 모형과 비교한 결과, 전체적인 예측 정확도에서는 인공신경망 모형과 비슷한 결과를 보이나 상업적으로 성공한 영화를 예측하는 데에는 베이지안 선택모형이 보다 더 우수한 것으로 나타났다. 또한, 개봉 주의 경쟁심화 정도 및 개봉 첫 주의 스크린 수 등이 영화 흥행에 가장 중요한 변수로 나타났으며, 영화 개봉 전 그 영화에 대한 기대치가 높을수록 흥행 성적 또한 좋음을 알 수 있었다. 배우의 힘 및 계절성, 영화 평점 등은 이질성을 고려하지 않은 전체수준에서는 통계적으로 유의하지 않은 것으로 나타났으나, 그룹 간 이질성을 반영한 모형에서는 어느 정도 흥행한 영화를 만들기 위해서는 고려되어야 할 요소로 나타났다.렇지 않을 경우 적절한 벤치마킹 대상을 도출할 때까지 추가적인 분석과정을 반복한다. 제안한 방법을 통하여 조직은 기술적 생산 가능성 외에도 다양한 조직 운영 관점에서 적절한 벤치마킹 대상을 선정할 수 있으며, 이에 따른 목표를 수립할 수 있을 것으로 기대한다. 또한 더 나아가 global efficiency 관점에서 효율적 조직이 되기 위하여 단계적인 벤치마킹 대상 선정과 이에 따른 목표를 수립하는데도 유용하리라 판단된다.$1.20{\pm}0.37L$, 72시간에 $1.33{\pm}0.33L$로 유의한 차이를 보였으므로(F=6.153, P=0.004), 술 후 폐환기능 회복에 효과가 있다. 4) 실험군과 대조군의 수술 후 노력성 폐활량은 수술 후 72시간에서 실험군이 $1.90{\pm}0.61L$, 대조군이 $1.51{\pm}0.38L$로 유의한 차이를 보였다(t=2.620, P=0.013). 5) 실험군과 대조군의 수술 후 일초 노력성 호기량은 수술 후 24시간에서 $1.33{\pm}0.56L,\;1.00{\ge}0.28L$로 유의한 차이를 보였고(t=2.530, P=0.017), 술 후 72시간에서 $1.72{\pm}0.65L,\;1.33{\pm}0.3L$로 유의한 차이를 보였다(t=2.540, P=0.016). 6) 대상자의 술 후 폐환기능에 영향을 미치는 요인은 성별로 나타났다. 이에 따른 폐환기능의 차이를 보면, 실험군의 술 후 노력성 폐활량이 48시간에 남자($1.78{\pm}0.61L$)가 여자($1.27{\pm}0.45L$)보다 더 높게 나타났으며 (t=2.170, P=0.042), 72시간에도 역시 남자($2.16{\pm}0.56L$)가 여자($1.50{\pm}0.47L$)보다 더

  • PDF

백혈병환자 대상의 제1상임상시험 연속재평가방법 (Continual Reassessment Method in Phase I Clinical Trials for Leukemia Patients)

  • 이주형;송혜향
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.581-594
    • /
    • 2011
  • 제 1상 임상시험 계획에서 신약제의 최대허용용량을 추정하기 위해 전통적 방법인 표준 3+3계획과 모형중심의 베이지안 방법을 적용시킨 연속재평가방법이 주로 사용되고 있다. 본 논문에서는 치료불응 또는 재발된 백혈병이나 골수형성 이상증후군 환자를 대상으로 시행한 제 1상 임상시험의 연구계획을 개관하였다. 단순한 표준 3+3계획으로 환자확보 기간이 길어져 연구를 완성하지 못하고 때 이르게 중단할 수밖에 없는 실정에 반하여, 최근에 제시된 표준 3+1+1계획과 Rolling-6 계획은 연구기간을 크게 단축시킬 수 있다. 제1상 임상시험의 용량수준 선택과정에서 너무 보수적인 연구자의 태도는 최대허용용량의 정확한 추정을 불가능하게 한다. 새로운 환자에게 투여할 용량수준을 결정할 시점에서 용량제한 독성반응이 아직 나타나지 않은 환자의 관측시간 및 늦게 나타나는 환자의 독성반응 시간을 모두 감안한 연속재평가방법인 TITE-CRM계획이 유용하며, 이러한 CRM계획으로 진행되는 임상시험 시행 중 모의실험으로 각 용량수준에서 용량제한 독성반응율이 과대 또는 과소 추정되는지를 파악할 수 있음이 장점이다. 백혈병환자 대상의 임상연구에서 채택되는 제 1상 임상시험의 여러 연구계획의 장, 단점을 제시한다.

Genetic Contribution of Indigenous Yakutian Cattle to Two Hybrid Populations, Revealed by Microsatellite Variation

  • Li, M.H.;Nogovitsina, E.;Ivanova, Z.;Erhardt, G.;Vilkki, J.;Popov, R.;Ammosov, I.;Kiselyova, T.;Kantanen, J.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제18권5호
    • /
    • pp.613-619
    • /
    • 2005
  • Indigenous Yakutian cattle' adaptation to the hardest subarctic conditions makes them a valuable genetic resource for cattle breeding in the Siberian area. Since early last century, crossbreeding between native Yakutian cattle and imported Simmental and Kholmogory breeds has been widely adopted. In this study, variations at 22 polymorphic microsatellite loci in 5 populations of Yakutian, Kholmogory, Simmental, Yakutian-Kholmogory and Yakutian-Simmental cattle were analysed to estimate the genetic contribution of Yakutian cattle to the two hybrid populations. Three statistical approaches were used: the weighted least-squares (WLS) method which considers all allele frequencies; a recently developed implementation of a Markov chain Monte Carlo (MCMC) method called likelihood-based estimation of admixture (LEA); and a model-based Bayesian admixture analysis method (STRUCTURE). At population-level admixture analyses, the estimate based on the LEA was consistent with that obtained by the WLS method. Both methods showed that the genetic contribution of the indigenous Yakutian cattle in Yakutian-Kholmogory was small (9.6% by the LEA and 14.2% by the WLS method). In the Yakutian-Simmental population, the genetic contribution of the indigenous Yakutian cattle was considerably higher (62.8% by the LEA and 56.9% by the WLS method). Individual-level admixture analyses using STRUCTURE proved to be more informative than the multidimensional scaling analysis (MDSA) based on individual-based genetic distances. Of the 9 Yakutian-Simmental animals studied, 8 showed admixed origin, whereas of the 14 studied Yakutian-Kholmogory animals only 2 showed Yakutian ancestry (>5%). The mean posterior distributions of individual admixture coefficient (q) varied greatly among the samples in both hybrid populations. This study revealed a minor existing contribution of the Yakutian cattle in the Yakutian-Kholmogory hybrid population, but in the Yakutian-Simmental hybrid population, a major genetic contribution of the Yakutian cattle was seen. The results reflect the different crossbreeding patterns used in the development of the two hybrid populations. Additionally, molecular evidence for differences among individual admixture proportions was seen in both hybrid populations, resulting from the stochastic process in crossing over generations.