• 제목/요약/키워드: Bayesian model

검색결과 1,312건 처리시간 0.025초

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

메소코즘을 이용한 지각류, 요각류 및 패충류의 섭식 성향 분석; 탄소, 질소 안정동위원소비의 믹싱모델 (R package SIAR)을 이용한 정량 분석 (Feeding Behavior of Crustaceans (Cladocera, Copepoda and Ostracoda): Food Selection Measured by Stable Isotope Analysis Using R Package SIAR in Mesocosm Experiment)

  • 장광현;서동일;고순미;;남귀숙;최종윤;김민섭;정광석;나긍환;김현우
    • 생태와환경
    • /
    • 제49권4호
    • /
    • pp.279-288
    • /
    • 2016
  • 탄소와 질소 안정동위원소비를 이용한 먹이망 구조 해석 기법은 수생태계 연구에서 폭 넓게 활용되고 있으며, 먹이원의 정량적 기여율을 분석하는 믹싱모델에 적용될 수 있다. 본 연구에서는 Bayesian 모델을 이용한 믹싱모델의 적용이 가능한 통계 패키지(R, SIAR package)의 사용방법을 제시하고, 사용 예로 저수지 및 메소코즘 배양조에서의 동물플랑크톤과 먹이원의 탄소, 질소 안정동위원소비를 이용한 섭식 성향 분석 방법 및 결과를 제시하였다. 분석 결과, 국내 저수지 및 대형하천 등에서 주로 우점하는 Daphnia galeata는 소형의 POM (<$50{\mu}m$)을 주로 섭식하는 것으로 나타나, 부영양화된 환경에서 녹조 발생시 먹이로의 활용이 용이하지 않은 것으로 나타났다. 논 생태계 등에서 빈번히 출현하는 패충류의 경우 D. galeata와 유사한 섭식 성향을 나타내었다. 반면 습지 등에서 주로 출현하는 Simocephalus vetulus의 경우, 부착성 POM이 아닌 부유성 POM을 주로 섭식하며 Microcystis를 포함하는 대형의 POM (>$50{\mu}m$)을 섭식하는 것으로 분석되었다.

선거(選擧)의 거시경제적(巨視經濟的) 충격(衝擊)과 파급효과(波及效果) (The Macroeconomic Impacts of Korean Elections and Their Future Consequences)

  • 심상달;이항용
    • KDI Journal of Economic Policy
    • /
    • 제14권1호
    • /
    • pp.147-165
    • /
    • 1992
  • 본고(本稿)는 선거가 선거기간을 전후해서 어떻게 경제에 충격을 주고 이러한 충격의 여파로 경제는 선거후에 어떻게 영향을 받는지를 "베이지안" 벡터자기회귀모형(自己回歸模型)을 이용하여 분석하였다. 계수(係數)를 수정하면서 선거기간에 대해 예측을 할 경우의 예측오차의 평균으로 선거의 충격효과를 계산해 보면 선거는 선거전, 선거분기 및 선거후분기에 본원통화(本源通貨), 물가(物價), 생산(生産), 이자율(利子率), 투자(投資) 등에 상당한 충격을 주는 것으로 나타났다. 과거의 선거(選擧), 특히 80년대 이후 선거중에는 대체로 현금통화(現金通貨) 및 본원통화(本源通貨)가 선거 기간중 증가하고 선거후 환수된다. 이에 따른 유동성(流動性)의 변화(變化)로 금리(金利)는 선거기간중 약간 하락하고 선거후 다시 증가하는 양상을 보였다. 선거기간중(選擧期間中) 생산(生産) 및 고용(雇傭)은 선거에 따른 운동원차출(運動員差出) 및 조업감소(操業減少) 등의 영향으로 감소하나, 선거후에는 선거중의 생산감소(生産減少)를 상쇄(相殺)할 만큼 증대(增大)하는 것으로 나타났다. 선거(選擧)에 따른 물가(物價)의 충격(衝擊)은 주로 선거전분기에 나타났다. 이러한 과거의 선거기간중의 양태가 1992년의 각 선거에서 되풀이되고 총선과 대통령선거가 실시될 경우를 가상해서 그 효과를 시산(試算)해 보면 선거(選擧)로 인한 상당한 유동성증대(流動性增大)가 본원통화를 중심으로 예상되는 가운데, 소비자물가(消費者物價)가 1992년중 약 2%포인트, 1993년에 2.5%포인트 상승할 것으로 나타났다. 반면 선거로 인한 소비증대(消費增大)나 생산감소(生産減少) 등의 효과는 상대적으로 작을 것으로 예상되는 한편, 자금흐름의 왜곡이 발생하여 유동성이 증가했음에도 불구하고 생산자금은 압박을 받게 되어 투자(投資)가 부진해질 것으로 나타났다. 또한 이러한 선거의 효과는 1992년중 지방자치단체장선거가 실시될 경우 크게 확대된다.

  • PDF

실내 항온과 온실 변온조건에서 목화진딧물의 온도 발육비교 (Comparison of Temperature-dependent Development Model of Aphis gossypii (Hemiptera: Aphididae) under Constant Temperature and Fluctuating Temperature)

  • 김도익;고숙주;최덕수;강범용;박창규;김선곤;박종대;김상수
    • 한국응용곤충학회지
    • /
    • 제51권4호
    • /
    • pp.421-429
    • /
    • 2012
  • 목화진딧물 (Aphis gossypii)의 온도에 따른 발육시험을 실내 15, 18, 21, 24, 27, $30^{\circ}C$의 6개 항온, 광주기 14L:10D, 상대습도 50~60% 조건과 오이 비닐하우스에서 3월 23일부터 8월 20일까지 6회 접종하여 수행하였다. 실내사망률은 저온에서는 2~3령충의 사망률이 높았고 온도가 증가할수록 3~4령충의 사망률이 높았으며 고온에서 전체 사망률이 높았다. 전체 약충의 발육기간은 실내에서 $15^{\circ}C$에서 12.2일로 가장 짧았으며 변온의 $28.5^{\circ}C$에서 4.09일로 가장 짧았다. 온도와 발육율과의 관계를 보기위해 선형 및 3개의 비선형 모형(Briere 1, Lactin 2, Logan 6)을 이용하여 분석한 결과, 선형모형을 이용하여 전체약충의 발육영점온도는 $6.8^{\circ}C$였으며 발육유효적산온도는 각각 111.1DD였다. 3가지 비선형 모형중 Logan-6 모형이 전약충, 후약충 전체약충 단계에서 AIC와 BIC 값이 가장 적어 온도와 발육율과의 관계를 잘 설명하였으며, 발육단계별 발육완료분포는 3-parameter Weibull 함수를 사용하였으며 전약충, 후약충, 전체약충에서 $r^2$값이 0.88~0.91로 높은 값을 보여 양호한 모형 적합성을 보였으며 정식시기별 성충 발생 예측치와 포장 조사치가 일치하여 방제적기 추정에 유용하게 사용할 수 있을 것이다.

충전 전압 특성을 이용한 리튬 이온 배터리의 잔존 수명 예측 (Remaining Useful Life Prediction of Li-Ion Battery Based on Charge Voltage Characteristics)

  • 심성흠;강진혁;안다운;김선일;김진영;최주호
    • 대한기계학회논문집B
    • /
    • 제37권4호
    • /
    • pp.313-322
    • /
    • 2013
  • 배터리는 최근 여러 분야에서 중요한 에너지원 역할을 하고 있는데, 사용 중 충방전을 거듭하면 용량이 점차 저하되며 초기 대비 80% 이하로 떨어지면 고장으로 간주되므로, 이를 예측하기 위한 수명 예측 기법이 활발히 개발되고 있다. 본 연구에서는 사용중인 배터리에 대해 충전곡선 기울기를 이용하여 배터리의 용량을 평가하고 이를 바탕으로 잔존수명을 예측하는 새로운 방법을 제안하였다. 이 과정에서 발생하는 여러 불확실성을 고려하기 위해 베이지안 접근법에 기반한 파티클 필터 방법을 활용하였고 그 결과 잔존수명을 확률분포로 구하였다. 개발된 방법을 미국 NASA Ames 연구소와 본 연구실에서 직접 수행한 배터리 충방전 시험 데이터에 대해 각각 적용한 결과 충전곡선 기울기가 용량 열화를 잘 나타내며 파티클 필터로 예측된 잔존수명 신뢰구간은 실제 수명을 잘 포함함을 확인할 수 있었다.

Prospective validation of a novel dosing scheme for intravenous busulfan in adult patients undergoing hematopoietic stem cell transplantation

  • Cho, Sang-Heon;Lee, Jung-Hee;Lim, Hyeong-Seok;Lee, Kyoo-Hyung;Kim, Dae-Young;Choe, Sangmin;Bae, Kyun-Seop;Lee, Je-Hwan
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제20권3호
    • /
    • pp.245-251
    • /
    • 2016
  • The objective of this study was to externally validate a new dosing scheme for busulfan. Thirty-seven adult patients who received busulfan as conditioning therapy for hematopoietic stem cell transplantation (HCT) participated in this prospective study. Patients were randomized to receive intravenous busulfan, either as the conventional dosage (3.2 mg/kg daily) or according to the new dosing scheme based on their actual body weight (ABW) ($23{\times}ABW^{0.5}mg\;daily$) targeting an area under the concentration-time curve (AUC) of $5924{\mu}M{\cdot}min$. Pharmacokinetic profiles were collected using a limited sampling strategy by randomly selecting 2 time points at 3.5, 5, 6, 7 or 22 hours after starting busulfan administration. Using an established population pharmacokinetic model with NONMEM software, busulfan concentrations at the available blood sampling times were predicted from dosage history and demographic data. The predicted and measured concentrations were compared by a visual predictive check (VPC). Maximum a posteriori Bayesian estimators were estimated to calculate the predicted AUC ($AUC_{PRED}$). The accuracy and precision of the $AUC_{PRED}$ values were assessed by calculating the mean prediction error (MPE) and root mean squared prediction error (RMSE), and compared with the target AUC of $5924{\mu}M{\cdot}min$. VPC showed that most data fell within the 95% prediction interval. MPE and RMSE of $AUC_{PRED}$ were -5.8% and 20.6%, respectively, in the conventional dosing group and -2.1% and 14.0%, respectively, in the new dosing scheme group. These findings demonstrated the validity of a new dosing scheme for daily intravenous busulfan used as conditioning therapy for HCT.

베이지안 선택 모형을 이용한 영화흥행 예측 (Predicting Financial Success of a Movie Using Bayesian Choice Model)

  • 이경재;장우진
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1851-1856
    • /
    • 2006
  • 영화는 대표적인 경험재로 가치판단이 주관적이고 제품 수명주기가 매우 짧아 예측의 불확실성이 높기 때문에 이를 정량적인 방법으로 모형화하기는 쉽지 않다. 이러한 한계점에도 불구하고 한 영화의 상업적 성공을 예측하는 것은 영화 제작자나 배급사, 극장 등 모든 주체에게 수익과 직결되는 중요한 문제이기 때문에 지금까지 다양한 통계 모형이 제시되었다. 그러나 이들 모형의 대부분은 영화흥행에는 영향을 미치나 측정할 수 없는 효과를 반영하지 못한다거나, 추정 모수의 효과가 모든 영화에 대해서 같다는 동일성 가정으로 인해 영화간 이질성을 고려하지 못하고 있다. 따라서, 본 연구에서는 추정 모수의 사전분포를 모호사전분포로 정의함으로써 변수들의 불확실성을 반영할 수 있고, 영화간 이질성을 고려할 수 있는 베이지안 선택 모형을 제안하였다. 모수의 사후분포는 마코프체인 몬테카를로 기법인 깁스 샘플러를 이용하여 추정하였다. 또한, 감독, 배우, 장르 등의 영화 별 속성 변수뿐만 아니라, 입소문에 의한 영화관람 결정 등의 구전효과와 경쟁영화의 개봉으로 인한 효과를 반영할 수 있는 변수를 추가하여 모형의 정확성을 높였다. 2005년과 2006년 상반기에 상영된 영화를 바탕으로 모형을 구축하고 인공신경망 모형과 비교한 결과, 전체적인 예측 정확도에서는 인공신경망 모형과 비슷한 결과를 보이나 상업적으로 성공한 영화를 예측하는 데에는 베이지안 선택모형이 보다 더 우수한 것으로 나타났다. 또한, 개봉 주의 경쟁심화 정도 및 개봉 첫 주의 스크린 수 등이 영화 흥행에 가장 중요한 변수로 나타났으며, 영화 개봉 전 그 영화에 대한 기대치가 높을수록 흥행 성적 또한 좋음을 알 수 있었다. 배우의 힘 및 계절성, 영화 평점 등은 이질성을 고려하지 않은 전체수준에서는 통계적으로 유의하지 않은 것으로 나타났으나, 그룹 간 이질성을 반영한 모형에서는 어느 정도 흥행한 영화를 만들기 위해서는 고려되어야 할 요소로 나타났다.렇지 않을 경우 적절한 벤치마킹 대상을 도출할 때까지 추가적인 분석과정을 반복한다. 제안한 방법을 통하여 조직은 기술적 생산 가능성 외에도 다양한 조직 운영 관점에서 적절한 벤치마킹 대상을 선정할 수 있으며, 이에 따른 목표를 수립할 수 있을 것으로 기대한다. 또한 더 나아가 global efficiency 관점에서 효율적 조직이 되기 위하여 단계적인 벤치마킹 대상 선정과 이에 따른 목표를 수립하는데도 유용하리라 판단된다.$1.20{\pm}0.37L$, 72시간에 $1.33{\pm}0.33L$로 유의한 차이를 보였으므로(F=6.153, P=0.004), 술 후 폐환기능 회복에 효과가 있다. 4) 실험군과 대조군의 수술 후 노력성 폐활량은 수술 후 72시간에서 실험군이 $1.90{\pm}0.61L$, 대조군이 $1.51{\pm}0.38L$로 유의한 차이를 보였다(t=2.620, P=0.013). 5) 실험군과 대조군의 수술 후 일초 노력성 호기량은 수술 후 24시간에서 $1.33{\pm}0.56L,\;1.00{\ge}0.28L$로 유의한 차이를 보였고(t=2.530, P=0.017), 술 후 72시간에서 $1.72{\pm}0.65L,\;1.33{\pm}0.3L$로 유의한 차이를 보였다(t=2.540, P=0.016). 6) 대상자의 술 후 폐환기능에 영향을 미치는 요인은 성별로 나타났다. 이에 따른 폐환기능의 차이를 보면, 실험군의 술 후 노력성 폐활량이 48시간에 남자($1.78{\pm}0.61L$)가 여자($1.27{\pm}0.45L$)보다 더 높게 나타났으며 (t=2.170, P=0.042), 72시간에도 역시 남자($2.16{\pm}0.56L$)가 여자($1.50{\pm}0.47L$)보다 더

  • PDF

백혈병환자 대상의 제1상임상시험 연속재평가방법 (Continual Reassessment Method in Phase I Clinical Trials for Leukemia Patients)

  • 이주형;송혜향
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.581-594
    • /
    • 2011
  • 제 1상 임상시험 계획에서 신약제의 최대허용용량을 추정하기 위해 전통적 방법인 표준 3+3계획과 모형중심의 베이지안 방법을 적용시킨 연속재평가방법이 주로 사용되고 있다. 본 논문에서는 치료불응 또는 재발된 백혈병이나 골수형성 이상증후군 환자를 대상으로 시행한 제 1상 임상시험의 연구계획을 개관하였다. 단순한 표준 3+3계획으로 환자확보 기간이 길어져 연구를 완성하지 못하고 때 이르게 중단할 수밖에 없는 실정에 반하여, 최근에 제시된 표준 3+1+1계획과 Rolling-6 계획은 연구기간을 크게 단축시킬 수 있다. 제1상 임상시험의 용량수준 선택과정에서 너무 보수적인 연구자의 태도는 최대허용용량의 정확한 추정을 불가능하게 한다. 새로운 환자에게 투여할 용량수준을 결정할 시점에서 용량제한 독성반응이 아직 나타나지 않은 환자의 관측시간 및 늦게 나타나는 환자의 독성반응 시간을 모두 감안한 연속재평가방법인 TITE-CRM계획이 유용하며, 이러한 CRM계획으로 진행되는 임상시험 시행 중 모의실험으로 각 용량수준에서 용량제한 독성반응율이 과대 또는 과소 추정되는지를 파악할 수 있음이 장점이다. 백혈병환자 대상의 임상연구에서 채택되는 제 1상 임상시험의 여러 연구계획의 장, 단점을 제시한다.