• 제목/요약/키워드: empirical Bayes

검색결과 106건 처리시간 0.019초

7대 광역시에서 대기오염과 폐암 발생 및 사망에 대한 공간 분석 (Spatial Analysis of Air Pollution and Lung Cancer Incidence and Mortality in 7 Metropolitan Cities in Korea.)

  • 황승식;이진희;정규원;임정훈;권호장
    • Journal of Preventive Medicine and Public Health
    • /
    • 제40권3호
    • /
    • pp.233-238
    • /
    • 2007
  • Objectives : We aimed to assess the relationship between long-term exposure to air pollution and lung cancer in the Republic of Korea. Methods : Using the Annual Report of Ambient Air Quality in Korea, Annual Report of National Cancer Registration, and Annual Report on the Cause of Death Statistics, we calculated the standardized mortality ratio (SMR) and standardized incidence ratio (SIR) of lung cancer for both sexes in 74 areas from 7 Korean metropolitan cities. We performed random intercept, Poisson regression using empirical Bayes method. Results : Both SMRs and SIRs in the 7 metropolitan cities were higher in women than in men. Mean SIRs were 99.0 for males and 107.0 for females. The association between $PM_{10}$ and lung cancer risk differed according to gender. $PM_{10}$ was not associated with the risk of lung cancer in males, but both incidence and mortality of lung cancer were positively associated with $PM_{10}$ in females. The estimated percentage increases in the rate of female lung cancer mortality and incidence were 27% and 65% at the highest $PM_{10}$ category $({\geq}70\;{\mu}g/m^3)$, compared to the referent category $({\geq}50\;{\mu}g/m^3)$. Conclusions : Long-term exposure to $PM_{10}$ was significantly associated with female lung cancer incidence in 7 Korean metropolitan cities. Further study is undergoing to estimate the relative risk of $PM_{10}$ using multi-level analysis for controlling individual and regional confounders such as smoking and socioeconomic position.

Movie Popularity Classification Based on Support Vector Machine Combined with Social Network Analysis

  • Dorjmaa, Tserendulam;Shin, Taeksoo
    • 한국IT서비스학회지
    • /
    • 제16권3호
    • /
    • pp.167-183
    • /
    • 2017
  • The rapid growth of information technology and mobile service platforms, i.e., internet, google, and facebook, etc. has led the abundance of data. Due to this environment, the world is now facing a revolution in the process that data is searched, collected, stored, and shared. Abundance of data gives us several opportunities to knowledge discovery and data mining techniques. In recent years, data mining methods as a solution to discovery and extraction of available knowledge in database has been more popular in e-commerce service fields such as, in particular, movie recommendation. However, most of the classification approaches for predicting the movie popularity have used only several types of information of the movie such as actor, director, rating score, language and countries etc. In this study, we propose a classification-based support vector machine (SVM) model for predicting the movie popularity based on movie's genre data and social network data. Social network analysis (SNA) is used for improving the classification accuracy. This study builds the movies' network (one mode network) based on initial data which is a two mode network as user-to-movie network. For the proposed method we computed degree centrality, betweenness centrality, closeness centrality, and eigenvector centrality as centrality measures in movie's network. Those four centrality values and movies' genre data were used to classify the movie popularity in this study. The logistic regression, neural network, $na{\ddot{i}}ve$ Bayes classifier, and decision tree as benchmarking models for movie popularity classification were also used for comparison with the performance of our proposed model. To assess the classifier's performance accuracy this study used MovieLens data as an open database. Our empirical results indicate that our proposed model with movie's genre and centrality data has by approximately 0% higher accuracy than other classification models with only movie's genre data. The implications of our results show that our proposed model can be used for improving movie popularity classification accuracy.

자동차보험 신뢰도 적용에 대한 베이지안 추론 방식 연구 (A study of Bayesian inference on auto insurance credibility application)

  • 김명준;김영화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.689-699
    • /
    • 2013
  • 본 연구는 가격 경쟁으로 인하여 최근 들어 요율 세분화가 심화되고 있는 자동차보험 시장에서, 부분 신뢰도의 적용 대상에 대한 경험적 사전분포 (empirical prior distribution) 함수 또는 무정보적 사전분포 (noninformative prior distribution) 정보의 가정을 통한 신뢰도 산출 방식에 대하여 살펴보았다. 요율 세분화의 확대로 가격 산출 단위의 수가 증가될 경우, 부분 신뢰도의 적용 대상은 점차 증가되게 될 것으로 판단되기 때문에, 기존에 제시된 신뢰도 적용 방식을 베이지안 프레임에서 적용, 추론함으로써 보다 다양하고 정교한 방식으로 그 활용 범위를 넓히고자 한다. 즉, 경험적으로 사용되는 사전 분포함수 또는 무정보적 사전 정보를 통하여 적절한 사후분포 (posterior distribution)함수를 도출하고 오차를 최소화하는 베이즈 통계량을 적용한 신뢰도를 추정하여 적용함으로써, 위험도 예측에 있어 기존에 제시된 방법과 비교하여 그 효용성을 입증하고자 한다. 현재 가장 많이 활용되는 제곱근 법칙 (square root rule)의 신뢰도 추정 방식에 베이지안 추론에서 도출된 통계량을 반영한 결과를 분석하여 실질적인 위험도에 수렴하는 수준을 비교하게 된다. 이는 이론적으로 위험도 예측에서 오차를 줄이는 방식에 대한 대안 제시와 더불어 신뢰도 적용 방식에 대한 추가적인 활용 대안을 보험업계에 제시함으로써 요율 세분화로 인한 부분 신뢰도 적용방식에 대한 그 이해와 활용의 폭을 넓히고자 한다.

하이테크 제품에 대한 소비자의 주관적 평가와 객관적 정보 구전 활동에 대한 연구 (Modeling Consumers' WOM (Word-Of-Mouth) Behavior with Subjective Evaluation and Objective Information on High-tech Products)

  • 정재학
    • Asia Marketing Journal
    • /
    • 제11권1호
    • /
    • pp.73-92
    • /
    • 2009
  • 소비자들은 때로 특정 제품에 대한 정보들을 다른 소비자에게 전달하여 그들의 제품 선택에 영향을 미치는 전달자 역할을 한다. 본 연구는 구전 전달자로서 소비자가 다른 소비자에게 전달하는 제품 정보를 주관적 (긍정적 또는 부정적) 정보와 객관적 정보로 구분하여, 소비자가 어떤 정보를 어떤 경우 더욱 활발히 전달하는 지를 분석하고자 한다. 본 연구는 이를 위해, 소비자의 메시지 전달 행위를 제품 선택과 같이 또 다른 형태의 선택 행위로 보고, 고객의 제품 구매 선택 행위를 연구하는 데 주로 적용되어 온 소비자 선택 모형(consumer choice model)를 이용하여 소비자의 메시지 전파(구전) 활동을 분석하였다. 소비자 선택 모형을 이용하여, 구전 전달자들이 제품에 관한 객관적 정보와 주관적 평가를 언제 더욱 많이 확산 시키는 지를 알아보고, 더 나아가서는 소비자들이 제품 관련 정보를 확산하는 과정에 구전 활동을 더욱 활성화 또는 약화시키는 요인이 무엇인지를 살펴 보았다. 본 연구는 실증 분석 결과를 통해, 구전 전달자의 메시지 확산 행위는 정보를 획득하게 된 경로/원천(source)의 유형에 따라 더욱 활발해 지거나 위축될 수 있다는 점을 발견하였다. 또한, 이러한 구전 활동은 전달하는 제품관련 메시지가 주관적 제품 평가에 관한 것인지 아니면 제품에 대한 객관적 정보인지에 따라 그 정도가 달라진다. 본 연구의 결과가 의미하는 바는, 소비자의 제품에 관한 메시지 확산 활동은 소비자의 구전 메시지 선택 행위에 영향을 미치는 효과적인 커뮤니케이션 계획을 통하여 더욱 확산 또는 위축시킬 수 있다는 점을 보여준다. 본 연구는 기업이 확산되기를 바라는 제품 정보가 구전을 통하여 효과적으로 확산되도록 계획을 수립하는 데 필요한 방법론을 제공하고 있으며, 실증 분석 결과를 기반으로 제품구전의 성공적인 확산을 위한 커뮤니케이션 전략 수립에 필요한 가이드라인을 제공하여 준다.

  • PDF

고령운전자 운전 및 신체특성을 반영한 교통사고 분석 연구 (Analysis of Elderly Drivers' Accident Models Considering Operations and Physical Characteristics)

  • 임삼진;박준태;김영일;김태호
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.37-46
    • /
    • 2012
  • 65세 이상 고령운전자의 경우 지난 10년 새 교통사고건수는 3만 7,000건에서 27만 4,000건으로 무려 640.5% 증가되었다. 이는 전체사고에서 차지하는 비율이 1.2%에서 3.1배 증가한 3.7%를 차지하고 있는 것으로 교통안전 관련기관에서는 여러 대책을 강구하고 있다. 무엇보다 고령운전자의 행동특성 및 신체특성에 대한 심층연구를 통해 안전대책과 연계하는 방안이 중요하다 할 수 있다. 본 연구에서는 고령운전자의 행동특성을 측정할 수 있는 운전자 적성검사(Driving Aptitude) 항목과 교통사고 자료를 토대로 고령운전자 운전특성과 사고특성을 연결한 실증연구를 수행하였다. 영향모형 개발을 위해 활용한 방법론은 영과잉 회귀모형을 적용하였고, ZIP 회귀모형과 ZINB 회귀모형에 대하여 베이지안 추론을 이용한 사고예측 모형을 선택하였다. AAE분석결과 ZIP 회귀모형이 적합하며, 3가지 변수속도예측, 주의전환, 인지능력이 고령자사고와 영향관계에 있음을 확인할 수 있었다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.