• 제목/요약/키워드: multinomial tree model

검색결과 6건 처리시간 0.017초

세 사건간의 인과관계 판단 (Inferring the Causal Relationship between Three Events)

  • 도경수;최재혁
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.47-75
    • /
    • 2010
  • 인과도식에 의한 하향처리 과정과 빈도 자료 해석에 의한 상향처리 과정이 어떻게 작동하는 지를 알아보기 위해, 세 사건들의 빈도 자료를 주고 인과관계를 판단하게 하였다. 중성 사건들을 주고 판단하게 한 실험 1에서는 Or 구조의 정답율이 높았다. 인과도식 정보와 빈도자료를 주고 판단하게 한 실험 2에서는 Or 구조의 정답율이 높았고, 인과도식과 빈도자료가 일치할 때 정답율이 높았다. 정반응 수와 오반응 수를 대상으로 반응에 이르는 인지과정을 이산적인 과정들의 조합으로 가정하는 Multinomial Processing Tree Modeling을 실시하였다. 모델 피팅 결과 사람들이 빈도자료를 이용하여 인과 구조를 판단할 때 기본적으로 작동하는 인과 도식이 Or 구조라는 점을 시사하는 결과를 얻었다.

  • PDF

데이터마이닝 기법들을 통한 제주 안개 예측 방안 연구 (A Study on Fog Forecasting Method through Data Mining Techniques in Jeju)

  • 이영미;배주현;박다빈
    • 한국환경과학회지
    • /
    • 제25권4호
    • /
    • pp.603-613
    • /
    • 2016
  • Fog may have a significant impact on road conditions. In an attempt to improve fog predictability in Jeju, we conducted machine learning with various data mining techniques such as tree models, conditional inference tree, random forest, multinomial logistic regression, neural network and support vector machine. To validate machine learning models, the results from the simulation was compared with the fog data observed over Jeju(184 ASOS site) and Gosan(185 ASOS site). Predictive rates proposed by six data mining methods are all above 92% at two regions. Additionally, we validated the performance of machine learning models with WRF (weather research and forecasting) model meteorological outputs. We found that it is still not good enough for operational fog forecast. According to the model assesment by metrics from confusion matrix, it can be seen that the fog prediction using neural network is the most effective method.

데이터마이닝을 이용한 박스오피스 예측 (Prediction of box office using data mining)

  • 전성현;손영숙
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1257-1270
    • /
    • 2016
  • 본 연구는 영화 흥행의 척도로서 총 관객수의 예측을 다루었다. 의사결정나무, MLP 신경망모형, 다항로짓모형, support vector machine과 같은 데이터마이닝 분류 기법들을 사용하여 개봉 전, 개봉 일, 개봉 1주 후, 그리고 개봉 2주 후 시점 별로 예측이 이루어진다. 국적, 등급, 개봉 월, 개봉 계절, 감독, 배우, 배급사, 관객수, 그리고 스크린 수와 같은 영화의 내재적인 속성을 나타내는 변수 뿐만 아니라 포털의 평점과 평가자 수, 블로그 수, 뉴스 수와 같은 온라인 구전 변수들이 예측변수로 사용되었다. 10-중 교차 검증에서 신경망모형의 정확도는 개봉 전 시점에서도 90% 이상의 높은 예측력을 보였다. 또한 최종 온라인 구전 변수의 추정치를 예측변수로 추가함으로서 예측의 정확도가 더 높아짐을 볼 수 있다.

Study of Machine-Learning Classifier and Feature Set Selection for Intent Classification of Korean Tweets about Food Safety

  • Yeom, Ha-Neul;Hwang, Myunggwon;Hwang, Mi-Nyeong;Jung, Hanmin
    • Journal of Information Science Theory and Practice
    • /
    • 제2권3호
    • /
    • pp.29-39
    • /
    • 2014
  • In recent years, several studies have proposed making use of the Twitter micro-blogging service to track various trends in online media and discussion. In this study, we specifically examine the use of Twitter to track discussions of food safety in the Korean language. Given the irregularity of keyword use in most tweets, we focus on optimistic machine-learning and feature set selection to classify collected tweets. We build the classifier model using Naive Bayes & Naive Bayes Multinomial, Support Vector Machine, and Decision Tree Algorithms, all of which show good performance. To select an optimum feature set, we construct a basic feature set as a standard for performance comparison, so that further test feature sets can be evaluated. Experiments show that precision and F-measure performance are best when using a Naive Bayes Multinomial classifier model with a test feature set defined by extracting Substantive, Predicate, Modifier, and Interjection parts of speech.

의사결정나무 분석을 활용한 스마트 기기의 사용이 사회관계 확대에 미치는 영향에 관한 탐색적 연구 (A Decision Tree Analysis-based Exploratory Study on the Effects of Using Smart Devices on the Expansion of Social Relationship)

  • 손웅비;장재민
    • 정보화정책
    • /
    • 제26권1호
    • /
    • pp.62-82
    • /
    • 2019
  • 본 연구는 모바일 기기가 사용자의 관계 형성에 어떠한 영향을 미치는지? 영향을 준다고 하면, 그 관계는 부정적인지 혹은 긍정적인지에 대한 실증적인 분석을 하고자 한다. 모든 가능성을 열어두고 모바일 기기 사용을 중심으로 한 일상생활에 대한 탐색적인 고찰을 통해 서술하려는 목적을 가지고 있다. 이를 위해 경기연구원에서 수행한 "모바일 환경 인식에 관한 연구"의 설문조사 원자료를 사용했다. 주요 질문은 모바일 기기 및 사회관계망 서비스(Social Network Service: SNS)이용 및 기기 사용에 대한 의견에 대한 내용이었다. 경기도 전체의 31개 시 군 모두를 공간적 범위로 설정했으며, 최종 유효 표본은 1,004명 이었다. 다항로지스틱모형 및 의사결정나무를 통해 사람들과의 관계 범위 정도를 종속변수로 선정하여 특성을 탐색하였다. 설문에 대한 다항로지스틱 분석결과 인간관계의 범위의 일부 변화가 있는 응답자의 특성은 가족과의 대화, SNS 사용량, 군(郡) 지역 거주, 사용 내용은 뉴스에서 유의미한 변화(+)효과를 보이는 것으로 나타났다. 관계 범위 정도에 영향을 미치는 가장 큰 변수는 SNS 사용량으로 나타났다. 사용량이 많아질수록 관계 범위 정도 역시 많은 변화를 보이고 있다.

교통사고 데이터의 패턴 분석과 Hybrid Model을 이용한 피해자 상해 심각도 예측 (Pattern Analysis of Traffic Accident data and Prediction of Victim Injury Severity Using Hybrid Model)

  • 주영지;홍택은;신주현
    • 스마트미디어저널
    • /
    • 제5권4호
    • /
    • pp.75-82
    • /
    • 2016
  • 우리나라의 경제 성장과 도로 환경의 변화를 통해 국내 자동차 시장이 성장하였으나, 이로 인해 교통사고율 또한 증가하였고, 인명 피해가 심각한 수준이다. 이에 따라, 정부에서는 교통사고 데이터를 개방하고 문제를 해결하기 위한 정책을 수립 및 추진 중이다. 본 논문에서는 교통사고 데이터를 이용하여 클래스의 불균형을 해소하고, Hybrid Model 구축을 통한 교통사고 예측을 위해 원본 교통사고 데이터와 Sampling을 수행한 데이터를 학습 데이터로 사용한다. 두 학습데이터에 연관규칙 학습기법인 FP-Growth 알고리즘을 이용하여 교통사고 상해 심각도와 연관된 패턴을 학습한다. 두 학습 데이터의 연관 패턴을 분석을 통해 같은 연관된 패턴을 추출하고 의사결정트리와 다항 로지스틱 회귀분석기법에 연관된 속성에 가중치를 부여하여 융합형 Hybrid Model을 구축하고 교통사고 피해자 상해 심각도를 예측하는 방법에 대해 제안한다.