• 제목/요약/키워드: 의사결정 나무 분석

검색결과 409건 처리시간 0.022초

의사결정나무분석을 활용한 방문 만족도, 재방문 의사, 타인 권유 의사 결정요인 분석 - 코로나19 상황에서의 한국 방문 외래관광객을 대상으로 - (Determinants of Satisfaction, Revisit Intention, and Recommendation Intention Using Decision Tree Analysis - Foreign Tourists Visiting Korea during the COVID-19 Pandemic -)

  • 김원식
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.129-136
    • /
    • 2023
  • 본 연구의 목적은 한국 관광 수요가 회복되고 있는 현시점에서, 코로나19의 위협에도 불구하고 한국을 방문한 외래관광객의 만족도, 재방문 의사, 그리고 타인 권유 의사에 영향을 미치는 요인이 무엇인지를 실증적으로 규명하는데 있다. 이를 위해, 본 연구는 한국관광공사가 2020년 한국을 방문한 외래방문객 8,135명을 대상으로 조사한 자료를 활용하였다. 조사자료가 연속형 변수와 범주형 변수가 혼재되어 있어 분석의 타당성을 확보하기 위해 의사결정나무분석을 수행한 결과, 외래방문객 만족도에 영향을 미치는 요인으로는 방문 목적과 체재 기간 중 자가격리 포함 여부로 나타났다. 재방문 의사에 영향을 미치는 요인으로는 방문 목적, 방문 횟수, 그리고 체재 기간 중 자가격리 포함 여부 그리고 타인 권유 의사에 영향을 미치는 요인으로는 방문 목적, 체류 기간, 성별로 확인되었다. 분석 결과를 토대로, 본 연구는 이런 요인과 만족도, 재방문 의사, 그리고 타인 권유 의사 간의 관계에 대한 설명뿐만 아니라 관광 활성화를 위한 시사점을 제시하였다.

다중외적연관성규칙을 이용한 불필요한 입력변수 제거에 관한 연구 (A study on removal of unnecessary input variables using multiple external association rule)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.877-884
    • /
    • 2011
  • 의사결정나무는 데이터마이닝의 대표적인 알고리즘으로서, 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법이다. 일반적으로 의사결정나무의 모형 생성 시, 입력 변수의 수가 많을 경우 생성된 의사결정모형은 복잡한 형태가 될 수 있고, 모형 탐색 및 분석에 있어 어려움을 겪기도 한다. 이때 입력변수들 간의 내재적인 관련성은 없으나, 외적 변수에 의하여 각 변수가 우연히 어떤 다른 변수와 연결됨으로써 관련성이 있는 것으로 나타나는 것을 종종 볼 수 있다. 이에 본 논문에서는 의사결정나무 생성 시, 입력 변수에 대한 외적 관계를 파악할 수 있는 다중외적연관성규칙을 이용하여 의사결정나무 생성에 불필요한 입력변수를 제거하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

기계학습 기반의 영화흥행예측 방법 비교: 인공신경망과 의사결정나무를 중심으로 (A Comparison of Predicting Movie Success between Artificial Neural Network and Decision Tree)

  • 권신혜;박경우;장병희
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권4호
    • /
    • pp.593-601
    • /
    • 2017
  • 본 연구는 영화산업의 가치사슬단계에 따라 각 단계에서 고려할 수 있는 변인을 활용하여 제작/투자, 배급, 상영단계별 모형을 구성하였다. 모형의 예측력을 높이기 위해 회귀분석으로 유의미한 변인을 도출하여 모형을 추가로 설정하였다. 주어진 변인을 바탕으로 기계학습 분석방법인 인공신경망과 의사결정나무 분석방법 간의 예측력 차이를 비교하였다. 분석 결과, 제작/투자 모형과 배급 모형에서 모든 변인을 투입했을 때는 인공신경망의 정확도가 의사결정나무보다 높았으나, 회귀분석결과에 따라 선정된 변인을 투입하였을 때는 의사결정나무의 정확도가 더 높았다. 상영 모형에서는 회귀분석결과의 반영여부와 관계없이 인공신경망의 정확도가 의사결정나무의 정확도보다 높게 나타났다. 본 논문은 영화흥행 예측연구에 기계학습기법을 적용하여 예측성과가 향상됨을 확인하였다는데 의의가 있다. 선형회귀분석 결과를 기계학습기법에 반영함으로써 기존의 선형적 분석방법의 한계를 극복하고자 하였다.

연속형 반응변수를 위한 데이터마이닝 방법 성능 향상 연구 (A study for improving data mining methods for continuous response variables)

  • 최진수;이석형;조형준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.917-926
    • /
    • 2010
  • 배깅과 부스팅의 기법은 예측력을 향상 시킨다고 알려져 있다. 이는 비교 실험을 통하여 성능이 검증 되었는데, 목표변수가 범주형인 경우에 특정 의사결정나무 알고리즘인 회귀분류나무만 주로 고려되었다. 본 논문에서는 의사결정나무 외에도 다른 데이터마이닝 방법도 고려하여 목표변수가 연속형인 경우에 배깅과 부스팅 기법의 성능 검증을 위한 비교 실험을 실시하였다. 구체적으로, 데이터마이닝 알고리즘 기법인 선형회귀, 의사결정나무, 신경망에 배깅 및 부스팅 앙상블 기법을 결합하여 8개의 데이터를 비교 분석하였다. 실험 결과로 연속형 자료에 대한 여러 데이터마이닝 알고리즘에도 배깅과 부스팅의 기법이 성능 향상에 도움이 되는 것으로 확인되었다.

엔트로피 지도 CRF를 이용한 한국어 어절 구문태그 예측 (Eojeol Syntactic Tag Prediction of Korean Text using Entropy Guided CRF)

  • 오진영;차정원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.395-399
    • /
    • 2009
  • 본 연구에서는 의사결정나무와 Conditional Random Fields(CRFs)를 이용하여 한국어 어절 구문태그를 예측하는 시스템에 대해서 설명한다. 기계학습에서 자질의 선택은 작성자의 직관에 의해서 주로 이루어지는데 이는 작성자의 지식에 의존한다. 본 연구에서는 의사결정나무를 사용하여 보다 체계적으로 조합이 이루어지도록 하였다. 또한 오류 분석을 통하여 최적의 자질이 무엇인지를 파악하여 최고의 성능을 보이도록 하였다. 실험을 통하여 본 논문에서 제안한 방법이 성능향상에 도움이 된다는 것을 확인할 수 있어 앞으로 구문 분석에 많은 도움이 될 것이라고 확신한다.

Development of Discernment Analysis System by Graphical User Interface

  • 차경준;신영재;이용균
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 추계 학술발표회 논문집
    • /
    • pp.113-117
    • /
    • 2006
  • 우리는 다양한 자료에서 유의미한 정보를 파악하기 위한 방법으로 다변량 분석 방법 중에서 정준판별분석, 로지스틱, 다층퍼셉트론 그리고 의사결정나무를 사용자 편의를 극대화하고 사용이 간단한 비주얼 베이직 6.0을 이용하여 개발하였다.

  • PDF

의사결정나무기법을 이용한 건설재해 사전 예측모델 개발 (Prediction Model of Construction Safety Accidents using Decision Tree Technique)

  • 조예림;김연철;신윤석
    • 한국건축시공학회지
    • /
    • 제17권3호
    • /
    • pp.295-303
    • /
    • 2017
  • 건설 산업 재해 예방을 위한 연구와 노력에도 불구하고 최근 7년간 국내 건설업 재해자 수가 꾸준히 증가했다. 건설현장에서 발생하는 재해는 다른 산업군에 비해 강도 높은 재해가 발생할 가능성이 크기 때문에 근본적으로 예방할 수 있는 방법이 필요하다. 따라서 본 연구에서는 모형에 대한 해석이 쉽고 변수의 상호작용 효과 해석이 용이한 의사결정나무 기법을 활용하여 건설재해 예측 모델을 제안하였다. 제안된 건설 재해 사전 예측 모델의 현장 활용 가능성을 평가하기 위하여 판별분석기법 기반 모델과의 건설 재해 예측 정확도를 비교하였다. 검토 결과 판별분석 모델에 비해 의사결정나무 모델의 누적 예측 정확도가 더 높은 것으로 나타났다. 의사결정나무 기법을 이용한 모델은 시간이 지남에 따라 데이터가 증가하기 때문에 예측 정확도가 더욱 높아지게 된다. 따라서 본 연구에서 제안된 건설 재해 예측 모델이 건설현장에서 활용된다면 효과적으로 안전 관리를 할 수 있고, 건설업 재해율 감소에도 기여할 수 있을 것으로 기대한다.

데이터 마이닝 기법을 활용한 스마트팩토리 도입 기업의 특성 분석 (An Analysis of the Characteristics of Companies introducing Smart Factory System Using Data Mining Technique)

  • 오정윤;최상현
    • 한국융합학회논문지
    • /
    • 제9권5호
    • /
    • pp.179-189
    • /
    • 2018
  • 현재 스마트팩토리에 관한 연구는 구축 방안이나 설립 시 고려사항 등에 대해 꾸준히 진행되고 있다. 그러나 스마트 팩토리를 도입한 기업에 대해서는 다양한 연구가 이루어지지 않고 있다. 이 연구에서는 스마트팩토리의 기초단계를 적용한 중소기업을 대상으로 설문조사를 실시하였다. 만족도의 특성을 확인하기 위해 군집분석을 하였고, 만족도에 따라 어떠한 특성을 가지는지 확인하기 위해 의사결정나무와 나이브베이즈 분석을 하였다. 군집분석 결과 만족도가 높은 그룹과 낮은 그룹으로 나뉘는 것을 확인하였으며, 의사결정나무와 나이브베이즈 분석을 실시한 결과 만족도가 높을수록 생산성 개선 정도가 높은 것을 확인하였다.

질환성 심정지 발생의 지역별 변이에 관한 연구 (A Study on Regional Variations for Disease-specific Cardiac Arrest)

  • 박일수;김은주;김유미;홍성옥;김영택;강성홍
    • 디지털융복합연구
    • /
    • 제13권1호
    • /
    • pp.353-366
    • /
    • 2015
  • 본 연구의 목적은 심정지 발생의 지역별 변이요인을 규명하는 것이다. 분석을 위하여 244개 행정구역별로 건강상태 및 심정지발생에 관한 지표를 수집하여 분석용 데이터 셋을 구축하였다. 지표 선정을 위해 질병관리본부의 2010년 심정지 조사자료와 지역사회 건강조사자료를 이용하였다. 자료 분석은 다중회귀분석, 지리적 가중회귀분석, 의사결정나무분석 기법을 이용하였다. 의사결정나무를 이용하여 심정지 발생의 지역별 변이를 설명하는 최종 모형을 설정하였다. 최종 모형인 의사결정나무에 근거한 지역별 변이요인은 인구밀도, 고혈압 평생의사 경험진단율, 스트레스 인지율, 고지혈증 평생의사 경험진단율, 우울증 경험률, 건강검진 수검율, 고위험음주율, 현재 흡연율로 나타났다. 심정지 발생을 감소시키기 위한 지역별 보건정책의 수립은 지역의 건강상태, 건강행위 및 사회경제적 요인 등에 근거하여 이루어질 필요가 있다.

지열 히트펌프 시스템의 데이터 마이닝 기반 성능 예측 기술 (Data Mining-Based Performance Prediction Technology of Geothermal Heat Pump System)

  • 황민혜;박명규;전인기;손병후
    • 대한기계학회논문집 C: 기술과 교육
    • /
    • 제4권1호
    • /
    • pp.27-34
    • /
    • 2016
  • 지열 시스템을 대상으로 데이터 마이닝 기반 성능 예측 모델을 구축하였다. 지열 시스템의 실시간 성능 분석과 예측에 필요한 데이터의 기본 조건을 검토한 후, 데이터베이스의 구조를 설계하였다. 먼저 시스템 성능계수(COP)와 전력 소비량을 분석 대상으로 설정한 후, 이들 물리량의 추출 주기(1분 5분 10분 30분 60분 간격)가 예측 결과에 미치는 영향을 분석하였다. 이어서 범주형과 수치형 의사결정나무 모델을 적용하여 시스템의 성능을 예측하였다. 범주형 의사결정나무 모델을 적용했을 때, 10분 주기의 예측 결과의 정확도는 97.7%로 가장 높았다. 또한 수치형 의사결정나무 분석 결과를 통해 COP가 변하는 순간의 임계값을 찾을 수 있었다. 본 논문에서 제안한 방법은 지열 시스템의 실시간 성능 분석과 운전 상태 등에 적용할 수 있을 것으로 판단된다.