• 제목/요약/키워드: 의사결정나무 분석

검색결과 409건 처리시간 0.034초

영화 흥행 예측변수로서 온라인 구전 변수의 효과 (Effect of online word-of-mouth variables as predictors of box office)

  • 전성현;손영숙
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.657-678
    • /
    • 2016
  • 본 연구는 영화 흥행에 미치는 온라인 구전 변수들의 영향을 다루었다. 2012년 부터 2015년까지 4년 동안 국내에서 개봉한 총 관객 수 50만 이상인 276편의 영화에 대한 통계분석 결과 개봉 후 포털의 평가자 수, 개봉 후 블로그 수, 개봉 후 뉴스 수와 같은 온라인 구전의 크기를 나타내는 변수들이 온라인 구전의 방향을 나타내는 개봉 후 포털의 평점이나 혹은 영화의 내재적 속성을 나타내는 변수들로서 감독, 배우, 배급사, 등급, 국적, 개봉 월, 개봉 계절 등 보다 영화 흥행과 더욱 연관성이 있었다.

데이터 마이닝 기법을 이용한 소규모 악성코드 탐지에 관한 연구 (A Study on Detection of Small Size Malicious Code using Data Mining Method)

  • 이택현;국광호
    • 융합보안논문지
    • /
    • 제19권1호
    • /
    • pp.11-17
    • /
    • 2019
  • 최근 인터넷 기술을 악용하는 행위로 인하여 경제적, 정신적 피해가 증가하고 있다. 특히, 신규로 제작되거나 변형된 악성코드는 기존의 정보보호 체계를 우회하여 사이버 보안 위협의 기본 수단으로 활용되고 있다. 이를 억제하기 위한 다양한 연구가 진행되었지만, 실제 악성코드의 많은 비중을 차지하는 소규모 실행 파일에 대한 연구는 미진한 편이다. 본 연구에서는 기존에 알려진 소규모 실행 파일의 특징을 데이터마이닝 기법으로 분석하여 알려지지 않은 악성코드 탐지에 활용할 수 있는 모델을 제안한다. 데이터 마이닝 분석 기법에는 나이브베이지안, SVM, 의사결정나무, 랜덤포레스트, 인공신경망 등 다양하게 수행하였으며, 바이러스토탈의 악성코드 검출 수준에 따라서 개별적으로 정확도를 비교하였다. 결과적으로 분석 파일 34,646개에 대하여 80% 이상의 분류 정확도를 검증하였다.

머신러닝 기반 부산 청년인구 유출위험 요인 분석 (Analysis of Risk Factors for Youth Population Outflow in Busan Based on Machine Learning)

  • 손서영;양혜성;박민서
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.131-136
    • /
    • 2023
  • 지방을 떠나 수도권으로 이동하는 청년들이 나날이 늘고 있다. 청년 유출의 요인을 파악하기 위한 연구들이 다양하게 진행되고 있으나 각 지방별로 분석하는 연구는 부족한 실정이다. 이에 따라 본 연구는 부산의 청년 인구 유출 요인을 분석하고, 머신러닝 기법을 사용해 청년 인구 유출 위험 등급을 예측하고자 한다. 국가통계포털에서 수집한 부산의 구별 데이터를 활용하여 나이대(20대 초반, 20대 후반, 30대 초반)별로 세 그룹으로 나눈 뒤, 의사결정나무와 랜덤 포레스트 알고리즘을 이용해 청년 인구 유출 위험 등급을 분류하고 예측한다. 그 결과, 청년 인구 유출 위험 등급 예측 모델은 나이 그룹별 각각 최고 정확도 0.93, 0.75, 0.63을 갖는다.

데이터마이닝을 활용한 한방분야에서의 데이터베이스 마케팅에 대한 연구 (A Study on the Database Marketing using Data Mining in the Traditional Medicine)

  • 이상영;이윤석
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.271-280
    • /
    • 2005
  • 본 연구에서는 한방분야에서 검진에 영향을 미치는 요인들에 대하여 의사결정나무기법을 이용하여 도출하였고, 군집 분석을 통해 환자들의 특성에 대하여 알아보았다. 또한 질병간 연관성 분석을 재입원 환자 군들의 질병 구조를 파악하기 위하여 실시하였다 아울러 도출된 군집들은 병원수익에 어떤 영향을 미치고 있는지에 대한 결과를 도출하였다. 즉 한방분야에 대하여 데이터마이닝 기법을 적용한 데이터베이스 마케팅을 통해 내원 환자들의 특성을 파악하고 병원 수익에 영향을 미치는 요인들을 실증적으로 도출하였다. 본 연구를 통하여 병원의 효율적인 운영과 활성화를 위한 데이터베이스 마케팅을 실시함으로써 병원 경영 에 효율성을 도모할 수 있을 것이다.

  • PDF

CART 분석을 이용한 지하철 소음모형 개발 및 특성 연구 (The Development of Models and the Characteristics for Subway Noise Using the Classification and Regression Trees)

  • 김태호;이재명;원제무;송인석
    • 한국철도학회논문집
    • /
    • 제10권5호
    • /
    • pp.480-486
    • /
    • 2007
  • 대도시에서 지하철은 많은 도시민들에게 필요한 대중교통수단이다. 그러나 이용수요가 증가함에 따라 환경에 관련된 많은 문제가 발생하였다. 본 연구는 최근 사회적 관심사가 되어 있는 지하철 차내소음 문제를 연구대상으로 선정하였다. 지하철 5호선의 기하구조 및 운영요인을 수집하고, CART분석을 통해 소음자료 특성을 반영한 소음 영향모형을 개발하였다. 모형개발결과 지하철 기하구조 및 운영적 측면의 유형별로 소음에 미치는 영향들에 차이가 있는 것으로 나타났다.

석면 해체 작업의 위험성평가모델 비교 분석 (A Comparative Analysis of Risk Assessment Models for Asbestos Demolition)

  • 김동규;김민승;이수민;김유진;한승우
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2022년도 가을 학술논문 발표대회
    • /
    • pp.99-100
    • /
    • 2022
  • As the danger of exposure to the asbestos has been revealed, the importance of demolition asbestos in existing buildings has been raised. Extensive body of study has been conducted to evaluate the risk of demolition asbestos, but there were confined types of variables caused by not reflecting categorical information and limitations in collecting quantitative information. Thus, this study aims to derive a model that predicts the risk in workplace of demolition asbestos by collecting categorical and continuous variables. For this purpose, categorical and continuous variables were collected from asbestos demolition reports, and the risk assessment score was set as the dependent variable. In this study, the influence of each variable was identified using logistic regression, and the risk prediction model methodologies were compared through decision tree regression and artificial neural network. As a result, a conditional risk prediction model was derived to evaluate the risk of demolition asbestos, and this model is expected to be used to ensure the safety of asbestos demolition workers.

  • PDF

의사결정나무 CART 알고리즘을 이용한 청소년 아침결식 예측 모형: 제7기 (2016-2018년) 국민건강영양조사 자료분석 (A prediction model for adolescents' skipping breakfast using the CART algorithm for decision trees: 7th (2016-2018) Korea National Health and Nutrition Examination Survey)

  • 최선아;정성석;노정옥
    • Journal of Nutrition and Health
    • /
    • 제56권3호
    • /
    • pp.300-314
    • /
    • 2023
  • 본 연구는 2016-2018년 국민건강영양조사 자료를 이용하여 청소년의 아침결식과 관련된 요인을 찾고 아침결식 예측모형을 분석하여 청소년의 아침결식 예방 교육 및 정책 수립에 기초 자료를 제공하고자 하였다. 2016-2018년 국민건강영양조사의 참여자는 총 24,269명으로 12-18세의 청소년 중 변수 결측자를 제외한 대상자는 1,024명이며, 이중 아침식사 섭취자 579명, 결식자 445명이었다. 남학생의 49.1%, 여학생의 50.9%가 아침결식자였다. 연령은 아침식사 결식군이 유의적으로 높으며, 결식군의 고등학생 비율이 높았다. 가구소득 4분위수는 아침식사 섭취군의 9.1%, 결식군의 15.4%가 '하'로 유의적인 차이를 보였다. 조사대상자의 신체적 요인은 유의적인 차이를 보이지 않았으나 체중감소를 위해 결식을 하는 경우는 아침식사 결식군의 25.3%, 섭취군의 10.4%로 유의적인 차이를 보였다. 조사대상자의 식습관과 정신건강에서 아침식사 결식군이 섭취군보다 1일 1회이상 외식횟수가 유의적으로 높았으며, 최근 1년간 1주 동안 5-7회 이상의 저녁식사 섭취빈도는 아침섭취군이 유의적으로 높았다. 또한, 아침식사 섭취군은 결식군보다 영양교육 경험이 유의적으로 높았으며, 아침식사 섭취군이 결식군보다 에너지, 단백질, 지방, 탄수화물, 식이섬유, 콜레스테롤, 비타민 A, 비타민 B1, 비타민 B2, 니아신, 비타민 C, 칼슘, 인, 나트륨, 칼륨, 철의 섭취율 및 탄수화물, 단백질, 지방의 섭취비율도 유의적으로 높았다. 아침결식 예측 모형을 도출하기 위해 CART 알고리즘을 사용한 의사결정나무 분석결과, 아침식사 섭취여부를 결정하는 주요인은 투입된 7개의 변수 중 교육수준과 영양교육 경험을 제외한 결식을 통한 체중조절, 가구소득 4분위수, 저녁식사 빈도, 연령, 외식 횟수였다. 체중조절을 위하여 결식을 하는 경우는 아침식사 결식군에서 높았다. 체중조절을 위하여 결식을 하지 않는 대상자는 가구소득 4분위수의 수준에서 소득이 '하', '중하'일 때 아침결식 비율이 높았다. 가구소득수준이 '상', '중상' 대상자의 경우는 저녁식사 빈도가 주 3-4회 이하인 경우 아침결식 비율이 높았다. 저녁식사 빈도가 주 5-7회이더라도 연령이 14.5세 초과인 경우 아침결식을 하고 있으며, 연령이 14.5세 미만인 대상자들은 외식횟수가 일 1회 이상인 경우, 주 6회 이하인 경우 아침결식을 하고 있었다. 따라서 아침결식을 감소시키기 위해서 청소년 대상의 각 그룹의 결식 주요인에 따라 올바른 체중조절 방법, 아침식사 배달, 건강정보에 대한 접근성 높이기, 아침결식과 질병과의 관련성 교육을 위한 토론수업 및 역할놀이 등과 같은 맞춤형 교육이 필요하며, 향후 청소년의 저녁식사 결식 감소 방안에 대한 연구가 추가적으로 진행되어야 하겠다.

시계열 자료의 데이터마이닝을 통한 한국산업표준의 제정과 활용 분석 (Analysis of Enactment and Utilization of Korean Industrial Standards(KS) by Time Series Data Mining)

  • 윤재권;김완;이희상
    • 기술혁신연구
    • /
    • 제23권3호
    • /
    • pp.225-253
    • /
    • 2015
  • 표준은 산업발전 및 무역 자유화의 기반이며 사회 경제적인 효율을 향상시키는 중요한 수단이다. 표준과 관련된 정책은 국가적인 차원에서 중요한 이슈 중 하나가 되고 있으며, 이에 따라 산업 분야별 한국산업표준 제정과 활용에 대한 분석은 표준과 관련된 연구에서 중요한 부분이 되고 있다. 본 연구는 분야별 KS 보유 및 제정현황 분석 그리고 열람실적을 이용하여 표준의 활용도를 분석한다. 먼저 KS의 보유현황을 국가정책적인 이슈와 함께 살펴보고, 세부적으로 KS 제정현황이 유사한 분야들은 무엇인지 파악하기 위해 다차원 척도법을 이용하여 시각화 및 군집화를 실시한다. 이후 각 군집별 제정현황이 유사한 분야들의 표준화 제정활동에 영향을 미치는 결정요인이 무엇인지 가설설정에 따른 회귀분석을 실시한다. 연구결과 자본집약도, 연구개발 그리고 매출액이 표준화 제정활동에 영향을 미치는 것으로 나타났다. 이에 따라 정부는 자본집약도가 큰 기업들이 표준화 과정에서 선도적 역할을 유도하고, 연구개발에 따른 표준과 기술특허 등을 정책적으로 연계시키며, 매출액이 큰 기업들이 표준화 활동을 선도하도록 지원정책을 수립해야 한다. 두 번째로 표준의 활용도를 분석하기 위해, KS 열람실적 데이터를 사용하며, 각 KS의 제정연도, 형태 분야별 활용도가 어떻게 다른지 기초통계분석과 의사결정나무를 사용하여 분석을 수행한다. 그 결과 표준의 제정시기가 활용도에 영향을 크게 미치며, 특정 분야와 형태의 KS들은 최근에 제정되었더라도 활용도가 높은 것으로 나타났다. 이에 따라 열람실적이 낮은 표준들에 대한 홍보 정책과 함께, 표준을 제정할 때 미열람되는 표준이 적어지도록 활용도를 고려하는 정책을 수립해야 한다.

6차산업 경영체 성장단계별 핵심경영요소 탐색 (Exploring the Management Component of Rural Small Business in the 6th Industry at Each Stage of Growth)

  • 김정태
    • 벤처창업연구
    • /
    • 제12권6호
    • /
    • pp.123-138
    • /
    • 2017
  • 본 연구는 6차산업 경영체의 성장단계별 유형특징을 살펴보고, 각 단계별 경영전략의 핵심요소를 찾는데 목적을 두었다. 2015년 6차산업으로 인증된 752개 경영체 자료를 의사결정나무구조 분석의 CART 알고리즘으로 분석하였다. 분석결과 6차산업 유형결정에 초기 성장단계에서는 농산물가공유형, 성장기에는 농산물가공유형, 서비스유형, 지역, 매출액이 작용하고, 성숙기에는 서비스전략, 농산물가공유형이 작용하였다. 이 같은 결과는 6차산업 경영체의 성장단계별 지원될 핵심적 경영요소를 실증적으로 규명하여, 6차산업 지원방향을 제시하고 있다.

  • PDF

초음파를 이용한 한우의 도체육질 예측 (Prediction of Carcass Meat Quality Grade by Ultrasound in Hanwoo)

  • 이용준;김지용;이성기;송영한
    • Journal of Animal Science and Technology
    • /
    • 제47권6호
    • /
    • pp.1095-1100
    • /
    • 2005
  • 본 시험은 초음파진단기를 이용한 한우의 도체육질 예측기법의 확립과 예측율 향상을 목적으로 실시하였다. 도체육질 등급별 초음파 표준화상과 초음파 육질 index를 활용한 decision tree 분석을 이용하여 24개월령 거세한우 66두의 도체육질 등급을 예측하였으며, 그 결과를 요약하면 다음과 같다. 초음파 육질 index를 이용한 의사결정나무 분석 결과, 초음파 화상 내 늑골의 선명도가 육질 등급에 가장 큰 영향을 미치는 것으로 나타났다. 거세한우 66두를 대상으로 초음파 육질 index에 의한 도체육질 등급의 예측율은 86.4%를 나타났으며, 도체 등급별 초음파 표준화상을 이용한 78.8%에 비해 7.6%의 예측율 향상을 보였다.