• 제목/요약/키워드: CART 분석

검색결과 153건 처리시간 0.028초

연관규칙 흥미성 척도의 실용성 향상을 위한 장바구니 크기 효과 반영 방안 (Utilizing the Effect of Market Basket Size for Improving the Practicality of Association Rule Measures)

  • 김원서;정승렬;김남규
    • 정보처리학회논문지D
    • /
    • 제17D권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 연관규칙 마이닝은 물품들 간의 동시 구매 패턴 파악에 사용되는 대표적 마이닝 기법 중 하나로, 카탈로그 설계, 교차판매, 매장배치 등 다양한 마케팅 전략 수립에 활용된다. 방대한 데이터로부터 도출된 많은 연관규칙 중 수익성이 있는 규칙만을 식별해 내는 작업은 지나치게 많은 시간 및 비용을 필요로 한다. 따라서 연관규칙들의 흥미성 평가 과정을 신속하고 체계적으로 수행하기 위해 다양한 흥미성 척도들이 고안되어 왔다. 하지만 신뢰도와 지지도를 비롯한 대다수의 척도들은 대상 물품들의 발생 빈도수에만 근거하여 도출되므로, 실제 판매 현상을 정확하게 반영하지 못한다는 한계를 갖는다. 예를 들어, 기존의 척도는 매우 큰 장바구니에서 동시 구매된 한 건의 거래와 작은 크기의 장바구니에서 동시 구매된 한 건의 거래를 동일한 빈도로 측정한다. 그런데 매우 큰 장바구니에서는 서로 연관관계가 없는 물품들이 우연히 동시에 존재할 가능성이 크므로, 이에 대한 보정이 이루어지는 것이 타당하다. 기존의 척도들과 달리, 본 논문에서는 장바구니 크기 효과를 반영한 흥미성 척도를 새롭게 소개한다. 제안하는 척도는 큰 바구니에서 발생한 패턴과 작은 바구니에서 발생한 패턴에 대해 상이한 가중치를 부여하는 방식으로 계산됨으로써, 우연히 발생한 패턴으로 인해 결과가 왜곡되는 현상을 최소화할 수 있을 것으로 기대된다. 또한, 시뮬레이션 데이터 및 실 데이터에 대한 실험을 통해 제안하는 척도와 기존 척도가 다양한 환경 하에서 보이는 정확성과 일관성을 분석하고 그 결과를 제시하였다.

모바일 배달 애플리케이션 사용성 평가 연구: 한국(배달의민족)과 중국(어러머)을 중심으로 (Research on Usability of Mobile Food Delivery Application: Focusing on Korean Application and Chinese Application)

  • 전양;권은경;채상미
    • 경영정보학연구
    • /
    • 제20권1호
    • /
    • pp.1-16
    • /
    • 2018
  • 최근 인터넷의 발전과 스마트폰 보편화에 따라 배달 애플리케이션의 이용률이 높아지면서 O2O 기반의 외식 배달 시장이 급격하게 성장하고 있다. 본 연구는 한국(배달의민족)과 중국(어러머) 배달애플리케이션의 사용성을 비교 분석하고, 국내 배달 애플리케이션의 개선 방향을 제시하는 것을 목적으로 한다. 연구 방법으로는 1차로 국내외 배달 애플리케이션의 현황을 파악하고, 2차로 피터모빌의 허니콤 모델을 재구성하여, 이를 기준으로 설문조사와 심층인터뷰 진행하였다. 사용성 평가결과를 분석하여 제안된 개선 결과는 다음과 같다. 첫째, 배달의민족의 모든 가맹업체들은 애플리케이션으로 주문이 가능해야 한다. 둘째, 장바구니에 다른 업소의 음식을 동시에 담을 수 있어야 한다. 셋째, 화면 첫 페이지에서 장바구니와 구매내역을 바로 찾아볼 수 있고 첫 페이지에 오늘의 추천 메뉴를 보여주는 것은 사용자의 편의성을 높이는 것에 도움을 준다. 넷째, 검색창을 상단에 고정하면 검색성을 높일 수 있다. 다섯째, 배달 예상 시간과 배달원의 정확한 위치를 확인할 수 있어야 한다. 마지막으로 업소 주소가 명시되고 예상 배달 가능 시간에 대한 보장이 이루어진다면 신뢰성을 높일 수 있다. 본 연구 결과를 통해 국내 배달 애플리케이션 서비스 향상에 기여하기를 기대한다.

연마기 로봇의 강인제어를 위한 역진자의 선형화 모델을 통한 LQ제어 (LQ control by linear model of Inverted Pendulum for Robust Control of Robotic Vacuum Sweeping Machine)

  • 김수영;이재덕;진태석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.529-532
    • /
    • 2012
  • 본 논문은 연마용 로봇의 외부에 대한 강건 제어를 위한 방법으로 로봇의 강인제어기법을 테스트하기 위한 방법으로 수평형 도립진자를 이용하여 제안한 기법을 선형화된 모델을 기반으로 제어하고자 한다. 수평형 도립진자를 이용한 복잡한 동특성 분석과 비선형 시스템의 수학적 모델링을 통해 수식화하였고, 선형화된 상태공간방정식을 이용하는 현대제어인 슬라이드 모드 제어를 도입하여 시스템 제어를 해보았다. 또한, 동역학의 파라미터를 설계하며 또한 알 수 없는 외란과 파라미터 변동을 추정하는 외란 관측기를 사용하여 더욱 제어 시스템에 강인성을 실험결과로 분석하였다.

  • PDF

격자탐색법을 이용한 의사결정나무 분석 최적 모형 선택 : 직장예비군 지휘관의 직장만족도에 대한 영향 요인 분석을 중심으로 (Selection of the Optimal Decision Tree Model Using Grid Search Method : Focusing on the Analysis of the Factors Affecting Job Satisfaction of Workplace Reserve Force Commanders)

  • 정철우;정원영;신다윗
    • 한국경영과학회지
    • /
    • 제40권2호
    • /
    • pp.19-29
    • /
    • 2015
  • The purpose of this study is to suggest the grid search method for selecting an optimal decision tree model. It chooses optimal values for the maximum depth of tree and the minimum number of observations that must exist in a node in order for a split to be attempted. Therefore, the grid search method guarantees building a decision tree model that shows more precise and stable classifying performance. Through empirical analysis using data of job satisfaction of workplace reserve force commanders, we show that the grid search method helps us generate an optimal decision tree model that gives us hints for the improvement direction of labor conditions of Korean workplace reserve force commanders.

태양복사 및 기상요소의 고농도 오존형성에 대한 상관성 분석 (Correlation analysis of solar radiation and meteorological parameters on high ozone concentration)

  • 안재호
    • KIEAE Journal
    • /
    • 제12권6호
    • /
    • pp.93-98
    • /
    • 2012
  • The concerns on high ozone concentration phenomenon is significantly growing in Seoul metropolitan area including the industry complex area, like Shiwha Banwol area. The aims of this research is the analysis of relationship between high concentrations of $O_3$ and solar radiation parameters in atmosphere. The understanding of the effects of solar radiation intensity, humidity, high air temperature on ozone concentration in a day is very useful to provide a direction for reducing of the high ozone concentration to a local government or a metropolitan government. The correlation analysis between maximum ozone concentration and various meteorological parameters in 2009 - 2011 carried out using IBM's SPSS program. The results showed that the mean correlations coefficient (R) between daily Ozone maximum and solar radiation resulted R = 0.64 during 2011. May - September in 10 air pollution stations. In case of correlations between daily ozone maximum and relative humidity showed negative correlation R = -0.61. The correlation analysis with mean air temperature during 1-3 PM resulted R = 0.29. This low correlation coefficient could be corrected by using of categorized data of ozone concentration. The daily maximum ozone concentration is more dependent on peak solar radiation and high air temperature during 1-3 PM than its simple daily maximum values. The results of this research would be used to develop the high ozone alert system around Seoul metropolitan area. This correlation analysis could be partially integrated to prediction of ozone peak concentration in connection with other methods like classification and regression tree(CART).

장애인 직업재활 분야 활용을 위한 무인 추적 시스템 개발 (Development of Unmanned Tracking System for Part of Vocational Rehabilitation)

  • 김창걸;류근재;송병섭
    • 재활복지공학회논문지
    • /
    • 제8권1호
    • /
    • pp.27-32
    • /
    • 2014
  • 본 연구에서는 근래 활성화되고 있는 직업재활 분야의 장애인의 1차 산업 종사에 활성화를 도모하고자 업무 수행을 보조할 수 있는 장치인 수확물 카트 혹은 업무수행 공구함과 같은 장치의 무인 추적 시스템 개발하였다. 개발된 시스템은 사용자가 원거리에서 수동으로 이동을 제어할 수 있으며 또한, 무인으로 사용자를 추적하는 기능을 탑재하고 있다. 본 연구에서 개발된 시스템의 직업재활 분야의 허용성을 평가하기 위하여 사방이 3미터 이상 개방되어 있는 공간에서 시스템을 Y자와 W자 코스를 주행하여 최종 목적지로부터 오차 범위를 5회 기간 분석하였다. 분석 결과 개발된 시스템이 사용자의 추적을 문제없이 하고 있음을 알 수 있었다.

  • PDF

출발가속주행시 연료소모 및 이산화탄소 배출량 임계가속도 추정 (Estimation the Critical Accelerations for Fuel Consumption and CO2 Emission When Starting a Passenger car)

  • 최은진
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2015년 정기학술대회
    • /
    • pp.201-202
    • /
    • 2015
  • 과거 연료소모량과 오염물질 배출량을 추정하기 위한 연구에서는 주로 속도변수를 이용하였으나, 속도의 변화에 따른 연료소모량 및 오염물질 배출량의 변화를 올바르게 반영하지 못하는 문제점이 대두되었다. 이러한 문제점을 극복할 수 있는 대안으로 평가받는 것이 가속도이다. 이처럼 가속도 변수가 중요하게 다루어지고 있으나 여전히 연료소모량이나 오염물질 배출량과 관련하여 급가속을 판단할 만한 기준이 모호하다. 이에 본 연구에서는 연료소모 및 $CO_2$ 배출량을 증가시켜 급가속으로 판단할 수 있는 가속도 임계치를 추정하고자 하였다. 가속도 임계치 및 모형추정을 위해 LPG 중형 승용차량에 장착한 차량 정보 저장장치로부터 가속 주행실험시 수집한 실시간 데이터를 수집 분석하였다. 가속의 특성상 동일한 가속도라 할지라도 정지상태인지 여부에 따라 동일한 가속도에 대한 연료소모량, $CO_2$ 배출량이 상이하게 나타난다. 따라서 실험을 통해 정지상태에서 가속시 관성을 극복하기 위한 동력이 요구되는 속도의 범위를 확인하고 이중 출발 가속주행시 임계가속도를 도출하였다. 가속 주행실험 결과 연료소모 및 $CO_2$ 배출 증가량이 급격히 증가되는 임계가속도를 도출하기 위해 CART 분석을 이용하였으며, 그 결과 정지 상태에서 가속하는 경우 $2.598m/s^2$, 의 가속도가 연료 및 $CO_2$ 배출량을 크게 증가시키는 임계 가속도인 것으로 추정되었다.

  • PDF

사회 연결망 분석을 이용한 복수전공 유입 및 유출 분석 (Inflow and outflow analysis of double majors using social network analysis)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.693-701
    • /
    • 2012
  • 각 대학마다 복수전공에 대한 선택의 폭이 넓어짐에 따라 학과별 복수전공자의 유입과 유출에 심한 편중현상이 나타나고 있다. 이런 현상의 결과로 특정 학과에서는 과도한 복수전공자의 유입(유출)으로 여러 가지 문제가 발생하고 있다. 따라서 본 논문에서는 사회연결망 분석과 의사결정나무 분석을 이용하여 학과별 복수전공자들의 유입과 유출에 대한 특성을 분석하였다. 분석방법으로 데이터 마이닝의 한 기법인 의사결정나무 모형을 활용하였으며, 분석결과에 대한 적절한 함의를 찾기 위해서 이지분리를 하는 CART 알고리즘을 사용하였다. 분석결과에 따르면, 복수전공 유입에 영향을 미치는 특성으로는 학과별 수능성적이 가장 많은 영향을 미치며, 그 다음으로 계열, 강의평가점수, 취업률의 순서로 나타났다. 한편 복수전공 유출에 영향을 미치는 특성으로는 계열이 가장 많은 영향을 미치며, 그 다음으로 수능성적, 취업률, 강의평가점수의 순서로 나타났다.

의사결정트리를 이용한 교육성과 요인에 관한 연구 (A Study on Factors of Education's Outcome using Decision Trees)

  • 김완섭
    • 공학교육연구
    • /
    • 제13권4호
    • /
    • pp.51-59
    • /
    • 2010
  • 대학에서 운영되는 강좌를 효과적으로 관리하고 교육성과를 향상시키기 위해서는 각 클래스의 현재의 교육성과를 진단하고 교육성과에 영향을 미치는 요인들을 파악하는 과정이 요구된다. 요인을 발견하는 연구에는 연관성 분석, 회귀분석 등의 통계기법들이 많이 사용되고 있으며 최근에는 데이터마이닝의 결정트리 분석도 사용되고 있다. 결정트리 분석은 결과 모델을 이해하기 쉽고 의사결정에 적용하기 쉽다는 장점이 있지만, 다중공선성 등의 입력 데이터의 특성에 견고하지 못한 문제점이 있다. 본 연구에서는 기존의 결정트리 분석의 문제점들을 정리하고, 이 문제점들을 보완하기 위한 하나의 실험적 해결책으로 다중 결정트리를 이용한 요인의 발견 방법을 제안한다. 실험을 통해 다중 결정트리를 수행이 다중 결정트리를 적용할 때보다 신뢰할 수 있는 요인을 발견하고 각 변수의 중요성을 발견할 수 있음을 보였다.

  • PDF

확장된 다중인자 차원축소 (E-MDR) 알고리즘에 기반한 유전자 상호작용 효과 규명 (Study Gene Interaction Effect Based on Expanded Multifactor Dimensionality Reduction Algorithm)

  • 이제영;이호근;이용원
    • 응용통계연구
    • /
    • 제22권6호
    • /
    • pp.1239-1247
    • /
    • 2009
  • 인간의 질병 또는 가축의 경제적인 특성에 관한 유전자의 규명은 매우 중요한 관심사이며, 우리나라 축산업을 대표하는 한우의 유전자원 보존과 능력향상은 매우 중요한 과제이다. 이를 연구하기 위해 기존 EST_based SNP 연관지도를 사용하여 발굴한 유전자로 연구되어왔으나 이는 통계학적 모델에 기반한 연관지도 작성법으로 실제 위치와는 차이가 있을 수 있다. 따라서 Lee (2009)에 의해 EST_based SNP 연관지도와 염기서열 분석으로 작성되어지는 Gene on sequence를 함께 고려하여 한우의 경제형질 연관 후보 DNA marker들이 발견되었다. 한편, 통계모형의 상호작용 효과를 고려할 때, 유전자와 같은 범주형 data에서 범주가 많을 경우 상호작용의 조합이 많아지므로 종종 모수들의 상호작용에 대한 해석과 모형을 결정하는 것이 어려울 수 있다. 그래서 비모수적인 방법으로 다중인자 차원축소방법 (MDR)을 사용해왔으며, 사례_대조 데이터에만 적용가능 MDR방법을 연속형 데이터에도 적용하기 위해 CART알고리즘을 적용한 확장된 다중인자 차원축소방법(E-MDR)이 제안되었다. 본 연구에서는 새롭게 발견된 단일염기다형성 (SNP)으로부터 E-MDR방법을 적용하여 한우의 경제형질(일당중체량, 근내지방도)에 영향을 주는 우수 유전자 단일염기다형성을 규명하였다.