• 제목/요약/키워드: data based model

검색결과 20,785건 처리시간 0.052초

불균형 데이터 환경에서 변수가중치를 적용한 사례기반추론 기반의 고객반응 예측 (Response Modeling for the Marketing Promotion with Weighted Case Based Reasoning Under Imbalanced Data Distribution)

  • 김은미;홍태호
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.29-45
    • /
    • 2015
  • 고객반응 예측모형은 마케팅 프로모션을 제공할 목표고객을 효과적으로 선정할 수 있도록 하여 프로모션의 효과를 극대화 할 수 있도록 해준다. 오늘날과 같은 빅데이터 환경에서는 데이터 마이닝 기법을 적용하여 고객반응 예측모형을 구축하고 있으며 본 연구에서는 사례기반추론 기반의 고객반응 예측모형을 제시하였다. 일반적으로 사례기반추론 기반의 예측모형은 타 인공지능기법에 비해 성과가 낮다고 알려져 있으나 입력변수의 중요도에 따라 가중치를 상이하게 적용함으로써 예측성과를 향상시킬 수 있다. 본 연구에서는 프로모션에 대한 고객의 반응여부에 영향을 미치는 중요도에 따라 입력변수의 가중치를 산출하여 적용하였으며 동일한 가중치를 적용한 예측모형과의 성과를 비교하였다. 목욕세제 판매데이터를 사용하여 고객반응 예측모형을 개발하고 로짓모형의 계수를 적용하여 입력변수의 중요도에 따라 가중치를 산출하였다. 실증분석 결과 각 변수의 중요도에 기반하여 가중치를 적용한 예측모형이 동일한 가중치를 적용한 예측모형보다 높은 예측성과를 보여주었다. 또한 고객 반응예측 모형과 같이 실생활의 분류문제에서는 두 범주에 속하는 데이터의 수가 현격한 차이를 보이는 불균형 데이터가 대부분이다. 이러한 데이터의 불균형 문제는 기계학습 알고리즘의 성능을 저하시키는 요인으로 작용하며 본 연구에서 제안한 Weighted CBR이 불균형 환경에서도 안정적으로 적용할 수 있는지 검증하였다. 전체데이터에서 100개의 데이터를 무작위로 추출한 불균형 환경에서 100번 반복하여 예측성과를 비교해 본 결과 본 연구에서 제안한 Weighted CBR은 불균형 환경에서도 일관된 우수한 성과를 보여주었다.

A Study on the Time-Dependent Bonus-Malus System in Automobile Insurance

  • Kang, Jung-Chul
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.1147-1157
    • /
    • 2005
  • Bonus-Malus system is generally constructed based on claim frequency and Bayesian credibility model is used to represent claim frequency distribution. However, there is a problem with traditionally used credibility model for the purpose of constructing bonus-malus system. In traditional Bonus-Malus system adopted credibility model, individual estimates of premium rates for insureds are determined based solely on the total number of claim frequency without considering when those claims occurred. In this paper, a new model which is a modification of structural time series model applicable to counting time series data are suggested. Based on the suggested model relatively higher premium rates are charged to insured with more claim records.

  • PDF

강우-유출 자료에 의한 Clark 모형의 저류상수 결정 (Determination of the Storage Constant for the Clark Model by based on the Observed Rainfall-Runoff Data)

  • 안태진;최광훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1454-1458
    • /
    • 2007
  • The determination of feasible design flood is the most important to control flood damage in river management. Model parameters should be calibrated using observed discharge but due to deficiency of observed data the parameters have been adopted by engineer's empirical sense. Storage constant in the Clark unit hydrograph method mainly affects magnitude of peak flood. This study is to estimate the storage constant based on the observed rainfall-runoff data at the three stage stations in the Imjin river basin and the three stage stations in the Ansung river basin. In this study four methods have been proposed to estimate the storage constant from observed rainfall-runoff data. The HEC-HMS model has been adopted to execute the sensitivity of storage constant. A criteria has been proposed to determine storage constant based on the results of the observed hydrograph and the HEC-HMS model.

  • PDF

A Prediction Model Based on Relevance Vector Machine and Granularity Analysis

  • Cho, Young Im
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제16권3호
    • /
    • pp.157-162
    • /
    • 2016
  • In this paper, a yield prediction model based on relevance vector machine (RVM) and a granular computing model (quotient space theory) is presented. With a granular computing model, massive and complex meteorological data can be analyzed at different layers of different grain sizes, and new meteorological feature data sets can be formed in this way. In order to forecast the crop yield, a grey model is introduced to label the training sample data sets, which also can be used for computing the tendency yield. An RVM algorithm is introduced as the classification model for meteorological data mining. Experiments on data sets from the real world using this model show an advantage in terms of yield prediction compared with other models.

게임 데이터 요소의SCORM 데이터 모델에의 적용 방안 (Applying Game Data Elements to SCORM Data Model)

  • 최용석
    • 컴퓨터교육학회논문지
    • /
    • 제10권2호
    • /
    • pp.65-75
    • /
    • 2007
  • e-러닝 콘텐츠 및 시스템을 효과적으로 개발할 수 있게 하기 위한 기술 표준안으로서 개발 중인 SCORM은 전세계적으로 가장 많은 e-러닝 관련 업체에서 폭 넓게 수용하고 있는 구현 참조 모델이다. 최근들어 게임을 학습에 활용하고자 하는 노력에 대한 관심이 고조되고 있는 상황에서 SCORM을 개발한 ADL에서는 게임 기반 학습에 대한 기초 연구를 수행하고 있는 실정이다. 그러나 ADL은 SCORM 명세에 대한 연구와 게임 기반 학습에 대한 연구를 분리하여 따로 진행하고 있고 대부분의 SCORM 콘텐츠에 대한 연구는 고전적 훈련 및 교육 방법에 대한 웹 기반 온라인화에 초점을 두고 있으므로, 게임 데이터 요소를 적용한 SCORM 콘텐츠를 개발하기 위하여 SCORM 명세의 구체적인 어떠한 부분을 어떻게 활용할 것인가에 대한 연구는 매우 미흡한 실정이다. 본 연구에서는 게임 데이터 요소를 SCORM 데이터 모델에 적용하는 구체적 방안에 대한 연구를 수행하고 이를 바탕으로 SCORM을 게임 기반 학습 콘텐츠 개발에 적용하는 실제 사례를 제시한다.

  • PDF

Modelling Online Word-of-Mouth Effect on Korean Box-Office Sales Based on Kernel Regression Model

  • Park, Si-Yun;Kim, Jin-Gyo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권4호
    • /
    • pp.995-1004
    • /
    • 2007
  • In this paper, we analyse online word-of-mouth and Korean box-office sales data based on kernel regression method. To do this, we consider the regression model with mixed-data and apply the least square cross-validation method proposed by Li and Racine (2004) to the model. We found the box-office sales can be explained by volume of online word-of-mouth and the characteristics of the movies.

  • PDF

System Reliability Estimation in Bivariate Pareto Model Affected by Common Stress : Bivariate Random Censored Data Case

  • Cho, Jang-Sik
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.791-799
    • /
    • 2005
  • We consider two components parallel system in which the lifetimes have the bivariate Pareto model with bivariate random censored data. We assume that bivariate Pareto model is affected by common stress which is independent of the lifetimes of the components. We obtain estimators for the system reliability based on likelihood function and relative frequency. Also we construct approximated confidence intervals for the reliability based on maximum likelihood estimator and relative frequency estimator, respectively. Finally we present a numerical study.

  • PDF

제품, 공정, 서비스 통합 설계를 지원하는 제품자료모델 (Product Data Model for Supporting Integrated Product, Process, and Service Design)

  • 도남철
    • 대한산업공학회지
    • /
    • 제38권2호
    • /
    • pp.98-106
    • /
    • 2012
  • The current market preassure of least environmental effects of products needs companies to consider whole life cycle of their products during their design phase. To support the integrated and collaborative development of the products, this paper proposed product data model for extended Product Data Managemen (PDM) that can support integrated design of product, manufacturing process, and customer services, based on the consistent and comprehensive PDM databases. The product data model enables design, manufacturing, and service engineers to express their products and services efficiently, with sharing consistent product data, engineering changes, and both economical and environmental evaluations on their design alternatives. The product data model was implemented with a prototype PDM system, and validated through an example product. The result shows that the PDM based on the proposed product data model can support the integrated design for products, manufacturing process, and customer services, and provide an environment of collaborative product development for design, manufacturing and service engineers.

데이터 분석적 사고력 향상을 위한 딥러닝 기반 학습 시스템 개발 연구 (A Study on Development Deep Learning Based Learning System for Enhancing the Data Analytical Thinking)

  • 이영호;구덕회
    • 정보교육학회논문지
    • /
    • 제21권4호
    • /
    • pp.393-401
    • /
    • 2017
  • 본 연구의 목적은 학습자의 데이터 분석적 사고력 향상을 위한 딥러닝 기반 학습 시스템 개발 연구이다. 연구의 내용은 다음과 같다. 첫째, 데이터 분석적 사고력 향상을 위해 발견학습 모형에 딥러닝 기법을 적용하였다. 이는 데이터의 관계를 나타내주는 모델을 딥러닝 기법을 사용하여 생성하고, 새로운 데이터를 이 모델에 적용하여 데이터를 분석하는 과정을 경험할 수 있는 학습 방법이다. 둘째, 이 학습 방법에 따른 수업을 위한 딥러닝 기반 학습 시스템을 개발하였다. 딥러닝 기법을 사용하여 학습자가 입력한 데이터의 모델을 생성하고 적용할 수 있는 시스템을 개발하였다. 딥러닝을 적용한 발견학습 및 시스템 설계 연구는 데이터의 중요성이 더욱 커지는 미래 사회에서 학습자의 데이터 분석적 사고력을 향상시킬 수 있는 새로운 접근이 될 것으로 기대한다.

전문가시스템을 이용한 CAD 모델 수정 시스템 (A CAD Model Healing System with Rule-based Expert System)

  • 한순흥;천상욱;양정삼
    • 대한기계학회논문집A
    • /
    • 제30권3호
    • /
    • pp.219-230
    • /
    • 2006
  • Digital CAD models are one of the most important assets the manufacturer holds. The trend toward concurrent engineering and outsourcing in the distributed development and manufacturing environment has elevated the importance of high quality CAD model and its efficient exchange. But designers have spent a great deal of their time repairing CAD model errors. Most of those poor quality models may be due to designer errors caused by poor or incorrect CAD data generation practices. In this paper, we propose a rule-based approach for healing CAD model errors. The proposed approach focuses on the design history data representation from a commercial CAD model, and the procedural method for building knowledge base to heal CAD model. Through the use of rule-based approach, a CAD model healing system can be implemented, and experiments are carried out on automobile part models.