• 제목/요약/키워드: RFE

검색결과 50건 처리시간 0.041초

An Application of Support Vector Machines to Customer Loyalty Classification of Korean Retailing Company Using R Language

  • 응위엔푸티엔;이영찬
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권4호
    • /
    • pp.17-37
    • /
    • 2017
  • Purpose Customer Loyalty is the most important factor of customer relationship management (CRM). Especially in retailing industry, where customers have many options of where to spend their money. Classifying loyal customers through customers' data can help retailing companies build more efficient marketing strategies and gain competitive advantages. This study aims to construct classification models of distinguishing the loyal customers within a Korean retailing company using data mining techniques with R language. Design/methodology/approach In order to classify retailing customers, we used combination of support vector machines (SVMs) and other classification algorithms of machine learning (ML) with the support of recursive feature elimination (RFE). In particular, we first clean the dataset to remove outlier and impute the missing value. Then we used a RFE framework for electing most significant predictors. Finally, we construct models with classification algorithms, tune the best parameters and compare the performances among them. Findings The results reveal that ML classification techniques can work well with CRM data in Korean retailing industry. Moreover, customer loyalty is impacted by not only unique factor such as net promoter score but also other purchase habits such as expensive goods preferring or multi-branch visiting and so on. We also prove that with retailing customer's dataset the model constructed by SVMs algorithm has given better performance than others. We expect that the models in this study can be used by other retailing companies to classify their customers, then they can focus on giving services to these potential vip group. We also hope that the results of this ML algorithm using R language could be useful to other researchers for selecting appropriate ML algorithms.

Distribution and Activities of Hydrolytic Enzymes in the Rumen Compartments of Hereford Bulls Fed Alfalfa Based Diet

  • Lee, S.S.;Kim, C.-H.;Ha, J.K.;Moon, Y.H.;Choi, N.J.;Cheng, K.-J.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제15권12호
    • /
    • pp.1725-1731
    • /
    • 2002
  • The distribution and activities of hydrolytic enzymes (cellulolyti, hemicellulolytic,pectinolytic and others) in the rumen compartments of Hereford bulls fed 100% alfalfa hay based diets were evaluated. The alfalfa proportion in the diet was gradually increased for two weeks. Whole rumen contents were processed into four fractions: Rumen contents including both the liquid and solid fractions were homogenized and centrifuged, and the supernatant was assayed for enzymes located in whole rumen contents (WRE); rumen contents were centrifuged and the supernatant was assayed for enzymes located in rumen fluids (RFE); feed particles in rumen contents were separated manually, washed with buffer, resuspended in an equal volume of buffer, homogenized and centrifuged and supernatant was assayed for enzymes associated with feed particles (FAE); and rumen microbial cell fraction was separated by centrifugation, suspended in an equal volume of buffer, sonicated and centrifuged, and the supernatant was assayed for enzymes bound with microbial cells (CBE). It was found that polysaccharide-degrading proteins such as $\beta$-1,4-D-endoglucanase, $\beta$-1,4-D-exoglucanase, xylanase and pectinase enzymes were located mainly with the cell bound (CBE) fraction. However, $\beta$-D-glucosidase, $\beta$-D-fucosidase, acetylesterase, and $\alpha$-L-arabinofuranosidase were located in the rumen fluids (RFE) fraction. Protease activity distributions were 37.7, 22.1 and 40.2%, and amylase activity distributions were 51.6, 18.2 and 30.2% for the RFE, FAE and CBE fractions, respectively. These results indicated that protease is located mainly in rumen fluid and with microbial cells, whereas amylase was located mainly in the rumen fluid.

러시아 극동지역의 북한노동력과 러시아인의 인종편견에 관한 연구: 중국노동력과의 비교를 중심으로 (A Study about the North Korean Labor Forces and Racial Prejudice of Russians in the Russian Far East: Comparing with the Chinese Labor Forces)

  • 이채문
    • 한국지역지리학회지
    • /
    • 제9권1호
    • /
    • pp.1-23
    • /
    • 2003
  • 본 논문에서는 러시아 극동지역에 진출한 북한 노동력의 상황을 러시아 극동지역의 중국 노동력과 함께 비교 고찰한다. 먼저 러시아 극동지역에서의 북한 노동력과 중국 노동력의 과거와 현재의 상황을 살펴보았고, 그 다음으로 문헌연구를 통하여 북한 노동력과 중국 노동력에 대한 현지 러시아인들의 인종적 성향을 정치적, 경제적, 사회문화적 심리적 그리고 치안 관점에서 고찰하였다. 본 연구의 결과에 의하면 경제적 관점과 치안의 관점에서 볼 때 러시아 극동지역의 북한인과 중국인에 대한 러시아인의 태도는 거의 유사하였다. 양국 모두 러시아 극동지역내부에서 발생되는 사회문제에 빈번하게 관련됨으로서 좋은 반응을 얻지는 못하고 있다. 그러나 정치적 측면과 사회문화적 심리적 측면에서 극동지역의 북한 노동력은 중국 노동력에 비해 훨씬 선호를 받고 있다는 것을 알 수 있었다. 본 논문의 합의는 중국노동력에 대한 극동지역 러시아인의 우려를 감안했을 때, 북한 노동력의 이용으로 한국의 러시아 극동진출은 상당히 중요한 의미를 가진다는 것을 보여주는 것이다.

  • PDF

Intelligent System for the Prediction of Heart Diseases Using Machine Learning Algorithms with Anew Mixed Feature Creation (MFC) technique

  • Rawia Elarabi;Abdelrahman Elsharif Karrar;Murtada El-mukashfi El-taher
    • International Journal of Computer Science & Network Security
    • /
    • 제23권5호
    • /
    • pp.148-162
    • /
    • 2023
  • Classification systems can significantly assist the medical sector by allowing for the precise and quick diagnosis of diseases. As a result, both doctors and patients will save time. A possible way for identifying risk variables is to use machine learning algorithms. Non-surgical technologies, such as machine learning, are trustworthy and effective in categorizing healthy and heart-disease patients, and they save time and effort. The goal of this study is to create a medical intelligent decision support system based on machine learning for the diagnosis of heart disease. We have used a mixed feature creation (MFC) technique to generate new features from the UCI Cleveland Cardiology dataset. We select the most suitable features by using Least Absolute Shrinkage and Selection Operator (LASSO), Recursive Feature Elimination with Random Forest feature selection (RFE-RF) and the best features of both LASSO RFE-RF (BLR) techniques. Cross-validated and grid-search methods are used to optimize the parameters of the estimator used in applying these algorithms. and classifier performance assessment metrics including classification accuracy, specificity, sensitivity, precision, and F1-Score, of each classification model, along with execution time and RMSE the results are presented independently for comparison. Our proposed work finds the best potential outcome across all available prediction models and improves the system's performance, allowing physicians to diagnose heart patients more accurately.

Pre-harvest Sprouting Tolerance Test in Rice with Floury Endosperm

  • Su Kyung Ha;Seo Ho Shin;Hyun-Sook Lee;Chang-Min Lee;Seung Young Lee;Jae-Ryoung Park;Ji-Ung Jeung
    • 한국작물학회:학술대회논문집
    • /
    • 한국작물학회 2022년도 추계학술대회
    • /
    • pp.213-213
    • /
    • 2022
  • Pre-harvest sprouting(PHS) refers to germinating seeds in the mother plant before harvesting under low dormancy and humid climate, deteriorating grain quality, and rice yield. Rice varieties with floury endosperm(RFE) have been developed to boost domestic rice consumption by invigorating the processed rice industry, reducing milling and environmental cost. However, the PHS tolerance of RFE is relatively low in the rice varieties with transparent endosperm(RTE) since they soak moisture rapidly due to soft endosperm. In this study, Baromi2(BR2), floury endosperm, and Jomyeong1(JM1), PHS tolerance donor, were crossed to improve PHS tolerance. Major agronomic traits and PHS tolerance test of ten F7(BR2/JM1) lines were conducted in NICS, 2022. The evaluations of PHS were carried out according to the method of RDA(2012) with slight modifications. Briefly, three panicles were treated and incubated 25℃ in a growth chamber 35 days after the heading date. Ten PHS tolerance promising lines demonstrated floury endosperm. The heading date of BR2 and JM1 was 7/27 and 8/5, respectively. The heading date of promising lines was 7/23~8/10. The PHS rate of BR2 and JM1 exhibited 56.3% and 10.7%, respectively. However, the PHS rate often promising lines demonstrated 2.4%~52.4%, 3 lines significantly lower than BR2. Further studies such as ABA contents are necessary to elucidate the mechanism of PHS tolerance in BR2/JM1. These results may contribute to developing elite RFE lines with improved PHS tolerance.

  • PDF

단거리전용통신을 위한 5.8GHz대역 LNA MMIC 설계 및 구현 (The Design and implementation of a 5.8GHz band LNA MMIC for Dedicated Short Range Communication)

  • 문태정;황성범;김용규;송정근;홍창희
    • 대한전자공학회논문지SD
    • /
    • 제40권8호
    • /
    • pp.549-554
    • /
    • 2003
  • 본 논문에서 단거리전용통신을 위한 차량탑재장치내의 수신단 전반부의 구성부품인 5.8GHz대역 LNA를 MMIC로 설계 및 구현하였다. 설계된 LNA는 두개의 능동소자와 매칭회로, 두개의 드레인 바이어스 회로로 구성되며, 3V의 단일공급전압에서 18mA의 소비전류로 동작한다. 중심주파수 5.8GHz에서 이득 13.4dB, NF 1.94dB, Input IP3-3dBm, S/sub 11/ - l8dB, S/sub 22/ - 13.3dB의 특성을 나타내며, 제작된 회로의 실제 크기는 1.2×0.7㎟ 이다.

RFID와 ZigBee를 이용한 유비쿼터스 u-Health 시스템 구현 (Ubiquitous u-Health System using RFID & ZigBee)

  • 김진태;권영미
    • 대한전자공학회논문지TC
    • /
    • 제43권1호
    • /
    • pp.79-88
    • /
    • 2006
  • 본 논문에서는 RFID와 근거리 무선 통신 기술인 ZigBee를 접목시켜 유비쿼터스 u-Health 시스템을 구현하였다. RFID 태그인식 기술, ZigBee의 데이터 송수신 기술을 이용하는 무선 프로토콜 키트를 만들었고 TinyOS에서 ZigBee의 소프트웨어를 구현하였다. RFID와 접목 가능한 무선 통신 기술들은 Bluetooth, ZigBee, 802.11x WLAN 등이 있다. 논문에서 제시한 환경은 무인간병과 같은 u-Health 시스템으로서, 조밀한 sensor 네트워크 환경을 갖게 되는 병원 등의 환경에 적합하도록 ZigBee를 사용한 것이다. RFID와 ZigBee가 부착되는 디바이스들은 앞으로 팔찌, 손목시계, 반지 등의 크기로 소형화 될 것이다. 본 논문에서 제안하는 RFID와 ZigBee 통합 환경은 WBAN(Wireless Body Area Network) 및 WPAN(Wireless Person Area Network)환경에서 상태 정보를 인식하여 원하는 action들로 반응하도록 요구되는 응용에 활용될 수 있다. 태그의 정보와 환자의 상태에 따라 여러 가지 제약사항을 두어 환자의 단말기에 문자정보의 형태로 LCD에 표시하거나, 음성정보로 메시지를 전송하도록 설계하고 구축하였다 RFID는 어플리케이션의 목적에 맞춰 다양한 무선통신 기술과의 결합을 이루어 나갈 것이다.

조건부 상호정보를 이용한 분류분석에서의 변수선택 (Efficient variable selection method using conditional mutual information)

  • 안치경;김동욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1079-1094
    • /
    • 2014
  • 상호정보 (mutual information)를 이용한 변수 선택법은 반응변수와 설명변수간의 선형적인 연관성뿐만 아니라 비선형적인 연관성을 감지하며, 설명변수 사이의 연관성도 고려하는 좋은 변수선택 방법이다. 하지만 고차원 자료에서 상호정보를 추정하기가 쉽지 않아 이에 대한 연구가 필요하다. Cai 등 (2009)은 조건부 상호정보를 이용한 전진선택법과 가지치기법을 이용하여 이러한 문제를 해결하였으며, 마이크로어레이 자료와 같은 고차원 자료에서 조건부 상호정보를 이용한 변수 선택법으로 선택된 변수들로 구성된 SVM의 분류 성능이 SVM-RFE 및 기존의 필터링 방법으로 선택된 변수들로 구성된 SVM의 분류 성능보다 뛰어남을 보였다. 하지만 조건부 상호정보를 추정할 때 사용된 Parzen window 방법은 변수의 수가 많아질수록 변수 선택 시간이 길어지는 단점으로 인해 이에 대한 보완이 필요하다. 본 논문에서는 조건부 상호정보 계산 시 필요한 설명변수의 분포를 다변량 정규분포로 가정함으로써 변수선택을 위한 계산시간을 단축시키며 동시에 변수선택의 성능을 향상시키고자 한다. 반면, 설명변수의 분포를 다변량 정규분포로 가정한다는 것은 강한 제약이 될 수 있으므로 이를 완화시킨 Edgeworth 근사를 이용한 조건부 상호정보 기반의 변수 선택법을 제안한다. 실증분석을 통해 본 논문에서 제안한 방법의 효율성을 살펴보았으며, 기존의 조건부 상호정보 기반 변수 선택법에 비해 계산 속도나 분류 성능 면에서 우수함을 보였다.

Landslide susceptibility assessment using feature selection-based machine learning models

  • Liu, Lei-Lei;Yang, Can;Wang, Xiao-Mi
    • Geomechanics and Engineering
    • /
    • 제25권1호
    • /
    • pp.1-16
    • /
    • 2021
  • Machine learning models have been widely used for landslide susceptibility assessment (LSA) in recent years. The large number of inputs or conditioning factors for these models, however, can reduce the computation efficiency and increase the difficulty in collecting data. Feature selection is a good tool to address this problem by selecting the most important features among all factors to reduce the size of the input variables. However, two important questions need to be solved: (1) how do feature selection methods affect the performance of machine learning models? and (2) which feature selection method is the most suitable for a given machine learning model? This paper aims to address these two questions by comparing the predictive performance of 13 feature selection-based machine learning (FS-ML) models and 5 ordinary machine learning models on LSA. First, five commonly used machine learning models (i.e., logistic regression, support vector machine, artificial neural network, Gaussian process and random forest) and six typical feature selection methods in the literature are adopted to constitute the proposed models. Then, fifteen conditioning factors are chosen as input variables and 1,017 landslides are used as recorded data. Next, feature selection methods are used to obtain the importance of the conditioning factors to create feature subsets, based on which 13 FS-ML models are constructed. For each of the machine learning models, a best optimized FS-ML model is selected according to the area under curve value. Finally, five optimal FS-ML models are obtained and applied to the LSA of the studied area. The predictive abilities of the FS-ML models on LSA are verified and compared through the receive operating characteristic curve and statistical indicators such as sensitivity, specificity and accuracy. The results showed that different feature selection methods have different effects on the performance of LSA machine learning models. FS-ML models generally outperform the ordinary machine learning models. The best FS-ML model is the recursive feature elimination (RFE) optimized RF, and RFE is an optimal method for feature selection.

하천에 유입된 유해화학물질의 역추적을 위한 기계학습 프레임워크 개발 (Development of machine learning framework to inverse-track a contaminant source of hazardous chemicals in rivers)

  • 권시윤;서일원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.112-112
    • /
    • 2020
  • 하천에서 유해화학물질 유입 사고 발생 시 수환경 피해를 최소화하기 위해 신속한 초기 대응이 필요하다. 따라서, 본 연구에서는 수환경 화학사고 대응 시스템 구축을 위해 하천 실시간 모니터링 지점에서 관측된 유해화학물질의 농도 자료를 이용하여 발생원의 유입 지점과 유입량을 역추적하는 프레임워크를 개발하였다. 본 연구에서 제시하는 프레임워크는 첫 번째로 하천 저장대 모형(Transient Storage Zone Model; TSM)과 HEC-RAS 모형을 이용하여 다양한 유량의 수리 조건에서 화학사고 시나리오를 생성하는 단계, 두번째로 생성된 시나리오의 유입 지점과 유입량에 대한 시간-농도 곡선 (BreakThrough Curve; BTC)을 21개의 곡선특징 (BTC feature)으로 추출하는 단계, 최종적으로 재귀적 특징 선택법(Recursive Feature Elimination; RFE)을 이용하여 의사결정나무 모형, 랜덤포레스트 모형, Xgboost 모형, 선형 서포트 벡터 머신, 커널 서포트 벡터 머신 그리고 Ridge 모형에 대한 모형별 주요 특징을 학습하고 성능을 비교하여 각각 유입 위치와 유입 질량 예측에 대한 최적 모형 및 특징 조합을 제시하는 단계로 구축하였다. 또한, 현장 적용성 제고를 위해 시간-농도 곡선을 2가지 경우 (Whole BTC와 Fractured BTC)로 가정하여 기계학습 모형을 학습시켜 모의결과를 비교하였다. 제시된 프레임워크의 검증을 위해서 낙동강 지류인 감천에 적용하여 모형을 구축하고 시나리오 자료 기반 검증과 Rhodamine WT를 이용한 추적자 실험자료를 이용한 검증을 수행하였다. 기계학습 모형들의 비교 검증 결과, 각 모형은 가중항 기반과 불순도 감소량 기반 특징 중요도 산출 방식에 따라 주요 특징이 상이하게 산출되었으며, 전체 시간-농도 곡선 (WBTC)과 부분 시간-농도 곡선 (FBTC)별 최적 모형도 다르게 산출되었다. 유입 위치 정확도 및 유입 질량 예측에 대한 R2는 대부분의 모형이 90% 이상의 우수한 결과를 나타냈다.

  • PDF