• 제목/요약/키워드: distribution system an)

검색결과 6,324건 처리시간 0.04초

SaaS 기업의 차별화 및 가격전략이 고객획득성과에 미치는 영향: SaaS 기술성숙도 수준의 매개효과 및 조절효과를 중심으로 (Effects of firm strategies on customer acquisition of Software as a Service (SaaS) providers: A mediating and moderating role of SaaS technology maturity)

  • 채성욱;박승범
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.151-171
    • /
    • 2014
  • SaaS는 사용자가 필요한 소프트웨어를 인터넷을 통해 원격으로 서비스 받을 수 있도록 하는 모델로 소프트웨어 시장에서 차지하는 비중이 커짐과 동시에 관련 분야의 비즈니스 요구사항의 증가에 따라 지속적인 성장이 기대되는 분야이다. 이에 본 연구는 SaaS 공급업체들을 대상으로 기업에서 추구하는 차별화 전략 및 낮은 가격전략과 고객획득성과와의 관계를 살펴보고 더 나아가 이들 간의 관계에서 SaaS 기술성숙도 수준의 매개효과와 조절효과를 알아보고자 하였다. 이를 위해 SaaS 제공업체 및 국내 CNK(commerce net Korea) 데이터베이스에 등록된 업체의 어플리케이션을 대상으로, 175개 기업 총 199개 SaaS 전략사업단위의 설문결과를 분석에 활용하였다. SaaS 기술성숙도가 차별화전략 및 낮은가격전략과 고객획득성과와의 관계를 매개하는지 검증하기 위해 Baron and Kenny (1986)가 제안한 절차에 따라 회귀분석을 실시하였고, SaaS 기술성숙도의 조절효과를 살펴보기 위해 위계적 회귀분석(hierarchical regression analysis) 방법을 적용한 상호작용효과를 검증하였다. 분석결과, 첫째, SaaS 제공업체가 추구하는 차별화 전략(업종특화, 파트너활용, 전담인력수) 및 낮은 가격전략(월이용료, 초기설치비)과 같은 기업전략은 고객획득에 긍정적인 영향을 미치는 것으로 나타났다. 또한, SaaS 공급업체의 기술성숙도 수준(어플리케이션 서비스 제공, 웹 기본 어플리케이션, 웹 서비스 어플리케이션)과 고객 획득성과 간에 유의미한 긍정적인 관계가 있는 것으로 확인되었다. 마지막으로, SaaS 기술성숙도 수준의 기업전략과 고객획득성과와의 관계에 대한 조절효과는 주로 차별화 전략에 대해 나타난 반면, 매개효과는 주로 낮은 가격전략에 대해 나타남을 확인하였다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

한정된 O-D조사자료를 이용한 주 전체의 트럭교통예측방법 개발 (DEVELOPMENT OF STATEWIDE TRUCK TRAFFIC FORECASTING METHOD BY USING LIMITED O-D SURVEY DATA)

  • 박만배
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1995년도 제27회 학술발표회
    • /
    • pp.101-113
    • /
    • 1995
  • The objective of this research is to test the feasibility of developing a statewide truck traffic forecasting methodology for Wisconsin by using Origin-Destination surveys, traffic counts, classification counts, and other data that are routinely collected by the Wisconsin Department of Transportation (WisDOT). Development of a feasible model will permit estimation of future truck traffic for every major link in the network. This will provide the basis for improved estimation of future pavement deterioration. Pavement damage rises exponentially as axle weight increases, and trucks are responsible for most of the traffic-induced damage to pavement. Consequently, forecasts of truck traffic are critical to pavement management systems. The pavement Management Decision Supporting System (PMDSS) prepared by WisDOT in May 1990 combines pavement inventory and performance data with a knowledge base consisting of rules for evaluation, problem identification and rehabilitation recommendation. Without a r.easonable truck traffic forecasting methodology, PMDSS is not able to project pavement performance trends in order to make assessment and recommendations in the future years. However, none of WisDOT's existing forecasting methodologies has been designed specifically for predicting truck movements on a statewide highway network. For this research, the Origin-Destination survey data avaiiable from WisDOT, including two stateline areas, one county, and five cities, are analyzed and the zone-to'||'&'||'not;zone truck trip tables are developed. The resulting Origin-Destination Trip Length Frequency (00 TLF) distributions by trip type are applied to the Gravity Model (GM) for comparison with comparable TLFs from the GM. The gravity model is calibrated to obtain friction factor curves for the three trip types, Internal-Internal (I-I), Internal-External (I-E), and External-External (E-E). ~oth "macro-scale" calibration and "micro-scale" calibration are performed. The comparison of the statewide GM TLF with the 00 TLF for the macro-scale calibration does not provide suitable results because the available 00 survey data do not represent an unbiased sample of statewide truck trips. For the "micro-scale" calibration, "partial" GM trip tables that correspond to the 00 survey trip tables are extracted from the full statewide GM trip table. These "partial" GM trip tables are then merged and a partial GM TLF is created. The GM friction factor curves are adjusted until the partial GM TLF matches the 00 TLF. Three friction factor curves, one for each trip type, resulting from the micro-scale calibration produce a reasonable GM truck trip model. A key methodological issue for GM. calibration involves the use of multiple friction factor curves versus a single friction factor curve for each trip type in order to estimate truck trips with reasonable accuracy. A single friction factor curve for each of the three trip types was found to reproduce the 00 TLFs from the calibration data base. Given the very limited trip generation data available for this research, additional refinement of the gravity model using multiple mction factor curves for each trip type was not warranted. In the traditional urban transportation planning studies, the zonal trip productions and attractions and region-wide OD TLFs are available. However, for this research, the information available for the development .of the GM model is limited to Ground Counts (GC) and a limited set ofOD TLFs. The GM is calibrated using the limited OD data, but the OD data are not adequate to obtain good estimates of truck trip productions and attractions .. Consequently, zonal productions and attractions are estimated using zonal population as a first approximation. Then, Selected Link based (SELINK) analyses are used to adjust the productions and attractions and possibly recalibrate the GM. The SELINK adjustment process involves identifying the origins and destinations of all truck trips that are assigned to a specified "selected link" as the result of a standard traffic assignment. A link adjustment factor is computed as the ratio of the actual volume for the link (ground count) to the total assigned volume. This link adjustment factor is then applied to all of the origin and destination zones of the trips using that "selected link". Selected link based analyses are conducted by using both 16 selected links and 32 selected links. The result of SELINK analysis by u~ing 32 selected links provides the least %RMSE in the screenline volume analysis. In addition, the stability of the GM truck estimating model is preserved by using 32 selected links with three SELINK adjustments, that is, the GM remains calibrated despite substantial changes in the input productions and attractions. The coverage of zones provided by 32 selected links is satisfactory. Increasing the number of repetitions beyond four is not reasonable because the stability of GM model in reproducing the OD TLF reaches its limits. The total volume of truck traffic captured by 32 selected links is 107% of total trip productions. But more importantly, ~ELINK adjustment factors for all of the zones can be computed. Evaluation of the travel demand model resulting from the SELINK adjustments is conducted by using screenline volume analysis, functional class and route specific volume analysis, area specific volume analysis, production and attraction analysis, and Vehicle Miles of Travel (VMT) analysis. Screenline volume analysis by using four screenlines with 28 check points are used for evaluation of the adequacy of the overall model. The total trucks crossing the screenlines are compared to the ground count totals. L V/GC ratios of 0.958 by using 32 selected links and 1.001 by using 16 selected links are obtained. The %RM:SE for the four screenlines is inversely proportional to the average ground count totals by screenline .. The magnitude of %RM:SE for the four screenlines resulting from the fourth and last GM run by using 32 and 16 selected links is 22% and 31 % respectively. These results are similar to the overall %RMSE achieved for the 32 and 16 selected links themselves of 19% and 33% respectively. This implies that the SELINICanalysis results are reasonable for all sections of the state.Functional class and route specific volume analysis is possible by using the available 154 classification count check points. The truck traffic crossing the Interstate highways (ISH) with 37 check points, the US highways (USH) with 50 check points, and the State highways (STH) with 67 check points is compared to the actual ground count totals. The magnitude of the overall link volume to ground count ratio by route does not provide any specific pattern of over or underestimate. However, the %R11SE for the ISH shows the least value while that for the STH shows the largest value. This pattern is consistent with the screenline analysis and the overall relationship between %RMSE and ground count volume groups. Area specific volume analysis provides another broad statewide measure of the performance of the overall model. The truck traffic in the North area with 26 check points, the West area with 36 check points, the East area with 29 check points, and the South area with 64 check points are compared to the actual ground count totals. The four areas show similar results. No specific patterns in the L V/GC ratio by area are found. In addition, the %RMSE is computed for each of the four areas. The %RMSEs for the North, West, East, and South areas are 92%, 49%, 27%, and 35% respectively, whereas, the average ground counts are 481, 1383, 1532, and 3154 respectively. As for the screenline and volume range analyses, the %RMSE is inversely related to average link volume. 'The SELINK adjustments of productions and attractions resulted in a very substantial reduction in the total in-state zonal productions and attractions. The initial in-state zonal trip generation model can now be revised with a new trip production's trip rate (total adjusted productions/total population) and a new trip attraction's trip rate. Revised zonal production and attraction adjustment factors can then be developed that only reflect the impact of the SELINK adjustments that cause mcreases or , decreases from the revised zonal estimate of productions and attractions. Analysis of the revised production adjustment factors is conducted by plotting the factors on the state map. The east area of the state including the counties of Brown, Outagamie, Shawano, Wmnebago, Fond du Lac, Marathon shows comparatively large values of the revised adjustment factors. Overall, both small and large values of the revised adjustment factors are scattered around Wisconsin. This suggests that more independent variables beyond just 226; population are needed for the development of the heavy truck trip generation model. More independent variables including zonal employment data (office employees and manufacturing employees) by industry type, zonal private trucks 226; owned and zonal income data which are not available currently should be considered. A plot of frequency distribution of the in-state zones as a function of the revised production and attraction adjustment factors shows the overall " adjustment resulting from the SELINK analysis process. Overall, the revised SELINK adjustments show that the productions for many zones are reduced by, a factor of 0.5 to 0.8 while the productions for ~ relatively few zones are increased by factors from 1.1 to 4 with most of the factors in the 3.0 range. No obvious explanation for the frequency distribution could be found. The revised SELINK adjustments overall appear to be reasonable. The heavy truck VMT analysis is conducted by comparing the 1990 heavy truck VMT that is forecasted by the GM truck forecasting model, 2.975 billions, with the WisDOT computed data. This gives an estimate that is 18.3% less than the WisDOT computation of 3.642 billions of VMT. The WisDOT estimates are based on the sampling the link volumes for USH, 8TH, and CTH. This implies potential error in sampling the average link volume. The WisDOT estimate of heavy truck VMT cannot be tabulated by the three trip types, I-I, I-E ('||'&'||'pound;-I), and E-E. In contrast, the GM forecasting model shows that the proportion ofE-E VMT out of total VMT is 21.24%. In addition, tabulation of heavy truck VMT by route functional class shows that the proportion of truck traffic traversing the freeways and expressways is 76.5%. Only 14.1% of total freeway truck traffic is I-I trips, while 80% of total collector truck traffic is I-I trips. This implies that freeways are traversed mainly by I-E and E-E truck traffic while collectors are used mainly by I-I truck traffic. Other tabulations such as average heavy truck speed by trip type, average travel distance by trip type and the VMT distribution by trip type, route functional class and travel speed are useful information for highway planners to understand the characteristics of statewide heavy truck trip patternS. Heavy truck volumes for the target year 2010 are forecasted by using the GM truck forecasting model. Four scenarios are used. Fo~ better forecasting, ground count- based segment adjustment factors are developed and applied. ISH 90 '||'&'||' 94 and USH 41 are used as example routes. The forecasting results by using the ground count-based segment adjustment factors are satisfactory for long range planning purposes, but additional ground counts would be useful for USH 41. Sensitivity analysis provides estimates of the impacts of the alternative growth rates including information about changes in the trip types using key routes. The network'||'&'||'not;based GMcan easily model scenarios with different rates of growth in rural versus . . urban areas, small versus large cities, and in-state zones versus external stations. cities, and in-state zones versus external stations.

  • PDF

천연기념물 제374호 제주 평대리 비자나무 숲의 보존·관리방향 설정을 위한 기초연구 (A Basic Study on the Establishment of Preservation and Management for Natural Monument(No.374) Pyeongdae-ri Torreya nucifera forest of Jeju)

  • 이원호;김동현;김재웅;오해성;최병기;이종성
    • 한국전통조경학회지
    • /
    • 제32권1호
    • /
    • pp.93-106
    • /
    • 2014
  • 본 연구는 천연기념물 제374호 제주 평대리 비자나무 숲의 입지환경, 식생자원과 이용 및 관리현황을 조사하고, 현재 적용되는 관리구역에 대한 등급을 설정한 것으로써 다음과 같은 결과를 도출하였다. 첫째, 제주 평대리 비자나무 숲은 토지이용형태가 농업지역으로 변화하면서 대상지 주변지역으로의 개발압력에 의한 영향이 우려되며, 비자나무 숲 내 곶자왈지대는 종 다양성을 확보할 수 있는 기반요소로 원형보존의 관리계획 설정 및 지형의 변화를 야기하는 개발행위는 배제되어야 한다. 둘째, 제주 평대리 비자나무 숲의 소산식물상은 총 91과 263속 353종 41변종 8품종의 402분류군이 조사되었다. 이 중 환경부 지정 법정 멸종위기식물종 중 멸종위기식물 I II급에 해당하는 식물의 분포가 확인되었으나 현재의 서식처 변화 및 종의 병해, 불법 남획 등에 따른 개체 소실에 의해 비자나무 숲 내 종의 절멸 위험도 존재하므로 제주 평대리 비자나무 숲의 관리방안 설정 시 우선적으로 보호되어야 할 대상으로 고려되어야 한다. 셋째, 비자나무가 상관을 대표하는 식생구조를 나타내고 있으나, 노거수 위주의 영속적 관리와 보존전략은 빈약한 연령구조를 야기하였으며, 일부 구역의 인위적 관리에 의한 숲의 건조화, 자연적 천이에 의한 비자나무의 입지 감소 등의 문제점이 발생하는 바, 수목밀도의 조절 및 후계목 증식 등 제주 평대리 비자나무 숲의 특성을 유지할 수 있는 방안의 마련이 필요하다. 넷째, 이용에 따른 탐방로의 훼손이 발견되었으며, 특히 화산송이길의 훼손 및 분담율이 높게 나타났다. 따라서 화산송이의 단순한 보충보다는 현행 탐방로 외에 추가적인 관광루트 개발을 통한 분담율 완화 방안이 고려되어야 한다. 섯째, 제주 평대리 비자나무 숲의 관광요소 중 높은 선호도를 나타내는 식물적 요소는 이용에 관한 압력이 민감하게 작용하고, 비영속적인 특성상 지속적 모니터링이 필요하며, 추가적 관광요소 개발과 동시에 현재 높은 선호도를 나타내는 요소를 적극 활용하는 등의 방안이 마련되어야 한다. 여섯째, 보호강도별 중요도에 따라 I등급 지역은 존속개체군의 유지와 서식처의 훼손을 방지하고, II등급 지역은 연차별 숲의 재생을 위주로 관리방향을 설정하며, III등급 지역은 비자나무 시범림이나 후계목 증식을 위한 지역으로 설정되어야 한다. IV등급 지역은 고유 식생의 교란이 많이 발생하는 곳으로 부분별 휴식년제의 도입이 필요하다. V등급 지역은 비자나무 숲의 관광활용을 위한 서비스 공간 적지에 속한다. 상이한 등급의 지역 인접에 따른 가장자리효과에 대한 방안으로는 상대적으로 등급이 낮은 곳에 환경간섭을 피하기 위한 버퍼존의 설치와 주기적 모니터링이 요구된다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

이차원 고객충성도 세그먼트 기반의 고객이탈예측 방법론 (A Methodology of Customer Churn Prediction based on Two-Dimensional Loyalty Segmentation)

  • 김형수;홍승우
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.111-126
    • /
    • 2020
  • CRM의 하위 연구 분야로 진행되었던 고객이탈예측은 최근 비즈니스 머신러닝 기술의 발전으로 인해 빅데이터 기반의 퍼포먼스 마케팅 주제로 더욱 그 중요도가 높아지고 있다. 그러나, 기존의 관련 연구는 예측 모형 자체의 성능을 개선시키는 것이 주요 목적이었으며, 전체적인 고객이탈예측 프로세스를 개선하고자 하는 연구는 상대적으로 부족했다. 본 연구는 성공적인 고객이탈관리가 모형 자체의 성능보다는 전체 프로세스의 개선을 통해 더 잘 이루어질 수 있다는 가정하에, 이차원 고객충성도 세그먼트 기반의 고객이탈예측 프로세스 (CCP/2DL: Customer Churn Prediction based on Two-Dimensional Loyalty segmentation)를 제안한다. CCP/2DL은 양방향, 즉 양적 및 질적 로열티 기반의 고객세분화를 시행하고, 고객세그먼트들을 이탈패턴에 따라 2차 그룹핑을 실시한 뒤, 이탈패턴 그룹별 이질적인 이탈예측 모형을 독립적으로 적용하는 일련의 이탈예측 프로세스이다. 제안한 이탈예측 프로세스의 상대적 우수성을 평가하기 위해 기존의 범용이탈예측 프로세스와 클러스터링 기반 이탈예측 프로세스와의 성능 비교를 수행하였다. 글로벌 NGO 단체인 A사의 협력으로 후원자 데이터를 활용한 분석과 검증을 수행했으며, 제안한 CCP/2DL의 성능이 다른 이탈예측 방법론보다 우수한 성능을 보이는 것으로 나타났다. 이러한 이탈예측 프로세스는 이탈예측에도 효과적일 뿐만 아니라, 다양한 고객통찰력을 확보하고, 관련된 다른 퍼포먼스 마케팅 활동을 수행할 수 있는 전략적 기반이 될 수 있다는 점에서 연구의 의의를 찾을 수 있다.

농촌지역 주민들의 구취실태와 유발요인 (Halitosis and Related Factors among Rural Residents)

  • 이영옥;홍정표;이태용
    • Journal of Oral Medicine and Pain
    • /
    • 제32권2호
    • /
    • pp.157-175
    • /
    • 2007
  • 본 연구는 농촌지역 주민들의 구취실태를 파악하고 구취에 관련된 요인을 알아봄으로써 구취예방 및 효율적인 구취제거 방안을 마련하는데 기초 자료를 제공하고자 일부 농촌지역의 주민 293명을 대상으로 2006년 1월 4일부터 1월 21일까지 면접설문조사(구강위생관리 행태, 구취관련 질병력, 구취실태), 구취측정, 구강검사, 치아우식활성검사(스나이더검사, 타액분비율검사, 타액완충능검사)를 실시한 결과 다음과 같은 결론을 얻었다. 1. 잇솔질 횟수는 1일 2회가 46.1 %로 가장 많았고, 여자가 남자보다 잇솔질 횟수가 많았다. 매일 혀솔질을 하는 군은 25.6%이었고, 보조 구강위생용품을 사용하는 군은 9.2 %이었다. 2. 평상시 구취를 자각하고 있는 사람은 62.5 %이었고, 구취를 가장 심하게 자각하는 시기는 기상 후가 72.7 %, 구취를 자각하는 부위는 잇몸에서 23.0 %, 구취의 유형으로는 구린 냄새가 37.2 %로 높게 나타났다. 3. 구취측정 결과 OG는 50 ppm미만이 54.3 %, $50{\sim}100ppm$ 범위에 41.6 %로 나타났고, $NH_3$$20{\sim}60ppm$ 범위에 52.6 %로 가장 높았다. 4. 구취관련 질병력별 OG는 치아우식증으로 인한 식편압입, 당뇨병과 구취에 대한 가족력군에서 $50{\sim}100ppm$ 범위에 유의하게 높았으며, $NH_3$는 호흡기계 질환군에서 유의한 차이가 있었다. 5 평상시 구취 자각정도별 OG는 '냄새가 나지 않는다'는 군과 '가끔 냄새가 난다'는 군에서 50 ppm 미만에 각각 55.9 %, 57.5 %로 나타났고, '본인이 느낄 정도로 항상 냄새가 난다'는 군과 '항상 심하게 냄새가 난다'는 군에서 $50{\sim}100ppm$ 범위에 각각 52.0 %, 63.6 %로 높게 나타났으며, $NH_3$는 모두 $20{\sim}60ppm$ 범위에 높게 나타났다. 6. 구강검사별 OG는 치수노출치와 식편압입이 많을수록, 설태지수가 높아질수록 $50{\sim}100ppm$ 범위에 OG값이 증가되었고, $NH_3$는 보철치가 많을수록, 설태지수가 높아질수록 유의하게 증가되었으며, 하악 국소의치군에서 60 ppm 이상으로 유의하게 증가되었다. 7. 스나이더검사는 고도활성이 43.0 %로 가장 높았고, 산 생성균의 활성이 높을수록 OG값이 증가되었다. 자극성 타액분비율 검사는 8.0 ml 이하에서 62.5 %로 가장 높았고, 타액분비율이 많을수록 OG값이 감소된 분포를 보였으며, 타액완충능검사는 0.1N 유산용액의 방울 수가 $6{\sim}10$ 방울에서 58.7 %로 가장 높았고, 타액완충능이 증가될수록 OG값이 냄새를 느끼지 못하는 50 ppm 미만에서 증가되었다. 8. 구강환경과 구취와의 상관관계에서 OG는 타액분비율, 보철치와 음의 상관관계를, 치수노출치, 충전치, 현존치, 설태량, 식편압입과 양의 상관관계를 보였으며, $NH_3$는 우식치와 음의 상관관계를, 보철치, 잇솔질 횟수와 양의 상관관계를 보였다. 9. 다중회귀분석 결과에서 OG에 영향을 주는 요인으로는 여자, 치수노출치, 보철치, 식편압입, 타액분비율, 설태지수, 스나이 더검사의 고도활성이 선정되었고 이들의 설명력은 45.1 %이었으며, NH3에 영향을 주는 요인으로는 여자, 치수노출치, 설태지수, 보철치가 선정되었으며 이들의 설명력은 6.6 %이었다. 이상의 결과를 볼 때, 조사대상 농촌지역 주민들의 구취실태는 구강환경 및 구취관련 요인, 치아우식활성검사의 스나이더 검사, 타액분비율검사와 밀접한 관련이 있음을 시사한다. 따라서 이들 주민들의 구취예방을 위해서는 식후에 올바른 잇솔질 방법 및 혀솔질과 더불어 보조 구강위생용품을 사용하여 식편압입과 설태제거를 해야 할 필요성이 강조된다. 구취의 원인과 그 성분은 매우 복잡하고 다양하므로 개인별 구취발생 요인을 정확하게 분석하기 위해서는 추후 계속적이고, 체계적인 연구가 필요하며, 보건(지)소의 치과위생사를 활용하여 지역사회 주민들에게 계속적인 구강보건교육 프로그램이 제공되어야 한다고 생각된다.

뽕나무 古條揷木의 發根에 關한 組織 및 生化學的 硏究 (Histological and Biochemical Studies on the Rooting of Hard-wood Cuttings in Mulberry (Morus species))

  • 임수호
    • 한국잠사곤충학회지
    • /
    • 제23권1호
    • /
    • pp.1-31
    • /
    • 1981
  • 뽕나무의 古條揷木에 있어서 不定根의 發根力과 가장 密接한 關係가 있다고 생각되는 要因으로서 揷穗의 組織學的인 差異와 生理作用에 重要한 役割을 하는 生長調節物質을 生物的으로 檢定하고, 그 物質의 作用과 糖類, C/N率, 核酸, 아미노酸等 含有物質이 뽕나무의 發根力과 어떤 關係가 있는지를 究明하기 爲한 試驗을 實施하여 다음과 같은 結果를 얻었다. 1. 뽕나무는 系統과 品種에 따라 그 發根力에 큰 差가 있었다. 發根력力이 가장 强한 系統은 M. Lhou(51.00%${\pm}$, 그 다음이 M. alba(37.27%${\pm}$47.59)이며, M. bombycis(31.25%${\pm}$29.11)가 가장 낮았다. 그리고 品種的으로는 檢持, 仲間木, 甲選, 薄葉魯桑이 發根力이 가장 强했고 改良鼠返, 荊桑, 鶴田이 가장 弱했다. 2. 古條揷木에 있어서 發根力과 密接한 關係가 있는 組織的인 差는 厚膜組織을 이루는 石細胞群의 配列狀態로서 發根力이 弱한 品種은 皮層內에 이 組織이 2~3層으로 連結되어 있었고, 發根이 强한 品種群은 連結되어 있지 않고 分散되어 적은 數가 존재하였다. 3. 根基組織과 發根力과의 關係는 發根力이 强한 品種일 수록 그 突出程度가 높은 正의 相關($r=0.78^*$)을 나타내었고, 原始木部의 長 및 幅과도 正의 相關($r=0.73^*$)이 認定되었으며, 皮目과는 가지 表面에 차지하는 面積이 클수록 間接的인 要因의 하나였다. 4. 揷穗에서 抽出한 生長調節物質을 綠豆 幼胚軸을 利用한 生物的 檢定結果 發根力이 强한 品種群에서는 全般的으로 發根을 促進하는 物質의 活性이 높았고 發根力이 弱한 品種群에서는 發根을 抑制하는 物質의 活性이 높은 傾向을 보였다. 5. 發根力이 强한 品種群에서 나타난 發根促進 物質로는 $R_f$ 0~0.1이 phenolic substance로 推測되는 物質이며 $R_f$ 0.3~0.5의 物質은 indole acetic acid이었고 $R_f$ 0.8~1.0은 indole acetic nitrile로 推定되는 生長促進 物質이었다. 6. 揷穗內 各 組織의 生長調節物質은 量的 또는 그들간의 均衡이 다르게 存在하는데 이들 物質은 相助的으로 作用하므로서 發根에 영향을 미치고 特히 冬芽로부터 下降하는 物質이 없으면 發根이 되지 않았는데 그 決定的인 作用時期는 揷木後 1週日間이었다. 7. 發根과 깊은 關係가 있는 揷穗內의 營養物質로서는 炭水化物 및 全糖의 含量이 發根과 各各 正의 相關($r=0.72^*$, $r=0.67^*$)이 認定되었으나 還元糖과는 負相의 相關($r=-0.75^*$)을 나타내었으며 澱粉과는 負의 傾向値를 나타내었다. 8. 發根에 關與하는 營養要素로서 C/N率은 높을수록 發根率이 높았는데($r=0.67^*$) 이것은 炭水化物 含量이 높은데 基因하였다. 9. RNA 및 DNA 含量과 發根力과의 關係는 揷水 當時에는 RNA 및 DNA 含量의 差異가 없었으나 揷水後 RNA의 含量은 發根力이 强한 品種群이 弱한 品種群에 比하여 2週間 顯著히 增加하는 傾向을 보였다. 10. 아니모酸과 發根力과의 關係는 發根力이 높은 品種群에서 aspartic acid 및 cystine의 含量이 높은 傾向을 보였다.

  • PDF

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.