• 제목/요약/키워드: 다중선형회귀모형

검색결과 135건 처리시간 0.022초

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

전자빔 공정에서 실험계획법을 이용한 살균제 Benomyl의 제거특성 및 독성평가 (Decomposition Characteristics of Fungicides(Benomyl) using a Design of Experiment(DOE) in an E-beam Process and Acute Toxicity Assessment)

  • 유승호;조일형;장순웅;이시진;천석영;김한래
    • 대한환경공학회지
    • /
    • 제30권9호
    • /
    • pp.955-960
    • /
    • 2008
  • 본 연구는 전자빔 공정에서 실험계획법(design of experiment: DOE) 중 일반요인배치법(general factorial design)을 이용하여 2개 인자(X$_1$: benomyl concentration(mg/L), X$_2$: E-beam irradiation(Gy))를 토대로 요인(X$_1$: benomyl concentration) 1에서 3개 수준(3 level: 0.5, 1 및 1.5 mg/L)와 요인(X$_2$: E-beam irradiation) 2에서 6개 수준(6 level: 100, 800, 600, 400, 200 및 100 Gy)으로 구성된 3블록(block) 실험조합에 따라 Benomyl의 분해(Y$_1$: the % of decomposition), 무기화(Y$_2$: the % of materialization) 및 독성평가(acute toxicity assessment)를 수행하였다. 우선 HPCL 분석에 의한 Benomyl에 분해특성은 처리조합(treatment combination) 3 블록(block)의 17 및 18번을 제외한 모든 실험조건에서 100% 분해되었고 등분산(equal variance) 조건에서 일원분산분석(one-way ANOVA)결과 수준 간 유의한 차이가 없었다(p > 0.05). 전자빔 조사에 의한 Benomyl에 무기화(materialization) 특성은 각 3개의 처리조합에서 평균 46%, 36.7% 및 22%의 제거효율을 나타났고 각 조합에서 처리수준 간 예측식은 block 1(Y$_1$ = 0.024X$_1$ + 34.1(R$^2$ = 0.929)), block 2(Y$_2$ = 0.026X$_2$ + 23.1(R$^2$ = 0.976)) 및 block 3(Y$_3$ = 0.034X$_3$ + 6.2(R$^2$ = 0.98)) 등의 1차 선형 회귀식을 만족하였다. 또한 Benomyl에 무기화(materialization)에 대한 Anderson-Darling 검정을 이용한 정규성(normality)을 만족하였다(p > 0.05). 또한 무기화에 대한 반응에 대한 선형 및 비선형을 포함한 다중회귀분석(multi regression analysis)을 도출한 결과 다음과 같은 예측식 Y = 39.96 - 9.36X$_1$ + 0.03X$_2$ - 10.67X$_1{^2}$ - 0.001X$_2{^2}$ + 0.011X$_1$X$_2$(R$^2$ = 96.3%, Adjusted R$^2$ = 94.8%)을 도출하였다. 2가지 반응변수(X$_1$: benomyl concentration(mg/L), X$_2$: E-beam irradiation(Gy))에 의한 2차 반응표면 모형식 추정으로부터 정준분석을 통해 최적조건을 도출한 결과 Benomyl 초기농도(X$_1$) 0.55 mg/L, 전자빔 조사량 950 Gy에서 TOC 제거율 57.3%으로 나타났다. 마지막으로 V. fischeri를 이용한 MicrotoxTM modified 81.9% test을 이용하여 전자빔에 의한 Benomyl에 대한 급성 독성을 평가한 결과 전자빔 조사전 block 1의 0.5 mg/L에서 10.25%, block 2의 1 mg/L에서 20.14% 및 block 3의 1.5 mg/L에서 26.2%의 생물학적 방해(inhibition)작용이 발생하였으나 전자빔 조사 후 모든 조건에서 생물학적 방해영향을 나타나지 않았다.

청미천 논지에서의 증발산량 작물계수 산정에 관한 연구 (A Study on the Calculation of Evapotranspiration Crop Coefficient in the Cheongmi-cheon Paddy Field)

  • 김기영;이용준;정성원;이연길
    • 대한원격탐사학회지
    • /
    • 제35권6_1호
    • /
    • pp.883-893
    • /
    • 2019
  • 본 연구에서는 두 가지 방법으로 작물계수를 산정하고, 그 결과를 평가하였다. 첫 번째 방법에서는 GLDAS 자료를 청미천 플럭스타워의 증발산량 실측값과 비교하여 적정성을 평가한 뒤 GLDAS 기반 실제증발산량을 잠재증발산량으로 나눠 작물계수(GLDAS Kc)를 산정하였으며, 두 번째 방법에서는 MODIS기반 식생지수(NDVI, EVI, LAI, SAVI)와 플럭스타워에서의 토양수분 실측치를 이용해 다중선형회귀분석으로 작물 계수(SM&VI Kc)를 산정하였다. 전체기간에 대한 두 가지 작물계수(GLDAS Kc, SM&VI Kc)를 통계(mean, bias, RMSE, IOA)를 통해 비교해 본 결과 평균값은 각각 0.412와 0.378, bias는 0.031과 -0.004, RMSE는 0.092와 0.069, 적합도 지표(IOA)는 0.944와 0.958로 두 방식 모두 전반적으로 실측값과 유사한 패턴을 보여주었다. 그라나 SM&VI 회귀모형 방식이 더 우수한 것으로 나타났다. 또한, 벼의 생장 단계별로 GLDAS Kc와 SM&VI Kc에 대한 통계적 평가를 수행해본 결과 초기와 중기에는 GLDAS 기반의 Kc가 더 우수했으며, 후기에는 SM&VI 기반의 Kc가 더 우수한 것으로 나타났다. 이는 봄철에는 황사, 여름철에는 비구름으로 MODIS 센서의 정확성이 감소했기 때문인 것으로 판단된다. 향후 연구를 통해 MODIS 센서의 관측 정확성이 향상된다면, SM&VI 기반 작물계수 산정방식의 정확성 역시 향상될 것으로 판단되며, 미계측 유역의 작물계수 산정이나 작물계수의 예측에 사용될 수 있을 것으로 판단된다.

물리적 보행환경이 보행만족도에 미치는 영향 - 진해시를 사례지역으로 - (The Effect of Physical Pedestrian Environment on Walking Satisfaction - Focusing on the Case of Jinhae City -)

  • 변지혜;박경훈;최상록
    • 한국조경학회지
    • /
    • 제37권6호
    • /
    • pp.57-65
    • /
    • 2010
  • 최근 전 세계적으로 앉아서 일하거나 여가시간을 보내는 생활습관(sedentary lifestyle)의 비율이 증가하면서 사람들의 체활동시간이 상당량 감소하였다. 이로 인해 비만 및 당뇨병과 같은 만성질환의 발병률이 증가하였고, 이를 해결하기 위한 대책으로써 누구나 쉽게 접근할 수 있다는 장점을 지닌 걷기활동이 사람들의 관심을 받고 있다. 본 연구의 목적은 사람들이 즐겁고 안전하게, 그리고 쾌적하게 생활할 수 있는 걷기 중심의 활동친화적 도시를 조성하여 일상생활 속에서 사람들의 걷기활동을 유도함으로써 감소되고 있는 현대인들의 신체활동량을 증진시키고자 하는데 있다. 이를 위해 진해시민들을 대상으로 걷기활동의 참여 및 정도를 결정하는데 영향을 끼치는 물리적 보행환경에 대한 만족도 조사를 실시하였고, 이러한 물리적 환경요인들이 보행만족도에 미치는 영향을 평가하기 위한 모형을 제시하였다. 연구의 결과를 요약하면 다음과 같다. 총 18개의 물리적 보행환경 지표를 선정하였고, 지표별 만족도 분석을 실시한 결과 횡단시설지표가 가장 높았고, 건물외관지표가 가장 낮게 나타났다. 요인분석은 1차, 2차로 진행되었으며, 1차에서는 18개 물리적 보행환경 지표에 대한 요인분석의 적절성을 검토하였다. 그 결과 2개의 지표가 제거되었고 나머지 16개의 지표가 2차 분석에 의해 4개의 요인으로 추출되었다. 각 요인의 공통성에 근거하여 4개의 요인을 각각 보도의 기능성, 차량의 영향, 쾌적성, 안전성으로 명명하였다. 다음으로 각 요인의 요인점수를 독립변수로, 보행만족도를 종속변수로 설정하여 다중선형회귀분석을 실시한 결과 4개의 독립변수 모두 보행만족도에 긍정적인 영향을 미치는 것으로 분석되었다. 요인별 기여도는 '보도의 기능', '쾌적성', '차량의 영향', '안전성' 순으로 높게 나타났으며, 특히 '보도의 기능'과 '쾌적성'의 영향이 다른 두 요인에 비해 상대적으로 매우 높은 것으로 분석되었다. 본 연구 결과는 향후 걷기 중심의 활동친화적 도시를 창출하는데 중요한 기초자료로 활용될 것으로 판단된다.

토양인자(土壤因子)가 이태리 포플러의 생장(生長)에 미치는 영향 (The Effects of Soil factors on the Growth in Populus euramericana Guinier)

  • 손두식;홍성천;주성현
    • Current Research on Agriculture and Life Sciences
    • /
    • 제14권
    • /
    • pp.49-60
    • /
    • 1996
  • 이태리포플러의 생장(生長)에 가장 영향(影響)을 많이 주는 토양인자(土壤因子)를 찾기 위해서 이태리포플러 조림지(造林地) 23개(個) 지역(地域)을 하천변(河川邊), 농경지(農耕地), 산록부(山麓部)로 구분(區分)하여 그 생장(生長)과 토양인자(土壤因子)와의 관계(關係)를 조사(調査)하였다. 이태리포플러의 생장(生長)은 토양환경(土壤環境) 조건(條件)이 유리(有利)한 하천변(河川邊)의 조림지(造林地)가 우수(優秀)하였고, 산록부(山麓部)의 조림지(造林地)는 하천변(河川邊)에 비(比)하여 21%나 생장(生長)이 떨어지므로 수익성(收益性)이 없을 것으로 생각되며, 농경지(農耕地)의 조림지(造林地)는 토양(土壤)이 비옥(肥沃)하여 생장(生長)이 양호(良好)할 것으로 생각되었으나, 하천변(河川邊)에 비(比)하여 생장(生長)이 8%정도 떨어졌다. 그러나 농경지(農耕地) 중(中) 퇴적지(堆積地)나 성토부(盛土部)는 생장(生長)이 비교적(比較的) 양호(良好)하였다. 이태리포플러의 생장(生長)이 양호(良好)한 조림지(造林地)의 토양(土壤)은 대체로 액상(液相) 20%, 토양공극률(土壤孔隙率) 45%, 용수량(溶水量) 35~40%, 토양경도(土壤硬度) $1kg/cm^3$ 토양(土壤)pH 6인 곳이었으며, 유기물(有機物)과 전질소(全窒素)가 많은 곳에서 생장(生長)이 양호(良好)하였다. 이태리포플러의 생장(生長)에 영향(影響)을 미치는 토양인자(土壤因子)에 대한 요인분석(要因分析)을 한 결과(結果) eigenvalue가 1이상(以上) communality가 70% 이상(以上) 되는 요인(要因) 1은 액상(液相), 공극률(孔隙率), 용수량(溶水量), 요인(要因) 2는 토양(土壤)pH 및 칼슘, 요인(要因) 3은 토양경도(土壤硬度)로 나타났다. 그러므로 이태리포플러의 생장(生長)은 토양(土壤)의 화학적(化學的) 성질(性質)보다는 물리적(物理的) 성질(性質)에 더 많은 영향(影響)을 받는 것으로 생각된다. 이태리포플러의 직경생장(直徑生長)과 토양인자(土壤因子)간 다중회귀분석(多重回歸分析)에서 토양경도(土壤硬度), 액상(液相) 및 칼슘에 대한 t-value가 1~10%의 유의성(有意性)이 인정(認定)되므로 선형모형식(線形模型式)이 성립(成立)되었고 용수량(溶水量)과 토양(土壤)pH는 유의성(有意性)이 없었다. 종합적(綜合的)으로 보면 이태리포플러의 조림적지(造林適地)는 퇴적지(堆積地)인 사질양토(砂質壤土) 혹은 성토부(盛土部)로서 토양경도(土壤硬度)가 낮고 통기성(通氣性)이 양호(良好)하며, 지하수위(地下水位)가 100cm 내외(內外)로 토양수분(土壤水分)이 적당(適當)하고 유기물(有機物)과 전질소(全窒素)가 충분(充分)한 약산성(弱酸性) 토양(土壤)이 좋을 것으로 판단(判斷)된다.

  • PDF