• 제목/요약/키워드: demand pattern

검색결과 699건 처리시간 0.032초

생활용수 실적자료와 기후 변수를 활용한 충청권역 생활용수 이용량 패턴 분석 (Analysis of domestic water usage patterns in Chungcheong using historical data of domestic water usage and climate variables)

  • 김민지;박성민;이경주;소병진;김태웅
    • 한국수자원학회논문집
    • /
    • 제57권1호
    • /
    • pp.1-8
    • /
    • 2024
  • 우리나라는 기후변화의 영향으로 지속되는 가뭄으로 인해 물 부족 문제가 심화되고 있다. 제1차 국가물관리기본계획에 따르면, 생활 및 공업용수 부족량은 과거 최대 가뭄빈도(50년) 기준으로 0.07억 m3/년으로 전망되고 있다. 이러한 물 부족 문제에 효과적으로 대응하기 위해서는 장기적인 용수 수요 전망이 필수적이다. 공업용수의 경우 월별 사용량이 비교적 일정하지만, 생활용수의 경우 월별 패턴이 뚜렷하기 때문에 연단위 분석이 아닌 월단위 분석을 수행해야 한다. 본 연구는 충청권역을 대상으로 2017~2021년의 월별 용수 이용량 자료에 대해 패턴을 분석하고, 기후 변수와의 상관성을 이용하여 용수 분배 비율을 계산하였다. 그 결과 월별 생활용수 이용량을 연 이용량으로 나눈 월별 용수 이용률을 다시 평균기온으로 나누는 분법으로 계산한 경우가 절대오차가 가장 작게 산정되었으며, 이를 활용하여 충청권역의 월별 분배 비율을 산정하였다. 또한 충청권역의 월별 분배 비율에 SSP5-8.5 시나리오의 평균기온을 곱해 충청권역의 미래 월별 용수 이용률을 전망하였다. 그 결과, 최댓값의 평균은 1.16에서 1.29로 증가하고 최솟값의 평균은 0.86에서 0.84로 감소하였으며, 1사분위수는 0.95에서 0.93으로 감소하고 3사분위수는 1.04에서 1.06으로 증가하였다. 따라서 미래에는 현재와 비슷한 패턴을 유지할 것으로 보이지만, 월별 용수 이용률의 변동성은 커질 것으로 예상된다.

비정형 텍스트 분석을 활용한 이슈의 동적 변이과정 고찰 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2016
  • 최근 가용한 텍스트 데이터 자원이 증가함에 따라 방대한 텍스트 분석을 통해 새로운 가치를 창출하고자 하는 수요가 증가하고 있다. 특히 뉴스, 민원, 블로그, SNS 등을 통해 유통되는 글로부터 다양한 이슈를 발굴해내고 이들 이슈의 추이를 분석하는 이슈 트래킹에 대한 연구가 활발하게 이루어지고 있다. 전통적인 이슈 트래킹은 토픽 모델링을 통해 오랜 기간에 걸쳐 지속된 주요 이슈를 발굴한 후, 각 이슈를 구성하는 문서 수의 세부 기간별 분포를 분석하는 방식으로 이루어진다. 하지만 전통적 이슈 트래킹은 각 이슈를 구성하는 내용이 전체 기간에 걸쳐 변화 없이 유지된다는 가정 하에 수행되기 때문에, 다양한 세부 이슈가 서로 영향을 주며 생성, 병합, 분화, 소멸하는 이슈의 동적 변이과정을 나타내지 못한다. 또한 전체 기간에 걸쳐 지속적으로 출현한 키워드만이 이슈 키워드로 도출되기 때문에, 핵실험, 이산가족 등 세부 기간의 분석에서는 매우 상이한 맥락으로 파악되는 구체적인 이슈가 오랜 기간의 분석에서는 북한이라는 큰 이슈에 함몰되어 가려지는 현상이 발생할 수 있다. 본 연구에서는 이러한 한계를 극복하기 위해 각 세부 기간의 문서에 대한 독립적인 분석을 통해 세부 기간별 주요 이슈를 도출한 후, 각 이슈의 유사도에 기반하여 이슈 흐름도를 도출하고자 한다. 또한 각 문서의 카테고리 정보를 활용하여 카테고리간의 이슈 전이 패턴을 분석하고자 한다. 본 논문에서는 총 53,739건의 신문 기사에 제안 방법론을 적용한 실험을 수행하였으며, 이를 통해 전통적인 이슈 트래킹을 통해 발굴한 주요 이슈의 세부 기간별 구성 내용을 살펴볼 수 있을 뿐 아니라, 특정 이슈의 선행 이슈와 후행 이슈를 파악할 수 있음을 확인하였다. 또한 카테고리간 분석을 통해 단방향 전이와 양방향 전이의 흥미로운 패턴을 발견하였다.

경지 정리된 광역 논에서 영양물질 수지와 배출 특성 (Nutrient Load Balance in Large-Scale Paddy Fields during Rice Cultivation)

  • 김민경;노기안;이남종;서명철;고문환
    • 한국토양비료학회지
    • /
    • 제38권3호
    • /
    • pp.164-171
    • /
    • 2005
  • 벼농사가 주변 수계의 수질에 미치는 영향을 평가하기 위해 경기도 이천시 부발읍의 광역 논을 대상으로 2002년 5월부터 2003년까지 9월까지 벼 재배기간 동안 논에서 양분물질인 질소와 인의 유입 및 유출부하량을 조사하였다. 재배기간 동안 평균 시비량은 질소가 2002년에 $129.0kg\;ha^{-1}$ 그리고 2003년에 $145.1kg\;ha^{-1}$이었으며, 인은 각각 $56.5kg\;ha^{-1}$$55.1kg\;ha^{-1}$로서, 질소 시비량은 2003년에 약간 많았으나 인 시비량은 비슷하였다. 조사기간 동안 물 수지는 2002년에 강우량 888 mm, 관개수량 1,321 mm, 침투수량 1,028 mm, 지표유출량 677 mm, 증발산량은 342 mm이었고, 2003년에 강우량 1,115 mm, 관개수량 1,493 mm, 침투수량 1,147 mm, 지표유출량 865 mm, 증발산량은 276 mm 이었다. 강우량과 지표배출수량은 2002년과 2003년 모두 결정계수($r^2$)가 각각 0.92와 0.81로 선형적인 양의상관으로 나타나 재배기간 중 논에서의 배출수량은 강우량이 증가할수록 선형적으로 증가하였다. 강우, 관개수, 지표 배출수, 침투수 및 작물흡수량의 질소 부하량은 2002년에 각각 9.9, 41.6, 22.1, 5.5, $123.6kg\;ha^{-1}$이었으며, 2003년에는 각각 15.8, 55.4, 17.3, 7.5, $119.1kg\;ha^{-1}$이었다. 강우, 관개수, 지표 배출수, 침투수 및 작물흡수량의 인 부하량은 2002년에 각각 2.1, 13.0, 3.6, 1.8, $64.0kg\;ha^{-1}$이었으며, 2003년에는 각각 1.6, 15.0, 5.0, 1.2, $61.4kg\;ha^{-1}$이었다. 강우량 및 배출수량과 양분물질 배출 부하량과의 관계는 강우량 및 배출수량이 증가할수록 논에서의 양분물질 배출 부하량은 선형적으로 증가하였다. 또한, 재배시기별 질소와 인의 유입 부하량과 유출 부하량 차이는 전 생육기간동안 유입 부하량이 유출 부하량보다 많아 논은 양분물질을 흡수하는 기능을 가지고 있었다.

사적소득이전과 노후소득보장 (Private Income Transfers and Old-Age Income Security)

  • 김희삼
    • KDI Journal of Economic Policy
    • /
    • 제30권1호
    • /
    • pp.71-130
    • /
    • 2008
  • 본 연구는 그동안 사회적 안전망이 미흡한 가운데 우리나라의 고령인구 부양에 중요한 역할을 해온 사적소득이전에 대한 미시적 분석을 통해 향후 노후소득보장정책에 시사점을 제공하고 있다. 한국노동패널 자료에 따르면, 만 60세 이상 노인가구주 세대의 다섯 가구 중 두 가구는 매월 자식들로부터 생활비 등의 경제적 도움을 받고 있는 것으로 조사되었으며, 공공부조 등 공적소득이전은 사적소득이전을 구축하는 효과를 가진 것으로 나타났다. 또한 지금까지는 사적이전이 공적이전보다 빈곤완화효과가 큰 것으로 나타났지만, 외환위기 후 복지지출의 확대와 함께 공적이전의 비중이 대폭 높아져, 공적이전을 주 소득원으로 살아가는 만 60세 이상 고령자는 2003년 기준으로 약 4분의 1에 달하는 것으로 조사되었다. 그러나 같은 해 기준으로 국민기초생활보장제도의 보호지정을 실질적으로 필요로 하면서도 수급권에서 배제된 것으로 추정되는 노인가구주 세대는 약 12%로서, 이들 가구의 빈곤 해소를 위해서는 예산 확보와 함께 사각지대를 없애기 위한 전달체계 개선이 필요할 것으로 보인다. 이처럼 여전히 광범한 빈곤노인계층이 존재하는 한편, 고령인구에 대한 사적 부양이 공적 부양으로 전환되면서 재정건전성이 우려되고 있는 현 상황에서 소득재분배의 효과가 적고 경직적 비용부담이 큰 보편급여의 확대보다는 취약노인계층에 대한 집중적인 지원을 강화할 필요가 있을 것이다.

한국인 턱관절장애 환자의 유병률과 진료 양태 (Prevalence and Treatment Pattern of Korean Patients with Temporomandibular Disorders)

  • 양희영;김미은
    • Journal of Oral Medicine and Pain
    • /
    • 제34권1호
    • /
    • pp.63-79
    • /
    • 2009
  • 본 연구는 건강보험심사평가원(Health Insurance Review and Assessment Service, 이하 심평원)에서 전산화되어 관리되는 보험대상 환자들의 진료기록을 이용하여 턱관절장애(temporomandibular disorders, TMD)로 인해 병원을 찾고 있는 환자의 유병률과 진료양태를 파악하고자 하였다. 연구를 위하여 심평원 전산시스템에 등록된 국내 보험대상 환자 중 2003년, 2004년, 2005년의 3년에 걸친 환자 자료를 사용하여 턱관절장애 (K07.6)를 주상병으로 하여 진단과 치료를 받은 환자에 대하여 성별 및 연령별 진료인원, 지역별 진료인원, 요양기관종별 진료인원, 치료기간 및 진료건수, 진료과목별 진료건수와 평균치료기간, 진료과목별 1인당 소요비용, 원외처방 치료약제 약효분류코드(효능군)별 연간 투약일수, 외과적 수술 실시 횟수 등을 분석조사한 연구결과는 다음과 같다. TMD로 인해 병원을 찾는 평균 환자수는 전체인구의 0.15%이었으며, 3년간 매년 증가하는 추세를 보였다. 그 중 99.8%가 여자였고, 20대의 유병률이 가장 높고 연령이 증가하면서 감소하는 양상을 보였다. 3년간의 변화추이를 볼 때 20대의 유병률은 감소하고 40대 이후 증가하는 양상을 보였다는 점이 특징적이었다. 16개 시도별 분포에서는 인구가 많은 서울, 경기 지역의 환자수가 많았고, 매년 전체 환자수가 증가하면서 각 지역별로 유사한 비율로 증가하였다. 그러나 부산과 대구에서는 감소세가 뚜렷하였고 울산, 경기, 전남의 증가세가 관찰되었다. 의료기관별로 내원한 환자 수는 치과를 포함한 일차의료기관에 내원하여 진료한 경우가 평균 56.8%로 전체의 과반수를 차지하였고 TMD와 관련한 입원건수는 치과 입원(86.6%)이 의과전체(13.4%) 보다 훨씬 많았다. 외래내원건수에서는 치과가 전체 건수의 38.4%로서 가장 많았으며, 정형외과(28%), 이비인후과(13.6%)의 순서였다. 약물치료에서는 해열소염진통제가 가장 빈번하게 투여되었고 정신신경용제, 골격근이완제의 순서였다. 심평원의 자료는 TMD때문에 병원을 찾는 환자들의 역학적 특성과 진료양태에 대한 포괄적이고 광범위한 정보를 제공하고 있지만, 진료실에서 정확한 진단과 표준화된 치료가 이루어지고 있는지에 대한 평가가 함께 이루어질 때 더욱 신뢰할 수 있는 정보가 될 것으로 생각된다.

객체관계형 DBMS에서 타입수준 액세스 패턴을 이용한 선인출 전략 (Prefetching based on the Type-Level Access Pattern in Object-Relational DBMSs)

  • 한욱신;문양세;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.529-544
    • /
    • 2001
  • 선인출은 데이타베이스 관리 시스템에서 클라이언트와 서버 사이에 발생하는 라운드트립을 줄 일 수 있는 효과적인 방법이다. 본 논문에서는 타입수준 액세스 패턴과 타입수준 지역성이라는 새로운 개 념을 제시하고, 이 개념에 기반한 새로운 선인출 방법을 제시한다. 타입수준 액세스 패턴이란 항해에 사 용된 애트리뷰트들의 패턴이며, 타입수준 엑세스 지역성이란 항해 응용에서 타입수준 액세스 패턴이 반복 적으로 나타나는 현상이다. 기존의 선인출 방법은 항해 응용에서 액세스된 객체 흑은 페이지 식별자들간의 패턴인 객체수준 혹은 페이지수준 액세스 패턴을 선인룰에 이용하는데, 이 방법은 동일한 객체 혹은 페이 지들이 반복적으로 액세스될 때에만 선인출 효과를 가지는 문제점이 있다. 이에 반해 제안하는 방법은 항 해 응용에서 같은 객체들이 반복적으로 액세스되지 않더라도 같은 애트리뷰트들이 반복적으로 참조되는 경우. 즉, 타입수준 액세스 지역성이 존재하면, 효과적인 선인출을 수행하는 장점이 있다 객체관계형 DHMS(ORDBMS)의 많은 항해 응용들은 타입수준 액세스 지역성이 있다 따라서, 제안하는 방법을 ORDBMS에 적용하면 라운드트립의 횟수를 효과적으로 줄일 수 있고 성능을 크게 향상시킬 수 있다. 제 안하는 방법의 우수성을 증명하기 위해, ORDBMS 프로토타입에 구현하여 많은 종류의 실험을 수행하였 다. 실험결과, 복잡한 구조를 탐색하는 007 벤치마크나 실제 GIS 응용에서, 제안하는 선인출 방법은 단순 한 요구인출 방법 및 최근의 문맥 기반 선인출 방법과 비교하여 라운드트림 횟수를 수십 배에서 수백배가 지 줄이고 성능을 수배가지 향상시켰다. 이와 같은 결과로 볼 때, 제안하는 방법은 객체지향 항해 응용의 성능을 크게 향상시키는 결과로서, 상용 ORDBMS에 구현될 수 있는 실용적인 결과라 믿는다.

  • PDF

고전압 전력반도체 소자 개발을 위한 단위공정에서 식각공정과 이온주입공정의 영향 분석 (Analysis of the Effect of the Etching Process and Ion Injection Process in the Unit Process for the Development of High Voltage Power Semiconductor Devices)

  • 최규철;김경범;김봉환;김종민;장상목
    • 청정기술
    • /
    • 제29권4호
    • /
    • pp.255-261
    • /
    • 2023
  • 파워반도체는 전력의 변환, 변압, 분배 및 전력제어 등을 감당하는데 사용되는 반도체이다. 최근 세계적으로 고전압 파워반도체의 수요는 다양한 산업분야에 걸쳐 증가하고 있는 추세이며 해당 산업에서는 고전압 IGBT 부품의 최적화 연구가 절실한 상황이다. 고전압 IGBT개발을 위해서 wafer의 저항값 설정과 주요 단위공정의 최적화가 완성칩의 전기적특성에 큰 변수가 되며 높은 항복전압(breakdown voltage) 지지를 위한 공정 및 최적화 기술 확보가 중요하다. 식각공정은 포토리소그래피공정에서 마스크회로의 패턴을 wafer에 옮기고, 감광막의 하부에 있는 불필요한부분을 제거하는 공정이고, 이온주입공정은 반도체의 제조공정 중 열확산기술과 더불어 웨이퍼 기판내부로 불순물을 주입하여 일정한 전도성을 갖게 하는 과정이다. 본 연구에서는 IGBT의 3.3 kV 항복전압을 지지하는 ring 구조형성의 중요한 공정인 field ring 식각실험에서 건식식각과 습식식각을 조절해 4가지 조건으로 나누어 분석하고 항복전압확보를 위한 안정적인 바디junction 깊이형성을 최적화하기 위하여 TEG 설계를 기초로 field ring 이온주입공정을 4가지 조건으로 나누어 분석한 결과 식각공정에서 습식 식각 1스텝 방식이 공정 및 작업 효율성 측면에서 유리하며 링패턴 이온주입조건은 도핑농도 9.0E13과 에너지 120 keV로, p-이온주입 조건은 도핑농도 6.5E13과 에너지 80 keV로, p+ 이온주입 조건은 도핑농도 3.0E15와 에너지 160 keV로 최적화할 수 있었다.

광주시 소매업의 입지와 주민의 효율적 이용에 관한 연구 (A Study on the Location of Retail Trade in Kwangju-si and Its Inhabitants와 Effcient Utilization)

  • 전경숙
    • 대한지리학회지
    • /
    • 제30권1호
    • /
    • pp.68-92
    • /
    • 1995
  • 소매업은 경제, 사회, 문화, 정치를 배경으로 소비자의 요구에 부응하며 발전해 가 기 때문에 지역구조의 이해라는 측면에서 증요한 연구 주제이다. 또한 소매업은 일상생활을 영위하기 위한 기본적인 기능이므로, 이에 대한 이해는 삶의 질 향상이라는 측면에서도 중 요하다. 최근, 우리나라는 주민소득의 향상과 그에 따른 수요의 다양화, 개성화, 그리고 정보 화 사회로의 이행, 대기업 및 외국유통업의 참여, 정부의 유통산업 근대화 작업 등 소매업 환경의 변화와 함께 소매업이 크게 변화하고 있다. 따라서 미래의 변화 예측과 바람직한 발 전 방향이 제시되어야 함에도 불구하고, 이에 대한 연구가 미흡하다. 이에 광주시를 연구대 상지역으로 선정하여, 소매업의 입지와 그에 대한 주민의 이용 행태, 그리고 주민의 바람직 한 이용방안을 분석하였다. 이는 입지행태라는 순수한 학문적기여 뿐 아니라, 지역의 효율성 과 평등성의 실현이라는 응용면에서도 중요한 의의를 지닌다.

  • PDF

프로세스 마이닝을 이용한 공공서비스의 품질 측정: N시의 건축 인허가 민원 서비스를 중심으로 (Measuring the Public Service Quality Using Process Mining: Focusing on N City's Building Licensing Complaint Service)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.35-52
    • /
    • 2019
  • 전자정부를 포함한 다양한 형태의 공공서비스가 제공됨에 따라 공공서비스 품질에 대한 국민의 요구 수준이 점점 높아지고 있다. 공공서비스의 품질을 높이기 위해서 공공서비스 품질에 대한 상시적 측정과 개선이 필요함에도 불구하고 전통적인 설문조사는 비용과 시간이 많이 소요되어 한계가 있다. 따라서 공공서비스에서 발생하는 데이터를 기반으로 원하는 시점에 언제라도 공공서비스의 품질을 빠르고 정확하게 측정할 수 있는 분석적 기법이 필요하다. 본 연구에서 공공서비스의 품질을 데이터 기반으로 분석하기 위해 N시의 건축 인허가 민원 서비스를 대상으로 프로세스 마이닝 기법을 이용하여 분석하였다. N시의 건축 인허가 민원 서비스는 분석에 필요한 데이터를 확보할 수 있고 공공서비스 품질관리를 통해 타 기관으로 확산 가능할 것으로 판단되었기 때문이다. 본 연구는 2014년 1월부터 2년 동안 N시에서 발생한 총 3678건의 건축 인허가 민원 서비스에 대해 프로세스 마이닝을 실시하여 프로세스 맵을 그리고 빈도가 높은 부서와 평균작업시간이 긴 부서를 파악하였다. 분석 결과에 따르면 특정 시점에 한 부서별로 업무가 몰리거나 상대적으로 업무가 적은 경우가 발생하였다. 또한 민원의 부하가 늘 경우 민원완료까지 걸리는 시간이 늘어날 것이라는 합리적인 의심을 하였으나 분석 결과 상관관계는 크게 없었다. 분석 결과에 따르면 민원완료까지 걸리는 시간은 당일처리에서 1년 146일까지 매우 다양하게 분포하였다. '하수처리과,' '수도과,' '도시디자인과,' '녹색성장과'의 상위 4개 부서의 누적빈도가 전체의 50%를 넘고 상위 9개 부서의 누적빈도가 70%를 넘어서는 등 빈도가 높은 부서는 한정적이며 부서 간 부하의 불균형이 심했다. 대부분의 민원 서비스는 서로 다른 다양한 패턴의 프로세스를 갖고 있었다. 본 연구의 결과를 활용하면 특정 시점에 민원의 부하가 큰 부서를 찾아내 부서 간 인력 배치를 탄력적으로 운영할 수 있을 것이다. 또한 민원 특성별 협의에 참여하는 부서의 패턴을 분석한 결과, 협의 부서 요청 시 자동화 혹은 추천에 활용할 수 있는 가능성이 보인다. 본 연구는 민원 서비스에 대한 프로세스 마이닝 분석을 통해 향후 공공서비스 품질 개선방향을 제시하는데 활용될 것으로 기대한다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.