• 제목/요약/키워드: Web Traffic Analysis

검색결과 126건 처리시간 0.021초

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

Persistent Connection을 지원하는 웹서버 모델링 및 성능분석 (Modeling and Performance Evaluation of the Web server supporting Persistent Connection)

  • 민병석;남의석;이상문;심영석;김학배
    • 정보처리학회논문지C
    • /
    • 제9C권4호
    • /
    • pp.605-614
    • /
    • 2002
  • 웹서버가 처리하는 웹 트래픽 양이 폭발적으로 증가하고, 다양한 형태의 웹 서비스에 대한 웹서버의 성능 개선이 요구되고 있다. 이를 위해, HTTP 트래픽의 특성에 대한 분석과 웹서버의 적절한 튜닝이 요구되고 있지만 이에 대한 연구는 아직 미진한 상태이다. 특히, 현재 대부분의 어플리케이션이 HTTP 1.0에 기반하여 구현되고 있음에도 불구하고, 대부분의 연구들이 HTP 1.0에 기반하여 성능 분석이 이루어진 반면 HTTP 1.1에 대한 모델링과 성능분석은 거의 이루어지지 못하였다. 따라서, 본 논문에서는 Persistent connection을 지원하는 HTTP 1.1 프로토콜을 기반으로 하여 서버내의 세부 하드웨어 특성 등을 고려하여, 웹서버가 사용자의 요청을 받아들이면서부터 서비스를 마칠 때까지의 과정을 Tandem 네트워크 큐잉 모델을 사용하여 해석적인 웹서버 모델을 제안한다. 그리고, HTTP 1.0에 대한 HTTP 1.1의 개선된 점과 과부하 하에서의 문제점 등을 분석하고, 웹 서버에 요청하는 파일크기, 파일전송 사이의 OFF 시간, 요청빈도, 요청시간에 대한 지역성과 같은 HTTP 트래픽에 대한 특성을 분석한다. 제안된 모델은 실제 웹서버에서 웹 서비스 요청율의 변화에 따른 서버의 처리량에 대한 비교를 통해 검증하였다. 또, HTTP 1.1 기반의 웹서버에 있어서, TCP 요청 대기큐 크기와 HTTP 쓰레드의 개수 및 네트워크 버퍼 크기와의 상관 관계에 따른 웹서버의 성능분석을 하였다.

도시안전맵 웹사이트 구축을 위한 기존 웹사이트 분석연구 (Research for Building an Existing Web Site to Web Site Analysis of Urban Safety Map)

  • 임동현;김현수;김진욱;강부성
    • 한국주거학회:학술대회논문집
    • /
    • 한국주거학회 2008년 추계학술발표대회 논문집
    • /
    • pp.222-225
    • /
    • 2008
  • In urban life, an interest in safety and demands for safety information about crimes and traffic are increasing. As well, communication on the internet is so active. In this study, we analyze web sites in US, UK, and JP, which have started safety map services, and then we provide basic material for the introduction of safety map into Korea. According to the analysis result, in US and UK, the safety map web sites are administered by the government and provided to the general public. The geographical area is provided around administrative districts and statistical data. In JP, The safety map web site provide not a one sided service but the service that user can directly take a part in, and also there is an web site for crimes against vulnerable people.

  • PDF

개인정보보호 관점에서의 웹 트래픽 수집 및 분석 서비스에 대한 타당성 연구 (The Evaluation for Web Mining and Analytics Service from the View of Personal Information Protection and Privacy)

  • 강신범;심미나;방제완;이상진;임종인
    • 정보보호학회논문지
    • /
    • 제19권6호
    • /
    • pp.121-134
    • /
    • 2009
  • 소비자 중심 마케팅 성장과 더불어 확대되고 있는 웹 트래픽 수집 및 분석 서비스 시장에서는 이미 서비스 제공자와 사용자간 정보 활용과 정보보호의 치열한 공방이 시작되었고 보다 상세한 소비자 정보를 마케팅에 활용하고 싶은 욕구가 극대화되고 있다. 기업은 익명화된 개인정보의 마케팅활용을 정당화하고 개인은 잠재적 우려사항을 감수할 수밖에 없는 실정이다. 그러므로 본고에서는 국내의 웹 트래픽 수집 및 분석 서비스 산업에서 개인정보보호에 저해되는 프로세스를 검토하고 잠재적 우려사항을 밝히고자 한다. 국내 주요 상용서비스를 중심으로 개인정보보호정책 분석과 서비스과정의 고의 혹은 우연한 개인정보 수집행위 등 목적 외 범위 타당성을 검토하고, 역공학을 통해 서비스과정에서의 개인정보 수집 및 이용 범위를 분석하였다. 개인정보 추출 범위 확대와 침해 가능성 심화로 인해 현재 국내 서비스의 타당성 평가는 매우 중요하다. 웹 트래픽 수집 및 분석 행위로 인한 개인정보 침해의 잠재요인과 서비스 활용을 위한 개인정보보호의 요건을 명확히 밝히는 것은 웹 트래픽 분석산업과 개인정보보호의 균형 발전을 위해 매우 중요할 것이다.

The Continuous Service Usage Intention in the Web Analytics Services

  • 박재성;정경호;김재전;조건;고준
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2008년도 추계 공동 국제학술대회
    • /
    • pp.301-306
    • /
    • 2008
  • The World Wide Web (WWW) has continued to grow at very rapid speed in both the sheer volume of traffic and size and the complexity of Web sites. Web Analytics Industry also has been growing rapidly. Web Analytics is to analyze web log files to discover accessing patterns of web pages. In this paper, we identify factors which can affect the continuous usage intention of a firm using services in web analytics services and empirically validate the relationships between the identified factors. For this purpose, we analyze 174 Korea firms. The analysis results show that the satisfaction is significantly associated with service quality and switching cost and the service usage period is not significantly associated with continuous service usage intention. We measure the service quality using SERVQUAL. It turn out that two dimensions of SERVQUAL, reliability and empathy are significantly associated with satisfaction, but another dimension of SERVQUAL, responsibility, is not. Finally, satisfaction is significantly associated with continuous service usage intention.

  • PDF

GPS 기술기반의 동적 도로소통정보시스템 개발 (Development of Dynamic Traffic Information System based on GPS Technology)

  • 장용구
    • 한국지리정보학회지
    • /
    • 제9권3호
    • /
    • pp.14-24
    • /
    • 2006
  • 국내에서 이루어지고 있는 부분적인 교통량분석 장비에는 여러 문제점과 한계성을 가지고 있다. 또한, 교통량분석 장비를 통하여 획득한 기존의 교통량 정보는 실시간 제공이 되지 못하고, 도심지의 경우 교통량 밀도분석과 시계열 분석이 어려워 적절한 도로용량 파악의 신뢰성 확보에 한계가 있고, 교통소통 제어관련 정보를 제공하지 못하는 등 도로정책 수립에 활용하기 어려운 실정이다. 따라서 실시간 교통량조사를 통한 정확한 도로소통정보와 후처리 통계분석에 의한 도로소통정보를 통해 정확하고 신속한 교통 및 도로소통정책수립이 필요하다. 본 연구에서는 차량위치정보를 교통정보화하여 교통관제센터로 교통정보를 전송할 수 있는 인공위성측량 기술기반의 차량용 교통정보수집시스템을 개발하였다. 또한, 전송된 교통정보를 관리 분석하고 처리된 도로소통정보를 실시간으로 웹상에 제공해줄 수 있는 웹 지리정보체계 기술기반의 교통관제시스템을 개발하였다.

  • PDF

통합 SNS 게이트웨이를 위한 웹 서비스 어댑터 구현 및 성능 분석 (Implementation and Performance Analysis of Web Service Adapter for Integrated SNS Gateway)

  • 김인식;김현우;권동우;주홍택
    • 인터넷정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.135-142
    • /
    • 2014
  • 본 논문은 모바일 SNS 트래픽을 줄이는 방안으로 통합 SNS 게이트웨이를 이용하는 방법을 제시한다. 통합 SNS 게이트웨이는 모바일 클라이언트와 SNS 서버 사이에서 통신 중계자 역할을 한다. 통합 SNS 게이트웨이 내에서 SNS 서버와의 통신을 담당하는 웹 서비스 어댑터의 역할을 제안하고 구현하였다. 또한, 통합 SNS 게이트웨이 내의 캐시 엔진을 사용하여 사용자가 통합 SNS 게이트웨이를 통하여 특정 SNS 서버에게 콘텐츠를 요청할 때 발생하는 트래픽량과 응답 시간에 대한 성능을 측정하고 분석하여 결과를 제시한다.

Performance Analysis of Web Service Architecture for Inter-AS DiffServ-over-MPLS Traffic Engineering

  • Sundaram Shanmugham;Chae Youngsu;Kim Young-Tak
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제14권3호
    • /
    • pp.9-16
    • /
    • 2005
  • In this paper, the performance of the WebService architecture for QoS guaranteed connection provisioning in inter-AS domain networks has been measured and analyzed for service publish/inquiry, collection of NMSs ASBR details, source routing by ingress NMS in constraint based routing and connection establishment. From the analysis, it has been found that, the connection between inter-AS domain networks can be established within the usual time limits of 3 seconds by the Web Service architecture. Since no standard solutions have been implemented in Interdomain QoS provisioning, this performance analysis assures Web Service architecture as a promising solution and can be easily implemented in the early stages of MPLS network employment.

  • PDF

Key Traffic Metrics as a Basis to Measure Library Performance

  • Udartseva, Olga M.
    • Journal of Information Science Theory and Practice
    • /
    • 제8권2호
    • /
    • pp.55-67
    • /
    • 2020
  • Webometric research in the Russian library sector is just beginning to gain momentum. This article examines the experience of webometric research in libraries from the perspective of the global practice. In particular, it highlights a number of foreign works, which may have a special practical value for Russian libraries, and emphasizes important webometrics areas for libraries. The purpose of this study is to research the practical application of key performance indicators (KPIs) abroad and conduct a webometric analysis of the websites of some leading Siberian and Far Eastern scientific libraries based on selected KPIs. The study data were collected with SimilarWeb and other analytical tools. The study revealed that key traffic metrics are the basis of webometric research, and identified available promising groundwork for the purpose of their further testing. The shortcomings in the current state of the websites of the Siberian and Far Eastern scientific libraries were noted. Based on the obtained webometric traffic indicators, the ranking of the Siberian and Far Eastern scientific libraries was made.

웹 서버에 대한 DDoS공격의 네트워크 트래픽 분석 (An Analysis of Network Traffic on DDoS Attacks against Web Servers)

  • 이철호;최경희;정기현;노상욱
    • 정보처리학회논문지C
    • /
    • 제10C권3호
    • /
    • pp.253-264
    • /
    • 2003
  • 본 연구에서는 웹 서비스를 대상으로 한 다양한 DDoS 공격이 진행 중일 때 패킷들의 TCP 헤더 내에 SYN, ACK 혹은 RST 등 다양한 플래그 값들이 설정된 패킷의 수와 총 패킷수와의 비율을 조사 분석하였다. 그 결과, 특정 플래그가 설정된 패킷 수의 비율이 각각의 DDoS 공격 유형에 따라서 매우 독특한 특성을 가짐을 발견하였다. 본 연구의 결과로 얻어진 이 특징들은 DDoS 공격을 조기에 탐지하는 기법과 시스템을 DDoS 공격으로부터 보호하는 기법 연구에 많은 도움을 줄 것으로 예상된다.