• 제목/요약/키워드: 검색 트래픽

검색결과 112건 처리시간 0.024초

검색 트래픽 정보를 활용한 고속도로 교통지표 분석 연구 (Analysis of Highway Traffic Indices Using Internet Search Data)

  • 류인곤;이재영;박경철;최기주;황준문
    • 대한교통학회지
    • /
    • 제33권1호
    • /
    • pp.14-28
    • /
    • 2015
  • 2000년대 중반부터 인터넷 검색 트래픽을 활용한 다양한 연구가 진행되었다. 대표적으로 구글은 미국의 독감 발병 상황을 인터넷 유저의 검색 패턴을 통해 예측하는 서비스를 만들기도 하였다. 교통지표 역시 인터넷 검색 패턴과 유사할 수 있다는 가설을 확인하기 위하여, 검색 트래픽 데이터를 활용하여 고속도로의 진입 교통량과 구간 속도를 추정하는 모형을 구축하고 적합도 등을 확인하는 것이 본 연구의 목적이다. 그 결과, 첫째, 출퇴근의 상시적 통행이 이루어지는 지점의 TCS 진입 교통량 모형은 구글 검색 트래픽이 입력변수로 우수하였고, 검색 트래픽과는 음의 상관관계를 보였다. 둘째, 여가 통행이 집중적으로 나타났던 지점의 TCS 진입 교통량 모형은 네이버의 검색 트래픽이 입력변수로 선정되었으며, 검색 트래픽과는 양의 상관관계가 나타났다. 셋째, VDS 속도의 경우 시계열 도표상 검색 트래픽과 음의 상관관계를 보였다. 넷째, 검색 트래픽을 입력변수로 활용한 전이함수 잡음 시계열 모형은 그렇지 않은 시계열 모형에 비해 비교적 적합도가 우수하다는 결과를 도출하였다. 다만, VDS 속도 모형의 경우 다수의 입력변수가 포함되고 모형 계수의 부호가 상이함에 따른 한계가 존재하였다. 향후 검색 트래픽의 출처나 검색어, 혹은 시차 및 집계 단위에 대한 추가적 연구가 진행된다면, 교통 분야의 빅 데이터 연구시 활용 폭이 넓어질 것으로 판단된다.

분산 정보 서비스를 위한 CORBA 기반의 멀티 에이전트 모델 설계 (Design of CORBA-based Multi-Agent Model for Distributed Information Service)

  • 김광종;고현;이연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.327-330
    • /
    • 2002
  • 웹 환경에서 효율적인 인터넷 서비스를 위한 동적 서비스의 다양한 요구 사항들을 만족시키고자 많은 연구들이 시도되고 있다. 그러나, 한정적인 네트웍 대역폭으로 인한 네트웍 트래픽 증가 및 서버 시스템의 부하로 안정적인 정보 서비스가 이루지지 않고 있는 실정이며, 또한 기존의 정보 서비스 형태에 있어 직접적인 사용자에 의한 정보 검색의 형태로만 정보를 서비스 받음으로써 새로운 형태의 정보 서비스 지원방식이 요구된다. 따라서, 본 논문에서는 분산환경에서 효율적인 정보 검색 과 안정적인 정보 서비스, 네트웍 트래픽 감소를 지원하는 CORBA 기반의 멀티 에이전트 모델을 설계한다. 이는 각 개별 에이전트들이 상호 보완적 관계를 유지하여 에이전트 간 상호 작용을 통해 네트웍 트래픽 감지를 통한 안정적이고 능동적인 정보 서비스, 검색 시간 및 네트웍 트래픽 감소, 검색 키워드 유지를 통한 정확한 정보 검색 서비스, 시스템 자원의 자동 관리 등을 지원함으로써 사용자에 대한 정보 서비스의 질을 향상시킬 수 있다.

  • PDF

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

웹 검색트래픽을 활용한 소비자의 기대주기 비교 연구: 네이버와 구글 검색을 중심으로 (A Comparative Study of Consumer's Hype Cycles Using Web Search Traffic of Naver and Google)

  • 전승표;김유일;유형선
    • 기술혁신학회지
    • /
    • 제16권4호
    • /
    • pp.1109-1133
    • /
    • 2013
  • 신기술을 발견하고, 사회적 변화를 예측 설명하기 위해 여러 가지 형태의 기술 수명주기 모델이 개발되어 활용되어 왔는데, 그 중에서 가트너(Gartner)사가 소개한 기술 기대주기(hype cycle) 이론은 현장에서 자주 활용되고 있으며 그 효과를 인정받고 있다. 그러나 널리 통용되는 인기에 비해서 현재 연구 문헌에서는 이론적 프레임과 관계 및 실증에 대한 고려가 부족했다. 본 연구에서는 이런 기대주기모델의 새로운 실증적 측정 방법으로 제시된 웹 검색트래픽을 활용해 국내와 해외의 기대주기를 비교했다. 기존 연구에서 특정 제품이나 특정 국가에만 한정되었던 기대주기 분석을 검색트래픽을 활용해 비교 분석을 시도했다. 먼저 동일 제품에 대한 국가간 기대주기의 차이를 확인하기 위하여 검색트래픽과 신차판매점유율을 비교했는데, 국가간 기대주기의 유사성을 확인했으며, 통계적인 유의미성도 확인했다. 다음으로 동일 국간에서 제품간 기대주기의 차이를 확인하기 위하여 검색트래픽과 보급률을 비교해 보았는데, 역시 버블기의 정점 시기라는 측면에서 제품간 기대주기의 유사성도 확인했다. 본 연구는 검색트래픽을 활용한 사회현상 설명이나 기대주기 모델의 객관성과 설명력을 높이는데 크게 기여할 수 있으며, 나아가 마케팅 전략 수립과 같은 실질적인 기업전략 수립에까지 기여할 수 있을 것으로 판단된다.

  • PDF

메타서치엔진에서 네트워크의 트래픽을 줄이기 위한 검색엔진의 선택 및 검색문서의 수 결정 (Selection of Search Engine and the number of documents in Meta Search Engine to reduce network traffic)

  • 이진호;박선진;박상호;남인길
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.100-110
    • /
    • 1999
  • 메타서치엔진에서 탐색하게 될 검색엔진의 수를 줄이거나, 각 검색엔진에서 반환할 문서의 수를 줄임으로서 메타서치엔진이 사용자에게 제공하는 전체 문서의 수를 줄여 네트워크상의 불필요한 트래픽을 감소시키면서 검색결과는 사용자의 질의어에 대한 적합도를 유지하는 방안을 제안하였다. 현재 많이 사용되는 검색엔진과 가장 검색 빈도수가 높은 검색어를 이용하여 검색엔진을 선택하는 방법과 검색문서의 수를 결정하는 방법을 실험하였다.

  • PDF

10Gbps 네트워크 트래픽 저장 및 실시간 인덱스 생성 (10Gbps Network Traffic Capture and Runtime Indexing)

  • 최선오;이주영;최양서;김종현;김익균
    • 전자통신동향분석
    • /
    • 제30권4호
    • /
    • pp.181-190
    • /
    • 2015
  • 요즘 3.20 대란이나 한수원 침해사고 같은 각종 사이버 공격이 빈번하게 발생하고 있다. 이러한 사이버 공격에 대응하기 위하여 네트워크 트래픽을 수집 저장하고 사이버 공격분석에 사용하려는 다양한 노력이 행해지고 있다. 그러나 일반적으로 10Gbps 같은 고속 네트워크에서 네트워크 트래픽을 수집 저장하는 것은 쉬운 일이 아니다. 그래서 이 문건에서는 10Gbps 네트워크 트래픽 수집 저장에 관한 기술동향을 다루고 이어서 수집된 대용량 트래픽을 효율적으로 검색하기 위하여 비트맵 인덱스를 생성하는 다양한 방법을 소개하고 마지막으로 비트맵 인덱스를 사용한 효율적인 검색방법에 대해 소개한다.

  • PDF

단계별 OK 기법 기반 효과적 P2P 검색 알고리즘 (An Effective P2P Searching Algorithm Based on Leveled OK Mechanism)

  • 김분희;이준연
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.69-78
    • /
    • 2005
  • P2P시스템의 연구와 활용이 다양화 되면서 피어들의 자원 검색과정에서 발생되는 트래픽의 네트워크 대역폭에 주는 과도한 영향은 더 이상 간과할 수 있는 일이 아니다. P2P응용 프로그램이 이러한 트래픽 발생의 양을 줄이지 않으면, 다양한 네트워크 응용 프로그램들이 산재해 있는 인터넷 환경에서 원활한 대역폭 사용에 큰 영향을 줄 수 있으며, 많은 네트워크 이용자의 관련 응용프로그램 사용에 불편함을 초래할 수 있다. 본 논문에서는 P2P시스템을 이용하는 피어의 연결과 종료의 시점이 모호한 약결합 환경을 기반으로 하는 P2P시스템에서 효과적인 검색 성공률과 트래픽 양을 발생하는 순수한 P2P모델 기반의 브로드 캐스팅 검색 기법에 대해 제안한다 제안한 검색 기법은 관련 시스템에 내재된 문제점을 개선하는 방향으로 설계 및 구현되었으며 기존의 브로드캐스팅 기반 검색기법과 비교 실험을 통해 제안된 검색 기법의 성능을 평가하였다.

  • PDF

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;최선완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.471-473
    • /
    • 1999
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 실행해서 인터넷에 연결되어 있는 수많은 웹 서버들을 방문해서 웹 문서를 획득하고, 인덱싱 기법을 써서 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축한다. 정보 추출을 위해 웹 로봇을 운영할 때 웹 서버에 대한 사전 지식 없이 진행된다면 수많은 불필요한 요구가 전송돼서 인터넷 트래픽을 증가시키는 요인이 된다. 하지만 웹 서버가 사전에 자신이 공개할 문서에 대한 요약 정보를 웹 로봇에게 통보하고, 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 처리한다면 불필요한 인터넷 트래픽을 줄일 수 있을 뿐만 아니라 검색 엔진의 정보의 정확도를 높이고, 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동된 사항들을 종합 정리해서 등록된 각 웹 로봇에게 전송하는 문서 감시 통보 시스템과 통보된 요약 정보를 토대로 웹 서버로부터 해당 문서를 전송받아 필요한 인덱스 정보를 추출하는 효율적인 웹 로봇을 제안한다.

  • PDF

대용량 트래픽 처리를 위한 채팅 구조 설계 (Design of Chatting Architecture that Handle Large-Scale Traffic)

  • 홍성문;이윤재;고세영;정승우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.13-16
    • /
    • 2019
  • 웹 서비스의 트래픽은 변화의 폭이 크다. 또한 서비스는 실시간으로 변화하는 트래픽에 대비하기 위하여 트래픽의 최대치를 가정하여 서버를 구성해야한다. 하지만 트래픽의 최대치와 평균적인 트래픽은 큰 차이가 있어 위와 같은 서버 구성은 많은 자원의 낭비로 이어진다. 이렇듯 실시간으로 변화하는 트래픽에 대응하기 위하여 분산 시스템 구조와 InMemory Cache, Messaging Queue 등을 활용하여 대응하도록 설계했다. 또한 InMemory Cache 와 NoSQL 을 활용하여 효과적으로 메세지를 저장하고 검색할 수 있도록 설계하였다.