• 제목/요약/키워드: 웹검색 트래픽 정보

검색결과 24건 처리시간 0.029초

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;최선완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.471-473
    • /
    • 1999
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 실행해서 인터넷에 연결되어 있는 수많은 웹 서버들을 방문해서 웹 문서를 획득하고, 인덱싱 기법을 써서 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축한다. 정보 추출을 위해 웹 로봇을 운영할 때 웹 서버에 대한 사전 지식 없이 진행된다면 수많은 불필요한 요구가 전송돼서 인터넷 트래픽을 증가시키는 요인이 된다. 하지만 웹 서버가 사전에 자신이 공개할 문서에 대한 요약 정보를 웹 로봇에게 통보하고, 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 처리한다면 불필요한 인터넷 트래픽을 줄일 수 있을 뿐만 아니라 검색 엔진의 정보의 정확도를 높이고, 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동된 사항들을 종합 정리해서 등록된 각 웹 로봇에게 전송하는 문서 감시 통보 시스템과 통보된 요약 정보를 토대로 웹 서버로부터 해당 문서를 전송받아 필요한 인덱스 정보를 추출하는 효율적인 웹 로봇을 제안한다.

  • PDF

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

반복적 웹 검색을 제거한 다중 웹정보 뷰어 (Multiple Web-Information Viewer removing repetitive web searching)

  • 이정수;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.964-966
    • /
    • 2014
  • 인터넷 이용자 급증으로 정보들은 무한히 생산되고 사방에 산재되어 가고 있다. 이로 인해 정보들을 탐색하는 시간은 계속 증가하고 있다. 특히 공지사항이나 날씨처럼 반복적으로 갱신되는 정보들을 얻기 위해 사람들은 동일한 정보를 주기적으로 검색하고 있으며 이에 따른 불필요한 트래픽 유발 및 검색시간이 낭비되고 있는 실정이다. 본 논문은 동일한 정보를 주기적으로 검색함으로써 야기되는 문제점을 서술하고 이를 해결하기 위해 다수의 웹상에서 각종 정보들만을 추출하여 하나의 웹페이지 내에 배치하는 웹 컴포넌트를 설계 및 구현한다. 이 시스템을 사용한다면 사용자는 단순히 하나의 웹페이지를 클릭함으로써 다수의 웹상에 저장된 정보들을 웹서핑 없이 얻을 수 있기 때문에 정보검색 시간을 크게 단축시킬 수 있다. 이 시스템을 구현하기 위해 크로스 도메인상의 웹문서에서 정보를 추출하고 조작하는 것을 금지하는 웹 표준 정책인 동일출처정책을 우회할 수 있는 방법을 서술하였으며 이 정책을 회피함으로써 파생되는 문제점과 해결방안을 서술하였다. 마지막으로 현존하는 관련 시스템들과 비교하여 우수성을 보인다.

분산 정보 서비스를 위한 CORBA 기반의 멀티 에이전트 모델 설계 (Design of CORBA-based Multi-Agent Model for Distributed Information Service)

  • 김광종;고현;이연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.327-330
    • /
    • 2002
  • 웹 환경에서 효율적인 인터넷 서비스를 위한 동적 서비스의 다양한 요구 사항들을 만족시키고자 많은 연구들이 시도되고 있다. 그러나, 한정적인 네트웍 대역폭으로 인한 네트웍 트래픽 증가 및 서버 시스템의 부하로 안정적인 정보 서비스가 이루지지 않고 있는 실정이며, 또한 기존의 정보 서비스 형태에 있어 직접적인 사용자에 의한 정보 검색의 형태로만 정보를 서비스 받음으로써 새로운 형태의 정보 서비스 지원방식이 요구된다. 따라서, 본 논문에서는 분산환경에서 효율적인 정보 검색 과 안정적인 정보 서비스, 네트웍 트래픽 감소를 지원하는 CORBA 기반의 멀티 에이전트 모델을 설계한다. 이는 각 개별 에이전트들이 상호 보완적 관계를 유지하여 에이전트 간 상호 작용을 통해 네트웍 트래픽 감지를 통한 안정적이고 능동적인 정보 서비스, 검색 시간 및 네트웍 트래픽 감소, 검색 키워드 유지를 통한 정확한 정보 검색 서비스, 시스템 자원의 자동 관리 등을 지원함으로써 사용자에 대한 정보 서비스의 질을 향상시킬 수 있다.

  • PDF

웹검색 트래픽 정보를 활용한 지능형 브랜드 포지셔닝 시스템 : 태블릿 PC 사례를 중심으로 (Intelligent Brand Positioning Visualization System Based on Web Search Traffic Information : Focusing on Tablet PC)

  • 전승표;박도형
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.93-111
    • /
    • 2013
  • 최근 독감 예측이나 부동산가격 예측 등 다양한 분야에서 웹검색 트래픽이나 소셜 네트워크 등의 방대한 고객 데이터를 통해 사회 현상, 소비 트렌드 등을 분석하고자 하는 시도가 증가하고 있다. 최근 구글이나 네이버 등의 인터넷 포털서비스 업체들은 온라인 사용자들의 웹검색 트래픽 정보를 구글 트렌드, 네이버 트렌드 등의 서비스로 공개하고 있는데, 이들이 제공하는 웹검색 트래픽 정보를 기반으로 온라인 사용자들의 정보 검색 행태에 대한 연구들이 학계 업계 등에서 주목받고 있다. 웹검색 정보를 기반으로 사회 현상이나, 소비 동향, 정치 투표 결과 등을 예측해 볼 수 있음을 실증하고 있는 분야는 많은 연구가 수행되고 있지만, 웹검색 트래픽 정보를 이용하여, 소비자의 제품에 대한 중요한 속성 도출 및 소비자의 기대 변화 관측 등의 온라인 사용자 행태에 초점을 맞추어 연구되고 있는 분야는 상대적으로 많은 연구가 수행되고 있지는 않다. 따라서, 본 연구에서는 구글이나 네이버가 제공하는 소비자의 웹검색 트래픽을 활용해서 소비자가 생각하는 제품 포지션을 가시화할 수 있는 방법을 제안한다. 브랜드 간의 관계를 확인하기 위해, 동시 검색 트래픽 정보를 활용하여 네트워크 모델링의 방법을 사용한 시스템을 제안하고 있으며, 이를 통해 소비자들이 제품 간의 유사성을 어떻게 인지하고 형성하며, 새로운 혁신 제품 카테고리 내에서 제품 브랜드들이 소비자의 마음 속에서 어떻게 자리 잡고 있는지의 브랜드 포지셔닝을 확인할 수 있는 방법론을 제안하였다. 또한 이를 태블릿 PC의 사례를 통해서, 미시적인 관점에서 소비자의 마음속에 위치한 태블릿 PC 개별 브랜드들의 위치 및 관계를 보여주었다. 기업은 소비자의 제품에 대한 인식 및 중요 속성 도출을 위해 많은 비용과 시간을 소요하여 소비자 조사를 행하게 되는데, 본 연구의 방법론을 활용하여 소비자의 제품에 대한 인식, 제품간 유사도, 제품에 대한 중요 속성의 변화 등을 일반에게 공개된 검색 트래픽 정보를 활용하여 비교적 쉽고 추가적인 비용 없이 도출할 수 있을 것이다.

4차 산업혁명 관련 기술의 정부R&D과제 현황과 관심도 분석 -그래핀, 빅데이터, 바이오마커를 중심으로

  • 정재웅;박현우;성태응
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 춘계학술대회 논문집
    • /
    • pp.549-558
    • /
    • 2017
  • 바야흐로 4차 산업혁명의 시대가 도래하면서, 4차 산업혁명과 관련된 기술에 대한 관심 또한 나날이 높아져 가고 있다. 이런 시대적 상황에 맞춰, 본 연구에서는 웹 검색트래픽을 활용하여 4차 산업혁명 관련 기술의 국내 외 트렌드를 비교하고 관련된 기술에 대한 국내 정부R&D 과제 현황에 대해 분석해 보고자 한다. 본 분석은 먼저 관련 기술에 대한 정부 R&D 현황 과제 현황을 네트워크 분석하고 분석된 기술을 4차 산업혁명의 3가지 카테고리로 구분한다. 이후 카테고리별로 선별된 각각의 기술에 대해 구글의 웹 검색트래픽을 활용하여 관련된 기술의 국내 외 트렌드를 비교 분석한다. 본 연구를 통해 4차 산업혁명 관련 기술에 대한 과거와 현재의 관심 동향을 확인할 수 있을 것으로 예상된다. 또한, 해당 기술과 관련된 정부 R&D 과제 현황을 네트워크 분석하고 시각화하여 4차 산업혁명 관련 R&D 현황에 대한 직관적인 정보를 제공하고자 한다. 본 연구는 인류 최대의 혁명으로 정의되는 4차 산업혁명 기술에 대한 국내 외 트렌드 정보와 함께 현재까지 진행되어온 정부의 R&D 현황을 직관적으로 볼 수 있게 제공함으로써, 4차 산업혁명과 함께 다가오는 미래에 대한 올바른 정책 방향 설정에 기여할 것으로 기대된다.

  • PDF

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;권희용;황호영
    • 정보처리학회논문지A
    • /
    • 제10A권5호
    • /
    • pp.469-478
    • /
    • 2003
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 이용해서 인터넷에 연결되어 있는 수 많은 웹 서버들을 주기적 또는 비주기적으로 방무나여 자체적인 인텍싱 방법에 따라 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축하고 변겨아는 작업을 계속하고 있다. 이런 일련의 작업은 인터넷 상에 분산되어 있는 막대한 정보를 쉽고 정확하게 찾을 수 있는 게이트 사이트로서의 역할을 담당하기 위한 전략적인 목적으로 진행되고 있다. 수천만 이상의 웹 사이트들을 상대로 하는 정보 수집은 검색 엔진 사이트 중심으로 기존 데이터의 수정과 삭제 등과 같은 데이터 베이스 유지 관리와 신규 사이트들에 대한 자료 수집 작업이 이루어지고 있다. 이러한 작업은 웹 서버에 대한 사전 지식 없이 정보 추출을 위해 웹 로봇을 실행하므로 인터넷 상에 수많은 요구가 전송되고 이는 인터넷 트래픽을 증가 시키는 원인이 되고 있다. 따라서 웹 서버가 사전에 자신이 공개할 문서에 대한 변경 정보를 웹 로봇에게 통보하고 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 한다면 불필요한 인터넷 트래픽을 감소시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 해당 문서에 대한 정보수집 작업을 한다면 불필요한 인터넷 트래픽을 감소 시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 시스템 부하와 검색 엔진의 시스템 부하를 줄일 수 있는 효과를 가질 수 있을 것이다. 본 논문에서는 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동 사항들을 종합 정리해서 변경 문서에 대한 정보를 통보 받기 원하는 등록된 각 웹 로봇에게 전송하는 검사 통보 시스템을 설계 구현하였다. 웹 로봇을 운영하는 검색 엔진에서는 통보된 요약 정보를 이용해서 웹 서버로부터 해당 문서를 전송 받아 필요로 하는 인덱스 정보를 추출해서 데이터베이스를 구축하는 효율적인 웹 로봇을 설계 구현하였다.

웹 기반 네트워크 관리 시스템 설계 및 구현 (Design and Implementation of Web-Based Network Management System)

  • 김형길;이수영;김명균
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.549-552
    • /
    • 2000
  • 본 논문은 웹 기반 네트워크 관리 시스템 WNMS(Web-based Network Management System)에 대한 설계 및 구현에 대해 기술한다. WNMS는 크게 네트워크 구성 관리, MIB(Management Information Base: 이하 MIB ) Browser, 그리고 트래픽 모니터링 기능을 갖는다. 네트워크 구성 관리는 관리 서버가구동 되면, 네트워크들과 네트워크 장비들을 찾는다. 이는 관리자에게 전체적인 네트워크 구성을 한눈에 쉽게 파악할 수 있게 한다. MIB Browsers 는 관리자가 직접 SNMP 에이전트의 특정한 관리정보(MIB 노드 값)를 검색 또는 조작할 수 있게 한다. 그리고 트래픽 모니터링은 구성 관리에서 찾아진 네트워크나 네트워크 장비의 트래픽을 실시간으로 그래프로 보여준다

  • PDF

대용량 트래픽 처리를 위한 채팅 구조 설계 (Design of Chatting Architecture that Handle Large-Scale Traffic)

  • 홍성문;이윤재;고세영;정승우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.13-16
    • /
    • 2019
  • 웹 서비스의 트래픽은 변화의 폭이 크다. 또한 서비스는 실시간으로 변화하는 트래픽에 대비하기 위하여 트래픽의 최대치를 가정하여 서버를 구성해야한다. 하지만 트래픽의 최대치와 평균적인 트래픽은 큰 차이가 있어 위와 같은 서버 구성은 많은 자원의 낭비로 이어진다. 이렇듯 실시간으로 변화하는 트래픽에 대응하기 위하여 분산 시스템 구조와 InMemory Cache, Messaging Queue 등을 활용하여 대응하도록 설계했다. 또한 InMemory Cache 와 NoSQL 을 활용하여 효과적으로 메세지를 저장하고 검색할 수 있도록 설계하였다.

웹 환경에서 확장된 객체지향형 미들웨어(CORBA/JAVA)를 이용한 멀티미디어 정보 검색 시스템 구현 (An Implementation of The multimedia Information searching System Using Extended object-Oriented Middleware(CORBA/JAVA) on Web Envionments)

  • 이원중;안길수;주수종
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1847-1854
    • /
    • 1998
  • 최근, 웹(World Wide Web) 환경에서 효율적인 인터넷 서비스를 위해서 정적 서비스보다는 동적 서비스에 대한 다양한 요구사항들을 만족시키고자 많은 연구자들의 노력이 시도되고 있다. 웹 상에 있는 서버들로부터 정보를 얻기 위하여, CGI는 분산 응용들 간의 상호연동의 한 방법으로 제안되었다. 이 방ㅂ버에서 서버는 서비스 객체들간의 정적 바인딩 인한 과중한 처리 부담 및 네트워크 트래픽 부하를 극복할 수 없는 문제점들을 가지고 있다. 이러한 이유에서 본 논문에서는 기존의 CGI를 사용하는 대신에 확장된 객체 지향형 미들웨어를 사용하므로 웹 상에서 분산자원을 효율적으로 지원할 수 있도록 한다. 목표 시스템을 웹 상에서 구현하였다. 여기에서 클라이언트 모듈들은 임의의 서버에게 정보를 요청하기 위한 CORBA 미들웨어 접속용으로 서버 모듈은 클라이언트의 요청을 CORBA/JAVA 미들웨어를 통해 받아 웹 서버내의 멀티미디어 정보를 검색하도록 각각 구현되었다.

  • PDF