• Title/Summary/Keyword: Popularity of Information

검색결과 798건 처리시간 0.036초

웹 사이트의 인기도에 의한 도큐먼트 교체정책 (Document Replacement Policy by Web Site Popularity)

  • 유행석;장태무
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.227-232
    • /
    • 2008
  • 일반적으로 웹 캐시는 도큐먼트를 기반으로 하여 캐시 내에 임시적으로 도큐먼트를 저장하고 사용자의 요청이 있을 때 그에 해당된 도큐먼트가 캐시 내에 존재하면 그 도큐먼트를 사용자에게 전송해 주고, 캐시 내에 존재하지 않을 때에는 새로운 도큐먼트를 서버에게 요청하여 캐시 내에 복사를 하고 사용자에게 되돌려 준다. 이때 캐시의 용량 초과로 인해 새로운 도큐먼트를 기존의 도큐먼트와 교체하기 위해 도큐먼트 교체정책(replacement policy)을 사용한다. 일반적인 교체정책에는 도큐먼트를 기반으로 한 LRU기법이나 LFU기법 등이 있고, 그 밖의 여러 가지 교체정책을 사용하여 캐시내의 도큐먼트를 효과적으로 교체한다. 하지만. 위의 교체정책은 사이트의 인기도를 고려하지 않고 도큐먼트 요청 시간과 빈도수 만을 고려하여 교체정책을 수행한다. 따라서 본 논문에서는 요청이 빈번한 도큐먼트와 사이트의 인기도를 고려한 교체정책을 사용하여 요청이 빈번하지 않은 도큐먼트를 효과적으로 교체함으로써 캐시의 적중률(hit-ratio)을 높이고, 캐시의 내용을 효과적으로 관리할 수 있는 현대적인 네트워크 환경에 적합한 도큐먼트 교체정책인 웹사이트의 인기도를 고려한 도큐먼트 교체 정책을 제시한다.

  • PDF

콘텐츠 중심 네트워크에서 정보제공자의 이동성 지원을 위한 인기도 기반 푸싱 기법 (Popularity-Based Pushing Scheme for Supporting Content Provider Mobility in Content-Centric Networking)

  • 우태희;박흥순;권태욱
    • 한국통신학회논문지
    • /
    • 제40권1호
    • /
    • pp.78-87
    • /
    • 2015
  • 콘텐츠 중심 네트워크(CCN)는 데이터를 찾는데 필요한 라우팅 정보를 콘텐츠 이름에서 찾는 방식으로 기존의 IP 방식과는 다른 새로운 네트워킹 패러다임이다. CCN의 도전과제 중 하나인 이동성 관리는 크게 정보요청자의 이동과 정보제공자의 이동을 들 수 있다. 그 중에서도 정보제공자 이동의 경우 해당되는 라우터의 경로 정보를 갱신해야 하므로 많은 오버헤드와 시간이 필요하다. 이에 본 논문은 CCN에서 효율적인 정보제공자의 이동성 지원을 위해 콘텐츠의 인기도를 고려한 Popularity-based Pushing CCN(PoPCoN)을 제안한다. 제안하는 알고리즘은 기존의 기법과 비교하여 요청자의 콘텐츠 다운로드 시간을 단축시키고 네트워크의 오버헤드를 감소시킨다.

머신러닝 기반의 유튜브 먹방 콘텐츠 인기 예측 모델 (A Machine Learning-based Popularity Prediction Model for YouTube Mukbang Content)

  • 서범근;이한준
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.49-55
    • /
    • 2023
  • 본 연구에서는 유튜브 먹방 콘텐츠의 인기를 예측하는 모형을 제안하고 사후 분석을 통하여 먹방 콘텐츠의 인기에 영향을 주는 요인들을 식별하였다. 이를 위해 API와 Pretty Scale을 활용하여 구독자수 상위 먹방 채널들로부터 22,223개 콘텐츠의 정보를 수집하고 Random Forest, XGBoost 및 LGBM 등의 머신러닝 알고리즘을 기반으로 조회수와 좋아요수 예측모델을 구축하였다. SHAP 분석 결과 조회수 예측 모형에서는 구독자수가 예측에 가장 큰 영향을 미치는 반면, 좋아요수 예측 모형에서는 크리에이터의 매력도가 중요변수로 도출되는 등 콘텐츠 조회와 좋아요 반응에 대한 선행요인이 다름을 확인할 수 있었다. 본 연구는 대량의 온라인 콘텐츠를 분석하여 실증 분석을 진행하였다는 점에서 학술적 의의가 있으며 먹방 크리에이터들에게 시청자들의 콘텐츠 소비 경향을 알려주고 상품성 높은 콘텐츠 제작의 가이드를 제공한다는 점에서 실무적인 의의를 지닌다.

선호도 기반 웹 캐싱 전략 (Web Caching Strategy based on Documents Popularity)

  • 유해영;박철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권9호
    • /
    • pp.530-538
    • /
    • 2002
  • 본 논문에서는 파일이 요청된 순간에는 파일의 선호도만을 조사하고, 일정 시간이 흐른 후에 선호도가 높은 파일들을 일괄적으로 캐싱하는 새로운 캐싱 전략을 소개한다. 이 전략에서는 일정 기간 동안 캐시의 상태가 변하지 않기 때문에 캐시 조작 비용이 거의 들지 않는 매우 효과적인 자료 구조의 사용이 가능하다는 장점을 가지고 있다. 뿐만 아니라, 국내외 5개 웹 서버로부터 수집한 log 파일을 대상으로 실험한 결과에 의하면, LRU를 사용하였을 때보다 오히려 캐시 히트율이 증가하였으며, 캐시 내 자료 재사용율도 증가하는 장점을 보석 주고 있다. 본 논문에서 제안하는 선호도 기반 게으른 캐싱전략(Popularity Based Lazy Caching Strategy)은 캐시에 포함되지 못한 파일의 선호도가 크게 증가하는 경우에 성능이 떨어지는 단점을 가지고는 있다. 그러나 이러한 경우는 자주발생하지 않으며, 웹 서버를 적응적으로 구현하여 해결할 수 있다.

네트워크 자원효율 및 QoE 향상을 위한 콘텐츠 인기도 기반 무선 캐싱 기술 (Wireless Caching Techniques Based on Content Popularity for Network Resource Efficiency and Quality of Experience Improvement)

  • 김근욱;홍준표
    • 한국정보통신학회논문지
    • /
    • 제21권8호
    • /
    • pp.1498-1507
    • /
    • 2017
  • 최근 발표에 따르면, 2020년까지 모바일 데이터 트래픽이 현재의 11배까지 증가 될 것으로 예상된다. 그 중 비디오 트래픽이 70%를 차지할 것으로 예상되는 만큼 방대해지는 모바일 비디오 트래픽의 문제를 해결하기 위해서는 비디오 트래픽의 특성을 이해할 필요가 있다. 최근, 인기 있는 유튜브 비디오와 같은 일부 인기 있는 콘텐츠의 반복적인 요청으로 인해 네트워크 트래픽 오버헤드가 많이 발생한다. 만약 콘텐츠 인기도를 알고 인기 있는 콘텐츠를 미리 캐싱 할 수 있는 네트워크 노드를 구성한다면 이용자의 요청에 대해 캐싱 된 콘텐츠를 이용함으로써 네트워크 오버헤드를 줄일 수 있다. 장치 대 장치 통신, 멀티캐스트, 헬퍼를 통해 비디오 처리량이 기존의 방법보다 약 1.5배에서 2배의 이득이 향상되었다. 또한, 프리픽스 캐싱을 통해 기존의 방법보다 약 0.2배에서 0.5배의 재생 지연이 감소되었다. 본 논문에서는 무선 네트워크 환경에서 콘텐츠 인기도를 기반한 캐싱 기술에 대한 최신 연구를 소개 한다.

Mitigating Cache Pollution Attack in Information Centric Mobile Internet

  • Chen, Jia;Yue, Liang;Chen, Jing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권11호
    • /
    • pp.5673-5691
    • /
    • 2019
  • Information centric mobile network can significantly improve the data retrieving efficiency by caching contents at mobile edge. However, the cache pollution attack can affect the data obtaining process severely by requiring unpopular contents deliberately. To tackle the problem, we design an algorithm of mitigating cache pollution attacks in information centric mobile network. Particularly, the content popularity distribution statistic is proposed to detect abnormal behavior. Then a probabilistic caching strategy based on abnormal behavior is applied to dynamically maintain the steady-state distribution for content visiting probability and achieve the purpose of defense. The experimental results show that the proposed scheme can achieve higher request hit ratio and smaller latency for false locality content pollution attack than the CacheShield approach and the baseline approach where no mitigation approach is applied.

인터넷 토론 게시판의 게시물 인기도 예측 모델 (A Model to Predict Popularity of Internet Posts on Internet Forum Sites)

  • 이윤정;정인준;우균
    • 정보처리학회논문지D
    • /
    • 제19D권1호
    • /
    • pp.113-120
    • /
    • 2012
  • 오늘날 인터넷 사용자들은 유튜브(YouTube)와 같은 온라인 콘텐츠 공유 사이트를 통해 손쉽게 자신의 콘텐츠를 만들고 다른 사람들과 공유하고 있다. 그로 인해 하루에도 엄청난 양의 온라인 콘텐츠들이 쏟아지고 있다. 온라인 콘텐츠들의 홍수 속에서 어떤 콘텐츠가 향후에 인기가 있을 것인지를 예측하는 문제는 일반 이용자들이나 콘텐츠 공유 사이트 운영자들 모두가 관심을 가지는 문제이다. 본 논문에서는 인터넷 토론 게시판에 등록된 게시물들의 인기도를 예측하는 방법을 제안한다. 본 논문에서는 인터넷 토론 게시판에 등록된 게시물들의 인기도를 예측하기 위해 게시물의 조회수를 인기 척도로 간주하고 각 게시물의 조회수 변화량을 분석하였다. 게시물의 최종 조회수를 예측하기 위하여 관찰된 조회수 시계열 데이터를 이용하여 지수 함수를 기반으로 하는 조회수 증가 모델을 제안한다. 다음 아고라 게시판의 게시물을 대상으로 한 실험에서 전체 실험 게시물 중 약 90.7%인 20,532개의 게시물이 예측 오차가 10개 이하로 나타났다.

메타 검색 엔진을 위한 인기도 기반 캐쉬 관리 및 성능 평가 (A Popularity-driven Cache Management and its Performance Evaluation in Meta-search Engines)

  • 홍진선;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.148-157
    • /
    • 2002
  • 메타 검색 엔진에서 캐쉬의 사용은 사용자의 응답시간을 향상시킬 수 있다. 본 논문에서는 메타 검색 엔진의 구조와 동작을 보이고, 메타 검색 엔진을 위한 인기도 기반의 새로운 캐쉬 대체 방법을 제안한다. 인기도는 사용자들이 검색 엔진에 요청한 단어들의 출현 빈도수를 정규화한 값으로, 캐쉬 대체를 위한 기준치로 이용된다. 본 논문에서는 인기 검색어 수집 방법, 인기도 산출방법을 기술하고, 인기도를 기반으로 하는 새로운 알고리즘을 제안한다. 또한 실제 사용자가 검색 엔진에 입력한 자료를 바탕으로, 전통적인 캐쉬 대체 기법인 LRU, LFU 알고리즘과 제안된 알고리즘을 성능 평가하였다. 본 성능 평가에서는 제안된 알고리즘이 대다수의 경우 우수한 성능을 나타내었다.

주문형 전자신문 시스템에서 사용자 접근패턴을 이용한 기사 프리패칭 기법 (Article Data Prefetching Policy using User Access Patterns in News-On-demand System)

  • 김영주;최태욱
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1189-1202
    • /
    • 1999
  • As compared with VOD data, NOD article data has the following characteristics: it is created at any time, has a short life cycle, is selected as not one article but several articles by a user, and has high access locality in time. Because of these intrinsic features, user access patterns of NOD article data are different from those of VOD. Thus, building NOD system using the existing techniques of VOD system leads to poor performance. In this paper, we analysis the log file of a currently running electronic newspaper, show that the popularity distribution of NOD articles is different from Zipf distribution of VOD data, and suggest a new popularity model of NOD article data MS-Zipf(Multi-Selection Zipf) distribution and its approximate solution. Also we present a life cycle model of NOD article data, which shows changes of popularity over time. Using this life cycle model, we develop LLBF (Largest Life-cycle Based Frequency) prefetching algorithm and analysis he performance by simulation. The developed LLBF algorithm supports the similar level in hit-ratio to the other prefetching algorithms such as LRU(Least Recently Used) etc, while decreasing the number of data replacement in article prefetching and reducing the overhead of the prefetching in system performance. Using the accurate user access patterns of NOD article data, we could analysis correctly the performance of NOD server system and develop the efficient policies in the implementation of NOD server system.

  • PDF

Understanding Watching Patterns of Live TV Programs on Mobile Devices: A Content Centric Perspective

  • Li, Yuheng;Zhao, Qianchuan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권9호
    • /
    • pp.3635-3654
    • /
    • 2015
  • With the rapid development of smart devices and mobile Internet, the video application plays an increasingly important role on mobile devices. Understanding user behavior patterns is critical for optimized operation of mobile live streaming systems. On the other hand, volume based billing models on cloud services make it easier for video service providers to scale their services as well as to reduce the waste from oversized service capacities. In this paper, the watching behaviors of a commercial mobile live streaming system are studied in a content-centric manner. Our analysis captures the intrinsic correlation existing between popularity and watching intensity of programs due to the synchronized watching behaviors with program schedule. The watching pattern is further used to estimate traffic volume generated by the program, which is useful on data volume capacity reservation and billing strategy selection in cloud services. The traffic range of programs is estimated based on a naive popularity prediction. In cross validation, the traffic ranges of around 94% of programs are successfully estimated. In high popularity programs (>20000 viewers), the overestimated traffic is less than 15% of real happened traffic when using upper bound to estimate program traffic.