• 제목/요약/키워드: Zipf Distribution

검색결과 21건 처리시간 0.019초

검색엔진에서 일간질의 어분포의 정상성에 관한 연구 (On Regularity of Daily Distribution of Queries in Search Engine)

  • 박상규;이찬규;윤경현;김성희;이준호
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.255-265
    • /
    • 2007
  • 하루에도 수백만 건 이상의 방대한 질의어가 입력되는 검색엔진을 통해 인터넷 검색 패턴을 분석하는데 활용될 수 있는 질의어 분포의 정상성을, Pareto 분포와 Zipf 모형을 이용해 검토하였다. 실제2주일간의 일간 검색어 분포를 Pareto 모형으로 적합 시킨 결과, 그 기울기가 1.33에서 1.34 정도로 일관되게 측정되고 있어 Pareto 분포를 이용해 일간질의어 분포의 정상성을 평가할수 있음을 제시하였다. 이런 연구결과는 사회적 관심사와 그 변동 흐름을 해석하는데 보다 객관적이며, 효율적인 자료를 제공해 줄 수 있을 것이다.

한글 문헌에 있어서 Zipfian 현상에 관한 연구 (A Study of Zipfian Phenomena in Hangul Literaure)

  • 신강현;이두영
    • 정보관리학회지
    • /
    • 제5권2호
    • /
    • pp.53-98
    • /
    • 1988
  • 본 연구는 Zipf가 최초에 유도한 공식이 한글 문헌에 있어서도 그 타당성이 성립하 는지의 여부를 조사 연구 하였다. 그 결과 한글 문헌에 있어서도 단어의 수록 빈도와 등급 사이에 일정한 통계적인 법칙성이 존재하며 이 현상은 Zipf가 유도한 공식과 일치하는 것으 로 나타났다. 한편 Zipf의 제2법칙은 한글 문헌에 적용되지 않았기 때문에 본 연구에서는 이 에 적합한 공식을 유도하였다.

  • PDF

주문형 전자신문 시스템에서 사용자 접근패턴을 이용한 기사 프리패칭 기법 (Article Data Prefetching Policy using User Access Patterns in News-On-demand System)

  • 김영주;최태욱
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1189-1202
    • /
    • 1999
  • As compared with VOD data, NOD article data has the following characteristics: it is created at any time, has a short life cycle, is selected as not one article but several articles by a user, and has high access locality in time. Because of these intrinsic features, user access patterns of NOD article data are different from those of VOD. Thus, building NOD system using the existing techniques of VOD system leads to poor performance. In this paper, we analysis the log file of a currently running electronic newspaper, show that the popularity distribution of NOD articles is different from Zipf distribution of VOD data, and suggest a new popularity model of NOD article data MS-Zipf(Multi-Selection Zipf) distribution and its approximate solution. Also we present a life cycle model of NOD article data, which shows changes of popularity over time. Using this life cycle model, we develop LLBF (Largest Life-cycle Based Frequency) prefetching algorithm and analysis he performance by simulation. The developed LLBF algorithm supports the similar level in hit-ratio to the other prefetching algorithms such as LRU(Least Recently Used) etc, while decreasing the number of data replacement in article prefetching and reducing the overhead of the prefetching in system performance. Using the accurate user access patterns of NOD article data, we could analysis correctly the performance of NOD server system and develop the efficient policies in the implementation of NOD server system.

  • PDF

웹 프락시 서버를 위한 적응형 캐시 교체 정책 (An Adaptive Cache Replacement Policy for Web Proxy Servers)

  • 최승락;김미영;박창섭;조대현;이윤준
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권6호
    • /
    • pp.346-353
    • /
    • 2002
  • 월드 와이드 웹 사용의 폭발적인 증가는 네트워크 트래픽과 서버 부하의 급격한 증가를 초래 하였다. 이러한 문제를 해결하기 위해 웹 프락시 캐싱 기술은 빈번히 요청되는 웹 문서를 사용자와 인접한 위치에 설치된 프락시(proxy)에 저장한다. 캐시 성능을 결정짓는 가장 중요한 요소는 캐시 교체 정책으로서, 가까운 미래에 빈번히 요청될 문서들을 저장하기 위해 사용된다. 캐시 교체 정책이 문서의 인기도를 정확히 예측하기 위해서는 웹 프락시 워크로드의 특성을 반영하는 것이 중요하다. 시간 지역성과 Zipf 빈도 분포는 웹 프락시 워크로드에서 빈번히 관찰되는 특성으로서 문서의 인기도를 예측하기 위한 중요한 속성들이다. 본 논문은 1) LFU를 기반으로 하여 Zipf 빈도 분포를 반영하며, 2) 문서들의 시간에 따른 인기도 감소를 효율적으로 측정하여 시간 지역성을 적응적으로 반영하는 적응형 LFU(ALFU) 캐시 교체 정책을 제안한다. 트레이스 기반의 모의 실험을 통해 다른 교체 정책들과 ALFU를 비교 분석한다. 실험 결과, ALFU는 다른 교체 정책보다 우수한 성능을 보였다.

Characterizing Memory References for Smartphone Applications and Its Implications

  • Lee, Soyoon;Bahn, Hyokyung
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제15권2호
    • /
    • pp.223-231
    • /
    • 2015
  • As smartphones support a variety of applications and their memory demand keeps increasing, the design of an efficient memory management policy is becoming increasingly important. Meanwhile, as nonvolatile memory (NVM) technologies such as PCM and STT-MRAM have emerged as new memory media of smartphones, characterizing memory references for NVM-based smartphone memory systems is needed. For the deep understanding of memory access features in smartphones, this paper performs comprehensive analysis of memory references for various smartphone applications. We first analyze the temporal locality and frequency of memory reference behaviors to quantify the effects of the two properties with respect to the re-reference likelihood of pages. We also analyze the skewed popularity of memory references and model it as a Zipf-like distribution. We expect that the result of this study will be a good guidance to design an efficient memory management policy for future smartphones.

모바일 장치와 공용 디스플레이 장치를 포함하는 환경에서 사용자의 특성에 기반한 Adaptive UI 설계 방안 (Method for Designing Adaptive UI Based on User's Context in the Environment Including Mobile Device and Public Display Device)

  • 강승수;고현;윤희용
    • 한국IT서비스학회지
    • /
    • 제11권4호
    • /
    • pp.181-194
    • /
    • 2012
  • The one of the most meaningful change in the recent ubiquitous environment is the omnipresence of public digital display device for providing ubiquitous information. It is the important issue to provide publicity as well as adaptive information to each user in the field of the public digital display device. This research proposes the idea ensuring fast response speed by the selection of user preference function. The preference function is selected by statistics using Zipf distribution in the system comprising mobile device and digital display device based on NFC (Near Field Communication). The idea is proved by CPM-GOMS model and the improvement of user response can be achieved.

User Centric Content Management System for Open IPTV Over SNS

  • Jeon, Seung Hyun;An, Sanghong;Yoon, Changwoo;Lee, Hyun-woo;Choi, Junkyun
    • Journal of Communications and Networks
    • /
    • 제17권3호
    • /
    • pp.296-305
    • /
    • 2015
  • Coupled schemes between service-oriented architecture (SOA) and Web 2.0 have recently been researched. Web-based content providers and telecommunications company (Telecom) based Internet protocol television (IPTV) providers have struggled against each other to accommodate more three-screen service subscribers. Since the advent of Web 2.0, more abundant reproduced content can be circulated. However, because according to increasing device's resolution and content formats IPTV providers transcode content in advance, network bandwidth, storage and operation costs for content management systems (CMSs) are wasted. In this paper, we present a user centric CMS for open IPTV, which integrates SOA and Web 2.0. Considering content popularity based on a Zipf-like distribution to solve these problems, we analyze the performance between the user centric CMS and the conventional Web syndication system for normalized costs. Based on the user centric CMS, we implement a social Web TV with device-aware function, which can aggregate, transcode, and deploy content over social networking service independently.

트위터에서 트윗 주기와 사용자 속도 사이 관계 (Relationship Between Tweet Frequency and User Velocity on Twitter)

  • 전소영;이알찬;서고은;신원용
    • 한국정보통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.1380-1386
    • /
    • 2015
  • 최근 위치 정보를 제공하는 온라인 소셜 네트워크 서비스들의 급증으로 인해 사용자들의 지리적 위치 데이터의 중요성이 강조되고 있다. 본 논문에서는 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 (geo-tagged tweet) 정보를 활용하여 트위터 사용자들의 정확한 위치와 트윗 전송시각을 알아낸 후, 이를 통해 사용자의 평균 이동속도와 트윗 주기 (tweet frequency) 사이의 관계를 분석한다. 구체적으로, 트윗 빈도수 계산 알고리즘을 소개하며, 결과에 대한 분석은 국가별, 도시별로 나누어 진행한다. 주요 결과로써, 사용자 속도에 따른 트윗 주기가 멱 법칙 분포 (power-law distribution) (또는 Zipf의 법칙 분포, Pareto 분포)를 따름을 보인다. 또한, 미국과 일본에서의 결과를 비교할 때, 일본에서의 분포도 지수가 미국의 경우에 비해 작음을 확인한다.

OTT 서비스를 위한 계층적 부호화 기반 멀티미디어 데이터 관리 시스템 (Hierarchically Encoded Multimedia-data Management System for Over The Top Service)

  • 이태훈;정기동
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.723-733
    • /
    • 2015
  • 여러 종류의 해상도를 가지는 단말들에 대해 인터넷을 통해 멀티미디어 동영상을 제공하는 OTT 서비스가 확산되고 있다. 각 단말들은 3G, LTE, VDSL, ADSL등 네트워크 망을 이용한 통신을 하고 있다. 다양한 해상도의 단말들과 다양한 속도의 네트워크망의 이용자들에 맞춰서 새로운 멀티미디어의 압축방식의 필요성이 높아졌다. 스케일러블 부호화 방식은 시간적/공간적 계위성을 제공하기 위해서 멀티미디어 데이터를 저장할 때 계층적 B 화면 구조를 이용하고 있다. 이를 이용하여 계층적으로 부호화된 멀티미디어 데이터는 OTT 서비스에 최적화 되어있으며, 이를 효율적으로 관리하기 위한 파일 배치 기법과 MLP 인기도 관리 정책, WFF 버퍼 캐시 관리 정책을 제안한다. 본 논문에서는 zipf 분포를 이용한 접근 트레이스를 생성하고, 기존 시스템과 제안한 시스템의 성능을 비교 평가하였다.

우리나라 공공도서관의 규모에 나타나는 복잡계 현상에 관한 연구 (A Study on the Behaviors of Complex System Revealed in the Sizes of Public Libraries in Korea)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제44권4호
    • /
    • pp.399-419
    • /
    • 2013
  • 이 연구는 우리나라 공공도서관의 규모를 나타내는 8가지 변인을 대상으로 2011년도 통계데이터를 적용한 분포에서 어떤 독특한 특성이 나타나는지를 실증적으로 분석하였다. 그 결과 8가지 규모변인들 모두에서 멱함수 법칙이 나타나는 복잡계 현상이 발견되었다. 우리나라 공공도서관의 규모에서 양극화가 발생한 것이다. 특히 연면적, 직원수, 도서수, 예산의 변인에서는 지프의 법칙이 나타났다. 그리고 등록회원수, 자료실 이용자수, 대출자수, 대출권수의 변인에서는 지프의 법칙보다 더 심하게 불균등한 분포가 나타났다. 따라서 우리나라 공공도서관 규모의 양극화 현상을 해소할 수 있는 정책의 개발이 요구된다.