• 제목/요약/키워드: long-tail distribution

검색결과 48건 처리시간 0.032초

POWER TAIL ASYMPTOTIC RESULTS OF A DISCRETE TIME QUEUE WITH LONG RANGE DEPENDENT INPUT

  • Hwang, Gang-Uk;Sohraby, Khosrow
    • 대한수학회지
    • /
    • 제40권1호
    • /
    • pp.87-107
    • /
    • 2003
  • In this paper, we consider a discrete time queueing system fed by a superposition of an ON and OFF source with heavy tail ON periods and geometric OFF periods and a D-BMAP (Discrete Batch Markovian Arrival Process). We study the tail behavior of the queue length distribution and both infinite and finite buffer systems are considered. In the infinite buffer case, we show that the asymptotic tail behavior of the queue length of the system is equivalent to that of the same queueing system with the D-BMAP being replaced by a batch renewal process. In the finite buffer case (of buffer size K), we derive upper and lower bounds of the asymptotic behavior of the loss probability as $K\;\longrightarrow\;\infty$.

근사 꼬리분포의 유형별 적용 모형 고찰 (Review of Application Models According to the Classification of Asymptotic Tail Distribution)

  • 최성운
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2010년도 추계학술대회
    • /
    • pp.35-39
    • /
    • 2010
  • The research classifies three types of asymptotic tail distributions such as long(heavy, thick) tailed distribution, medium tailed distribution and short(light, thin) tailed distribution. The extreme value distributions(EVD) classified in this paper can be used in SPC(Statistical Process Control) control chart and reliability engineering.

  • PDF

음식 주문 배달 산업의 긴꼬리 효과에 관한 실증 연구 (The Long Tail Effect in the Online Food Ordering and Delivery Industry)

  • 안용길;이철성
    • 아태비즈니스연구
    • /
    • 제15권1호
    • /
    • pp.99-111
    • /
    • 2024
  • Purpose - This study aims to quantify the long tail effect in the digital economy. It also investigates the role of digital platform before and after the COVID-19 pandemic. Design/methodology/approach - We take advantage of a granular data set from one of the biggest digital platforms in Korea. Rather than computing the absolute number of products sold or the Gini coefficient, we estimate the slope of the log-linear relationship of the non-parametric sales distribution. Findings - We find that the use of online food order and delivery services is positively associated with individual restaurant's sales growth. We also document that the long tail effect is increasing over time. Long tail effects are clustered in the cross-section where average revenue per order is high or the restaurant belongs to the top 50% of the sales distribution. Research implications or Originality - The findings may indicate that digital platforms are contributing to the development of the digital economy in Korea. Also, we confirm that digital platforms make it possible for small and sole proprietors to go through the difficulties induced by the COVID-19 pandemic.

CLOSURE PROPERTY AND TAIL PROBABILITY ASYMPTOTICS FOR RANDOMLY WEIGHTED SUMS OF DEPENDENT RANDOM VARIABLES WITH HEAVY TAILS

  • Dindiene, Lina;Leipus, Remigijus;Siaulys, Jonas
    • 대한수학회지
    • /
    • 제54권6호
    • /
    • pp.1879-1903
    • /
    • 2017
  • In this paper we study the closure property and probability tail asymptotics for randomly weighted sums $S^{\Theta}_n={\Theta}_1X_1+{\cdots}+{\Theta}_nX_n$ for long-tailed random variables $X_1,{\ldots},X_n$ and positive bounded random weights ${\Theta}_1,{\ldots},{\Theta}_n$ under similar dependence structure as in [26]. In particular, we study the case where the distribution of random vector ($X_1,{\ldots},X_n$) is generated by an absolutely continuous copula.

두꺼운 꼬리를 갖는 연속 확률분포들의 꼬리 확률에 관하여 (On Tail Probabilities of Continuous Probability Distributions with Heavy Tails)

  • 윤석훈
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.759-766
    • /
    • 2013
  • 본 논문에서는 두꺼운 꼬리를 갖는 확률분포들의 여러 부류에 대해서 살펴본다. 주어진 하나의 확률분포가 이들 중 어떤 부류에 속하는 지를 알려면 해당 분포의 꼬리 확률에 대한 (점근) 표현식을 알아야만 한다. 그러나 대다수의 절대 연속 확률분포들은 분포함수가 아닌 확률밀도함수로 명시되기 때문에 통상적으로 이들의 꼬리 확률에 대한 표현식을 얻는 작업은 그리 쉬운 일이 아니다. 본 논문에서는 이러한 경우 확률밀도함수만을 이용하여 꼬리 확률에 대한 점근 표현식을 쉽게 얻을 수 있는 하나의 방법을 제안한다. 또한 제안한 방법을 설명하기 위하여 몇가지 예를 첨부한다.

불균형 데이터세트 학습에서 정확도 균일화를 위한 학습 방법에 관한 연구 (A Study of a Method for Maintaining Accuracy Uniformity When Using Long-tailed Dataset)

  • 박근표;박흠우;김종국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.585-587
    • /
    • 2023
  • Long-tailed datasets have an imbalanced distribution because they consist of a different number of data samples for each class. However, there are problems of the performance degradation in tail-classes and class-accuracy imbalance for all classes. To address these problems, this paper suggests a learning method for training of long-tailed dataset. The proposed method uses and combines two methods; one is a resampling method to generate a uniform mini-batch to prevent the performance degradation in tail-classes, and the other is a reweighting method to address the accuracy imbalance problem. The purpose of our proposed method is to train the learning models to have uniform accuracy for each class in a long-tailed dataset.

우리나라 연안의 기온과 수온 분포함수 추정 및 비교평가 (Estimation and Comparative Analysis on the Distribution Functions of Air and Water Temperatures in Korean Coastal Seas)

  • 조홍연;정신택
    • 한국해안·해양공학회논문집
    • /
    • 제28권3호
    • /
    • pp.171-176
    • /
    • 2016
  • 기온과 수온의 분포형태는 발생빈도의 양상을 결정하는 기본적이고 필수적인 정보이다. 또한 기후변화에 의한 기온과 수온의 장기변화 양상 파악에 유용하다. 기온과 수온의 전형적인 분포형태는 다수의 첨두(mode)를 가지는 형태로 일반적으로 널리 사용되는 정규분포로 표현하기에는 한계가 있다. 본 연구에서는 Gaussian 혼합함수와 Kernel 분포함수를 보다 기온과 수온의 보다 적합한 분포함수 형태로 제안한다. 제안된 분포함수를 우리나라 연안 기온과 수온자료를 이용하여 추정-평가한 결과, 관측 자료의 분포는 꼬리 영역에서 크게 차이를 보이고 있는 것으로 파악되었다. 높은 수온영역과 낮은 기온 영역에서 꼬리 영역이 길게 나타나고 있다. 또한 본 연구에서 제안한 분포함수 추정 및 비교는 기온과 수온의 상호 변동관계 및 장기적인 변동양상을 파악할 수 있다. 그러나 평균 기온 및 수온 그리고 정규분포 함수 형태로는 이러한 변화 양상의 파악은 크게 제한되고 있다.

한국의 미세먼지 시계열 분석: 장기종속 시계열 혹은 비정상 평균변화모형? (Time Series Modelling of Air Quality in Korea: Long Range Dependence or Changes in Mean?)

  • 백창룡
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.987-998
    • /
    • 2013
  • 이 논문에서는 한국의 대기질을 결정하는 중요한 수치인 미세먼지(PM10)에 대한 통계적 고찰을 한다. 2011년 매시 관찰된 자료 분석을 토대로 미세먼지가 매우 높은 시차에서도 강한 양의 상관관계를 가지는 장기 종속 시계열의 특징을 보임을 밝힌다. 또한 주변분포는 꼬리가 두터운 모형으로서 로그-정규분포보다는 일반화 파레토 분포가 훨씬 더 자료를 잘 적합함을 보인다. 하지만 이러한 높은 상관관계는 종종 단순한 평균변화 모형에 의한 그럴듯싸한 가짜 효과에 기인하기도 하여 통계모형을 세우는데 많은 혼동을 준다. 따라서 이 논문에서는 강한 종속성이 장기 종속 시계열에 의한 것인지 아니면 비정상 평균변화에 의한 것인지 근본적인 물리적 모형에 대한 논의를 통계적인 가설 검정을 통해 살펴본다. 그 결과 미세먼지의 강한 종속성은 구조변화에의한 착시 효과임을 밝힌다.

Numerical study of propeller boss cap fins on propeller performance for Thai Long-Tail Boat

  • Kaewkhiaw, Prachakon
    • Ocean Systems Engineering
    • /
    • 제11권4호
    • /
    • pp.373-392
    • /
    • 2021
  • The present paper purposes a numerical evaluation of the Thai Long-Tail Boat propeller (TLTBP) performance by without and with propeller boss cap fins (PBCF) in full-scale operating straight shaft condition in the first. Next, those are applied to inclined shaft conditions. The actual TLTBP has defined an inclined shaft propeller including the high rotational speed, therefore vortex from the propeller boss and boss cap (hub vortex) have been generated very much. The PBCF designs are considered to weaken of vortex behind the propeller boss which makes the saving energy for the propulsion systems. The blade sections of PBCF developed from the original TLTBP blade shape. The integrative for the TLTBP and the PBCF is analyzed to increase the performance using computational fluid dynamics (CFD). The computational results of propeller performance are thoroughly compared between without and with PBCF. Moreover, the effects of each PBCF component are computed to influence the TLTBP performance. The fluid flows around the propeller blades, propeller boss, boss cap, and vortex have been investigated in terms of pressure distribution and wake-fields to verify the increasing efficiency of propulsion systems.

데이터 활용률 제고를 위한 기술 용어의 상호 네트워크 생성과 통제 (Generating and Controlling an Interlinking Network of Technical Terms to Enhance Data Utilization)

  • 정도헌
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.157-182
    • /
    • 2018
  • 빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.