• 제목/요약/키워드: 파레토분포

검색결과 57건 처리시간 0.021초

시간에 따라 변화하는 로그-정규분포와 파레토 합성 분포의 모형 추정 (Time-varying modeling of the composite LN-GPD)

  • 박소진;백창룡
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.109-122
    • /
    • 2018
  • 임계값을 기준으로 그 보다 작은 값은 로그정규분포(lognormal distribution; LN)를, 큰 값은 일반화파레토분포(generalized Pareto distribution; GPD)를 따르는 합성 분포를 LN-GPD 합성분포라 한다. Scollnik (2007)은 LN-GPD 합성분포가 로그정규분포와 GPD를 합성 시킴으로써 자료의 손실 없이 꼬리가 두꺼운 분포에서 좋은 적합력을 가진다고 밝혔다. 본 논문에서는 시간에 따라 변하는 LN-GPD 평균모형을 다루었으며 방법론으로는 국소 다항최대우도법을 기반으로 추정하는 방법에 대해서 연구하였다. 시간에 따라 변하는 분포를 추정함으로써 자료에 대한 훨씬 자세한 이해가 가능하며 이는 곧 상담원 배치나 자원배분과 같은 운영관리에 큰 도움을 줄 수 있다. 본 연구는 GPD 분포만을 고려한 Beirlant와 Goegebeur (2004)를 확장하여 절삭한 로그정규분포를 추가하여 자료의 손실 없이 자료의 특징을 살펴볼 수 있다는데도 의의가 있다. 모의실험을 통해 제안한 방법론의 적절함을 살펴 보았고 실증 자료 분석으로 이스라엘 은행의 콜센터 서비스 시간에 대해 분석하여 상담원 배치와 관련된 흥미로운 결과를 찾을 수 있었다.

꼬리가 두꺼운 분포의 고분위수에 대한 준모수적 붓스트랩 신뢰구간 (Semi-parametric Bootstrap Confidence Intervals for High-Quantiles of Heavy-Tailed Distributions)

  • 김지현
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.717-732
    • /
    • 2011
  • 꼬리가 두꺼운 분포의 고분위수에 대한 신뢰구간을 구할 때 적절한 붓스트랩 방법은 무엇인가에 대해 알아보았다. 비모수적 방법과 모수적 방법, 그리고 준모수적 방법의 성능을 모의실험을 통해 비교하였다.

기술혁신분포, 기술모방분포 그리고 신 국제무역이론에 대한 실증연구 (An Empirical Study on the Technology Innovation Distribution, Technology Imitation Distribution and New International Trade Theory)

  • 조상섭;민경세;조병선;황호영
    • 기술혁신학회지
    • /
    • 제21권2호
    • /
    • pp.860-874
    • /
    • 2018
  • 본 연구는 신 국제무역이론(Melitz, 2012, 2014, 2015)에 대한 실증분석을 목적으로 한다. 신 국제무역이론은 기업기술역량에 대한 이질적 기업분포가 무역효과에 미치는 영향을 중심으로 전개되고 있으며, 기업기술역량분포형태가 무역효과를 결정한다는 중요한 가정에서 출발한다. 본 연구는 실증적으로 우리나라 제조업에 기업기술역량분포를 추정하였다. 이 연구목적을 위하여 우리나라 총 기업기술역량분포를 기술혁신과 기술모방분포로 분리하였으며, 분포형태의 적합성에 대하여 통계적으로 검증하고, 신 국제무역이론기반에 대한 적정성을 평가하였다. 연구시사점으로 본 분석결과를 바탕으로 기술정책 및 산업정책 방향을 간단하게 제언하였다.

해양사고 원인을 분류하기 위한 공통단어의 축소에 관한 연구 (A Study on the Reduction of Common Words to Classify Causes of Marine Accidents)

  • 임정빈
    • 한국항해항만학회지
    • /
    • 제41권3호
    • /
    • pp.109-118
    • /
    • 2017
  • 주제어(key word, KW)는 해양사고의 주요한 원인을 간단하게 표현하기 위한 단어들의 집합으로 해양안전심판원의 심판관들이 작성한다. KW는 심판관들의 서로 다른 주관적인 견해 때문에 일관성 유지가 어렵고, KW의 수가 너무 많은 문제점이 있다. 이러한 문제를 해결하기 위해서는 최적화된 최소의 공통단어(common word, CW)를 이용한 체계적인 KW 구축 프레임이 필요하다. 본 연구의 목적은 체계적인 KW 구축 프레임 개발에 필요한 CW을 도출하는데 있다. 이러한 목적을 달성하기 위하여 본 연구에서는 파레토(Pareto) 분포함수와 파레토 지수를 이용한 최적의 최소 CW 도출방법을 제안하였다. 총 2,642개의 KW을 수집한 후, 수집한 KW의 세부 단어와 이들의 빈도를 갖는 데이터 세트에서 총 56개의 특징적인 CW를 식별하였다. 56개의 특징적인 CW를 이용한 단어 축소실험을 통해서 평균 58.5%의 축소율을 획득하였고, 축소율에 따라서 추정한 CW는 파레토 차트로 검증하였다. 이를 통해서 체계적인 KW 구축 프레임 개발이 가능할 것으로 기대된다.

네트워크이론과 경제구조 그리고 경제충격에 관한 실증연구: 기술경제적 함의 (An Empirical Study on the Network Theory, Economic Structure and Economic Shocks: The Implications on Technology Economics)

  • 조상섭;강신원
    • 기술혁신학회지
    • /
    • 제16권4호
    • /
    • pp.937-953
    • /
    • 2013
  • 경제변동의 원인과 발생과정 그리고 발전방향에 대한 이론적 논의가 활발하게 전개되고 있다. 본 연구는 경제변동에 대한 설명이론으로 네트워크 이론[Acemoglu, et al. 2012, 2010]을 적용하여 우리나라 경제변동성에 대한 실증적 연구를 수행하였다. 2000년도, 2005년도와 2010년도 3개년도 산업연관표를 적용하여 실시한 실증분석결과를 보면, 다음과 같이 분석결과를 요약할 수 있다. 먼저 우리나라 경제구조는 2000년도에 비하여 2005년도 그리고 2010년도가 1차 상호연결성과 2차 상호연결성의 파레토분포 인자가 지속적으로 높아지고 있다. 이러한 분석결과로부터 우리나라 네트워크 경제구조는 과거에 부문사이에 높은 연결성을 갖는 경제구조에서 그 연결성이 낮아지고 있는 경제구조로 변화하고 있음을 알 수 있다. 둘째, 유클리드 놈으로 측정된 우리나라 산업부문사이에 평균 영향력 벡터는 2000년도에 비하여 2005년도 그리고 2010년도에 더욱 낮아졌다. 이 분석결과는 핵심적 산업부문의 영향력이 낮아지고 있음을 보여주며, 산업부문사이에 투입과 산출의 상호연결성이 약화되고 있음을 보여 준다. 이 분석결과는 한 부문의 경제적 충격이 느리게 진행되는 특징이 존재하지만, 전체 경제에 그 부문충격이 2000년대 초기에 비하여 상대적으로 완화되었음을 보여준다. 이러한 연구결과를 바탕으로 몇 가지 산업 및 기술정책적 시사점을 제시하였다.

  • PDF

절단고정시간에 근거한 파레토 NHPP 소프트웨어 신뢰성장모형에 관한 비교 연구 (The Comparative Study for NHPP of Truncated Pareto Software Reliability Growth Model)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제12권1호
    • /
    • pp.9-16
    • /
    • 2012
  • 소프트웨어 시스템의 대규모자료의 적용 때문에 소프트웨어 신뢰도는 소프트웨어 개발에 중요한 역할을 해왔다. 본 연구에서는 고장시간에 관련된 소프트웨어 신뢰성장모형이 제안되었다. 이러한 검사시간은 미리 정해진 절단 고정 시간을 의미한다. 본 연구에서는 소프트웨어의 강도함수, 평균값 함수 및 신뢰도와 모수추정에 대하여 나열하고 파레토 분포를 수명분포로 적용한 비동질적인 포아송 과정을 적용하였다. 본 논문의 수치적인 예에서는 고장 간격 시간 자료를 적용하고 모수추정 방법은 최우 추정 법을 이용하고 추세분석을 통하여 자료의 효율성을 입증한 후 평균자승오차와 $R_{SQ}$(결정계수)를 이용하고 예측 값과 실제 값의 차이에 의존한 효율적인 모형을 선택 비교하였다.

Likelihood based inference for the shape parameter of Pareto Distribution

  • Lee, Jae-Un;Lee, Woo-Dong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1173-1181
    • /
    • 2008
  • In this paper, when the parameter of interest is the shape parameter in Pareto distribution, we develop likelihood based inference for this parameter. Specially, we develop signed log-likelihood ratio statistic and the modified signed log-likelihood ratio statistic for the shape parameter. It is well-known that as sample size grows, the modified signed log-likelihood ratio statistic converges to standard normal distribution faster than the signed log-likelihood ratio statistic. But the computation of the modified signed log-likelihood statistic is hard or even impossible when the sufficient statistics and the ancillary statistics are not clear. In this case, one can consider an approximation to the modified signed log-likelihood statistic. Specially, when the parameter of interest is informationally orthogonal to the nuisance parameters, we propose the approximate modified signed log-likelihood statistic. Through simulation, we investigate the performances of the proposed statistics with the signed log-likelihood statistic.

  • PDF

파레토분포(分布)에서 두 모수(母數)의 함수(函數) 추정(推定) (Estimation for Functions of Two Parameters in the Pareto Distribution)

  • 우정수;강석복
    • Journal of the Korean Data and Information Science Society
    • /
    • 제1권
    • /
    • pp.67-76
    • /
    • 1990
  • For a two-parameter Pareto distribution, the uniformly minimum variance unbiased estimateors(UMVUE) for the function of the two parameters are expressed in terms of confluent hypergeometric function. The variance of the UMVUE is also expressed in terms of hypergeometric function of several variables. UMVUE's for the ${\gamma}th$ moment about zero and several useful parametric functions, and their variances are obtained as special cases. The estimators of Baxter(1980) and Saksena and Johnson(1984) are special cases of our estimator.

  • PDF

POT방법론을 이용한 자동차보험 손해율 추정 (Estimation of Car Insurance Loss Ratio Using the Peaks over Threshold Method)

  • 김수영;송종우
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.101-114
    • /
    • 2012
  • 자동차보험의 손해율이란 지급보험금의 수입보험료에 대한 비율을 의미한다. 손해율이 매우 큰 값을 갖는 대형손실이 일어나는 경우에는 보험회사의 재무적인 부분에 큰 악영향을 미치게 된다. 따라서 보험회사가 이에 대비할 수 있도록 하기 위하여 손해율의 극단 분위수(extreme quantile)를 추정하는 것은 매우 중요한 일이다. 다른 종류의 보험 관련 데이터와 같이 손해율의 분포는 오른쪽으로 긴 꼬리를 갖는 두꺼운 꼬리분포(heavy-tailed distribution)를 갖는다. 이런 자료에서 극단 분위수룰 추정하기 위하여 가장 많이 사용되는 방법론은 POT(Peaks over threshold)와 Hill 추정(Hill estimation)이다. 본 논문에서는 일반화파레토분포(generalized Pareto distribution; GPD)의 다양한 모수추정방법론의 성능을 모의실험과 실제 손해율 데이터를 사용하여 비교, 분석하였다. 또한 Hill 추정치를 사용하여 극단 분위수를 추정하였다. 그 결과 대부분의 경우에 POT 방법론이 Hill 추정치를 이용한 방법보다 정확한 분위수를 추정하였고, 모수추정방법론 중에서는 MLE, Zhang, NLS-2 방법론이 가장 좋은 결과를 보여주었다.