• 제목/요약/키워드: 파레토분포

검색결과 57건 처리시간 0.022초

장기종속성을 갖는 트래픽의 시뮬레이션 분석 (A simulation analysis for long-range dependent traffic)

  • 윤복식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2006년도 추계학술대회
    • /
    • pp.383-387
    • /
    • 2006
  • 자기유사(self-similar)과정은 인터넷 트래픽을 보다 정확하게 분석하는데 꼭 필요한 확률과정이다. 본 연구는 계산이 간편하고 다양한 시간범위의 종속성을 반영할 수 있는 M/G/${\infty}$에 모형을 기반으로 하여 자기유사과정을 생성하는 방법을 채택하고 G를 파레토 분포로 표준화하여 적용 가능성을 다양하게 실험한다. 시뮬레이션에서 이산화를 매 단위시점으로 설정하지 않고 대기열에서의 도착, 이탈시점으로 설정하여 시뮬레이션의 속도를 높이고 보다 정확한 성능측정이 이루어지도록 시도한다.

  • PDF

검색엔진에서 일간질의 어분포의 정상성에 관한 연구 (On Regularity of Daily Distribution of Queries in Search Engine)

  • 박상규;이찬규;윤경현;김성희;이준호
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.255-265
    • /
    • 2007
  • 하루에도 수백만 건 이상의 방대한 질의어가 입력되는 검색엔진을 통해 인터넷 검색 패턴을 분석하는데 활용될 수 있는 질의어 분포의 정상성을, Pareto 분포와 Zipf 모형을 이용해 검토하였다. 실제2주일간의 일간 검색어 분포를 Pareto 모형으로 적합 시킨 결과, 그 기울기가 1.33에서 1.34 정도로 일관되게 측정되고 있어 Pareto 분포를 이용해 일간질의어 분포의 정상성을 평가할수 있음을 제시하였다. 이런 연구결과는 사회적 관심사와 그 변동 흐름을 해석하는데 보다 객관적이며, 효율적인 자료를 제공해 줄 수 있을 것이다.

극단값 분포 추정을 위한 모수적 비모수적 방법 (Parametric nonparametric methods for estimating extreme value distribution)

  • 우승현;강기훈
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.531-536
    • /
    • 2022
  • 본 논문은 꼬리가 두꺼운 분포의 꼬리부분에 대한 분포를 추정할 경우 모수적 방법과 비모수적 방법의 성능에 대해 비교하였다. 모수적 방법으로는 일반화 극단값 분포와 일반화 파레토 분포를 이용하였고, 비모수적 방법은 커널형 확률밀도함수 추정방법을 적용하였다. 두 접근법의 비교를 위해 2014년부터 2018년까지 서울시 관측소별 일일 미세먼지 공공데이터를 이용하여 블록 최댓값 모형과 분계점 초과치 모형을 적용하여 함수 추정한 결과를 함께 보이고 2년, 5년, 10년의 재현수준을 통해 고농도의 미세먼지가 일어날 지역을 예측하였다.

데이터 분포특성을 이용한 다목적함수 최적화 알고리즘 개발 (Development of a Multiobjective Optimization Algorithm Using Data Distribution Characteristics)

  • 황인진;박경진
    • 대한기계학회논문집A
    • /
    • 제34권12호
    • /
    • pp.1793-1803
    • /
    • 2010
  • 가중치법이나 목표계획법을 이용하여 다목적함수 최적화를 수행할 때 설계자는 각 함수에 적절한 가중치나 목표값을 설정해 주어야 한다. 하지만 파라미터를 잘못 설정하게 되면 파레토 최적해를 얻지못하기 때문에 이는 설계자에게 큰 부담이 된다. 최근에 데이터의 분포특성만을 이용하여 데이터의 평균과 함수 사이의 거리를 표현하는 마하라노비스 거리(MD)를 최소화하는 MTS기법이 개발되었다. 이 방법은 파라미터를 설정하지 않아도 되는 장점이 있지만 최적해가 참고데이터의 평균으로 수렴하는 단점이 있다. 따라서 본 연구에서는 방향성이 없는 기존의 MD에 방향성을 부여한 새로운 거리 척도인 SMD를 제안하였다. 그리고 SMD법이 계산과정에서 각 함수의 가중치를 자동으로 반영하고 평균에서 가장 멀리 위치한 한 점을 항상 파레토 최적해로 제공한다는 것을 2개의 단순예제를 통해 검증하였다.

링크다운 시간에 따른 TCP와 SCTP의 웹 트래픽 분석 (Web Traffic Analysis according to the Link-down Duration of TCP and SCTP)

  • 최용운;조광문;이용진
    • 한국콘텐츠학회논문지
    • /
    • 제10권3호
    • /
    • pp.44-52
    • /
    • 2010
  • 인터넷에서 가장 많이 사용하고 있는 월드 와이드 웹(world wide web) 트래픽은 트랜스포트 계층 프로토콜로 TCP를 사용하고 있다. TCP는 단일 경로를 사용하므로 경로상의 링크가 다운(down)된 후 다시업(up)될 때까지의 시간동안 통신할 수 없다. 이에 비해 SCTP는 다중 경로를 사용하므로 1차 경로가 다운되어도 대체 경로를 이용하여 통신이 가능하다. TCP와 SCTP의 성능을 비교하는 기존 연구들은 주로 파일 전송을 사용하여 수행되었고, 링크다운 환경에서 웹 트래픽을 다룬 연구는 없었다. 자기-유사성의 특징을 갖는 웹 트래픽은 웹 파일의 크기에 영향을 주는 파레토 분포의 형태(shape) 파라미터와 평균 도착 시간간격에 의해 특징지어지므로 이 두 개의 파라미터에 따른 성능 비교가 필요하다. 따라서 본 연구에서는 링크다운 환경에서 웹 트래픽의 특성을 반영하는 두 개의 파라미터를 변화시키면서 TCP와 SCTP의 처리율을 비교하였다. NS-2 시뮬레이션을 사용한 웹 트래픽의 실험 결과는 멀티호밍을 사용한 SCTP의 처리율이 TCP의 처리율보다 우수함을 보여주었다. 특히 웹 트래픽의 특성과 관련해서는 TCP가 SCTP에 비해 평균 도착시간 간격과 형태 파라미터에 더 많은 영향을 받았다. 이 연구의 결과는 링크의 다운기간에 따른 웹 트래픽의 성능변화를 예측하는 데 이용될 수 있다.

5MW급 수평축 풍력발전 블레이드의 다점 최적설계 (Multi-Point Design Optimization of 5MW HAWT Blade)

  • 박경현;전상욱;김상훈;정지훈;이기학;전용희;최동훈;이동호
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2009년도 추계학술대회 논문집
    • /
    • pp.474-477
    • /
    • 2009
  • 본 연구에서는 5MW급 수평축 풍력발전 블레이드에 대한 정격풍속과 낮은 풍속 영역을 고려하여 풍속에 대한 다점 최적설계를 수행하였다. 다점 최적설계를 수행하기 위해 블레이드 해석은 Blade Element and Momentum theory를 이용 하였으며, 설계 시 적용된 기저형상은 NREL에서 제안한 5MW급 풍력터빈 블레이드이다. 최적화 과정을 통해 얻어진 최적해의 집합에 대하여 L2 Norm을 통한 파레토분석을 하였으며, 이를 통해 기저형상의 연간 에너지생산량과 설비 이용률을 보다 향상 시킬 수 있었다.

  • PDF

로그형 특성분포에 근거한 소프트웨어 최적 방출시기에 관한 비교 연구 (The Comparative Study of Software Optimal Release Time Based on Log property Distribution)

  • 김희철;박형근
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.149-152
    • /
    • 2010
  • 본 연구에서는 소프트웨어 제품을 개발하여 테스팅을 거친 후 사용자에게 인도하는 시기를 결정하는 방출문제에 대하여 연구되었다. 인도시기에 관한 모형은 무한 고장 수에 의존하는 비동질적인 포아송 과정을 적용하였다. 이러한 포아송 과정은 소프트웨어의 결함을 제거하거나 수정 작업 중에도 새로운 결함이 발생될 가능성을 반영하는 모형이다. 적용모형은 여러 수명 분포들을 적합시키는데 효율적인 특성을 가진 콤페르쯔, 파레토, 로그-로지스틱 모형과 같은 로그형 특성분포를 이용하였다. 따라서 소프트웨어 요구 신뢰도를 만족시키고 소프트웨어 개발 및 유지 총비용을 최소화 시키는 방출시간이 최적 소프트웨어 방출 정책이 된다. 본 논문의 수치적인 예에서는 고장 간격 시간 자료를 적용하고 모수추정 방법은 최우추정법을 이용하여 최적 방출시기를 추정하였다.

  • PDF

Peacks over threshold를 이용한 Value at Risk: 모수추정 방법론의 비교 (Value at Risk with Peaks over Threshold: Comparison Study of Parameter Estimation)

  • 강민정;김지연;송종우;송성주
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.483-494
    • /
    • 2013
  • 국제적인 금융위기가 연달아 발생하면서, 금융리스크관리의 중요성이 어느 때보다 더 커지고 있다. 금융리스크관리의 주요 현안 가운데 하나는 리스크를 어떻게 측정할 것인가이며, 가장 널리 사용되고 있는 방법이 Value at Risk(VaR)이다. 금융자료가 최근 시장에서처럼 두꺼운 꼬리를 갖는 분포를 보일 때, 우리는 극단치 이론을 이용하여 VaR를 측정하는 방법을 고려할 수 있다. 이 논문에서는 꼬리가 매우 두꺼운 분포를 갖는 자료를 적합시킬 때 많이 사용되는 Peaks over Threshold(POT)를 이용하여 VaR를 측정하는 방법을 연구하였다. POT를 이용하기 위해서는 우선 일반화 파레토 분포(GPD)의 모수를 추정해야 하는데, 여기서 우리는 KOSPI 5분 자료를 이용하여 추정된 VaR의 성능을 살펴봄으로써 세 가지 다른 모수추정 방법을 비교하였다. 또한, Normal Inverse Gaussian(NIG) 분포에서 자료를 생성하여 두 가지 다른 모수추정 방법을 비교하기도 하였다. 이러한 비교를 통하여 KOSPI 수익률 자료의 첨도가 매우 큰 경우에는 최근 제안된 모수추정 방법들이 최대가능도 추정법에 비해 월등히 나은 성능을 보임을 알 수 있었고, 모의실험 자료에서도 같은 결과를 확인하였다.

꼬리가 두꺼운 분포의 고분위수에 대한 신뢰구간 (Confidence Intervals for High Quantiles of Heavy-Tailed Distributions)

  • 김지현
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.461-473
    • /
    • 2014
  • 꼬리가 두꺼운 분포의 고분위수에 대한 신뢰구간을 연구하였다. 통계량의 극한 분포에 근거한 점근적 방법과 붓스트랩 방법을 같이 고려하였다. 이 두 방법에 모수적, 비모수적, 준모수적 기법을 각각 적용할 수 있는데, 전체 11가지 신뢰구간의 성능을 실제신뢰수준과 길이로 비교하였다. 모의실험 결과 준모수적이면서 점근적인 신뢰구간과 축량을 이용하는 준모수적 붓스트랩 신뢰구간이 실제신뢰수준의 기준에서 안정된 성능을 보인다는 것을 알 수 있었다.

로그-정규분포와 파레토 합성 분포의 임계점 추정 (Threshold estimation for the composite lognormal-GPD models)

  • 김보배;노지숙;백창룡
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.807-822
    • /
    • 2016
  • LN-GPD 합성 분포는 몸통부분은 로그-정규분포를 두터운 꼬리에 대해서는 GPD분포를 따르도록 합성한 분포로 두터운 몸통과 꼬리를 동시에 가지는 자료를 절삭없이 효율적으로 다룰 수 있는 분포이다. 하지만 임계점을 포함하고 있기에 최대우도추정량은 매우 불안정함이 잘 알려져 있어 본 논문이서는 이를 극복하기 위해서 임계점을 먼저 추정하고 나머지 모수들에 대해서 따로 추정하는 2단계 추정 방법들에 대해서 살펴보고 그 성능을 비교해 보았다. 그 결과 동시 추정하는 최대우도추정량의 경우 불안정한 추정이 GPD 분포의 꼬리 지수에서 두드러 졌으며 임계점에 대해서는 비교적 잘 추정함을 알 수 있었다. 이와 반대로 여러 비모수적인 방법들은 꼬리 지수는 만족스럽게 잘 추정하였으나 임계점의 경우 편의가 있음을 관찰할 수 있었다. 실증자료 분석을 위해 2단계 추정법을 이스라엘 은행의 콜센터에서 수집한 서비스 시간에 대한 자료에 적합해 보았으며 그 결과 LN-GPD 합성 분포를 사용하는 것이 로그-정규분포 혹은 GPD 분포 단독으로 사용하는 것보다 자료의 손실도 없이 더 좋은 적합도를 보임을 알 수 있었다.