• 제목/요약/키워드: 2-포아송 분포모형

검색결과 33건 처리시간 0.02초

2-포아송 모형의 전문검색시스템 응용에 관한 연구 (Application of the 2-Poisson Model to Full-Text Information Retrieval System)

  • 문성빈
    • 정보관리학회지
    • /
    • 제16권3호
    • /
    • pp.49-63
    • /
    • 1999
  • 본 연구는 질문용어의 분포가 초록/표제 및 전문으로 표현된 문헌 내에서 2-포아송 분포를 따르고 있는지를 조사하였으며 질문용어의 2-포아송 분포여부가 확률이론에 기반을 둔 이진독립모형과 2-포아송 독립모형에서 초록/표제 및 전문의 검색효율성에 미치는 영향을 비교 분석하였다.

  • PDF

2-포아송 모형을 이용한 한글 주제어 선정에 관한 연구 (A Study on the Applicability of 2-Poisson Model for Selecting Korean Subject Words)

  • 정영미;최대식
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.129-148
    • /
    • 2000
  • 최근 구축된 한글 실험문헌 집단을 대상으로 2-포아송 모형의 Z값의 주제어 식별력을 측정하였으며, 역문헌빈도와 2 포아송 모형간의 상관관계를 분석하였다. 이를 위해 Z와 수정 $\beta$값 및 IDF와 수정 TF.IDF 가중치를 하위 실험집단별로 각기 산출, 비교하였다. 실험 결과 Z값의 주제어 선정능력은 3개의 하위 실험집단 가운데 과학기술분야에서만 확인되었다. 2-포아송 모형의 Z값과 역문헌빈도 가중치간의 상관관계 분석에서는 전문(full text)인 여성학분야 실험집단에 비해 초록 및 신문기사와 같이 단문(short text)으로 구성된 과학기술분야 및 일반사회 분야 실험집단에서 상관관계가 더 크게 나타 났다.

  • PDF

이변량 영과잉-포아송모형에서 변화시점에 관한 추론 (Inferences for the Changepoint in Bivariate Zero-Inflated Poisson Model)

  • 김경무
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권2호
    • /
    • pp.319-327
    • /
    • 1999
  • 영과잉-포아송분포는 여러 형태의 불량률을 줄이는 생산공정과정에서 유용하게 이용되어 왔다. 또한 생산공정과정 중 미지의 변화시점 이후 불량률의 변화가 있는지를 알아보는 것은 흥미 있는 일이고 연구된바있다. 만약 불량품들이 서로 두가지 다른 형태의 규격에 의해 발생되었다면, 이는 일변량이 아닌 이변량 영과잉-포아송 분포를 이용해야 할 것이다. 본 논문은 이변량 영과잉-포아송모형에서 어느 미지의 시점 이후 분포의 변화가 있는지를 우도비 검정을 통해 알아본다. 또한 변화가 있다면 변화시점과 그리고 여러 형태의 모수들에 대한 점추정량을 알아보려 한다.

  • PDF

포아송 모형에서의 설명변수 선택문제 - 정규분포 설명변수하에서 - (Subset Selection in the Poisson Models - A Normal Predictors case -)

  • 박종선
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.247-255
    • /
    • 1998
  • 일반선형 모형의 하나인 포아송모형에서 설명변수들을 선택하는 문제를 고려하여 보았다 설명변수들이 정규분포를 따르는 확률변수일 때 반응변수의 조건부 분포를 통하여 모형에 필요한 설명변수의 부분집합을 선택하는 방범을 제시하였다.

  • PDF

시뮬레이션을 통한 베이즈요인에 의한 모형선택의 비교연구 : 포아송, 음이항모형의 선택과 정규, 이중지수, 코쉬모형의 선택 (Comparative Study of Model Selection Using Bayes Factor through Simulation : Poisson vs. Negative Binomial Model Selection and Normal, Double Exponential vs. Cauchy Model Selection)

  • 오미라;윤소영;심정욱;손영숙
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.335-349
    • /
    • 2003
  • 본 논문에서는 포아송분포 대 음이항분포, 그리고 정규분포, 이중지 수분포 대 코쉬분포에 대한 모형선택을 위하여 베이지안 방법을 사용한다. 각 모수에 대한 사전분포로는 무정보 부적절 사전분포의 가정 하에, 베이지안 모형선택을 위하여 O'Hagan (1995)의 부분적 베 이즈요인을 이용하였다. 실제자료와 모의 실험 자료의 분석을 통하여 부분적 베이즈요인의 유용성을 Berger와 Pericchi (1996, 1998)의 내재적 베이즈요인들과 함께 비교 검토해 본다.

포아송과정을 이용한 가뭄의 공간분포 분석 (Analysis of Drought Spatial Distribution Using Poisson Process)

  • 유철상;안재현;류소라
    • 한국수자원학회논문집
    • /
    • 제37권10호
    • /
    • pp.813-822
    • /
    • 2004
  • 본 연구에서는 경기도 지역을 중심으로 관측자료로 부터 아울러 포아송 과정을 적용하여 가뭄의 재현 및 지속특성을 정량화하고 그 공간분포를 비교 분석해 보았다. 본 연구에서는 관측된 월 강수량 자료를 가뭄지수인 SPI로 변환하여 분석에 이용하였다. 특히, 가뭄의 공간분포 특성 파악을 위해 관측길이가 서로 다른 자료에 포아송 과정을 적용하는 경우의 장ㆍ단점 등을 파악해 보고자 하였다. 본 연구의 결과를 요약하면 다음과 같다. (1) 포아송 과정을 이용한 가뭄의 정량화는 특히 관측기록이 짧은 경우에 유리한 것으로 나타났다. 공간적으로 가까운 위치에 있는 두 지점의 특성이 관측기록의 길이에 덜 민감해 짐에 따라 전체적으로 유사한 특성을 나타냄을 확인할 수 있었다. (2) 지점별 관측기록의 길이가 크게 다른 경우 모형에 의한 가뭄의 공간적 특성 파악이 단순히 관측자료를 이용한 경우에 비해 우월할 수 있다. 본 연구의 경우에 있어서도 모형을 이용한 경우 가뭄의 공간분포가 관측을 직접 분석하여 얻은 가뭄의 공간분포보다 뚜렷하게 나타남을 확인할 수 있었다.

지수화 지수 분포에 의존한 NHPP 소프트웨어 신뢰성장 모형에 관한 연구 (The Study for NHPP Software Reliability Growth Model based on Exponentiated Exponential Distribution)

  • 김희철
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.9-18
    • /
    • 2006
  • 유한고장수를 가진 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개당 고장 발생률은 일반적으로 상수, 혹은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 기존의 소프트웨어 신뢰성 모형인 Goel-Okumoto 모형과 Yamada-Ohba-Osaki 모형을 재조명하고 최근에 Gupta 와 Kundu(2001)에 의해서 2 모수 감마분포나 와이블 분포의 대체모형으로서 여러 가지 수명자료를 분석함에 있어서 효율적 분포가 됨이 밝혀진 지수화된 지수 분포를 이용한 모형을 제안하였다. 고장 간격시간으로 구성된 자료를 이용한 모수추정 방법은 최우추정법과 일반적인 수치해석 방법인 이분법을 사용하여 모수 추정을 실시하고 효율적인 모형 선택은 편차자승합(SSE), AIC 통계량 및 콜모고로프 거리를 적용하여 모형들에 대한 효율성 입증방법을 설명하였다. 소프트웨어 고장 자료 분석에서는 NTDS 자료를 통하여 분석하였다. 이 자료들에서 기존의 모형과 지수화된 지수 분포 모형의 비교를 위하여 산술적 및 라플라스 검정, 편의 검정 등을 이용하였다.

  • PDF

An application to Multivariate Zero-Inflated Poisson Regression Model

  • Kim, Kyung-Moo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권2호
    • /
    • pp.177-186
    • /
    • 2003
  • The Zero-Inflated Poisson regression is a model for count data with exess zeros. When the correlated response variables are intrested, we have to extend the univariate zero-inflated regression model to multivariate model. In this paper, we study and simulate the multivariate zero-inflated regression model. A real example was applied to this model. Regression parameters are estimated by using MLE's. We also compare the fitness of multivariate zero-inflated Poisson regression model with the decision tree model.

  • PDF

포아송 분포의 혼합모형을 이용한 기부 횟수 자료 분석 (The Analysis of the Number of Donations Based on a Mixture of Poisson Regression Model)

  • 김인영;박수범;김병수;박태규
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.1-12
    • /
    • 2006
  • 본 논문에서는 2002년에 (사)볼런티어21에서 실시한 설문조사 자료를 이용하여 2001년에 우리나라 개인들이 기부한 횟수에 영향을 주는 유의한 변수들을 식별하였다. 기부횟수의 경험적 분포로 미루어 모집단은 기부를 적게 하는 집단과 많이 하는 집단으로 구성되며 따라서 모집단 분포를 두개 포아송 분포의 혼합분포로 모형화하였다. 이 모형에 기초하여 기부횟수에 영향을 미치는 변수들을 식별하였다. EM알고리즘을 이용하여 모수를 추정하고 2.5%와 97.5%에 기초한 백분위수 신뢰구간을 보완한 BCa(bias-corrected and accelerated) 신뢰구간을 계산하여 유의한 변수들을 찾았다. 연구결과 혼합 포아송 회귀모형에서는 기부횟수가 적은 집단("작은 군")과 기부횟수가 많은 집단("큰 군") 모두에서 소득과 자원봉사의 경험 유무(1:예, 0:아니오)가 기부횟수에 유의적으로 영향을 주는 변수로 밝혀졌다. 또한 두 변수 각각에서 회귀계수가 양수로 나타나 소득이 많을수록, 혹은 자원봉사의 경험이 있는 사람일수록 기부횟수가 증가하는 것을 알 수 있다. 그러나 소득과 자원봉사 변수의 회귀계수는 "작은 군"이 "큰 군"에 비해 더욱 크게 나타나고 있다. "작은 군"보다 "큰 군"의 사람들에게 기부가 생활화되어 있고, 따라서 소득과 자원봉사의 경험 유무가 기부횟수에 미치는 영향이 상대적으로 적은 것으로 파악된다.

NHPP에 기초한 소프트웨어 신뢰도 모형에 대한 비교연구 (The Comparative Study for Software Reliability Models Based on NHPP)

  • 간광현;김희철;이병수
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.393-400
    • /
    • 2001
  • 본 논문에서는 비동질 포아송 프로세스(NHPP)에 기초한 소프트웨어 에러 현상에 대한 확률 모형을 고려하였다. 고장 패턴은 NHPP에 대한 강도함수와 평균값 함수로서 나타낼 수 있다. 따라서 본 논문에서는 기존의 모형인 Goel 이 제시한 일반화모형[2]과 Yamada, Ohba-Osaki 모형[11]을 재조명하고 이러한 모형과 연관되고 신뢰도 분포로 많이 사용되는 와이블 분포의 특수형태인 레일리(Rayleigh)분포와 겜벨(Gumbel)분포[5]를 이용한 모형을 제시하고, 또 효율적 모형을 위한 모형선택으로서 편차자승합(SSE)을 이용하여 비교하였다. 모수의 추정을 위해서 최우추정법(MLE)과 일반적인 수치해석적 방법인 이분법을 이용하였다. 수치적인 예에서는 실측자료인 NTDS 자료[4]를 이용하여 모수 및 신뢰도를 추정하였고 편차자승합을 이용한 모형비교의 결과를 나열하였다.

  • PDF