• 제목/요약/키워드: 순서통계량

검색결과 87건 처리시간 0.021초

텐서 스플라인 모형 선택에 관한 연구 (A study on selection of tensor spline models)

  • 구자용
    • 응용통계연구
    • /
    • 제5권2호
    • /
    • pp.181-192
    • /
    • 1992
  • 본 논문에서는 텐서 스플라인을 이용하여, 일반화된 선형모형의 회귀합수를 자료에만 의존 하는 방식으로 추정하는 문제를 고려하였다. 최우 추정법을 이용하여 회귀 함수를 추정하는 데, 이용된 텐서 스틀라인은 접목점의 수가 유한개이며, 독립변수 영역의 주변에서는 선형으 로 제한되었다. 접목점을 자료의 각 좌표의 순서 통계량에 위치하도록 했고 그 수는 AIC의 변형된 식을 최소로 하는 수로 결정 했다. 모의 실험 예를 통하여 추정량을 예시하였다.

  • PDF

희박다항분포확률에 대한 국소최대우도 추정량

  • 백장선
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.29-34
    • /
    • 2002
  • $p=(p_{}1,p_{2},{\cdots},p_{k})^{T}$의 확률벡터를 가진 다항분포로부터 관측된 칸 돗수(cell frequency) 벡터가 $N=(N_{1},N_{2},{\cdots},N_{k})^{T}$이며 ${\sum}{\limits}_{j=1}^{k}N_{j}=n$이라 하자. 총돗수 n이 칸의 총갯수 k에 비하여 상대적으로 매우 작을 때 이러한 이산형 자료를 희박다항분포자료(sparse multinomial data)라 한다. 이러한 희박다항분포자료의 칸들이 순서화 되어 있을 때 우리는 i번째 칸의 확률 $p_{i}$를 돗수 추정량 $N_{j}/n$ 들을 평활함으로써 추정 할 수 있다. Aerts, et al.(1997)과 Baek(1998) 등에 의해 제안된 국소최소제곱기준에 근거한 국소다항커널추정량은 희박점근일치성의 좋은 성질을 가짐에도 불구하고 확률추정지가 음수값을 가질 수 있는 단점을 내포하고 있다. 본 연구에서는 이러한 단점을 극복하기 위하여 국소최대우도 기준에 근거한 새로운 커널추정량을 제안하고, 그것의 점근적 성질을 연구하였다.

  • PDF

다변량 경험분포함수와 시각적인 표현방법 (Multivariate empirical distribution functions and descriptive methods)

  • 홍종선;박준;박용호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.87-98
    • /
    • 2017
  • 일변량 이상의 다변량 경험분포함수의 정의를 새롭게 제안하고, 경험분포함수의 기대값과 분산을 유도하면서 다변량 경험분포함수가 실제의 분포함수로 수렴함을 확인한다. 그리고 다양한 상관계수의 이변량 표준정규분포에서 추출한 확률표본을 바탕으로 이변량 경험분포함수를 구하고 이를 이차원 평면에 시각적으로 표현하는 두 종류의 그래픽적인 방법을 제안한다. 하나는 계단으로 표현하여 계단식 함수와 유사한 성격을 갖고 있는 방법이고, 다른 하나는 이변량 분위벡터로 설명되는 그림 방법이다. 두 종류의 시각적인 표현 방법은 삼차원으로 표현할 수 있으나 이차원 평면으로도 쉽게 구현이 가능하며, 일반적으로 이변량 누적분포함수의 모든 특징을 충분히 설명할 수 있다. 따라서 삼변량 경험분포함수를 시각적 표현이 가능함을 보인다. 이변량과 사변량의 실증 예제를 통하여 본 연구에서 제안한 다변량 경험분포함수와 이차원 평면에 표현하는 시각적인 표현 방법들을 구현하고 탐색한다.

시뮬레이션을 통한 다양한 로버스트 회귀추정량의 비교 연구 (A comparison study of various robust regression estimators using simulation)

  • 장수희;윤정연;전희주
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.471-485
    • /
    • 2016
  • 회귀모형의 대표적인 추정법인 최소제곱법은 오차항의 분포가 정규분포를 따르고 이상치가 없는 상황에서는 최적이지만, 자료가 회귀모형의 가정을 만족하지 않을 경우 또는 이상치를 포함하는 경우와 같이 자료가 오염된 상황에서는 왜곡된 추정 결과를 준다. 따라서 이상치에 민감한 최소제곱법의 단점을 보완하기 위해 다양한 로버스트 추정방법이 제안되었다. 본 논문에서는 MLE를 기반으로 제안된 M 추정량, 순서형 통계량을 기반으로 제안된 L 추정량, 잔차의 순위를 기반으로 제안된 R 추정량 계열에서 높은 붕괴점 또는 높은 효율을 갖는 대표적인 추정량들을 다양한 모의실험을 통해 비교 연구하였다. 추정량의 성능을 비교하는데 효율성 뿐만 아니라 편의, 분산을 포함한 분포를 살펴보았다. 그 결과 실제 데이터 적용에는 MM 추정량과 GR 추정량이 좋은 성능을 가진 것으로 보였다.

마이크로어레이 자료의 사전 처리 순서에 따른 검색의 일치도 분석 (A Concordance Study of the Preprocessing Orders in Microarray Data)

  • 김상철;이재휘;김병수
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.585-594
    • /
    • 2009
  • 마이크로어레이 실험의 실험자들은 원 측정치인 영상을 조사하여 통계적 분석이 가능한 자료의 형태로 변환하는데 이러한 과정을 흔히 사전 처리라고 부른다. 마이크로어레이의 사전 처리는 불량 영상의 제거(filtering), 결측치의 대치와 표준화로 세분되어질 수 있다. 표준화 방법과 결측치 대치 방법 각각에 대하여서는 많은 연구가 보고되었으나, 사전 처리를 구성하는 원소들간의 적정한 순서에 대하여서는 연구가 미흡하다. 표준화 방법과 결측치 대치 방법 중 어느 것이 먼저 실시되어야 하는지에 대하여서 아직 알려진 바가 없다. 본 연구는 사전 처리 순서에 대한 탐색적 시도로서 대장암과 위암을 대상으로 실시한 두 조의 cDNA 마이크로어레이 실험 자료를 이용하여 사전 처리를 구성하는 원소들간의 다양한 순서에 따라 검색된 특이 발현 유전자 군이 어떻게 변화하는지를 분석하고 있다. 즉, 결측치대치와 표준화의 여러가지 방법들의 조합에 따라 검색된 특이 발현 유전자 군이 얼마나 일치적인가를 확인하고자 한다. 결측치 대치 방법으로는 K 최근접 이웃 방법과 베이지안 주성분 분석을 고려하였고, 표준화 방법으로는 전체 표준화, 블럭별 국소(within-print tip group) 평활 표준화 그리고 분산 안정화를 유도하는 표준화 방법을 적용하였다. 따라서 사전 처리를 구성하는 두개 원소가 각각 2개 수준과 3개 수준을 가지고 있고, 두개 원소의 순열에 따른 모든 가능한 사전 처리 개수 수는 12개가 된다. 본 연구에서는 12개 사전 처리 방법 각각에 따라 정상 조직과 암 조직간 특이적으로 발현하는 유전자 군을 검색하였고, 사전 처리 순서를 바꾸었을때 유전자 군이 얼마나 일치적으로 유지되는지를 파악하고 있다. 표준화 방법으로 분산 안정화 표준화를 사용할 경우는 사전 처리 순서에 따라 특이 발현 유전자 군이 다소 민감하게 변하는 것을 보이고 있다.

Gumbel 분포에 대한 도시위치공식의 비교 (Comparison of Plotting Position Formulas for Gumbel Distribution)

  • 김수영;허준행;신홍준;고연우
    • 한국수자원학회논문집
    • /
    • 제42권5호
    • /
    • pp.365-374
    • /
    • 2009
  • 확률도시위치는 주로 도시적 해석을 통한 연최대홍수량 또는 연최대강우량의 초과확률의 추정치 산정에 사용되며 빈도해석을 통해 선정된 적정 확률분포형과 표본자료의 적합도를 도시적으로 파악할 수 있도록 해주기 때문에 오래 전부터 수문 및 수자원 분야에 널리 이용되어 왔다. 본 연구에서는 Gumbel 분포에 적합한 도시위치공식을 추정하고자 Gumbel 분포의 순서통계량과 확률가중모멘트를 이용하여 다양한 표본크기에 대한 도시위치공식의 기본식을 유도하였고, 최적화 기법 중 하나인 유전자 알고리즘을 이용하여 도시위치공식의 매개변수를 추정하였다. 또한 Gumbel 분포에 적합한 도시위치공식을 검토하고자 Gumbel 분포의 이론적인 축소변량과 본 연구에서 추정한 도시위치공식과 기존의 도시위치공식에 의해 계산된 축소변량 간의 평균제곱근오차와 편의를 비교하였다. 그 결과, Gringorten이 제안한 도시위치공식을 적용한 경우의 축소변량간 평균제곱근오차와 순서별 편의가 가장 작은 것으로 분석되었다.

가중 합치도 Hω와 κ의 새로운 역설 (Weighted Hω and New Paradox of κ)

  • 권나영;김진곤;박용규
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.1073-1084
    • /
    • 2009
  • 두 평정자가 R개의 순서형 반응 범주로 각 개체를 분류한 $R{\times}R$ 분할표에 대해, 불합치의 정도를 가중치로 부여한 가중 합치도 $H_{\omega}$를 제안하고, 최대 우도추정량 및 분산을 유도하였다. 또한 $2{\times}2$ 분할표에서 Feinstein과 Cicchetti(1990)가 제기한 마지막 역설을 새롭게 정의하고 증명하였으며, ${\kappa}$의 새로운 역설을 제기하고, ${\kappa}$와 주변분포의 전반적인 관계를 정리하였다.

비대칭 다차원척도법의 시각화 (Visualizations of Asymmetric Multidimensional Scaling)

  • 이수기;최용석;이보희
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.619-627
    • /
    • 2014
  • 다차원척도법(MDS)에서는 대게 개체간의 거리나 유사성이 대칭성을 따른다. 따라서 비대칭 거리를 다루기는 쉽지 않다. 통용되고 있는 비대칭 다차원척도법도 여전히 결과를 해석하는데 어려움이 있다. 본 연구는 비대칭행렬의 순서 통계량을 활용하여 더 간단한 비대칭 대차원척도법을 제안한다. 제안된 웹(Web) 방법은 개체간의 영향력을 사용자들이 해석을 쉽게 하도록 화살표의 방향크기와 모양에 따라 시각화하여 보여준다.

복합운동의 운동유형 순서변화가 비만여성에게 미치는 영향 (The Effect of Changing the Order of Exercise Types on Body Composition and Blood Lipid in Obese Women)

  • 한창수;이규승;이무식;황혜정
    • 한국산학기술학회논문지
    • /
    • 제10권12호
    • /
    • pp.3888-3894
    • /
    • 2009
  • 본 연구는 복합운동 유형 순서 변화에 따른 생리적, 생화학적 변화를 비교 하고자 40대 비만여성(n=18)을 대상으로 12주간 복합운동을 실시하였다. 복합운동 유형은 유산소성 운동과 저항성 운동그룹 A(n=9) 그리고 저항성 운동과 유산소성 운동그룹 B(=9)로 구성하였다. 체지방량의 경우 A그룹의 평균변화량이 B그룹 평균변화량보다 더 많이 감소하였고 통계적으로 유의한 차이를 보였다(p<0.01). 혈당의 경우는 A그룹보다는 B그룹이 더 많이 감소하였으며 통계적으로 유의한 차이를 보였다(p<0.01). 따라서, 비만 중년 여성의 체중감량을 위한 신체구성 변화 유도를 위해서는 복합운동의 순서 변화에 따른 운동유형이 선택적으로 사용되어질 수 있다.

베이지안 통계 추론 (On the Bayesian Statistical Inference)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.263-266
    • /
    • 2007
  • 본 논문은 베이지안 통계 추론에 대하여 논의한다. 논문은 베이지안 추론, Markov Chain과 Monte Carlo 적분, MCMC(Markov Chain Monte Carlo) 기법, Metropolis-Hastings 알고리즘, Gibbs 샘플링, Maximum Likelihood Estimation, EM 알고리즘, 상실된 데이터 보완 기법, BMA(Bayesian Model Averaging) 순서로 논의를 진행한다. 이러한 통계적 기법들은 대용량의 데이터를 처리하는 생물학, 의학, 생명 공학, 과학과 공학, 그리고 일반 데이터 조사와 처리 등에 사용되고 있으며, 최적의 추론 결과를 이끌어 내는데 중요한 방법을 제공하고 있다. 그리고 마지막으로 PC(Principal Component) 분석 기법에 대하여 논의한다. PC 분석 기법도 데이터 분석과 연구에 많이 활용된다.

  • PDF