• 제목/요약/키워드: 카이제곱 적합도검정

검색결과 11건 처리시간 0.027초

종속관측중단이 관측중단된 자료의 적합도 검정에 미치는 영향

  • 김주한;김정란
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.33-42
    • /
    • 1995
  • 종속 관측중단(dependent censoring)이 카이제곱 형태의 적합도 검정에 어떻게 영향을 미치고 종속도와 관측중단된 정도에 따라 검정의 오류와 검정력이 변화하는 형태를 시뮬레이션을 통해 경험적으로 알아보았다. Sakar(1987)가 제안한 이변량 지수분포로부터 종속 관측중단된 자료를 만들어 Kim(1993)이 제안한 방법과 Akritas(1988)가 제안한 적합도의 검정방법을 적용하였다. 전체적으로 Kim(1993)의 검정법이 더 효과적이었으며 관측 중단된 정도가 클 때는 중속도에 따라 검정의 오류와 검정력이 무척 크게 변하였다.

  • PDF

집락자료의 분할표에서 독립성검정 (Testing Independence in Contingency Tables with Clustered Data)

  • 정광모;이현영
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.337-346
    • /
    • 2004
  • 랜덤표본에 관한 이원분할표의 독립성검정에는 통상 피어슨의 카이제곱적합도검정과 우도비검정을 사용한다. 그러나 랜덤표본이 아닌 집락자료에 관한 분할표의 경우에는 이들 검정법은 잘못된 결과를 나타낸다. 이러한 경우에는 공변량의 고정효과 외에 집락에 따른 변량효과를 함께 포함하는 일반화선형혼합모형을 고려함으로써 집락간의 이질성과 집락내의 종속성을 반영할 수 있다. 본 연구에서는 집락자료의 분할표에 대한 일반화선형혼합모형을 소개하고 실례를 통하여 이들 모형의 적합에 대해 논의한다.

토지이용시설과 자전거도로 유형의 관계 분석 연구 (The Cycleway Types by Land Uses Analysis)

  • 변완희;임하얀;윤은주
    • 대한교통학회지
    • /
    • 제28권3호
    • /
    • pp.19-28
    • /
    • 2010
  • 국내의 자전거도로는 대체로 주변 토지이용시설 특성을 고려하지 않은 채 계획되고 있다. 이와 같이 획일화된 도로계획은 효율적이지도 못할뿐더러 안전과 이용편리에 있어서 최적의 환경을 제공할 수가 없다. 따라서 본 연구는 보다 안전하고 편리한 자전거도로 이용환경 구축을 목적으로, 자전거도로 유형에 대해 물리적 시설측면의 분류를 시도하였고, 토지이용시설 이용자의 통행특성을 조사 분석하였다. 카이제곱 독립성검정을 통해서 토지이용시설 간에 통행특성의 차이가 있음을 확인했고, 군집분석과 자전거도로 유형 결정기준을 통해 해당 토지이용시설에 적합한 자전거도로 유형을 제시하였다.

수문학적 데이터의 자릿수 빈도 분석 적용가능성 연구 (A study on applicability of the digit frequency analysis to Hydrological Data)

  • 박정은;맹승진;임광섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.102-102
    • /
    • 2023
  • 벤포드 법칙(Benford's Law)은 실생활에서 관찰되는 수치 데이터를 첫 자리 숫자에 따라 분류할 때 첫 자리의 숫자가 커질수록 그 분포가 점차 감소되는 현상을 말한다. 이러한 벤포드 법칙은 일반식으로 도출하여 다양한 자릿수로 확장하여 적용할 수 있는 연구결과가 제시되었으며, 회계학, 사회과학, 물리학, 컴퓨터과학, 생물학 등 다방면의 수치 자료에서 그 유효성이 확인되고 있다. 자릿수의 관찰빈도를 분석하는 것만으로 많은 양의 실생활 데이터에서 빠르고 쉽게 데이터 조작여부를 탐지하거나 1차적인 데이터 품질검사에 효과적으로 활용되고 있다. 본 연구에서는 다학제적 연구의 측면에서 수학·물리적 법칙인 벤포드 법칙을 일유량 등 다양한 수문학 측정자료에 적용하여 그 적용가능성을 확인하고 자료의 불균질성과 신뢰성을 빠르게 탐지할 수 있는 방법론을 제시하고자 한다. 수문자료는 공인심의를 통해 자료의 신뢰도를 확보하고 있으나 확정·배포까지 약 2년이 소요되어 활용기간 단축에 대한 사용자 요구가 지속되고 있는 실정이다. 따라서 본 연구에서는 분석대상 데이터의 자릿수 관찰빈도가 벤포드 법칙에 의한 예상자릿수 빈도를 따르는지 여부에 대한 가설을 설정하고 카이제곱 검정 또는 Kolmogorov-Smirnov(K-S) 검정 등을 통해 적합도에 대한 통계적 유의미함을 분석함으로써 대략적으로나마 빠르고 쉽게 측정자료의 신뢰성을 판단할 수 있다. 본 연구는 다양한 학문과의 결합을 통한 새로운 접근을 시도함으로써 빅데이터 시대에 효과적으로 수자원의 개발, 관리 및 운영의 의사결정을 하는데 도움이 될 수 있을 것으로 판단된다.

  • PDF

여대생의 건강증진 행위에 영향을 미치는 요인 (Antecedents of Health-Promoting Behavior Among Female University Students in Korea)

  • 신혜숙;신현숙
    • 동서간호학연구지
    • /
    • 제14권1호
    • /
    • pp.78-86
    • /
    • 2008
  • 본 연구는 여대생의 건강증진행위를 설명하기 위하여, 문헌고찰을 통해 가설적 모형을 도출하고, 여대생을 대상으로 건강증진행위를 횡단적으로 조사하여 모형의 적합성과 모형에서 제시된 가설을 검증하는 서술적 상관관계 연구이다. 연구에 사용된 변수는 건강증진행위와 관련된 선행 문헌의 고찰을 근거로 선정되었으며, 총 280명의 자료가 최종 분석에 이용되었다. 설문지는 Pender의 건강증진모형을 기초로 하여 개발하였으며, 조정요인 5문항, 건강상태 지각 3문항, 건강 통제위 4문항, 자아 존중감 5문항, 건강증진 행위 24문항의 총 41문항으로 구성하여 사용하였다. 개발된 항목에 대하여 간호대학생들을 대상으로 사전 조사를 실시하여 최종적인 설문지를 완성하였다. 본 연구모형에 대한 구성개념의 파악을 위해서 탐색적 요인분석을 실시하였고, 측정항목에 대한 요인별 단일 차원성 확인 및 통계적 검정을 위해 확인적 요인분석을 실시하였다. 연구의 가설검증을 위해 공변량 구조분석을 실시하였다. 모형의 적합도는 카이제곱은 244.04(자유도=121, p<0.001), GFI=0.91, CFI=0.97, NNFI=0.96, RMSR= 0.022으로 나타났다. 분석결과 여대생의 자아존중감과 내적통제위는 건강상태지각 및 건강증진행위에 유의한 영향을 미치는 요인으로 확인되었으며, 여대생의 건강상태지각은 건강증진행위에 유의한 영향을 미치는 것으로 나타났다.

  • PDF

가능도함수를 이용한 로그분산함수의 불연속점 검정 (Testing of a discontinuity point in the log-variance function based on likelihood)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권1호
    • /
    • pp.1-9
    • /
    • 2009
  • 회귀모형의 분산함수가 알려져 있지 않은 한 점에서 불연속이라 가정하자. Yu와 Jones (2004)는 음이 아닌 값을 취하는 분산함수를 실수 값을 취하도록 하기 위하여 로그 변환하였고, 변환된 로그분산함수를 국소다항적합으로 추정하였다. 로그분산함수의 국소다항적합을 이용하여, Huh (2008)는 분산함수의 불연속점의 추정하는 대신 로그분산함수의 불연속점을 추정하였다. 본 연구는 Huh의 점프의 크기 추정량의 점근분포를 이용하여 로그분산함수의 불연속점의 존재여부에 대한 가설검정을 제안하고, 제안한 방법에 대한 모의실험 결과를 제시하고자 한다.

  • PDF

K-리그에서 축구 골의 분포 (Soccer goal distributions in K-league)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1231-1239
    • /
    • 2014
  • 본 연구에서는 1983년부터 2012년까지의 한국프로축구 K-리그 전 경기 결과를 이용하여 홈 경기와 원정 경기에서의 골의 분포를 분석하였다. 고려된 확률분포는 포아송분포, 음이항분포, 극단치분포 및 영과잉 포아송분포이며, 카이제곱분포를 이용한 적합도검정을 수행하였다. 그 결과 홈경기는 포아송분포, 원정경기는 영과잉 포아송분포가 골의 분포를 위한 최적 적합분포로 간주되며 홈경기와 원정경기 골의 수는 서로 약한 정도의 상관관계가 있는 것으로 나타났다.

문화마케팅 관심도에 따른 기업이미지 및 의복구매행동에 관한 연구 - 유니클로 브랜드를 중심으로 - (A Study on the Corporate Image and Clothes Purchasing Behavior Depending on the Degree of Interest in Cultural Marketing - Focusing on Uniqlo Brand -)

  • 류미애;박옥련
    • 경영과정보연구
    • /
    • 제31권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 본 연구는 문화마케팅에 대한 관심도가 기업이미지에 어떤 영향을 미치고, 나아가 기업이미지가 소비자의 의복구매행동에 어떠한 영향을 미치는가를 실증적으로 분석하고자 '유니클로' 패션브랜드를 선정하여 연구하였다. 이에 응답자의 일반적 특성에 따른 빈도차이 검정을 위하여 카이제곱 검정(Chi-square test), 평균차이 검정을 위한 독립표본 T-test 를 실시하였다. 그리고 비율척도간의 영향을 알아보기 위한 다중회귀분석(Multiple Regression)을 실시하였고, 경로분석은 AMOS16.0을 이용해 경로 모형의 적합성을 검증하고, 각각의 경로계수를 구하였다. 분석결과, 소비자의 문화마케팅 관심도에 따라 기업신뢰, 마케팅 등의 기업이미지에 영향을 미치고, 기업이미지는 소비자의 의복구매행동과 만족도에도 영향을 미치는 것으로 나타났다. 즉, 문화마케팅을 활용하는 기업에 관심이 많거나 다양한 문화행사에 참여해 본 소비자일수록 '유니클로'가 문화적 요소를 마케팅에 적극 활용함으로써 건실한 이미지의 신뢰감 있는 기업이라 생각하는 것을 알 수 있었다. 이와 같이 긍정적으로 형성된 '유니클로'의 기업이미지는 제품구매에도 영향을 미치고, 구매 후에도 메세나 운동에 동참한 기분이 들어 만족도가 높게 나타나는 것을 알 수 있었다. 본 연구는 특정 브랜드를 선정하여 조사한 연구이기 때문에 연구결과를 일반화시키는 데는 한계가 있다. 그러나 향후 문화마케팅 시장의 개척과 활성화를 위한 실증연구에 도움이 되고, 선도적 기업의 사례를 통해 문화마케팅 활용 유, 무 기업들에게 시사점을 줄 수 있다.

  • PDF

일반국도 설계시간계수의 적정 확률분포 선정 및 추정 (The Selection of Optimal Probability Distribution and Estimation for Design Hourly Factor in National Highway Roads)

  • 조준한;한종현;김성호;이병생
    • 대한교통학회지
    • /
    • 제24권6호
    • /
    • pp.33-43
    • /
    • 2006
  • 본 연구는 도로의 기능 및 통행특성. 차로수, 연평균일교통량 등을 고려하여 설계시간계수와의 관계를 살펴보고 적정 확률분포형 선정과 K값을 추정하였다 이를 위해 2005년도 상시 교통량 조사지점에서 수집된 교통자료를 이용하여 14개의 확률분포형을 적용하였다. 각 확률분포형은 최우도법을 이용하여 매개변수를 추정하였으며 각 분포형별로 매개변수 적합성 조건을 검토하였다. 적정 확률분포형의 결정은 chi-square검정을 통하여 대상 분포형의 기각유무를 판단하였으며. 그 결과에 대해 우선순위를 정하여 적정 확률분포형을 선정하였다. 그리고 각 유형별 AADT에 따른 적정 K계수를 추정하였다. 그 결과, 지방부 2차로 및 4차로. 도시부, 관광부도로의 적정 확률분포형은 각각 Pearson V, LogLogistic, LogLogistic, Extreme value 분포로 분석되었으며 적정 K계수는 각각 $0.1{\sim}0.2,\;0.09{\sim}0.14,\;0.07{\sim}0.13,\;0.1{\sim}0.2$로 추정되었다.

Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스 (Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis)

  • 박민희;조영복;김소영;박종배;박종혁
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1277-1286
    • /
    • 2018
  • 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.