• 제목/요약/키워드: 다변량 통계분석

검색결과 475건 처리시간 0.024초

SRC-Stat 통계패키지를 이용한 생존분석 (Survival Analysis using SRC-Stat Statistical Package)

  • 하일도;노맹석;이영조;임요한;이재용;오희석;신동완;이상구;서진욱;박용태;조성준;박종헌;김유경;유경상
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.309-324
    • /
    • 2015
  • 본 논문에서는 SRC-Stat 통계패키지를 이용하여 생존자료를 분석하는 방법을 소개한다. 본 패키지는 단변량 생존 자료 분석을 위한 콕스의 비례위험모형 뿐만아니라, 다변량 생존자료분석을 위한 공통 및 지분 프레일티 모형과 같은 고급 생존분석법을 제공한다. 잘 알려져 있는 실제자료의 사용을 통해 본 패키지의 유용성을 예증한다.

결시적 자료에서 관측 중단을 모형화하기 위해 사용되는 경쟁 위험의 적용과 결합 모형 (Joint model of longitudinal data with informative observation time and competing risk)

  • 김양진
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.113-122
    • /
    • 2016
  • 경시적 자료는 반복적으로 측정된 다변량 자료의 한 형태로 임상학, 보건학, 경제학에서 자주 발생된다. 시계열자료와 구분되는 가장 큰 특징은 표본수와 공변량 효과의 추정에 있다. 경시적 자료는 일반적으로 시계열 자료보다 더 큰 표본 개체로 이루어져 있으며 연구의 주 관심은 특정 공변량의 효과를 추정하는 데 있다. 또한 시계열 자료보다 반복 측정 횟수가 짧으며 개체마다 다른 관측 횟수와 다른 관측 중단 시점을 가질 수 있다. 본 연구에서는 관측 시점과 관측 종료 원인이 경시자료와 서로 연관된 경우에 결합 모형을 적용함으로써 이들간의 연관성을 분석하고자한다. 따라서 이들 변량간의 연관성을 모형화하기 위해 이변량 랜덤효과가 적용된다. 실제 자료 분석에서는 간경변증 환자의 핼액 응고 수치 시간을 관심 있는 경시적 자료로 환자가 병원 방문시점과 관측 중단원인들간의 상호 연관관계를 규명하고자 하였다. 특히, 중도 절단원인은 사망이나 간이식을 받는 사건일 때 발생하는데 본 연구에서는 사망 사건과의 연관성이 고려되었다. 결과를 통해 혈액 응고 시간이 길고 병원 방문 시점이 빈번할수록 사망할 가능성이 높음을 알수 있었다. 또한 혈액응고 시간이 길수록 병원 방문 횟수가 빈번하였다.

주행시뮬레이터에 대한 탑승자의 감성공학적 평가 (Ergonomic Sensibility Evaluation of a Driving Simulator for Passenger Vehicle)

  • 엄성숙;이상철;손권;최경현
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2000년도 추계학술대회 논문집
    • /
    • pp.207-211
    • /
    • 2000
  • 주행 시뮬레이터는 여러 가지 주행상황을 탑승자에게 전달하고자 하는 장치이다. 기존의 주행 시뮬레이터에 관한 대부분의 연구는 탑승자의 감성평가에 관해 이루어지지 않았다. 본 논문에서는 탑승자의 감성을 주행 시뮬레이터에 피드백하여 주행 시뮬레이터의 성능을 향상시키고자 한다. 이를 위하여 본 논문에서는 다변량 해석형 수법, 기능 전개형 수법, 가상현실 감성공학 등을 응용하여 동적 시스템에 대한 측정 및 평가방안을 연구하였다. 설정된 목표감성인 운동감에 대한 20여개의 감성어휘 추출과 주행 시뮬레이터에 대한 분석을 통하여 차단주파수를 감성요인으로 정하였다. 감성어휘와 감성요인간의 관계를 평가하기 위하여 감성실험을 수행하였고, 그 측정결과를 통계학적으로 분석하였다.

  • PDF

합병일 이후 합병기업 주가의 장기성과 (Postmerger Share-Price Performance of Acquiring Firms in the Korean Stock Market)

  • 정형찬;박경희
    • 재무관리연구
    • /
    • 제16권1호
    • /
    • pp.83-114
    • /
    • 1999
  • 본 연구는 우리나라 기업지배권 시장에서 합병일 이후 합병기업 주가의 장기성과를 측정하고자 하였다. 이를 위해, 본 연구에서는 1980년에서부터 1994년까지의 15년 동안 이루어진 120개 합병기업을 대상으로 합병일 이후 3년 동안 합병기업 주식의 초과수익률을 추정하였다. 실증분석 결과, 전체표본(N=120)의 경우 합병일 이후 3년 동안 합병기업 주식의 누적초과수익률과 매입-보유 초과수익률의 값이 모두 마이너스를 나타내고 있으나 통계적으로 유의성이 없어, 합병일 이후 합병기업의 장기성과가 존재하지 않는다는 귀무가설을 기각하지 못했다. 그러나, 동일 계열기업을 합병한 합병기업의 부표본(N=105)과 비상장기업을 합병한 합병기업의 부표본(N=92)에서는, 합병기업의 장기성과가 모두 유의적인 마이너스 초과수익률로 나타났다. 그리고, 합병일 이후 합병기업 주가의 저성과 현상은 합병대상기업이 계열기업이면서 동시에 비상장기업일 경우에 더욱 두드러지게 나타난다는 것을 다변량 회귀분석을 통해 발견하였다. 계열기업간 합병 및 비상장기업과의 합병을 대상으로 한 이러한 연구결과는, 우리나라 기업집단의 지배구조와 기업문화와 상당한 관련성이 있는 것으로 생각된다.

  • PDF

귀납적 학습방법들의 분류성능 비교 : 기업신용평가의 경우 (Classification Performance Comparison of Inductive Learning Methods : The Case of Corporate Credit Rating)

  • 이상호;지원철
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.1-21
    • /
    • 1998
  • 귀납적 학습방법들의 분류성능을 비교 평가하기 위하여 대표적 분류문제의 하나인 신용평가 문제를 사용하였다. 분류기로서 사용된 귀납적 학습방법론들은 통계학의 다변량 판별분석(MDA), 기계학습 분야의 C4.5, 신경망의 다계층 퍼셉트론(MLP) 및 Cascade Correlation Network(CCN)의 4 가지이며, 학습자료로는 국내 3개 신용평가기관이 발표한 신용등급 및 공포된 재무제표를 사용하였다. 신용등급 예측의 정확도에 의한 분류성능을 평가하였는데 연도별 평가와 시계열 평가의 두 가지를 실시하였다. Cascade Correlation Network이 가장 좋은 분류성능을 보였지만 4가지 분류기들 사이에 통계적으로 유의한 차이는 발견되지 않았다. 이는 사용된 학습자료가 갖는 한계로 인한 것으로 추정되지만, 성능평가 과정에 있어 학습자료의 전처리 과정이 분류성과의 제고에 매우 유효함이 입증되었다.

  • PDF

산업 부도의 동조화 현상 연구 (A Study on the Comovement of Industry Default)

  • 전혜현;김소연;김창기
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1289-1312
    • /
    • 2015
  • 본 연구에서는 상장 기업을 중심으로 산업 부도의 동조화 현상에 대해 살펴보았다. 순위상관계수인 스피어만의 로(${\rho}$)와 켄달의 타우(${\tau}$)를 이용하여 부도의 컨코던스 즉, 부도율의 움직임이 얼마나 일치하는지를 측정하였다. 여기서 스피어만의 로와 켄달의 타우는 분포 가정이 필요하지 않고, 자료 숫자가 적거나 극단값을 갖는 경우에도 분석이용이하다는 장점을 가진 비모수 통계적 방법이다. 본 연구의 목적은 산업 부도의 동조화 현상을 살펴봄으로써 향후 일어날 금융위기를 예측하는 데에 있다. 또한 기업 경영인을 비롯하여 모든 시장참여자의 투자결정 및 위험관리, 더 나아가 산업 전반에 대한 이해에 도움이 되길 바란다.

다목적 다변량 자료분석을 위한 변수선택 (Variable Selection for Multi-Purpose Multivariate Data Analysis)

  • 허명회;임용빈;이용구
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.141-149
    • /
    • 2008
  • 다변량 자료분석에서 최근의 추세는 관측개체의 수 n이 커지는 외에 변수의 수 p가 큰사례들이 많아지고 있다는 것이다. n개 개체 각각에서 획득된 p개 변수들 $X_1$, $X_2$, $\ldots$, $X_p$ 가운데는 이름이나 개념적으로는 구분이 가능하지 만 실제로 거의 중복이 되는 변수들이 있을 수 있는데, 이들 변수들이 모두 분석에 포함되면 여러 문제가 유발될 수 있다. 예컨대 주성분 분석이나 인자분석에서는 중복 변수들이 주축(主軸, principal axis) 결정에, 관측개체 군집 화에서는 개체간 거리 산출에 왜곡된 영향을 줄 수 있다. 또한 목적변수가 지정된 지도학습(supervised learning)에서 설명변수들의 중복성은 추정모형의 안정성을 해치는 결과를 초래한다. 실제 자료 분석에서는 한 자료 세트가 여러 기법으로 탐색되고 다수의 모형이 추출되므로 변수세트를 최대한 절약적(parsimonious)으로 구성할 필요가 있다. 본 연구의 목적은 $X_1$, $X_2$, $\ldots$, $X_p$ 중에서 필요한 변수들은 선적하고 불필요한 변수들은 제거함으로써 주어진 변수세트를 보다 적은 크기의 변수세트로 대치하는 방법을 제시하는 데 있다. 제안 방법을 몇 개의 수치적 사례에 적용해 봄으로써 선적 변수와 제거변수간 관계의 시각화, 회귀모형에서의 유용성, 범주형 자료분석에서의 활용 등에 대해 논의 하고자 한다.

백강균(白殭菌)을 처리(處理)한 소나무림의 낙엽(落葉)과 토양(土壤)에 서식(棲息)하는 무척주동물(無脊柱動物) 군집(群集)에 대한 다변량분석(多變量分析) (Multivariate Analysis on Invertebrate Communities in Litter and Soils of Japanese Red Pine Forests treated by Beauveria bassiana)

  • 권태성;박영석;신상철;이범영
    • 한국산림과학회지
    • /
    • 제90권5호
    • /
    • pp.593-599
    • /
    • 2001
  • 다변량분석법(주성분분석법, PCA)을 이용하여 무척추동물 군집에 백강균 처리가 미치는 영향을 검정하였다. 좌표공간내의 군집들간의 거리를 이용하여, 군집구조에 미치는 요인들의 영향을 통계 검정하였다. 백강균 처리는 낙엽과 토양의 무척추동물 군집에 유의한 영향을 주지 않았다.

  • PDF

두 진단검사의 비교에 대한 민감도와 특이도의 다변량 메타분석법 (Multivariate Meta-Analysis Methods of Comparing the Sensitivity and Specificity of Two Diagnostic Tests)

  • 남선영;송혜향
    • Communications for Statistical Applications and Methods
    • /
    • 제18권1호
    • /
    • pp.57-69
    • /
    • 2011
  • 질병에 대한 새로운 진단검사 방법이 의학 연구자들에 의해 끊임없이 개발되고 있으며, 기존 진단검사 방법과 새로운 진단검사 방법을 비교하는 연구논문이 계속 출간되어 누적되고 있다. 메타분석법으로 다수 연구논문의 결과를 종합하여 정확성이 높은 진단검사에 대해 객관적인 결론을 내리게 된다. 이와같이 출간된 두 진단검사를 비교하는 각 연구논문은 각각 질병을 가진 개체와 질병을 가지지 않은 개체에 두 검사를 모두 실시하여 한 쌍의 민감도와 특이도를 구하여 비교한다. 이러한 연구논문의 결과를 종합하는 메타분석은 동일 개체에 실시한 두 검사로 인해 한 쌍의 민감도간의 연관성과 한 쌍의 특이도 간의 연관성을 고려한 메타분석법을 본 논문에서 제시한다. 논문예제 자료와 모의시험으로 메타분석 검정통계량의 효율성을 평가한다.

비정규분포를 이용한 표본선택 모형 추정: 자동차 보유와 유지비용에 관한 실증분석 (An Alternative Parametric Estimation of Sample Selection Model: An Application to Car Ownership and Car Expense)

  • 최필선;민인식
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.345-358
    • /
    • 2012
  • 표본선택 모형을 최우추정법으로 추정할 때 오차항의 분포를 제대로 가정하는 것이 매우 중요하다. 표본선택 모형의 선택 방정식과 본 방정식의 오차항 분포를 일반적으로 이변량 정규분포로 가정하지만, 이 가정이 오차항의 실제 분포를 과도하게 제약할 가능성이 있다. 본 연구는 표본선택 모형의 오차항 분포로 $S_U$-정규분포를 도입한다. $S_U$-정규분포는 분포의 비대칭성과 초과첨도를 허용한다는 측면에서 정규분포보다 훨씬 유연하면서, 동시에 정규분포를 극한분포의 형태로 포함하고 있다. 또한 정규분포처럼 다변량 분포함수가 존재하기 때문에 표본선택 모형과 같은 다변량 모형에서도 활용할 수 있다. 본 논문은 $S_U$-정규분포를 이용한 표본선택 모형에서 로그우도 함수와 조건부 기댓값을 도출하고, 시뮬레이션을 통해 정규분포 모형과 추정성과를 비교한다. 또한 자동차 보유 가구들의 자동차 유지비에 관한 실제 데이터를 이용하여 $S_U$-정규분포 표본선택 모형의 추정결과를 제시한다.