• 제목/요약/키워드: 다변량 통계분석

검색결과 475건 처리시간 0.023초

벡터자기회귀모형과 오차수정모형의 자기상관성을 위한 와일드 붓스트랩 Ljung-Box 검정 (Wild bootstrap Ljung-Box test for autocorrelation in vector autoregressive and error correction models)

  • 이명우;이태욱
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.61-73
    • /
    • 2016
  • 본 논문에서는 다변량 시계열 모형 진단을 위해 잔차의 자기상관성 유무를 확인하기 위한 와일드 붓스트랩(wild bootstrap) Ljung-Box(LB) 검정통계량을 연구하였다. 일반적으로 LB 검정은 오차가 서로 독립이며 동일한 분포를 따른다는 IID 가정 하에 유도되는 점근적 카이제곱 분포를 이용한다. 한편 금융시계열 자료는 분산에 조건부 이분산성이 존재하기 때문에 오차의 IID 가정을 만족시키지 못하며 이에 따라 점근적 분포를 이용한 LB 검정은 제1종의 오류를 만족시키지 못하게 된다. 이를 극복하기 위해 와일드 붓스트랩을 이용한 LB 검정법을 제안하고 그 성질을 연구하고자 한다. 벡터자기회귀 모형과 벡터오차수정 모형 등의 다양한 다변량 시계열 모형을 이용하여 모의실험을 실시하는 한편, 코스피 200지수와 지수선물 자료를 이용한 실증분석을 통해 와일드 붓스트랩을 이용한 LB 검정법이 조건부 이분산성의 부정적인 영향을 효과적으로 제거할 수 있음을 입증하였다.

DCC 모델링을 이용한 다변량-GARCH 모형의 분석 및 응용 (Analysis of Multivariate-GARCH via DCC Modelling)

  • 최성미;홍선영;최문선;박진아;백지선;황선영
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.995-1005
    • /
    • 2009
  • 금융 시계열 자료들 간의 상관계수는 자산의 배분, 위험관리 그리고 포트폴리오의 선택에 있어서 중요한 역할을 한다. 이러한 상관계수들을 모형화하기 위해 단변량-GARCH 모형을 다변량-GARCH 모형으로 확장시킨 MGARCH류 모형들에 대한 많은 연구들이 진행되고 있다. 특히, CCC 모형 (Bollerslev, 1990)과 DCC 모형 (Engle, 2002)은 다른 모형들에 비해 추정해야 할 모수의 수가 작다는 이점으로 인해 분석에 널리 쓰이고 있다. 본 논문에서는 국내 주가자료에 대해 CCC 모형과 DCC 모형을 적합시킨 후, 각 모형들에 대한 VaR(value at risk)와 사후검증(back-testing), 결합예측영역(joint prediction region) 등을 통하여 두 모형의 예측 능력을 비교해 보고자 한다.

오미자(Schisandra chinensis)의 국내 산지별 화학적마커 선정을 위한 LC/MS 기반의 대사체학 접근법 (LC/MS-based metabolomics approach for selection of chemical markers by domestic production region of Schisandra chinensis)

  • 김인선;오선민;송하은;김두영;윤다혜;이대영;류형원
    • Journal of Applied Biological Chemistry
    • /
    • 제66권
    • /
    • pp.467-476
    • /
    • 2023
  • 오미자(Schisandra chinensis)는 오미자과에 속하는 낙엽활엽덩굴식물로 한국, 일본, 중국, 대만 등 동아시아에 널리 분포한다. 오미자에 함유된 주요 성분에는 리그난 화합물뿐만 아니라 트리테르페노이드 화합물도 포함되어 있는 것으로 보고되었다. 한국 산지별 오미자의 특성을 구별하기 위해 대사산물 프로파일링과 다변량 통계 분석 기법인 PCA을 수행하여 판별식을 설정하였고, 그 결과 triterpenoids 16종, lignan 9종, flavonoid, phenylpropanoid, fatty acid 각 1종을 동정하였다. 또한 다변량 통계분석을 통해 OPLS-DA의 s-plot 모델을 적용하여 단양, 문경, 거창, 평창의 4개 그룹을 구분하는 것을 확인하였고, lanostane, cycloartane, 그리고 schiartane triterpenoid, dibenzocyclooctadiene lignan 이 각각 화학적마커로 동정하였다.

주성분 분석을 이용한 빅데이터 분석 (Big Data Analysis Using Principal Component Analysis)

  • 이승주
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.592-599
    • /
    • 2015
  • 빅 데이터 환경에서 빅데이터를 분석하기 위한 새로운 방법의 필요성이 대두되고 있다. 데이터의 크기, 다양성, 그리고 적재 속도 등의 빅데이터 특성으로 인해 모집단의 추론에서 전체 데이터의 분석이 가능해졌기 때문이다. 그러나 전통적인 통계분석 방법은 모집단으로부터 추출된 확률표본에 초점이 맞추어져 있다. 따라서 기존의 통계적 접근방법은 빅데이터 분석에 적합하지 않은 경우가 발생한다. 이와 같은 문제점을 해결하기 위하여 본 논문에서는 빅데이터분석을 위한 새로운 접근방법에 대하여 제안하였다. 특히 대표적인 다변량 통계분석 기법인 주성분 분석을 이용하여 효율적인 빅데이터분석을 위한 방법론을 연구하였다. 제안방법의 성능평가를 위하여 통계적 모의실험을 실시하였다.

κ-공간중위 군집방법을 활용한 층화방법 (Stratification Method Using κ-Spatial Medians Clustering)

  • 손순철;전명식
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.677-686
    • /
    • 2009
  • 표본조사에서 널리 쓰이는 모집단의 층화는 추정의 효율을 높이는 방법 중의 하나지만, 이상점을 포함하는 변수가 있는 경우에 여러 가지 문제점을 유발시킬 수 있다. 특히, 이상점이 존재하는 다변량 자료의 경우, 층화를 위한 $\kappa$-평균 군집방법은 이상점에 매우 민감하여 추정의 효율을 떨어뜨릴 수 있다. 본 연구에서는 이상점이 존재하는 다변량 자료의 층화를 위해 $\kappa$-평균 군집방법보다 강건하며 이상점을 따로 식별하는 과정이 배제된 $\kappa$-공간중위수 군집방법을 제안한다. 기존 관련연구인 박진우와 윤석훈 (2008)과 동일한 자료에 대한 사례분석을 통해 층화과정들을 비교, 검토하였으며 이들의 효율성을 추정량의 분산을 통해 비교하였다.

잠재변수 모형에서의 군집효율을 이용한 변수선택 (Variable selection for latent class analysis using clustering efficiency)

  • 김성경;서병태
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.721-732
    • /
    • 2018
  • 잠재집단 모형은 다변량 범주형 자료 안에 숨겨진 집단을 찾는 매우 중요한 도구종의 하나이다. 하지만 실제 자료분석에서 너무 많은 관찰변수들을 포함시킨 모형은 모형을 복잡하게 만들고 또한 모수추정의 정확도에 영향을 주기 때문에 정보가 손실되지 않는 내에서 유용한 변수를 찾는 것은 중요한 문제이다. Dean과 Raftery (2010)은 잠재집단 모형에서의 변수선택을 위해 BIC를 이용한 Headlong search 알고리즘을 제시하였는데 본 논문에서는 이 방법을 대체할 수 있는 방법으로 적합한 모형으로부터 계산된 잠재집단에 속할 사후확률을 이용하여 변수 선택을 하는 방법을 제안하고자 한다. 이를 위하여 잠재집단 모형의 적합성을 측정할 수 있는 새로운 통계량과 이를 이용한 변수선택 알고리즘을 제시할 것이다. 또한 제안된 방법의 효율성을 모의실험과 실증자료 분석을 통해 살펴보고자 한다.

다변량 정규분포에서 대안적인 VaR의 특성 (Properties of alternative VaR for multivariate normal distributions)

  • 홍종선;이기쁨
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1453-1463
    • /
    • 2016
  • 가장 선호하는 금융위험 측정 방법은 통계적으로 최대손실금액을 추정하는 VaR (Value at Risk)이다. 포트폴리오를 구성하는 여러 산업에 대한 VaR (Value at Risk)는 분산공분산 행렬과 특정한 포트폴리오가 포함되어 변환된 일변량 위험을 이용하여 추정한다. Hong 등 (2016)은 다변량 분위벡터를 바탕으로 Vector at Risk를 정의하였으며, 특정한 포트폴리오가 설정되면 Vector at Risk 중의 한 점을 최적의 VaR 즉, 대안적인 VaR (AVaR)로 제안하였다. 본 연구에서는 다변량 정규분포에 대하여 AVaR의 특성을 탐색한다. 여러 종류의 분산공분산 행렬과 다양한 포트폴리오 가중값 벡터인 경우의 이변량과 삼변량의 정규분포를 따르는 모의실험 자료와 실증예제를 이용하여 대안적인 최대손실금액인 AVaR을 구하고 VaR과 비교 분석한다. 다변량 분위벡터를 이용한 AVaR는 VaR보다 작게 추정함을 발견하였으며, 이런 특징과 함께 AVaR의 특성을 토론한다.

다목적 표본조사를 위한 다변량 층화 : 어업비계통생산량조사를 위한 표본설계 사례 (Multivariate Stratification Method for the Multipurpose Sample Survey : A Case Study of the Sample Design for Fisher Production Survey)

  • 박진우;김영원;이석훈;신지은
    • 한국조사연구학회지:조사연구
    • /
    • 제9권1호
    • /
    • pp.69-85
    • /
    • 2008
  • 층화는 표본설계 단계에서 예비정보를 활용하는 대표적인 방법으로 대부분의 전국 단위의 표본설계에서 널리 활용된다. 층화의 효율을 극대화시키기 위해서는 조사목적에 부합되는 적절한 층화변수를 선택하는 것이 매우 중요하다. 하나의 표본을 통해 여러 개의 관심변수를 동시에 조사하는 다목적조사에서 다변량 층화변수가 있을 때 층화 전략을 세우는 것은 매우 복잡한 양상을 띤다. 본 연구에서는 관심변수의 수가 매우 많은 다목적조사를 위한 층화전략을 다룬다. 층화를 위해 구체적으로 사용하는 통계적 도구는 요인분석과 군집분석 등의 다변량 통계기법인데, 먼저 요인분석을 통해 적절한 층화변수들을 선정한 후 그 변수들을 이용하여 군집분석을 통해 층화를 하는 전략을 소개한다. 본 연구에서는 구체적으로 해양수산부의 어업비계통생산량조사를 위한 표본설계에서의 층화과정을 다룬다.

  • PDF

레이저유도붕괴분광법을 이용한 폐금속 분류 (Classification of Metal Scraps Using Laser Induced Breakdown Spectroscopy)

  • 신성호;이재필;문영민;최장희;정성호
    • 자원리싸이클링
    • /
    • 제27권1호
    • /
    • pp.31-37
    • /
    • 2018
  • 폐금속자원의 재활용률을 높이기 위해서는 섞여 있는 다양한 종류의 금속 스크랩을 자동으로 선별할 수 있는 금속 선별 시스템 개발이 요구된다. 레이저유도붕괴분광법(Laser induced breakdown spectroscpoy, LIBS)은 빠른 속도로 공기 중에서도 다원소 분석이 가능하여 실시간 선별이 가능한 측면에서 매우 우수한 기술로 여겨지고 있으며, 측정된 LIBS 데이터의 다변량 통계분석을 통해 분류 정확도를 크게 향상시킬 수 있다. 본 연구에서는 재활용 업체로부터 획득한 5종류의 현장 폐금속 시료의 LIBS 성분 분석을 진행하였다. 금속 종류별로 좀 더 정확한 선별을 위해 적합한 분광선의 선정을 토대로 다변량 통계분석법이 적용되었으며, 선정된 분광선들을 이용하여 높은 정확도와 속도로 분류가 가능한 것을 확인할 수 있었다. 본 연구를 토대로 LIBS 기술의 산업현장에서의 실시간 폐금속 선별 적용 가능성을 제시한다.

다변량 통계기법을 활용한 데이터기반 실시간 진단 (Data-based On-line Diagnosis Using Multivariate Statistical Techniques)

  • 조현우
    • 한국산학기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.538-543
    • /
    • 2016
  • 고품질의 제품과 조업 안전을 확보하기 위해서는 적절한 실시간 공정 감시 및 진단 시스템이 설치되어있는 것이 무엇보다 중요하다. 공정 감시 시스템과 결합된 신뢰도 높은 진단 시스템은 공정에서 발생한 특별한 사건이나 사고의 근본적인 원인과 공정 변수를 알려준다. 본 연구에서는 다변량 통계 분석과 분류기법에 기반한 공정진단 체계를 제시한다. 이 진단시스템은 비선형 데이터 표현과 필터링을 통한 지능적 데이터 표현으로 구성되어 있다. 진단 성능을 평가하기 위해 사례연구를 수행하였으며 다른 방법론과의 결과를 비교하기 위하여 진단 결과와 미래값 추정 방법을 평가하였다. 그 결과 본 연구에서 비교된 진단 방법론들에 비해 신뢰도 높은 진단 결과를 얻을 수 있었다.