• 제목/요약/키워드: 분위수

검색결과 82건 처리시간 0.028초

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형 (Divide and conquer kernel quantile regression for massive dataset)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.569-578
    • /
    • 2020
  • 분위수 회귀모형은 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 특히 커널 분위수 회귀모형은 비선형 관계식을 고려하기 위하여 양정치 커널함수(kernel function)에 의해 만들어지는 재생 커널 힐버트 공간(reproducing kernel Hilbert space)에서 비선형 조건부 분위수 함수를 추정한다. 그러나 KQR은 이차계획법으로 공식화되어 많은 계산비용을 필요로 하므로 컴퓨터 메모리 능력의 제한으로 대용량 자료의 분석은 불가능하다. 이러한 문제점을 해결하기 위하여 본 논문에서는 분할정복(divide and conquer) 알고리즘을 활용한 KQR 추정법(DC-KQR)을 제안한다. DC-KQR은 먼저 전체 훈련자료를 몇 개의 부분집합으로 무작위로 분할(divide)한 후, 각각의 부분집합에 대하여 KQR 분위수 함수를 추정하고 이들의 산술 평균을 이용하여 최종적인 추정량으로 통합(conquer)하는 기법이다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DC-KQR의 효율적인 성능과 활용 가능성을 확인하였다.

반응표면실험계획을 평가하기 위한 동적분위수그림 (Animated Quantile Plots for Evaluating Response Surface Designs)

  • 장대홍
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2010년도 춘계학술대회
    • /
    • pp.115-120
    • /
    • 2010
  • 반응표면실험계획들을 평가하기 위한 방법으로서 전형적인 방법이 알파벳최적화이다. 그러나 이러한 알파벳최적화(D-, A-, G-, V-최적화 등)는 하나의 수치이므로 그 유용성에도 불구하고 반응표면실험 계획들이 갖는 추정반응값분산의 분포에 대한 정보에 한계를 갖는다. 이를 극복하고자 하는 대안으로서 그래픽 방법들이 있는데 우리는 그 중에 분위수그림을 애니메이션화한 동적분위수그림을 제안할 수 있고 이 동적분위수그림을 이용하여 반응표면실험계획들이 갖는 추정반응값분산의 분포를 서로 비교, 평가 할 수 있다.

  • PDF

분위수 회귀를 이용한 가속수명시험 자료 분석 (Accelerated Lifetime Data Analysis Using Quantile Regression)

  • 노지연;김희정;나명환
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.631-638
    • /
    • 2008
  • 가속수명시험은 실제 사용조건보다 열악한 수준으로 시험하여 빠른 기간 내에 제품의 고장자료를 얻고, 실제 사용조건에서의 수명관련 품질 특성치를 추정하는 방법이다. 본 논문에서는 가속수명 자료를 이용하여 분위수 회귀추정 방법을 통해 정상 조건에서의 수명을 추정하는 방법을 제안한다. 대표적인 가속 스트레스인 온도와 전압을 갖는 실제 자료에 분위수 회귀 모형을 적용하여 수명을 추정하였다.

원유가격에 대한 환율의 인과관계 : 비모수 분위수검정 접근 (Quantile causality from dollar exchange rate to international oil price)

  • 정기호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.361-369
    • /
    • 2017
  • 본 논문은 국제원유가격에 대한 환율의 인과관계를 분석하였다. 두 변수의 인과관계에 대해서는 많은 선행연구들이 있지만 인과관계의 유무에 대해서는 결과들이 일치하지 않고 있다. 본 연구는 이러한 상반된 결과들이 경제상황에 따라 각기 다른 인과관계가 분석되었을 가능성에 착안해서 분위수별로 인과관계를 분석하며 이 점에서 지금까지 평균 인과관계를 분석한 선행연구들과 차별화된다. 자료는 Brent 원유의 국제가격과 미국의 주요국 환율의 가중평균 (major currencies dollar index; MCDI)의 1987년 5월부터 2013년 7월까지 기간의 월별자료를 이용하였다. 분석방법으로서 분위수 인과관계 개념에 대해 비모수 커널방법을 적용한 Jeong 등 (2012) 방법을 사용하였다. 분석결과, 전통적인 평균 인과관계에서는 달러 환율이 원인이고 Brent 원유가격이 결과인 인과관계가 존재하는 반면에, 비모수분위수검정에서는 중앙값인 0.5 분위수 근방의 분위수에서는 인과관계가 존재하고 대부분 분위수에서 인과관계는 존재하지 않는 것으로 나타나서 평균인과 검정결과를 해석할 때 주의가 필요한 것으로 나타났다.

베이즈 정보 기준을 활용한 분할-정복 벌점화 분위수 회귀 (Model selection via Bayesian information criterion for divide-and-conquer penalized quantile regression)

  • 강종경;한석원;방성완
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.217-227
    • /
    • 2022
  • 분위수 회귀 모형은 변수에 숨겨진 복잡한 정보를 살펴보기 위한 효율적인 도구를 제공하는 장점을 바탕으로 많은 분야에서 널리 사용되고 있다. 그러나 현대의 대용량-고차원 데이터는 계산 시간 및 저장공간의 제한으로 인해 분위수 회귀 모형의 추정을 매우 어렵게 만든다. 분할-정복은 전체 데이터를 계산이 용이한 여러개의 부분집합으로 나눈 다음 각 분할에서의 요약 통계량만을 이용하여 전체 데이터의 추정량을 재구성하는 기법이다. 본 연구에서는 분할-정복 기법을 벌점화 분위수 회귀에 적용하고 베이즈 정보기준을 활용하여 변수를 선택하는 방법에 관하여 연구하였다. 제안 방법은 분할 수를 적절하게 선택하였을 때, 전체 데이터로 계산한 일반적인 분위수 회귀 추정량만큼 변수 선택의 측면에서 일관된 결과를 제공하면서 계산 속도의 측면에서 효율적이다. 이러한 제안된 방법의 장점은 시뮬레이션 데이터 및 실제 데이터 분석을 통해 확인하였다.

분위수 공적분 모형과 해운 경기변동 분석 (Quantile Co-integration Application for Maritime Business Fluctuation)

  • 김현석
    • 한국항만경제학회지
    • /
    • 제38권2호
    • /
    • pp.153-164
    • /
    • 2022
  • 본 연구는 2000년 1월부터 2021년 12월까지의 대표적 원자재 운송 수단인 Capesize 중고선가를 대상으로 해운산업에 대한 분위수 모형을 추정한다. 본 연구는 두 가지 학술적 기여를 목표로 한다. 첫째, 혼재된 실증분석 결과가 제기되는 원자재 운송 시장의 대표적 선종인 Capesize 중고선과 운임시장의 연관성을 분석한다. 둘째, 분위수 회귀로 김현석·장명희(2020a) 연구에서 제기하는 구조변환을 고려하는 실증분석 모형을 제시한다. 분석 결과는 분위수 모형은 시계열 자료에서 구조변화를 분석에 반영함으로써 오차의 불안정성으로 제기되는 문제를 우회할 수 있음을 확인한다. 그리고 공적분 모형의 장기 균형관계를 장기와 단기 추정변수를 통해 외생변수의 장·단기 영향으로 구분하고, 이를 분위별로 세분화한 예측으로 확장한다. 이상의 추정결과는 해운 이론모형에 기반한 분석을 인공지능과 기계학습으로 확장할 수 있는 근거가 된다.

다변량 분위수 회귀나무 모형에 대한 연구 (Multivariate quantile regression tree)

  • 김재오;조형준;방성완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.533-545
    • /
    • 2017
  • 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향 발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.

구간형 자료의 주성분 분석에 관한 연구 (On principal component analysis for interval-valued data)

  • 최수진;강기훈
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.61-74
    • /
    • 2020
  • 심볼릭 자료 중 하나인 구간형 자료는 모든 관측값에서 단일 값이 아닌 구간을 값으로 취하며, 관측값 내에 변동이 존재한다는 특징을 갖는다. 주성분 분석은 자료의 분산을 최대로 설명하여 자료의 차원을 축소하는 방법이므로 구간형 자료의 주성분 분석은 관측값 간의 분산 뿐만 아니라 관측값 내의 분산 역시 설명하여야 한다. 본 논문에서는 구간형 자료의 세 가지 주성분 분석법을 소개하고자 한다. 또한 기존의 분위수 방법에서 균일분포를 사용하는 것이 아니라 구간의 중심점 부근이 좀 더 많은 정보를 가지고 있는 것으로 보고 절단정규분포를 사용하는 방법을 제안하였다. 모의실험과 OECD 관련 실제 통계 자료를 통하여 각 방법의 결과를 비교해 보았다. 마지막으로 분위수 방법의 경우 화살표 표현법을 통해 주성분 산점도를 그리고 분위수들의 위치와 분포를 확인하였다.

서포트벡터기계를 이용한 VaR 모형의 결합 (Combination of Value-at-Risk Models with Support Vector Machine)

  • 김용태;심주용;이장택;황창하
    • Communications for Statistical Applications and Methods
    • /
    • 제16권5호
    • /
    • pp.791-801
    • /
    • 2009
  • VaR(Value-at-Risk)는 시장위험을 측정하기 위한 중요한 도구로 사용되고 있다. 그러나 적절한 VaR 모형의 선택에는 논란의 여지가 많다. 본 논문에서는 특정 모형을 선택하여 VaR 예측값을 구하는 대신 대표적으로 많이 사용되는 두개의 VaR 모형인 역사적 모의실험과 GARCH 모형의 예측값들을 서포트벡터기계 분위수 회귀모형을 이용하여 결합하는 방법을 제안한다.