• 제목/요약/키워드: dimension reduction

검색결과 530건 처리시간 0.034초

An Empirical Study on Dimension Reduction

  • Suh, Changhee;Lee, Hakbae
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2733-2746
    • /
    • 2018
  • The two inverse regression estimation methods, SIR and SAVE to estimate the central space are computationally easy and are widely used. However, SIR and SAVE may have poor performance in finite samples and need strong assumptions (linearity and/or constant covariance conditions) on predictors. The two non-parametric estimation methods, MAVE and dMAVE have much better performance for finite samples than SIR and SAVE. MAVE and dMAVE need no strong requirements on predictors or on the response variable. MAVE is focused on estimating the central mean subspace, but dMAVE is to estimate the central space. This paper explores and compares four methods to explain the dimension reduction. Each algorithm of these four methods is reviewed. Empirical study for simulated data shows that MAVE and dMAVE has relatively better performance than SIR and SAVE, regardless of not only different models but also different distributional assumptions of predictors. However, real data example with the binary response demonstrates that SAVE is better than other methods.

Comparison of accuracy between LC model and 4-PFM when COVID-19 impacts mortality structure

  • Choi, Janghoon
    • Communications for Statistical Applications and Methods
    • /
    • 제28권3호
    • /
    • pp.233-250
    • /
    • 2021
  • This paper studies if the accuracies of mortality models (LC model vs. 4-parametric model) are aggravated if a mortality structure changes due to the impact of COVID-19. LC model (LCM) uses dimension reduction for fitting to the log mortality matrix so that the performance of the dimension reduction method may not be good when the matrix structure changes. On the other hand, 4-parametric factor model (4-PFM) is designed to use factors for fitting to log mortality data by age groups so that it would be less affected by the change of the mortality structure. In fact, the forecast accuracies of LCM are better than those of 4-PFM when life-tables are used whereas those of 4-PFM are better when the mortality structure changes. Thus this result shows that 4-PFM is more reliable in performance to the structural changes of the mortality. To support the accuracy changes of LCM the functional aspect is explained by computing eigenvalues produced by singular vector decomposition

The use of support vector machines in semi-supervised classification

  • Bae, Hyunjoo;Kim, Hyungwoo;Shin, Seung Jun
    • Communications for Statistical Applications and Methods
    • /
    • 제29권2호
    • /
    • pp.193-202
    • /
    • 2022
  • Semi-supervised learning has gained significant attention in recent applications. In this article, we provide a selective overview of popular semi-supervised methods and then propose a simple but effective algorithm for semi-supervised classification using support vector machines (SVM), one of the most popular binary classifiers in a machine learning community. The idea is simple as follows. First, we apply the dimension reduction to the unlabeled observations and cluster them to assign labels on the reduced space. SVM is then employed to the combined set of labeled and unlabeled observations to construct a classification rule. The use of SVM enables us to extend it to the nonlinear counterpart via kernel trick. Our numerical experiments under various scenarios demonstrate that the proposed method is promising in semi-supervised classification.

A concise overview of principal support vector machines and its generalization

  • Jungmin Shin;Seung Jun Shin
    • Communications for Statistical Applications and Methods
    • /
    • 제31권2호
    • /
    • pp.235-246
    • /
    • 2024
  • In high-dimensional data analysis, sufficient dimension reduction (SDR) has been considered as an attractive tool for reducing the dimensionality of predictors while preserving regression information. The principal support vector machine (PSVM) (Li et al., 2011) offers a unified approach for both linear and nonlinear SDR. This article comprehensively explores a variety of SDR methods based on the PSVM, which we call principal machines (PM) for SDR. The PM achieves SDR by solving a sequence of convex optimizations akin to popular supervised learning methods, such as the support vector machine, logistic regression, and quantile regression, to name a few. This makes the PM straightforward to handle and extend in both theoretical and computational aspects, as we will see throughout this article.

3차원 영상처리를 이용한 암반 사면의 절리 측정에 관한 연구 (Measurement of Rock Slope Joint using 3D Image Processing)

  • 이승호;황영철;심석래;정태영
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.854-861
    • /
    • 2005
  • Studied accuracy and practical use possibility of joint measurement that using 3D laser scanner to rock slope. Measured joint of Rock slope and comparison applied 3 dimension laser scanner and clinometer. 3D laser scanning system preserves on computer calculating to 3 dimension coordinate scaning laser to object. and according to laser measurement method of interior, produce correct vector value from charge-coupled device(CCD) or laser reciver and telegram register and time measuring equipment. Create of object x, y, z point coordinates to 3 dimension space of computer. Such 3 dimension point datum (Point Clouds) forms relocate position informations that exist to practical space to computer space. Practical numerical values related between each other. Compared joint distribution and direction that measured by laser scanner and clinometer. By the result, Distribution of joint projected almost equally. Could get more joint datas by measurement of 3 dimension scanner than measured by clinometer. Therefore, There is effect that objectification of rock slope investigation data, shortening of investigation periods, investigation reduction of cost. could know that it is very effective method in joint measuring.

  • PDF

노이즈 필터링과 충분차원축소를 이용한 비정형 경제 데이터 활용에 대한 연구 (Using noise filtering and sufficient dimension reduction method on unstructured economic data)

  • 유재근;박유진;서범석
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.119-138
    • /
    • 2024
  • 본 연구는 노이즈 필터링과 차원축소 등의 방법을 이용하여 텍스트 지표의 정상화에 대해 검토하고 실증 분석을 통해 동 지표의 활용가능성을 제고할 수 있는 후처리 과정을 탐색하고자 하였다. 실증분석에 대한 예측 목표 변수로 월별 선행지수 순환 변동치, BSI 전산업 매출실적, BSI 전산업 매출전망 그리고 분기별 실질 GDP SA전기비와 실질 GDP 원계열 전년동기비를 상정하고 계량경제학에서 널리 활용되는 Hodrick and Prescott 필터와 비모수 차원축소 방법론인 충분차원축소를 비정형 텍스트 데이터와 결합하여 분석하였다. 분석 결과 월별과 분기별 변수 모두에서 자료의 수가 많은 경우 텍스트 지표의 노이즈 필터링이 예측 정확도를 높이고, 차원 축소를 적용함에 따라 보다 높은 예측력을 확보할 수 있음을 확인하였다. 분석 결과가 시사하는 바는 텍스트 지표의 활용도 제고를 위해서는 노이즈 필터링과 차원 축소 등의 후처리 과정이 중요하며 이를 통해 경기 예측의 정도를 높일 수 있다는 것이다.

PCA기반 검색 축소 기법을 이용한 SURF 매칭 속도 개선 (Speed Improvement of SURF Matching Algorithm Using Reduction of Searching Range Based on PCA)

  • 김원규;강동중
    • 한국멀티미디어학회논문지
    • /
    • 제16권7호
    • /
    • pp.820-828
    • /
    • 2013
  • 영상에서 임의의 점에 대한 고유한 특징을 계산하는 알고리즘은 파노라마 영상의 제작, 스테레오 영상의 획득, 물체 인식, 이미지 분석 등에 다양하게 사용되는 중요한 요소이다. 일반적으로 어떤 점의 특징은 스칼라 형태가 아닌 벡터형태로 나타나게 되는데, 무수히 많은 특징 점들을 서로 비교하는 작업은 매우 많은 계산량을 요구한다. 본 연구에서는 영상의 특징점 계산에 SURF(speeded up robust features)를 이용하였고, 이미지로부터 추출된 특징을 PCA(principal component analysis)기법을 이용하여 벡터의 차원을 축소하여 연결리스트 자료구조에 정렬한 다음 특징을 비교하는 기법을 제안한다. 제안된 특징의 비교 방법을 적용할 경우 기존 방법의 매칭 정확도는 유지한 상태에서 계산시간을 줄일 수 있는 것을 실험을 통하여 확인하였다.

부분 최소제곱법을 이용한 얼굴 인식에 관한 연구 (A Study on Face Recognition based on Partial Least Squares)

  • 이창범;김도향;백장선;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.393-400
    • /
    • 2006
  • 얼굴 인식에서 얼굴 이미지의 특정 추출 방법에는 여러 가지가 있다. 그러나, 얼굴 이미지의 대부분은 표본의 수보다 특정 변수의 수가 많기 때문에 이러한 점을 고려한 특정 추출 방법이 필요하다. 본 논문에서는 부분 최소제곱법을 이용하여 특정 벡터의 차원을 축소하는 방법을 제안한다. 전통적인 차원 축소 방법인 주성분 분석은 클래스의 정보를 고려하지 않고 최대 변이를 가지는 성분을 추출하기 때문에, 클래스의 구분에 필요한 특정을 필수적으로 추출하지 못한다. 이에 비해, 부분 최소제곱법은 클래스 변수에 대한 정보를 포함하여 성분을 추출한다. 그러므로, 분류를 하는데 있어서는 주성분 분석에 의해 추출된 성분보다는 부분 최소제곱법에 의해 추출된 성분이 보다 더 예측적이다. 맨체스터와 ORL 얼굴 데이터베이스를 이용하여 실험한 결과, 분류와 차원 축소 측면에서 주성분 분석 방법보다는 부분 최소제곱법을 이용한 방법이 그 성능이 우수함을 알 수 있었다.

학습 성능 향상을 위한 차원 축소 기법 기반 재난 시뮬레이션 강화학습 환경 구성 및 활용 (The Design and Practice of Disaster Response RL Environment Using Dimension Reduction Method for Training Performance Enhancement)

  • 여상호;이승준;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권7호
    • /
    • pp.263-270
    • /
    • 2021
  • 강화학습은 학습을 통해 최적의 행동정책을 탐색하는 기법으로써, 재난 상황에서 효과적인 인명 구조 및 재난 대응 문제 해결을 위해 많이 활용되고 있다. 그러나, 기존 재난 대응을 위한 강화학습 기법은 상대적으로 단순한 그리드, 그래프와 같은 환경 혹은 자체 개발한 강화학습 환경을 통해 평가를 수행함에 따라 그 실용성이 충분히 검증되지 않았다. 본 논문에서는 강화학습 기법을 실세계 환경에서 사용하기 위해 기존 개발된 재난 시뮬레이션 환경의 복잡한 프로퍼티를 활용하는 강화학습 환경 구성과 활용 결과를 제시하고자 한다. 본 제안 강화학습 환경의 구성을 위하여 재난 시뮬레이션과 강화학습 에이전트 간 강화학습 커뮤니케이션 채널 및 인터페이스를 구축하였으며, 시뮬레이션 환경이 제공하는 고차원의 프로퍼티 정보의 활용을 위해 비-이미지 피쳐 벡터(non-image feature vector)에 이미지 변환방식을 적용하였다. 실험을 통해 본 제안 방식이 건물 화재 피해도를 기준으로 한 평가에서 기존 방식 대비 가장 낮은 건물 화재 피해를 기록한 것을 확인하였다.

단위 신경망과 특징벡터 차원 축소 기반의 음악 분위기 자동판별 (Music Mood Classification based on a New Feature Reduction Method and Modular Neural Network)

  • 송민균;김현수;문창배;김병만;오득환
    • 한국산업정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.25-35
    • /
    • 2013
  • 본 논문에서는 개인화된 분위기 분류 모델 대신에 대중의 분위기 분류 모델을 제안한다. 분위기 판별 성능을 개선하기 위해 두 가지 접근 방법을 선택하였는데, 그 첫 번째가 표준편차에 기초한 특징축소이다. 이는 음악의 특징을 추출하기 위해 사용하는 MIRtoolbox에서 추출되는 391개의 특징들을 모두 사용할 경우의 성능 저하 문제를 해결하기 위한 방법이다. 실험결과, 본 논문에서 제안한 특징축소 방법이 기존의 차원 축소 방법인 R-Square와 PCA보다 성능이 좋음을 확인할 수 있었다. 그리고 특징축소 방법만으로는 성능 개선에 한계가 있어 두 번째 개선방법으로 단위 신경망을 사용하여 추가의 성능 개선을 시도하였다. 실험결과 이 역시 유효한 성능 개선이 이루어짐을 확인할 수 있었다.