• Title/Summary/Keyword: 부분 최소제곱법

Search Result 27, Processing Time 0.026 seconds

Face Recognition using Dimension Reduction Features based on Partial Least Squares (부분 최소제곱법 기반한 차원 축소 특징을 이용한 얼굴 인식)

  • Lee, Chang-Beom;Kim, Do-Hyang;Park, Hyuk-Ro;Baek, Jangsun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.745-748
    • /
    • 2004
  • 얼굴 이미지의 대부분은 표본의 수보다 특징 변수의 수가 많기 때문에 이러한 점을 고려한 특징 추출 방법이 필요하다. 본 논문에서는 부분 최소제곱법을 이용하여 특징 벡터의 차원을 축소하는 방법을 제안한다. 전통적인 차원 축소 방법인 주성분 분석은 클래스의 정보를 고려하지 않고 최대 변이를 가지는 성분을 추출하기 때문에, 클래스의 구분에 필요한 특징을 필수적으로 추출하지 못한다. 이에 비해, 부분 최소제곱법은 클래스 변수에 대한 정보를 포함하여 성분을 추출한다. 그러므로, 분류를 하는데 있어서는 주성분 분석에 의해 추출된 성분보다는 부분 최소제곱법에 의해 추출된 성분이 보다 더 예측적이다. 맨체스터와 ORL 얼굴 데이터베이스를 이용하여 실험한 결과, 분류와 차원 축소 측면에서 주성분 분석 방법보다는 부분 최소제곱법을 이용한 방법이 그 성능이 우수함을 알 수 있었다.

  • PDF

A Study on Face Recognition based on Partial Least Squares (부분 최소제곱법을 이용한 얼굴 인식에 관한 연구)

  • Lee Chang-Beom;Kim Do-Hyang;Baek Jang-Sun;Park Hyuk-Ro
    • The KIPS Transactions:PartB
    • /
    • v.13B no.4 s.107
    • /
    • pp.393-400
    • /
    • 2006
  • There are many feature extraction methods for face recognition. We need a new method to overcome the small sample problem that the number of feature variables is larger than the sample size for face image data. The paper considers partial least squares(PLS) as a new dimension reduction technique for feature vector. Principal Component Analysis(PCA), a conventional dimension reduction method, selects the components with maximum variability, irrespective of the class information. So, PCA does not necessarily extract features that are important for the discrimination of classes. PLS, on the other hand, constructs the components so that the correlation between the class variable and themselves is maximized. Therefore PLS components are more predictive than PCA components in classification. The experimental results on Manchester and ORL databases shows that PLS is to be preferred over PCA when classification is the goal and dimension reduction is needed.

Analysis of internet addiction in Korean adolescents using sparse partial least-squares regression (희소 부분 최소 제곱법을 이용한 우리나라 청소년 인터넷 중독 자료 분석)

  • Han, Jeongseop;Park, Soobin;Lee, onghwan
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.2
    • /
    • pp.253-263
    • /
    • 2018
  • Internet addiction in adolescents is an important social issue. In this study, sparse partial least-squares regression (SPLS) was applied to internet addiction data in Korean adolescent samples. The internet addiction score and various clinical and psychopathological features were collected and analyzed from self-reported questionnaires. We considered three PLS methods and compared the performance in terms of prediction and sparsity. We found that the SPLS method with the hierarchical likelihood penalty was the best; in addition, two aggression features, AQ and BSAS, are important to discriminate and explain latent features of the SPLS model.

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management & Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

Type I projection sum of squares by weighted least squares (가중최소제곱법에 의한 제1종 사영제곱합)

  • Choi, Jaesung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.2
    • /
    • pp.423-429
    • /
    • 2014
  • This paper discusses a method for getting Type I sums of squares by projections under a two-way fixed-effects model when variances of errors are not equal. The method of weighted least squares is used to estimate the parameters of the assumed model. The model is fitted to the data in a sequential manner by using the model comparison technique. The vector space generated by the model matrix can be composed of orthogonal vector subspaces spanned by submatrices consisting of column vectors related to the parameters. It is discussed how to get the Type I sums of squares by using the projections into the orthogonal vector subspaces.

Extension Techniques of Partially Recorded Stream-flow to Continuous Daily Data (부분관측된 유량자료의 연속 일유량자료로 확장법)

  • Baek, Kyong-Oh;Yim, Dong-Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.397-397
    • /
    • 2011
  • 2004년부터 4대강 물환경연구소는 수질오염총량관리제의 원활한 추진을 위해 총량관리단위유역 말단부에서 8일 간격으로 청천(晴天)시를 중심으로 유량과 수질을 동시에 측정하기 시작하였다. 그 결과 연중 하천유량과 수질의 연동 여부 및 변동 추이를 확인하는 것이 가능하게 되었다. 그러나 8일 간격으로 생산되는 유량은 지침의 정의와 맞물려 기준유량의 산정에 또 다른 어려움을 주고 있다. '한강수계 오염총량관리계획수립 지침'에 따르면 '기준유량은 과거 10년간 평균 저수량으로 한다'고 명시되어 있다. 여기서 저수량이란 유량의 크기를 누가일수로서 표시하여 1년을 통하여 275일은 이보다 더 작지 않은 유량으로 정의된다. 따라서 정확한 저수량을 산정하기 위해서는 1년 365개 매일의 유량자료가 필요하다. 하지만 8일 간격으로 유량을 측정하게 되면 1년 365개 대신 최대 45 여개의 일 유량자료만 취득 가능하므로 유황분석에 어려움이 발생할 수밖에 없다. 본 연구에서는 수질오염총량관리단위유역의 말단부에서 8일 간격으로 계측된 유량자료가 있을 때 이를 연속적인 일유량으로 확대할 수 있는 방법론 중 하나를 소개한다. 미 지질조사국(USGS)에서 주로 사용되는 이 방법은 A지점(부분계측이 이루어지는 지점)의 결측치를 동일 유역 혹은 수문학적으로 유사한 유역의 B지점(연속계측이 이루어지는 지점)의 자료를 이용하여 보완하는 방식이다. 이를 위해 먼저 부분계측이 이루어진 날과 같은 날짜의 유량자료를 연속계측자료에서 추출한 다음 두 자료(A지점에서의 모든 유량과 B지점에서의 추출된 유량)의 상관성을 비교해 본다. 두 자료간에 상관도가 높다면 이를 잘 표현하는 방정식을 통해 A지점의 결측치를 내 외삽한다. 여기서 두 자료간 상관도를 잘 묘사할 수 있는 방법으로 본 연구에서는 최소제곱법(Least Square Estimator, LSE)과 분산확장법(Maintenance of Variance Extension, MOVE)을 비교,분석해 보았다. 한강수계 수질오염총량관리단위유역 중 동일지점에 8일 간격 부분계측 유량자료와 일 연속자료가 동시에 존재하는 곳이 6지점이 있었으며 이 자료들을 바탕으로 LSE와 MOVE의 정확도를 검증해 본 결과 MOVE가 일 연속유량 확장에 더 나은 결과를 보였다.

  • PDF

Automatic Object Recognition in 3D Measuring Data (3차원 측정점으로부터의 객체 자동인식)

  • Ahn, Sung-Joon
    • The KIPS Transactions:PartB
    • /
    • v.16B no.1
    • /
    • pp.47-54
    • /
    • 2009
  • Automatic object recognition in 3D measuring data is of great interest in many application fields e.g. computer vision, reverse engineering and digital factory. In this paper we present a software tool for a fully automatic object detection and parameter estimation in unordered and noisy point clouds with a large number of data points. The software consists of three interactive modules each for model selection, point segmentation and model fitting, in which the orthogonal distance fitting (ODF) plays an important role. The ODF algorithms estimate model parameters by minimizing the square sum of the shortest distances between model feature and measurement points. The local quadric surface fitted through ODF to a randomly touched small initial patch of the point cloud provides the necessary initial information for the overall procedures of model selection, point segmentation and model fitting. The performance of the presented software tool will be demonstrated by applying to point clouds.

Analysis of Carbonization Behavior of Hydrochar Produced by Hydrothermal Carbonization of Lignin and Development of a Prediction Model for Carbonization Degree Using Near-Infrared Spectroscopy (열수 탄화 공정을 거친 리그닌 하이드로차(hydrochar)의 탄화 거동 분석과 근적외선 분광법을 이용한 예측 모델 개발)

  • HWANG, Un Taek;BAE, Junsoo;LEE, Taekyeong;HWANG, Sung-Yun;KIM, Jong-Chan;PARK, Jinseok;CHOI, In-Gyu;KWAK, Hyo Won;HWANG, Sung-Wook;YEO, Hwanmyeong
    • Journal of the Korean Wood Science and Technology
    • /
    • v.49 no.3
    • /
    • pp.213-225
    • /
    • 2021
  • In this paper, we investigated the carbonization characteristics of lignin hydrochar prepared by hydrothermal carbonization and established a model for predicting the carbonization degree using near-infrared spectroscopy and partial least squares regression. The carbon content of the hydrothermally carbonized lignin at the temperature of 200 ℃ was higher by approximately 3 wt% than that of the untreated sample, and the carbon content tended to gradually increase as the heating time increased. Hydrothermal carbonization made lignin more carbon-intensive and more homogeneous by eliminating the microparticles. The discriminant and predictive models using near-infrared spectroscopy and partial least squares regression approppriately determined whether hydrothermal carbonization has been applied and predicted the carbon content of hydrothermal carbonized lignin with high accuracy. In this study, we confirmed that we can quickly and nondestructively predict the carbonization characteristics of lignin hydrochar manufactured by hydrothermal carbonization using a partial least squares regression model combined with near-infrared spectroscopy.

Type I Analysis by Projections (사영에 의한 제1종 분석)

  • Choi, Jae-Sung
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.2
    • /
    • pp.373-381
    • /
    • 2011
  • This paper discusses how to get the sums of squares due to treatment factors when Type I Analysis is used by projections for the analysis of data under the assumption of a two-way ANOVA model. The suggested method does not need to calculate the residual sums of squares for the calculation of sums of squares. There-fore, the calculation is easier and faster than classical ANOVA methods. It also discusses how eigenvectors and eigenvalues of the projection matrices can be used to get the calculation of sums of squares. An example is given to illustrate the calculation procedure by projections for unbalanced data.

A Robust Design of Response Surface Methods (반응표면방법론에서의 강건한 실험계획)

  • 임용빈;오만숙
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.2
    • /
    • pp.395-403
    • /
    • 2002
  • In the third phase of the response surface methods, the first-order model is assumed and the curvature of the response surface is checked with a fractional factorial design augmented by centre runs. We further assume that a true model is a quadratic polynomial. To choose an optimal design, Box and Draper(1959) suggested the use of an average mean squared error (AMSE), an average of MSE of y(x) over the region of interest R. The AMSE can be partitioned into the average prediction variance (APV) and average squared bias (ASB). Since AMSE is a function of design moments, region moments and a standardized vector of parameters, it is not possible to select the design that minimizes AMSE. As a practical alternative, Box and Draper(1959) proposed minimum bias design which minimize ASB and showed that factorial design points are shrunk toward the origin for a minimum bias design. In this paper we propose a robust AMSE design which maximizes the minimum efficiency of the design with respect to a standardized vector of parameters.