• 제목/요약/키워드: principal component regression

검색결과 253건 처리시간 0.03초

빠른 화자 적응과 연산량 감소를 위한 MLLR알고리즘 개선 (ImprovementofMLLRAlgorithmforRapidSpeakerAdaptationandReductionofComputation)

  • 김지운;정재호
    • 한국통신학회논문지
    • /
    • 제29권1C호
    • /
    • pp.65-71
    • /
    • 2004
  • 본 논문은 주성분분석(PCA, Principle Component Analysis) 혹은 독립성분분석(ICA, Independent Principle Component Analysis)를 이용하여 HMM(Hidden Markov Model) 파라메타의 차수를 감소시킴으로써 MLLR(Maximum Likelihood Linear Regression) 화자 적응 알고리즘을 개선하였다. 데이터의 특징을 잘 나타내는 PCA와 ICA를 통해 모델 mixture component의 상관관계를 줄이고 상대적으로 데이터의 분포가 적은 축을 삭제함으로써 추정해야 하는 적응 파라메타의 수를 줄였다. 기존의 MLLR 알고리즘은 SI(Speaker Independent)모델 보다 좋은 인식성능을 나타내기 위해 30초 이상의 적응 데이터가 요구되었고, 반면 제안한 알고리즘은 적응 파라메타의 수를 감소시킴으로써 10초 이상의 적응데이터가 요구되었다. 또한, 36차의 HMM 파라메타는 기존의 MLLR 알고리즘과 비슷한 인식성능을 나다내는 10차의 주성분이나 독릭성분을 사용함으로써 MLLR 알고리즘에서 적응파라메타를 추정할 때 요구되는 연산량을 1/167로 감소시켰다.

Analysis of Protein and Moisture Contents in Pea(Pisum sativum L. Using Near-Infrared Reflectance Spectroscopy

  • Jung, Chan-Sik;Kim, Byung-Joo;Kwon, Yil-Chan;Han, Won-Young;Kwack, Yong-Ho
    • 한국작물학회지
    • /
    • 제43권2호
    • /
    • pp.101-104
    • /
    • 1998
  • This study was conducted to establish a rapid analysis method for determining protein and moisture contents of pea. Ninety and eighty pea (Pisum sativum L.) lines were analyzed to determine protein and moisture contents, respectively using near-infrared reflectance spectroscopy. Simple correlations (${\gamma}$) of protein content in a ground sample and an intact grain sample by an automatic regression method were 0.978 and 0.910, respectively. Simple correlations by partial least square regression/principal component analysis (PLS/PCA) methods were 0.982 and 0.925, respectively. Standard error of performance (SEP) in protein content was the lowest value, 0.446 in ground sample by PLS/PCA methods. Simple correlation of moisture content was the highest at 0.871 in ground samples. when using a standard regression method. Accuracy for the moisture content was slightly lower than for protein content. It was concluded that the NIRS method would be applicable only for rapid determination of protein content in pea.

  • PDF

A New Calibration Method Based on the Recursive Linear Regression with Variables Selection

  • Park, Kwang-Su;Jun, Chi-Hyuck
    • 한국근적외분광분석학회:학술대회논문집
    • /
    • 한국근적외분광분석학회 2001년도 NIR-2001
    • /
    • pp.1241-1241
    • /
    • 2001
  • We propose a new calibration method, which uses the linearization method for spectral responses and the repetitive adoptions of the linearization weight matrices to construct a frature. Weight matrices are estimated through multiple linear regression (or principal component regression or partial least squares) with forward variable selection. The proposed method is applied to three data sets. The first is FTIR spectral data set for FeO content from sinter process and the second is NIR spectra from trans-alkylation process having two constituent variables. The third is NIR spectra of crude oil with three physical property variables. To see the calibration performance, we compare the new method with the PLS. It is found that the new method gives a little better performance than the PLS and the calibration result is stable in spite of the collinearity among each selected spectral responses. Furthermore, doing the repetitive adoptions of linearization matrices in the proposed methods, uninformative variables are disregarded. That is, the new methods include the effect of variables subset selection, simultaneously.

  • PDF

Bagged Auto-Associative Kernel Regression-Based Fault Detection and Identification Approach for Steam Boilers in Thermal Power Plants

  • Yu, Jungwon;Jang, Jaeyel;Yoo, Jaeyeong;Park, June Ho;Kim, Sungshin
    • Journal of Electrical Engineering and Technology
    • /
    • 제12권4호
    • /
    • pp.1406-1416
    • /
    • 2017
  • In complex and large-scale industries, properly designed fault detection and identification (FDI) systems considerably improve safety, reliability and availability of target processes. In thermal power plants (TPPs), generating units operate under very dangerous conditions; system failures can cause severe loss of life and property. In this paper, we propose a bagged auto-associative kernel regression (AAKR)-based FDI approach for steam boilers in TPPs. AAKR estimates new query vectors by online local modeling, and is suitable for TPPs operating under various load levels. By combining the bagging method, more stable and reliable estimations can be achieved, since the effects of random fluctuations decrease because of ensemble averaging. To validate performance, the proposed method and comparison methods (i.e., a clustering-based method and principal component analysis) are applied to failure data due to water wall tube leakage gathered from a 250 MW coal-fired TPP. Experimental results show that the proposed method fulfills reasonable false alarm rates and, at the same time, achieves better fault detection performance than the comparison methods. After performing fault detection, contribution analysis is carried out to identify fault variables; this helps operators to confirm the types of faults and efficiently take preventive actions.

로지스틱 회귀 분석을 이용한 스펨 필터링의 특징 축소 (Features Reduction using Logistic Regression for Spam Filtering)

  • 정용규;이범준
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.13-18
    • /
    • 2010
  • 오늘날의 스팸 메일이 메일 서버와 네트워크 저장장치의 대부분을 차지함으로 인해 네트워크 부하와 같은 부정적인 문제가 발생하고 있으며 사용자 입장에서는 스팸을 삭제하기 위한 시간과 자원 소모 같은 문제를 가지고 있다. 자동 스팸 메일 필터링은 문제 해결위한 필수적인 요소로 부각 되었다. 대표적인 방법은 나이브 베이지안 방법과 달리 PCA를 통하여 많은 차원을 가지는 스팸 테이터 집합을 몇 개의 주축으로 차원을 축소 시켜 연차 처리의 부담을 줄이고 특정 집으로 분류를 위한 로지스틱 회귀 분석 방법을 사용하여 스팸 필터링을 하였다. 이를 통하여 속도와 성능 두가지의 성과를 얻을 수 있었다.

주성분분석 및 다중회귀분석에 의한 제주도 토양유기물 및 $Al_o+1/2Fe_o$ 함량 분포 (Distribution of Organic Matter and $Al_o+1/2Fe_o$ Contents in Soils Using Principal Component and Multiple Regression Analysis in Jeju Island)

  • 문경환;임한철;현해남
    • 한국토양비료학회지
    • /
    • 제43권5호
    • /
    • pp.748-754
    • /
    • 2010
  • Soil Taxonomy의 새로운 Andisols목 토양의 분류체계에서 토양유기물 함량과 Ammonium oxalate 추출 Al함량과 Fe의 1/2함량의 합은 중요한 기준이다. 제주도는 토양생성환경이 다양하여 Andisols 토양을 포함하여 다양한 토양이 분포하고 있다. 이 논문은 제주도 토양을 대상으로 기후, 식생, 지형 등 여러 가지 환경변수들을 이용하여 토양유기물과 $Al_o+1/2Fe_o$의 함량을 추정할 수 있는 모형을 개발하고, 이를 이용하여 토양특성지도를 제작하기 위하여 수행하였다. 조사대상 지역의 321 지점에서 토양을 채취하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 분석하고, 각 토양시료 채취지점의 온도, 강우, 순일차생산량, 일사량, 증발산량, 해발고도, 토양생성에너지, 지형습윤지수, 주변과의 고도차, 해안과 정상으로부터의 거리 등의 환경변수들을 환경변수 지도를 제작하여 추출하였다. 여러 환경변수 간에는 서로 상관관계가 높게 나타나는 다중공선성을 나타내었으며, 이를 주성분분석에 의한 변수 변환으로 제거하였다. 주성분분석 결과를 바탕으로 변환된 변수들은 산악효과, 식생효과, 복잡 효과 등 3개의 주성분으로 축소할 수 있었고, 이 3개의 변수를 이용하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 예측할 수 있는 다중회귀모형을 구하였다. 이 모형들은 전체 토양유기물 변이의 52%와 전체 $Al_o+1/2Fe_o$ 변이의 37%를 설명할 수 있었다. 모형을 이용하여 제작된 토양유기물 지도는 토양도를 바탕으로 한 토양유기물 지도와 전체적인 형태에서 매우 유사한 형태를 나타내었다. 따라서 환경요인은 제주도 토양의 분포에 큰 영향을 미치는 것으로 판단되었고, 정량화할 수 있는 환경요인을 이용하여 토양특성지도를 제작할 수 있음을 구명하였다.

An evaluation of empirical regression models for predicting temporal variations in soil respiration in a cool-temperate deciduous broad-leaved forest

  • Lee, Na-Yeon
    • Journal of Ecology and Environment
    • /
    • 제33권2호
    • /
    • pp.165-173
    • /
    • 2010
  • Soil respiration ($R_S$) is a critical component of the annual carbon balance of forests, but few studies thus far have attempted to evaluate empirical regression models in $R_S$. The principal objectives of this study were to evaluate the relationship between $R_S$ rates and soil temperature (ST) and soil water content (SWC) in soil from a cool-temperate deciduous broad-leaved forest, and to evaluate empirical regression models for the prediction of $R_S$ using ST and SWC. We have been measuring $R_S$, using an open-flow gas-exchange system with an infrared gas analyzer during the snowfree season from 1999 to 2001 at the Takayama Forest, Japan. To evaluate the empirical regression models used for the prediction of $R_S$, we compared a simple exponential regression (flux = $ae^{bt}$Eq. [1]) and two polynomial multiple-regression models (flux = $ae^{bt}{\times}({\theta}{\nu}-c){\times}(d-{\theta}{\nu})^f:$ Eq. [2] and flux = $ae^{bt}{\times}(1-(1-({\theta}{\nu}/c))^2)$: Eq. [3]) that included two variables (ST: t and SWC: ${\theta}{\nu}$) and that utilized hourly data for $R_S$. In general, daily mean $R_S$ rates were positively well-correlated with ST, but no significant correlations were observed with any significant frequency between the ST and $R_S$ rates on periods of a day based on the hourly $R_S$ data. Eq. (2) has many more site-specific parameters than Eq. (3) and resulted in some significant underestimation. The empirical regression, Eq. (3) was best explained by temporal variations, as it provided a more unbiased fit to the data compared to Eq. (2). The Eq. (3) (ST $\times$ SWC function) also increased the predictive ability as compared to Eq. (1) (only ST exponential function), increasing the $R^2$ from 0.71 to 0.78.

철강 도금로의 예지보전을 위한 열화 기반 잔존수명 분석 (Degradation-Based Remaining Useful Life Analysis for Predictive Maintenance in a Steel Galvanizing Kettle)

  • 신준호;김창욱
    • 한국융합학회논문지
    • /
    • 제10권12호
    • /
    • pp.271-280
    • /
    • 2019
  • 제조산업 분야의 디지털트랜스포메이션의 일환인 스마트공장은 데이터 기반으로 모니터링 및 분석 그리고 예측을 통해서 의사결정 방식을 획기적으로 변화시키고 있다. 특히 설비에 대한 예지보전은 스마트공장의 핵심적인 요소로서 필요성이 증대되고 있다. 본 연구의 목적은 철강 도금공정의 예지보전을 위해 도금로 설비의 열화 특성을 고려한 잔존수명 분석과 예측모델을 산출하는 것이다. 상관성 분석, 다중회귀 분석, 주성분회귀 분석 그리고 시간의 경과에 따른 열화의 추이 파악을 위하여 이동회귀 방식을 제안하여 진행하였다. 그 결과 도금로 열화는 생산성 인자들과 주된 의존적 관계가 있으며, 특히 환경 온도 인자들의 영향성이 열화의 추이 변화에 관계가 있음을 추론할 수 있었다. 예측된 잔존수명을 활용하여 도금로 교체가 필요한 시점을 사전에 알려주는 예지보전을 구현하였다. 향후 설비의 열화 추이 파악에 본 연구에서 수행한 방안이 적절한 사례가 되어 보다 정합성 있는 예지보전 구현이 가능해지기를 기대한다.

시판 국수장국의 관능적 특성 및 소비자 기호도 연구 (Sensory Characteristics and Consumer Acceptance of the Clear Broth for Noodle on the Market)

  • 조동이;양정은;정라나
    • 한국식생활문화학회지
    • /
    • 제35권2호
    • /
    • pp.193-200
    • /
    • 2020
  • This study was conducted to understand the sensory characteristics and consumer acceptance for the commercially available clear broth for noodles. Totally, eight different clear broth samples were evaluated in this study. Seven trained panelists developed and evaluated sensory characteristics in the descriptive analysis. Significant differences (p<0.05) were obtained for all 28 attributes evaluated. Descriptive data was obtained by performing multivariate analysis of variance to identify differences between samples. Principal component analysis (PCA) was performed on the mean values of descriptive attributes obtained in the descriptive analysis, and summarizes the sensory characteristics of clear broth for noodles. PCA of the clear broths revealed that the first two principal components are responsible for 80.66% variations. For sensory testing, 160 consumers were recruited, and their acceptance for each sample was assessed. Consumer data was obtained by applying partial least square-regression (PLSR) to establish the relationship between the descriptive data and the consumer acceptance data.

병원 전 응급간호사의 응급 처치 수행 능력과 영향 요인 (Factors Influencing on Prehospital Emergency Nurses' Activities and Procedures in the Field)

  • 김복자;강경희;임용수
    • 간호행정학회지
    • /
    • 제15권1호
    • /
    • pp.64-71
    • /
    • 2009
  • Purpose: This study shows the prehospital emergency nursing practices, and analyzes them associated with their individual characteristics and job conditions. Method: Based on a survey of the National Emergency Medical Center in Korea(2008), principal components were extracted from 7 prehospital emergency nursing practices by factor analysis, and some regression analyses of principal components(CPR-AED and V/S-I.V.) were executed on individual characteristics and job conditions. Results: The PENs gave themselves higher order ratings for vital sign check, airway management for loss of consciousness patients, CPR for suspicious cardiac arrest, keeping vein open for shock patients, AED for abnormal pulse rate, AED for suspicious cardiac arrest, and AED for loss of consciousness. Age and duty periods were statistically significant influential factors on the CPR-AED component. Conclusion: The results indicate that the PENs were competent in overall prehospital emergency activities and procedures even some weak self-evaluations, and that the standard curriculum and practice standard for prehospital nursing should be developed in order to increase nursing leadership in prehospital emergency settings.

  • PDF