• 제목/요약/키워드: Principal components analysis

검색결과 763건 처리시간 0.031초

이미지 검색을 위한 색상 성분 분석 (Color Component Analysis For Image Retrieval)

  • 최영관;최철;박장춘
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.403-410
    • /
    • 2004
  • 최근 의료 영상 분석(Medical Image Analysis)이나 영상 검색(Image Retrieval)을 위한 전처리(Preprocessing) 단계로 영상 분석(Image Analysis)에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 영상 검색에서 색상 성분(Color Component)의 활용 방법을 제안하고자 한다. 이미지를 검색하기 위해 색상 성분을 기반으로 하고, 색상(Color)을 분석하기 위한 기법으로 CLCM(Color Level Co-occurrence Matrix)과 통계적 기법을 이용하고 있다. CLCM은 기하학적 회전 변환(Geometric Rotate Transform)을 통해서 색상 성분을 3차원 공간상에 투영(Projection)하여 공간 관계(Spatial Relationship)로부터 나타나는 분포를 해석하는 방법으로, 본 논문에서 제안하는 주제이다. CLCM은 색상 모델에서 만들어지는 2차원 히스토그램을 지칭하며 색상 모델의 기하학적인 회전 변환을 통해서 생성된다. 그리고 이를 분석하기 위한 방법으로 통계 기법을 활용하고 있다. CLCM과 유사하게 2차원 분포도를 사용하는 GLCM(Gray Level Co-occurrence Matrix)[1]과 불변 모멘트(Invariant Moment)[2,3] 같은 알고리즘은 2차원적인 데이터를 해석하기 위하여 기본적인 통계 기법을 활용하고 있다. 하지만 GLCM과 불변 모멘트가 각각의 도메인에 최적화되어 있다 하더라도 공간 좌표상에 존재하는 불규칙적인 데이터를 완전히 해석할 수는 없다. 즉 GLCM과 불변 모멘트는 기초 통계 기법만을 사용하고 있기 때문에 추출된 특징들의 신뢰성이 낮다는 것이다. 본 논문에서는 이러한 단점을 보완하여 공간 관계를 해석함과 동시에 데이터의 가중치를 해석하기 위해 전형적인 다변량 통계에서 사용하는 주성분 분석(Principal Component Analysis)[4,5]을 이용하고 있다. 그리고 데이터의 정확도를 높이기 위해서 3차원 공간상에 색상 성분을 투영하여 이를 회전시키면서 데이터의 특성을 다각도에서 추출하는 방법을 제시한다.

페널티 방법을 이용한 주성분분석 연구 (A study on principal component analysis using penalty method)

  • 박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.721-731
    • /
    • 2017
  • 이 연구에서는 Lasso 페널티 방법을 이용한 주성분분석 방법을 소개한다. 주성분분석에 Lasso 페널티를 적용하는 방법으로 흔히 사용되는 방법은 크게 두 가지가 있다. 첫 번째 방법은 주성분을 반응변수로 놓고 원 자료행렬을 설명변수로 하는 회귀분석의 회귀계수를 이용하여 최적의 선형결 합 벡터를 구할 때 Lasso 페널티 (일반적으로 elastic net 페널티)를 부과하는 방법이다. 두 번째 방법은 원자료행렬을 비정칙값 분해로 근사하고 남은 잔차행렬에 Lasso 페널티를 부과하여 최적의 선형결합 벡터를 구하는 방법이다. 이 연구에서는 주성분 분석에 Lasso 페널티를 부과하는 이 두 가지 방법들을 자세하게 개관하는데, 이 방법들은 변수 숫자가 표본크기보다 큰 경우에도 적용가능한 장점이 있다. 또한 실제 자료분석에서 R 프로그램을 통해 두 방법을 적용하고 그 결과를 비교한다. 구체적으로 변수 숫자가 표본크기보다 큰 Ahamad (1967)의 crime 자료에 적용한다.

Assessment of water quality variations under non-rainy and rainy conditions by principal component analysis techniques in Lake Doam watershed, Korea

  • Bhattrai, Bal Dev;Kwak, Sungjin;Heo, Woomyung
    • Journal of Ecology and Environment
    • /
    • 제38권2호
    • /
    • pp.145-156
    • /
    • 2015
  • This study was based on water quality data of the Lake Doam watershed, monitored from 2010 to 2013 at eight different sites with multiple physiochemical parameters. The dataset was divided into two sub-datasets, namely, non-rainy and rainy. Principal component analysis (PCA) and factor analysis (FA) techniques were applied to evaluate seasonal correlations of water quality parameters and extract the most significant parameters influencing stream water quality. The first five principal components identified by PCA techniques explained greater than 80% of the total variance for both datasets. PCA and FA results indicated that total nitrogen, nitrate nitrogen, total phosphorus, and dissolved inorganic phosphorus were the most significant parameters under the non-rainy condition. This indicates that organic and inorganic pollutants loads in the streams can be related to discharges from point sources (domestic discharges) and non-point sources (agriculture, forest) of pollution. During the rainy period, turbidity, suspended solids, nitrate nitrogen, and dissolved inorganic phosphorus were identified as the most significant parameters. Physical parameters, suspended solids, and turbidity, are related to soil erosion and runoff from the basin. Organic and inorganic pollutants during the rainy period can be linked to decayed matters, manure, and inorganic fertilizers used in farming. Thus, the results of this study suggest that principal component analysis techniques are useful for analysis and interpretation of data and identification of pollution factors, which are valuable for understanding seasonal variations in water quality for effective management.

Data anomaly detection and Data fusion based on Incremental Principal Component Analysis in Fog Computing

  • Yu, Xue-Yong;Guo, Xin-Hui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.3989-4006
    • /
    • 2020
  • The intelligent agriculture monitoring is based on the perception and analysis of environmental data, which enables the monitoring of the production environment and the control of environmental regulation equipment. As the scale of the application continues to expand, a large amount of data will be generated from the perception layer and uploaded to the cloud service, which will bring challenges of insufficient bandwidth and processing capacity. A fog-based offline and real-time hybrid data analysis architecture was proposed in this paper, which combines offline and real-time analysis to enable real-time data processing on resource-constrained IoT devices. Furthermore, we propose a data process-ing algorithm based on the incremental principal component analysis, which can achieve data dimensionality reduction and update of principal components. We also introduce the concept of Squared Prediction Error (SPE) value and realize the abnormal detection of data through the combination of SPE value and data fusion algorithm. To ensure the accuracy and effectiveness of the algorithm, we design a regular-SPE hybrid model update strategy, which enables the principal component to be updated on demand when data anomalies are found. In addition, this strategy can significantly reduce resource consumption growth due to the data analysis architectures. Practical datasets-based simulations have confirmed that the proposed algorithm can perform data fusion and exception processing in real-time on resource-constrained devices; Our model update strategy can reduce the overall system resource consumption while ensuring the accuracy of the algorithm.

실시간 데이터를 위한 64M DRAM s-Poly 식각공정에서의 웨이퍼 상태 예측 (Wafer state prediction in 64M DRAM s-Poly etching process using real-time data)

  • 이석주;차상엽;우광방
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1997년도 한국자동제어학술회의논문집; 한국전력공사 서울연수원; 17-18 Oct. 1997
    • /
    • pp.664-667
    • /
    • 1997
  • For higher component density per chip, it is necessary to identify and control the semiconductor manufacturing process more stringently. Recently, neural networks have been identified as one of the most promising techniques for modeling and control of complicated processes such as plasma etching process. Since wafer states after each run using identical recipe may differ from each other, conventional neural network models utilizing input factors only cannot represent the actual state of process and equipment. In this paper, in addition to the input factors of the recipe, real-time tool data are utilized for modeling of 64M DRAM s-poly plasma etching process to reflect the actual state of process and equipment. For real-time tool data, we collect optical emission spectroscopy (OES) data. Through principal component analysis (PCA), we extract principal components from entire OES data. And then these principal components are included to input parameters of neural network model. Finally neural network model is trained using feed forward error back propagation (FFEBP) algorithm. As a results, simulation results exhibit good wafer state prediction capability after plasma etching process.

  • PDF

Berberis amurensis complex의 형태 변이 분석 (Morphological Variation of Berberis amurensis Complex)

  • 현창우;김영동
    • 식물분류학회지
    • /
    • 제38권2호
    • /
    • pp.93-109
    • /
    • 2008
  • 본 연구에서는 B. amurensis complex를 구성하는 세 분류군, 매발톱나무(B. amurensis Rupr. var. amurensis), 섬매발톱나무[B. amurensis var. quelpaertensis (Nakai) Nakai] 및 왕매발톱나무(B. amurensis var. latifolia Nakai)를 대상으로 형태 변이 분석을 수행하여 이들에 대한 기존의 분류학적 견해를 논의하였다. 분류군 간에 차이를 나타낼 것으로 조사된 22개 형질에 대한 변이 양상 조사 및 주성분분석을 수행한 결과 섬매발톱나무는 엽신의 길이와 폭, 엽정의 각도, 거치 간격, 절간 길이, 화서당 꽃의 수 등 여러 형질에서 나머지 두 분류군과 차이를 보였고, 왕매발톱나무는 엽정의 각도, 엽신의 폭과 길이 비에서 다른 두 분류군과 달랐다. 주성분분석 결과 엽신의 길이와 폭 및 엽정의 각도 등 잎의 형질이 분류군의 차이를 잘 반영하는 유용한 형질로 재확인되었으며, 절간의 길이와 화서를 구성하는 꽃의 수는 이들 종내 분류군들을 구분하는 새로운 식별형질로 밝혀졌다. 이들 세 분류군의 지리적 분포와 변이 양상 및 주성분분석 결과를 종합해 고려할 때 섬매발톱나무와 왕매발톱나무를 각각 변종으로 인정하는 것이 가장 타당할 것으로 판단하였다.

Stability evaluation model for loess deposits based on PCA-PNN

  • Li, Guangkun;Su, Maoxin;Xue, Yiguo;Song, Qian;Qiu, Daohong;Fu, Kang;Wang, Peng
    • Geomechanics and Engineering
    • /
    • 제27권6호
    • /
    • pp.551-560
    • /
    • 2021
  • Due to the low strength and high compressibility characteristics, the loess deposits tunnels are prone to large deformations and collapse. An accurate stability evaluation for loess deposits is of considerable significance in deformation control and safety work during tunnel construction. 37 groups of representative data based on real loess deposits cases were adopted to establish the stability evaluation model for the tunnel project in Yan'an, China. Physical and mechanical indices, including water content, cohesion, internal friction angle, elastic modulus, and poisson ratio are selected as index system on the stability level of loess. The data set is randomly divided into 80% as the training set and 20% as the test set. Firstly, principal component analysis (PCA) is used to convert the five index system to three linearly independent principal components X1, X2 and X3. Then, the principal components were used as input vectors for probabilistic neural network (PNN) to map the nonlinear relationship between the index system and stability level of loess. Furthermore, Leave-One-Out cross validation was applied for the training set to find the suitable smoothing factor. At last, the established model with the target smoothing factor 0.04 was applied for the test set, and a 100% prediction accuracy rate was obtained. This intelligent classification method for loess deposits can be easily conducted, which has wide potential applications in evaluating loess deposits.

금산 매립장 주변 대수층의 수리지화학적 특성 및 오염 확산 평가 (Assessment of Hydrogeochemical Characteristics and Contaminant Dispersion of Aquifer around Keumsan Municipal Landfill)

  • 오인숙;고경석;공인철;구민호
    • 자원환경지질
    • /
    • 제41권6호
    • /
    • pp.657-672
    • /
    • 2008
  • 본 연구의 목적은 금산 생활쓰레기 매립장을 대상으로 지하수의 수리지 화학적 특성과 통계분석을 통하여 침출수의 누출원인과 누출경로 및 영향범위를 파악하고, 매립지로부터 발생되는 오염물질인 침출수의 누출이 연구지역의 지하수환경에 미치는 위해요인에 대해 정량적으로 평가하는 것이다. 본 연구를 위해서 수질 검층, 침출수와 지하수 수질 분석 및 통계분석, 그리고 오염물질 이동모델링 기법 등을 이용하였다. 수질검층 결과 침출수 집수정 부근에서 침출수가 주변 대수층으로 누출되고 있었으며, 매립장과 인접한 하류부 관측정의 4-12m 깊이에서 지하수에 대한 침출수의 영향을 확인할 수 있었다. 침출수는 유출 범위는 매립장으로부터 70-100m 내외이며 오염된 지하수에서 전기전도도는 $400-750{\mu}S/cm$를 나타내었다. 주성분분석수행 결과 주성분 1과 2는 각각 침출수과 대수층의 매질 특성을 나타내었다. 주성분분석결과는 또한 침출수의 영향을 받는 지하수의 수질 변화에 의해 나타내어지는 양이온교환반응, 흡착 및 미생물 생분해 같은 자연저감과정을 나타내었다. 지하수 흐름 및 오염물 이동 모델링 결과 지하수는 매립장에서 서쪽으로 계곡을 따라 흐르며, 오염물질은 그에 따라 이동함을 알 수 있었다.

주성분 분석기반 인간과 개의 얼굴 비율 연구 (A Study on the Ratio of Human and Dog Facial Components based on Principal Component Analysis)

  • 이영숙;기대욱
    • 한국멀티미디어학회논문지
    • /
    • 제23권10호
    • /
    • pp.1339-1347
    • /
    • 2020
  • This study is a preliminary study to design a character automation system that considers the facial characteristics of mammals. The experimental data of this study was conducted on dogs (dog breeds) and humans, which were designed to be used in many contents. First, data was extracted from 100 types of dogs and 100 human data. Second, the criteria for measuring the ratio of important parts of the dog and human face were suggested. In addition, a comparative analysis of the face of a dog and a human face is conducted. Lastly, by analyzing the main component(PCA), the most characteristic elements in the faces of dogs and humans were analyzed. As a result, it was confirmed that the length of the face, the size of the eyes, the length of the glabellar, and the length of the glabellar and other parts are important. Through this study, the features of the dog's face that are different from humans are expected to contribute to the animal character automation.

보편적인 기저함수를 이용한 개인의 머리전달함수 모델링 (Modeling of individual head-related impulse responses using a set of general basis functions)

  • 황성목;박영진;박윤식
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2007년도 추계학술대회논문집
    • /
    • pp.1430-1436
    • /
    • 2007
  • A principal components analysis (PCA) of the median head-related impulse responses (HRIRs) in the CIPIC HRTF database reveals that the individual HRIRs can be adequately reconstructed by a linear combination of 12 orthonormal basis functions. These basis functions can be used generally to model arbitrary HRIRs, which are not included in the process to obtain the basis functions. To clarify whether these basis functions can be used to model other set of arbitrary HRIRs, an numerical error analysis for modeling and a series of subjective listening tests were carried out using the measured and modeled HRIRs. The results showed that the set of individual HRIRs, which were measured in our lab using different measurement conditions, techniques, and source positions, can be well modeled with reasonable accuracy. Furthermore, all subjects reported not only the accurate vertical perception but also the front-back discrimination with the modeled HRIRs based on 12 basis functions. However, as less basis functions were used for HRIR modeling, the modeling accuracy and localization performance deteriorated.

  • PDF