• 제목/요약/키워드: PCA 분석

검색결과 1,048건 처리시간 0.036초

오피니언 마이닝을 위한 VOC 데이타의 신뢰성 분석 (Reliability Analysis of VOC Data for Opinion Mining)

  • 김동원;유성진
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.217-245
    • /
    • 2016
  • 이 연구의 목적은 소셜 미디어에서 추출된 7개의 감성 도메인이 기업의 성과에 대한 영향 분석실험을 위한 데이터로서 적합한 지에 대해 신뢰성을 확인하고, 실제 고객감성이 자동차 시장점유율에 어떠한 영향을 미치는 지에 대하여 확인하기 위한 것이다. 본 연구는 총 3단계 구성으로서, 단계 1은 감성사전 구축 단계로서 미국 내 26개의 자동차 제조 회사의 고객의 소리 (VOC: Voice of Customer) 총 45,447개를 자동차 커뮤니티로부터 crawling하여 POS 정보 추출 후 감성사전을 구축하였고, 7개의 감성도메인을 만들었다. 단계 2는 신뢰성분석의 단계로서 자기상관관계분석과 주성분 분석 (PCA)을 통해 데이터의 실험 적합성을 검증하였다. 단계 3에서는 PCA를 근거로 2개의 선형회귀분석 모델을 구축하였고 GM, FCA, VOLKSWAGEN 등 3개의 기업을 선정, 2013년부터 2015년까지 7개 감성영역의 자동차 시장점유율에 대한 영향을 실험하였다. 실험 결과, 자기상관관계분석에 의해서 감성 데이터에 자기상관성과 시계열적 패턴이 관찰되었다. PCA 결과, 감성영역이 부정성, 긍정성, 중립성을 주성분으로 연결되어 있음이 확인되었다. VOC 감성 데이터에 대한 신뢰성을 바탕으로 한 2개 Model의 선형회귀분석 결과, 기업마다 시장점유율에 유의미한 영향을 미치는 감성들이 존재하며 Model 1과, 2의 감성영향력이 차이가 있고 중립성의 영향을 발견하였다. 본 연구를 통해, 데이터 상에 나타난 정보를 가진 감성이 과거 값에 기초하여 자동차 시장에서 변화를 수반할 수 있다는 것을 나타내고 있음을 확인하였다. 또한, 우리가 시장 데이터의 가용성을 적용하려고 할 때, 자동차 시장 관련 정보나 감성의 자기상관성을 잘 활용할 수 있다면, 감정 분석에 대한 연구에 큰 기여를 할 수 있을 뿐만 아니라, 실제 시장에서의 비지니스 성과에도 다양한 방법으로 기여할 수 있을 것으로 기대된다.

새로운 Boosted 3-D PCA 기반 Head Pose Estimation 방법 (A New Head Pose Estimation Method based on Boosted 3-D PCA)

  • 이경민;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.105-109
    • /
    • 2021
  • 본 논문에서는 Boosted 3-D PCA 방법을 데이터 세트로 평가하고 성능을 평가한다. 그런 다음 네트워크의 특징과 성능을 분석하겠습니다. 본 논문에서는 Boosted 3-D PCA 학습방법을 사용하여 300W-LP 데이터 학습을 수행했으며 AFLW2000 데이터 세트를 사용하여 평가를 평가했다. 결과는 이 성능 결과는 기존 랜드마크 대 포즈 방법보다 자유롭게 얼굴 이미지의 데이터 세트를 사용하여 학습할 수 있으므로 실제 상황에서 포즈를 정확하게 예측할 수 있다. 키포인트 세트의 최적화는 독립적이지 않기 때문에, 우리는 계산 시간을 줄일 방법을 확인했다. 이 방법은 Boosted 3-D PCA 성능을 향상시키거나 다양한 애플리케이션 도메인에 적용하는 데 매우 중요한 자원이 될 것으로 예상한다

항공 하이퍼스펙트럴 영상의 PCA기법 적용을 통한 토지 피복 분류 정확도 개선 방안에 관한 연구 (A Study on the Improvement classification accuracy of Land Cover using the Aerial hyperspectral image with PCA)

  • 최병길;나영우;김승현;이정일
    • 대한공간정보학회지
    • /
    • 제22권1호
    • /
    • pp.81-88
    • /
    • 2014
  • 본 연구에서는 항공 하이퍼스펙트럴 영상에 대해 PCA를 적용하여 토지 이용 및 피복 분류 판독의 가독성을 향상시키기 위하여 고유성분이 높은 밴드를 선별적으로 조합하여 5개 유형의 PCA영상을 제작하였다. 유형별 영상은 SAM감독 분류 기법을 적용하여 영상분류를 시행하고 정확도를 평가한 결과 PCA변환 시 고유성분 포함율은 PCA변환 영상의 첫 번째 밴드에 해당하는 영상이 76.74%의 성분을 포함하며, PCA변환 영상의 두 번째 누적 밴드에 해당하는 영상이 98.40%로 대부분의 성분자료가 두 번째 영상까지에 담긴 것을 알 수 있었다. 유형별 영상의 정량적 분류정확도 평가는 전체정확도, 생산자 및 사용자 정확도를 분석한 결과 유사한 패턴을 가지며, 특이한 사항은 정성적인 분류정확도 평가는 PCA변환 영상의 네 번째 밴드이상이 포함되어야 정확도가 확보되는 것으로 판단되나 정량적인 분류 정확도 평가에서는 PCA변환 영상의 두 번째 밴드까지를 포함하는 영상이 가장 높은 정확도를 나타내는 것을 알 수 있었다.

화자 검증 시스템을 위한 PCA 기반 MFDWC 특징 파라미터 (A PCA-based MFDWC Feature Parameter for Speaker Verification System)

  • 함성준;정호열;정현열
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.36-42
    • /
    • 2006
  • 본 논문에서는 화자검증 시스템의 성능향상을 위해서 주성분 분석 (PCA) 기반 Mel-Frequency Discrete Wavelet Coefficients (MFDWC) 추출방법을 제안한다. 제안된 방법에서는 멜척도 (Mel-scale)를 근사화한 각 레벨 (level)의 각 노드 (node) 에너지를 계산하기 위해 기존의 평균치 대신 주성분 분석을 이용한 첫 번째 eigenvector를 이용한다. 이 eigenvecto.의 제곱의 합은 1로서 일반적인 가중 함수 (weighting function)의 조건을 만족하고, 또한 각 화자마다 서로 다른 값을 갖게 되므로, 화자의 특징을 더 잘 나타내는 MFDWC를 추출할 수 있다. 화자검증은 Gaussian Mixture Model (GMM) 기반의 백그라운드 모델과 화자 모델과의 점수를 비교하는 이진 결정 (binary decision) 방법을 이용하여 Universal 백그라운드 모델 (UBM)과 각 화자 모델의 값을 프레임단위로 비교하여 대상 화자의 수락/거부 여부를 결정하는 방법을 채택하였다. 특징 파라미터에 따른 화자 검증 성능변화를 확인하기 위하여 제안된 화자종속 가중함수를 이용한 MFDWC를 특징 파라미터로 이용한 경우와 Mel-Frequency Cepstral Coefficients (MFCC), Linear Predictive Cepstral Coefficients (LPCC), 기존의 MFDWC를 특징 파라미터로 이용한 경우에 대하여 성능비교실험을 수행한 결과 각각 $0.80\%,\;5.14\%,\; 6.69\%$의 향상된 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

무선 센서 네트워크에서 장애 검출을 위한 결합 주성분분석과 적응형 임계값 (Joint PCA and Adaptive Threshold for Fault Detection in Wireless Sensor Networks)

  • Dang, Thien-Binh;Vo, Vi Van;Le, Duc-Tai;Kim, Moonseong;Choo, Hyunseung
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.69-71
    • /
    • 2020
  • Principal Component Analysis (PCA) is an effective data analysis technique which is commonly used for fault detection on collected data of Wireless Sensor Networks (WSN), However, applying PCA on the whole data make the detection performance low. In this paper, we propose Joint PCA and Adaptive Threshold for Fault Detection (JPATAD). Experimental results on a real dataset show a remarkably higher performance of JPATAD comparing to conventional PCA model in detection of noise which is a popular fault in collected data of sensors.

특징 추출 알고리즘과 Adaboost를 이용한 이진분류기 (Binary classification by the combination of Adaboost and feature extraction methods)

  • 함승록;곽노준
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.42-53
    • /
    • 2012
  • 패턴 인식과 기계 학습 분야에서 분류는 가장 기본적으로 해결해야 하는 문제의 유형이다. Adaboost 알고리즘은 Boosting 알고리즘의 아이디어를 실제 데이터분석에 이용할 수 있도록 개량한 방법으로써, 단계를 반복하여 나온 여러 개의 약한 분류기와 가중치 값들의 조합으로 강한 분류기를 생성하는 두 개의 클래스를 분류하는 분류기이다. 주성분 분석법과 선형 판별 분석법은 높은 차원의 특징 벡터를 낮은 차원의 특징 벡터로 축소하는 특징 벡터의 차원 감소와 데이터의 특징 추출에도 유용하게 사용되는 방법들이다. 본 논문에서는, 주성분 분석법과 선형 판별 분석법을 이용하여 추출한 특징을 Adaboost 알고리즘의 약 분류기로 사용함으로써, 특징 추출과 분류를 동시에 하고, 인식률을 높이는 효율적인 Boosted-PCA와 Boosted-LDA 알고리즘을 제안한다. 마지막 장에서는, 제안하는 알고리즘으로 UCI Data-Set 중 2 Class-Data와 FRGC Data의 남자와 여자 영상에 대해서 분류 실험을 진행하였다. 실험의 결과로 제안한 Boosted-PCA와 Boosted-LDA 알고리즘이 기존의 특징 추출 알고리즘과 최근접 이웃 분류기, SVM을 이용한 분류기 방법과 비교하여 인식률이 향상됨을 보인다.

주성분 분석과 퍼지 연관을 이용한 문서군집 방법 (Document Clustering Method using PCA and Fuzzy Association)

  • 박선;안동언
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.177-182
    • /
    • 2010
  • 본 논문은 주성분 분석과 퍼지 연관을 이용한 새로운 문서군집 방법을 제안한다. 제안된 방법은 주성분 분석의 의미특징을 이용하여 군집 레이블과 군집의 대표 용어들을 선택하기 때문에 문서군집의 내부구조를 더 잘 표현할 수 있다. 또한 퍼지연관 값을 이용한 군집은 문서군집에 유사하지 않은 문서를 더 잘 구분함으로써 문서군집의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

영평균 정규화와 PCA를 이용한 회귀 신경망의 성능개선 (Performance Improvement of Regression Neural Networks by Using PCA and Zero-Mean Normalization)

  • 박용수;조용현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.515-518
    • /
    • 2001
  • 본 논문에서는 전처리단계로 영평균 정규화 기법과 주요성분분석 기법을 도입하여 다층신경망을 이용한 고신뢰성의 회귀분석 모델을 제안한다. 영평균 정규화 기법은 데이터의 1차적 통계성을 고려하여 알고리즘을 간략화시키며, 주요성분분석 기법은 입력 데이터의 2차적 통계성을 고려하여 독립인 특징들의 집합으로 변환시켜 학습데이터의 차원을 감소시킬 수 있어 고차원의 학습데이터에 따른 회귀분석 모델의 제약을 해결할 수 있었다. 제안된 기법의 신경망을 3개의 독립변수를 가진 암모니아 제조공정문제와 10개의 독립변수를 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 단순정규화나 PCA를 적용하지 않는 경우보다 제안된 기법의 학습속도와 회귀성능이 더욱 더 우수함을 확인할 수 있었다.

  • PDF

PCA 기법에 의한 회귀분석 신경망의 성능개선 (Performance Improvement of Regression Neural Networks by Using PCA)

  • 조용현;박용수
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.116-119
    • /
    • 2001
  • 본 논문에서는 주요성분분석 기법을 도입하여 회귀분석을 위한 신경망의 성능 개선방안을 제안하였다. 이는 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 타원을 감소시킴으로서 고차원의 학습데이터에 따른 신경망의 학습성능 의존성을 줄이기 위함이다. 제안된 기법의 신경망을 10개의 독립변수 패턴을 가진 자동차 연비문제에 적용하여 시뮬레이션한 결과, 기존의 학습데이터를 그대로 이용하는 신경 망보다 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다.

  • PDF

PCA와 비선형분류기에 기반을 둔 유도전동기의 고장진단 (Fault Diagnosis of Induction Motor based on PCA and Nonlinear Classifier)

  • 박성무;이대종;전명근
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.119-123
    • /
    • 2006
  • 본 논문에서는, 주성분분석기법과 다층신경망에 기반을 유도전동기의 고장진단기법을 제안하고자 한다. 입력의 수가 많을 경우 다층신경망만을 이용하여 분류하는 데는 한계가 있다. 이러한 문제점을 해결하기 위해 주성분분석기법에 의해 입력특징의 수를 축약한 후, 비선형분류기인 다층신경망을 적용하였다. 또한, 주성 분석기법에 추출된 특징벡터가 고장상태별로 비선형성 특성을 보일 경우 기존의 거리척도 기반에 의한 분류방법으로 정확한 진단을 하는데 어려움이 있다. 이를 위해 비선형 분류기인 MLP를 적용함으로써 효과적인 고장진단을 하자 한다. 세안된 기법은 다양한 실험을 통해 기존의 선형분류기에 비해 우수한 겨과를 보임을 나타내고자 한다.