• 제목/요약/키워드: 다중주성분분석

검색결과 103건 처리시간 0.019초

딥러닝과 머신러닝을 이용한 아파트 실거래가 예측 (Apartment Price Prediction Using Deep Learning and Machine Learning)

  • 김학현;유환규;오하영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.59-76
    • /
    • 2023
  • 코로나 시대 이후 아파트 가격 상승은 비상식적이었다. 이러한 불확실한 부동산 시장에서 가격 예측 연구는 매우 중요하다. 본 논문에서는 다양한 부동산 사이트에서 자료 수집 및 크롤링을 통해 2015년부터 2020년까지 87만개의 방대한 데이터셋을 구축하고 다양한 아파트 정보와 경제지표 등 가능한 많은 변수를 모은 뒤 미래 아파트 매매실거래가격을 예측하는 모델을 만든다. 해당 연구는 먼저 다중 공선성 문제를 변수 제거 및 결합으로 해결하였다. 이후 의미있는 독립변수들을 뽑아내는 전진선택법(Forward Selection), 후진소거법(Backward Elimination), 단계적선택법(Stepwise Selection), L1 Regularization, 주성분분석(PCA) 총 5개의 변수 선택 알고리즘을 사용했다. 또한 심층신경망(DNN), XGBoost, CatBoost, Linear Regression 총 4개의 머신러닝 및 딥러닝 알고리즘을 이용해 하이퍼파라미터 최적화 후 모델을 학습시키고 모형간 예측력을 비교하였다. 추가 실험에서는 DNN의 node와 layer 수를 바꿔가면서 실험을 진행하여 가장 적절한 node와 layer 수를 찾고자 하였다. 결론적으로 가장 성능이 우수한 모델로 2021년의 아파트 매매실거래가격을 예측한 후 실제 2021년 데이터와 비교한 결과 훌륭한 성과를 보였다. 이를 통해 머신러닝과 딥러닝은 다양한 경제 상황 속에서 투자자들이 주택을 구매할 때 올바른 판단을 할 수 있도록 도움을 줄 수 있을 것이라 확신한다.

카지노 시큐리티 종사자의 운동변화단계에 따른 신체적 자기개념과 자기 효능감의 관계 (The Relationship between the Stage of Exercise Behavior Change and Physical Self-Concept and Self-Efficacy of Casino Security Employees)

  • 전용태;오중일
    • 시큐리티연구
    • /
    • 제21호
    • /
    • pp.95-120
    • /
    • 2009
  • 본 연구는 카지노 시큐리티 종사자의 운동변화단계에 따른 신체적 자기개념과 자기효능감의 관계를 규명하는데 목적이 있다. 연구의 목적 달성을 위하여 전국 카지노 17개업체중 시큐리티 관련업무 30명 이상을 고용하고 있는 8개의 업체를 모집단으로 설정하여 표본을 추출하였다. 이 연구에서 시큐리티 종사자 30명 이상을 고용하고 있는 업체를 선정한 이유는 30명 이하의 영세한 업체에서 조직구성 및 직무체계와 환경이 대체적으로 차이가 있으므로 이에 따른 연구결과를 일반화하기에는 다소 제한적이라고 판단되기 때문이다. 편의 추출법(convenience sampling)에 의하여 대상을 표집 하였으며, 선정된 연구대상자는 본 연구의 취지 및 설문조사 교육을 받은 조사원을 통해 운동변화단계에 따른 신체적 자기개념과 자기효능감의 관계 설문지를 자기평가 기입법(self-administration method)에 따라 설문조사를 실시하였다. 연구 조사 자료의 결과를 처리하기 위하여 Window SPSS 16.0프로그램을 이용하여 분석하였으며, 측정도구의 타당성을 검증하기 위해 탐색적 요인분석(factor analysis)과 신뢰도 검증을 위하여 하위 척도별 내적 일관성 계수(Cronbach's alpha)를 산출하였다. 주성분 분석(principle component factor analysis)을 이용하였으며. 요인회전방법으로 직각회전방식(varimax rotation)을 이용하였다. 초기 고유값(Eigen value) 1.0을 요인 추출의 준거로 삼았다. 운동변화단계에 있어 성별, 근무형태의 차이를 알아보기 위하여 운동 변화단계에 대한 차이를 검증하기 위해 $X^2$을 실시하였다. 운동변화단계에 따라 신체적 자기개념과 자기효능감의 차이를 알아보기 위하여 운동변화단계를 독립변수로 신체적 자기개념과 자기효능감을 종속변수로 하는 일원변량분석(one-way ANOVA)을 실시하였다. 집단간의 평균차를 검증하기 위하여 사후검증으로 Scheffe 검증을 실시하였다. 신체적 자기개념이 자기효능감에 미치는 영향을 알아보기 위하여 먼저 상관관계분석을 실시하였고, 신체적 자기개념을 독립변수로 하고 자기효능감을 종속변수로 하는 다중회귀분석(multipie regression analysis)을 실시하였으며, Enter 방식으로 처리하였다. 이와 같은 방법과 절차에 따른 자료 분석을 통하여 얻은 결론은 다음과 같다. 첫째, 카지노 시큐리티 종사자들의 운동행동변화단계는 성별과 근무형태에 따라 운동행동 변화단계에 차이가 있었다. 둘째, 운동행동변화단계에서 유지단계로 이행 할수록 신체적 자기 개념과 자기효능감을 지각하는 정도가 높게 나타났다. 셋째, 신체적 자기개념의 하위요인 중, 신체활동과 체지방에 대한 정도가 자기효능감에 유의한 영향을 미쳤다.

  • PDF

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.