• 제목/요약/키워드: MNIST dataset

검색결과 37건 처리시간 0.025초

IGZO 멤리스터 소자기반 뉴로모픽 컴퓨팅 정확도 향상 (Improved Accuracy in Neuromorphic Computing Based on IGZO Memristor Devices)

  • 최서진;민경진;이종환
    • 반도체디스플레이기술학회지
    • /
    • 제22권4호
    • /
    • pp.166-171
    • /
    • 2023
  • This paper presents the synaptic characteristics of IGZO memristors in neuromorphic computing, using MATLAB/Simulink and NeuroSim. In order to investigate the variations in the conductivity of IGZO memristor and the corresponding changes in the hidden layer, simulations are conducted by using the MNIST dataset. It was observed from simulation results that the recognition accuracy could be dependent on various parameters of IGZO memristor, along with the experimental exploration. Moreover, we identified optimal parameters to achieve high accuracy, showing an outstanding accuracy of 96.83% in image classification.

  • PDF

숫자 인식을 위한 PCA 기반 pRBFNNs 패턴 분류기 설계 (Design of PCA-based pRBFNNs Pattern Classifier for Digit Recognition)

  • 이승철;오성권;김현기
    • 한국지능시스템학회논문지
    • /
    • 제25권4호
    • /
    • pp.355-360
    • /
    • 2015
  • 본 논문에서는 필기체 숫자를 인식하기 위해 주성분 분석법(PCA) 기반 방사형 기저함수 신경회로망(pRBFNNs) 패턴 분류기를 설계한다. 제안된 패턴 분류기는 PCA를 이용한 데이터 전처리 단계와 pRBFNNs를 이용한 분류 단계로 구성된다. 전처리 단계에서는 PCA를 사용하여 주어진 데이터의 정보손실을 최소화한 특징데이터를 생성하고, 이를 분류 단계인 pRBFNNs의 입력으로 사용한다. 제안된 분류기의 조건부에서는 Fuzzy C-Means(FCM) 클러스터링 알고리즘으로 구성하였고, 연결가중치는 1차 선형식을 사용하였다. 결론부에서는 최소자승법(LSE)을 사용하여 다항식 계수를 구하였다. 제안된 분류기의 성능평가를 위해 대표적인 필기체 숫자데이터인 MNIST 데이터를 사용하였으며, 제안된 분류기의 결과를 기존 다른 분류기들과 비교한다.

딥러닝 학습에서 최적의 알고리즘과 뉴론수 탐색 (Optimal Algorithm and Number of Neurons in Deep Learning)

  • 장하영;유은경;김혁진
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.389-396
    • /
    • 2022
  • 딥러닝(Deep Learning)은 퍼셉트론을 기반으로 하고 있으며 현재에는 이미지 인식, 음성 인식, 객체 검출 및 약물 개발 등과 같은 다양한 영역에서 사용되고 있다. 이에 따라 학습 알고리즘이 다양하게 제안되었고 신경망을 구성하는 뉴런수도 연구자마다 많은 차이를 보이고 있다. 본 연구는 현재 대표적으로 사용되고 있는 확률적 경사하강법(SGD), 모멘텀법(Momentum), AdaGrad, RMSProp 및 Adam법의 뉴런수에 따른 학습 특성을 분석하였다. 이를 위하여 1개의 입력층, 3개의 은닉층, 1개의 출력층으로 신경망을 구성하였고 활성화함수는 ReLU, 손실 함수는 교차 엔트로피 오차(CEE)를 적용하였고 실험 데이터셋은 MNIST를 사용하였다. 그 결과 뉴런수는 100~300개, 알고리즘은 Adam, 학습횟수(iteraction)는 200회가 딥러닝 학습에서 가장 효율적일 것으로 결론을 내렸다. 이러한 연구는 향후 새로운 학습 데이터가 주어졌을 경우 개발될 알고리즘과 뉴런수의 기준치에 함의를 제공할 것이다.

Deep Compression의 프루닝 문턱값 동적 조정 (Dynamic Adjustment of the Pruning Threshold in Deep Compression)

  • 이여진;박한훈
    • 융합신호처리학회논문지
    • /
    • 제22권3호
    • /
    • pp.99-103
    • /
    • 2021
  • 최근 CNN(Convolutional Neural Network)이 다양한 컴퓨터 비전 분야에서 우수한 성능으로 널리 사용되고 있다. 그러나 CNN은 계산 집약적이고 많은 메모리가 요구되어 한정적인 하드웨어 자원을 가지는 모바일이나 IoT(Internet of Things) 기기에 적용하기 어렵다. 이런 한계를 해결하기 위해, 기존의 학습된 모델의 성능을 최대한 유지하며 네트워크의 크기를 줄이는 인공신경망 경량화 연구가 진행되고 있다. 본 논문은 신경망 압축 기술 중 하나인 프루닝(Pruning)의 문턱값을 동적으로 조정하는 CNN 압축 기법을 제안한다. 프루닝될 가중치를 결정하는 문턱값을 실험적, 경험적으로 정하는 기존의 기술과 달리 정확도의 저하를 방지하는 최적의 문턱값을 동적으로 찾을 수 있으며, 경량화된 신경망을 얻는 시간을 단축할 수 있다. 제안 기법의 성능 검증을 위해 MNIST 데이터 셋을 사용하여 LeNet을 훈련시켰으며, 정확도 손실 없이 약 1.3 ~ 3배의 시간을 단축하여 경량화된 LeNet을 얻을 수 있었다.

Design of weighted federated learning framework based on local model validation

  • Kim, Jung-Jun;Kang, Jeon Seong;Chung, Hyun-Joon;Park, Byung-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.13-18
    • /
    • 2022
  • 본 논문에서는 학습에 참여하는 각 디바이스의 모델들로부터 성능검증에 따라 가중치를 두어 글로벌 모델을 업데이트하는 VW-FedAVG(Validation based Weighted FedAVG)를 두 가지 방식으로 제안 한다. 첫 번째 방식은 서버 검증(Server side Validation) 구조로 글로벌 모델을 업데이트 하기 전에 각 로컬 클라이언트 모델을 하나의 전체 검증 데이터셋을 통해 검증하도록 설계 했다. 두 번째는 클라이언트 검증(Client side Validation) 구조로 검증 데이터셋을 각 클라이언트에 고르게 분배하여 검증을 한 후 글로벌 모델을 업데이트 하는 방식으로 설계 했다. 전체 실험에 적용한 데이터셋은 MNIST, CIFAR-10으로 이미지 분류에 대해 IID, Non-IID 분포에서 기존 연구 대비 더 높은 정확도를 얻을 수 있었다.

뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경 응용 시나리오 (Application Scenario of Integrated Development Environment for Autonomous IoT Applications based on Neuromorphic Architecture)

  • 박지수;김서연;김회남;정재혁;김경수;정진만;윤영선
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.63-69
    • /
    • 2022
  • 다양한 IoT 디바이스 사용이 증가함에 따라 IoT 플랫폼의 중요성 또한 대두되고 있다. 최근에는 IoT 디바이스에 인공지능 기술이 결합되는 추세이며, 저전력으로 많은 연산 처리가 가능한 뉴로모픽 아키텍처를 적용하는 연구도 증가하고 있다. 본 논문에서는 GUI 형식의 뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경(NA-IDE:Integrated Development Environment for Autonomic IoT Applications based on Neuromorphic Architecture)에서 IoT 디바이스와 뉴로모픽 아키텍처 FPGA 디바이스를 사용하여 NA-IDE의 가능성 및 유효성을 확인하기 위한 IoT 응용 시나리오를 제안한다. 제안된 시나리오는 IoT 디바이스에 카메라 모듈을 연결하여 실시간으로 MNIST 데이터셋 이미지를 수집하여 뉴로모픽 보드를 통해 수집된 이미지를 인식하고 다른 IoT 디바이스에 연결된 센서 모듈을 통해 인식 결과를 표시한다. 이와 같이 이기종 IoT 디바이스에 뉴로모픽 아키텍처를 적용하여 다양한 응용 서비스에 활용한다면 뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경은 4차 산업혁명을 주도하는 핵심 기술로 부상할 것으로 전망한다.

선형 판별 분석 및 k-means 알고리즘을 이용한 적대적 공격 유형 분류 방안 (An Adversarial Attack Type Classification Method Using Linear Discriminant Analysis and k-means Algorithm)

  • 최석환;김형건;최윤호
    • 정보보호학회논문지
    • /
    • 제31권6호
    • /
    • pp.1215-1225
    • /
    • 2021
  • 인공지능 기술은 우수한 성능을 기반으로 다양한 분야에 적용되고 있지만 입력 데이터에 인간이 감지할 수 없는 적대적 섭동을 추가하여 인공지능 모델의 오작동을 유도하는 적대적 예제에 취약하다. 현재까지 적대적 예제에 대응하기 위한 방법은 세 가지 범주로 분류할 수 있다. (1) 모델 재학습 방법; (2) 입력 변환 방법; (3) 적대적 예제 탐지 방법. 이러한 적대적 예제에 대응하기 위한 방법은 끊임없이 등장하고 있지만 각 적대적 공격 유형을 분류하는 연구는 미비한 실정이다. 따라서, 본 논문에서는 차원 축소와 군집화 알고리즘을 활용한 적대적 공격 유형 분류 방법을 제안한다. 구체적으로, 제안하는 방법은 적대적 예시로부터 적대적 섭동을 추출하고 선형 판별 분석(LDA)를 통해 적대적 섭동의 차원을 축소한 후에 k-means 알고리즘으로 적대적 공격 유형 분류를 수행한다. MNIST 데이터셋과 CIFAR-10 데이터셋을 대상으로 한 실험을 통해, 제안하는 기법은 5개의 적대적 공격(FGSM, BIM, PGD, DeepFool, C&W)을 효율적으로 분류할 수 있으며, 적대적 예제에 대한 정상 입력을 알 수 없는 제한적인 상황에서도 우수한 분류 성능을 나타내는 것을 확인하였다.

PCA 기반 특징 되먹임을 이용한 중요 영역 추출 (Extraction of Important Areas Using Feature Feedback Based on PCA)

  • 이승현;김도연;최상일;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권6호
    • /
    • pp.461-469
    • /
    • 2020
  • 본 논문에서는 손글씨 숫자 데이터셋, 얼굴 데이터셋의 중요영역 추출을 위한 PCA 기반의 특징되먹임방법을 제안한다. 이전의 LDA 기반의 특징되먹임 방법을 확장하여 PCA 기반 특징되먹임 방법이 제안된다. 제안된 방법에서 데이터에 차원 축소 머신러닝 알고리듬 중 하나인 PCA 기법을 적용하여 데이터를 중요한 특징 차원들로 축소한다. 차원 축소과정에서 도출되는 weight를 통해 축소된 각 차원 축에서의 데이터 중요 지점을 확인한다. 각 차원 축은 축의 고유값의 크기에 따라 전체 데이터에서의 가중치가 다르다. 이에 각 차원 축의 고유값의 크기에 비례하는 가중치를 부여하여 각 차원 축에서의 데이터 중요 지점을 합하는 연산 과정을 거친다. 연산 과정을 통해 얻어진 데이터에 Threshold를 적용하여 데이터의 중요 영역을 구한다. 그 후 도출된 데이터의 중요 영역에 원본데이터로 역매핑을 유도하여 원본 데이터 공간에서 중요영역을 선택한다. MNIST 데이터셋에 대한 실험 결과를 확인하고 기존의 LDA 기반의 특징되먹임 방법을 통한 결과와 비교를 하여 PCA기반 특징되먹임을 기반한 패턴 인식 방법의 유효성과 가능성을 확인한다.

Robust Multi-Layer Hierarchical Model for Digit Character Recognition

  • Yang, Jie;Sun, Yadong;Zhang, Liangjun;Zhang, Qingnian
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권2호
    • /
    • pp.699-707
    • /
    • 2015
  • Although digit character recognition has got a significant improvement in recent years, it is still challenging to achieve satisfied result if the data contains an amount of distracting factors. This paper proposes a novel digit character recognition approach using a multi-layer hierarchical model, Hybrid Restricted Boltzmann Machines (HRBMs), which allows the learning architecture to be robust to background distracting factors. The insight behind the proposed model is that useful high-level features appear more frequently than distracting factors during learning, thus the high-level features can be decompose into hybrid hierarchical structures by using only small label information. In order to extract robust and compact features, a stochastic 0-1 layer is employed, which enables the model's hidden nodes to independently capture the useful character features during training. Experiments on the variations of Mixed National Institute of Standards and Technology (MNIST) dataset show that improvements of the multi-layer hierarchical model can be achieved by the proposed method. Finally, the paper shows the proposed technique which is used in a real-world application, where it is able to identify digit characters under various complex background images.

DeepCleanNet: Training Deep Convolutional Neural Network with Extremely Noisy Labels

  • Olimov, Bekhzod;Kim, Jeonghong
    • 한국멀티미디어학회논문지
    • /
    • 제23권11호
    • /
    • pp.1349-1360
    • /
    • 2020
  • In recent years, Convolutional Neural Networks (CNNs) have been successfully implemented in different tasks of computer vision. Since CNN models are the representatives of supervised learning algorithms, they demand large amount of data in order to train the classifiers. Thus, obtaining data with correct labels is imperative to attain the state-of-the-art performance of the CNN models. However, labelling datasets is quite tedious and expensive process, therefore real-life datasets often exhibit incorrect labels. Although the issue of poorly labelled datasets has been studied before, we have noticed that the methods are very complex and hard to reproduce. Therefore, in this research work, we propose Deep CleanNet - a considerably simple system that achieves competitive results when compared to the existing methods. We use K-means clustering algorithm for selecting data with correct labels and train the new dataset using a deep CNN model. The technique achieves competitive results in both training and validation stages. We conducted experiments using MNIST database of handwritten digits with 50% corrupted labels and achieved up to 10 and 20% increase in training and validation sets accuracy scores, respectively.