• 제목/요약/키워드: CNN Model

검색결과 963건 처리시간 0.022초

소프트맥스를 이용한 딥러닝 음악장르 자동구분 투표 시스템 (Deep Learning Music genre automatic classification voting system using Softmax)

  • 배준;김장영
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.27-32
    • /
    • 2019
  • 인간이 가진 뛰어난 능력 중의 하나인 곡 분류 과정을 딥러닝 알고리즘을 통해 구현하는 연구는 단일데이터를 이용한 유니모달 모델, 멀티모달 모델, 뮤직비디오를 이용한 멀티모달 방식 등이 있다. 이 연구에서는 곡의 스펙트로그램을 짧은 샘플들로 분할하여 각각을 CNN으로 분석한 뒤 그 결과를 투표하는 시스템을 제안하여 더 좋은 결과를 얻었다. 딥러닝 알고리즘 중 CNN이 RNN에 비해 음악 장르 구분에 있어 우수한 성능을 보였으며 CNN과 RNN을 같이 적용했을 때 성능이 좋아짐을 알 수 있었다. 음악샘플을 나누어 각각의 CNN 결과를 투표하는 시스템이 이전 모델에 비해 좋은 결과를 나타내었고 이 모델에 Softmax 레이어를 추가한 모델이 가장 좋은 성능을 보였다. 디지털 미디어의 폭발적인 성장과 수많은 스트리밍 서비스 속에서 음악장르의 자동분류에 대한 필요는 점점 증가하고 있는 추세이다. 향후 연구에서는 미분류 곡의 비율을 낮추고 최종적으로 미분류된 곡들의 장르구분에 대한 알고리즘을 개발할 필요가 있을 것이다.

Analyze weeds classification with visual explanation based on Convolutional Neural Networks

  • Vo, Hoang-Trong;Yu, Gwang-Hyun;Nguyen, Huy-Toan;Lee, Ju-Hwan;Dang, Thanh-Vu;Kim, Jin-Young
    • 스마트미디어저널
    • /
    • 제8권3호
    • /
    • pp.31-40
    • /
    • 2019
  • To understand how a Convolutional Neural Network (CNN) model captures the features of a pattern to determine which class it belongs to, in this paper, we use Gradient-weighted Class Activation Mapping (Grad-CAM) to visualize and analyze how well a CNN model behave on the CNU weeds dataset. We apply this technique to Resnet model and figure out which features this model captures to determine a specific class, what makes the model get a correct/wrong classification, and how those wrong label images can cause a negative effect to a CNN model during the training process. In the experiment, Grad-CAM highlights the important regions of weeds, depending on the patterns learned by Resnet, such as the lobe and limb on 미국가막사리, or the entire leaf surface on 단풍잎돼지풀. Besides, Grad-CAM points out a CNN model can localize the object even though it is trained only for the classification problem.

CNN 기반 딥러닝을 이용한 인공지지체의 외형 변형 불량 검출 모델에 관한 연구 (A Study on Shape Warpage Defect Detecion Model of Scaffold Using Deep Learning Based CNN)

  • 이송연;허용정
    • 반도체디스플레이기술학회지
    • /
    • 제20권1호
    • /
    • pp.99-103
    • /
    • 2021
  • Warpage defect detecting of scaffold is very important in biosensor production. Because warpaged scaffold cause problem in cell culture. Currently, there is no detection equipment to warpaged scaffold. In this paper, we produced detection model for shape warpage detection using deep learning based CNN. We confirmed the shape of the scaffold that is widely used in cell culture. We produced scaffold specimens, which are widely used in biosensor fabrications. Then, the scaffold specimens were photographed to collect image data necessary for model manufacturing. We produced the detecting model of scaffold warpage defect using Densenet among CNN models. We evaluated the accuracy of the defect detection model with mAP, which evaluates the detection accuracy of deep learning. As a result of model evaluating, it was confirmed that the defect detection accuracy of the scaffold was more than 95%.

Two-stage Deep Learning Model with LSTM-based Autoencoder and CNN for Crop Classification Using Multi-temporal Remote Sensing Images

  • Kwak, Geun-Ho;Park, No-Wook
    • 대한원격탐사학회지
    • /
    • 제37권4호
    • /
    • pp.719-731
    • /
    • 2021
  • This study proposes a two-stage hybrid classification model for crop classification using multi-temporal remote sensing images; the model combines feature embedding by using an autoencoder (AE) with a convolutional neural network (CNN) classifier to fully utilize features including informative temporal and spatial signatures. Long short-term memory (LSTM)-based AE (LAE) is fine-tuned using class label information to extract latent features that contain less noise and useful temporal signatures. The CNN classifier is then applied to effectively account for the spatial characteristics of the extracted latent features. A crop classification experiment with multi-temporal unmanned aerial vehicle images is conducted to illustrate the potential application of the proposed hybrid model. The classification performance of the proposed model is compared with various combinations of conventional deep learning models (CNN, LSTM, and convolutional LSTM) and different inputs (original multi-temporal images and features from stacked AE). From the crop classification experiment, the best classification accuracy was achieved by the proposed model that utilized the latent features by fine-tuned LAE as input for the CNN classifier. The latent features that contain useful temporal signatures and are less noisy could increase the class separability between crops with similar spectral signatures, thereby leading to superior classification accuracy. The experimental results demonstrate the importance of effective feature extraction and the potential of the proposed classification model for crop classification using multi-temporal remote sensing images.

CNN을 이용한 거리 사진의 분류와 안전도 평가 (Classification and Safety Score Evaluation of Street Images Using CNN)

  • 배규호;윤정언;박인규
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.345-350
    • /
    • 2018
  • CNN (convolutional neural network)은 최근 가장 주목받는 인공지능 기법 중 하나이며 특히 영상 분류에서 기존의 기법에 비해 월등한 성능을 보인다. 본 논문에서는 CNN을 이용하여 다양한 거리 사진을 분류하고, 분류 결과를 이용하여 해당 거리에 대한 안전도의 평가 방법을 제안한다. 제안하는 기법은 CNN을 이용하여 총 네 가지 유형의 거리 사진에 대하여 학습을 수행하는 과정과 학습된 네트워크 모델을 바탕으로 해당 거리 사진의 분류와 안전도를 평가하는 과정을 포함한다. 거리 사진의 학습 과정에서는 네 가지 유형의 거리 사진 데이터셋을 수집하고 이 데이터를 증강시킨 후 CNN 학습을 수행한다. 학습된 CNN 모델은 주어진 입력 영상의 분류를 정확히 수행하고, 거리의 안전도는 각 유형에 대한 확률을 조합하여 정량적으로 계산한다.

CNN-LSTM 혼합모델을 이용한 비행상태 예측 기법 (Flight State Prediction Techniques Using a Hybrid CNN-LSTM Model)

  • 박진상;송민재;최은주;김병수;문용호
    • 항공우주시스템공학회지
    • /
    • 제16권4호
    • /
    • pp.45-52
    • /
    • 2022
  • 최근 차세대 운송시스템으로 주목받고 있는 UAM 분야에서 무인항공기 활용을 위한 기술 개발이 활발히 진행되고 있다. 이러한 기술이 적용된 무인항공기는 주로 도심에서 운용되기 때문에 추락사고를 예방하는 것이 중요하다. 그러나 충돌이 발생되는 무인항공기는 비선형성이 강하기 때문에 비정상 비행상태를 예측하는 것은 쉽지 않은 일이다. 본 논문에서는 CNN-LSTM 혼합모델을 이용하여 무인항공기의 비행상태를 예측하는 방법을 제안한다. 제안 모델은 비행 데이터간의 시간적, 공간적 특징을 추출하는 CNN 모델과 추출된 특징의 장단기 시간 의존성을 추출하는 LSTM 모델을 결합하여 미래의 특정 시점에서 비행 상태변수를 예측한다. 모의 실험은 제안하는 방법이 기존 인공신경망 모델에 기반한 예측 방법보다 우수한 성능을 보인다.

The Impact of Transforming Unstructured Data into Structured Data on a Churn Prediction Model for Loan Customers

  • Jung, Hoon;Lee, Bong Gyou
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권12호
    • /
    • pp.4706-4724
    • /
    • 2020
  • With various structured data, such as the company size, loan balance, and savings accounts, the voice of customer (VOC), which is text data containing contact history and counseling details was analyzed in this study. To analyze unstructured data, the term frequency-inverse document frequency (TF-IDF) analysis, semantic network analysis, sentiment analysis, and a convolutional neural network (CNN) were implemented. A performance comparison of the models revealed that the predictive model using the CNN provided the best performance with regard to predictive power, followed by the model using the TF-IDF, and then the model using semantic network analysis. In particular, a character-level CNN and a word-level CNN were developed separately, and the character-level CNN exhibited better performance, according to an analysis for the Korean language. Moreover, a systematic selection model for optimal text mining techniques was proposed, suggesting which analytical technique is appropriate for analyzing text data depending on the context. This study also provides evidence that the results of previous studies, indicating that individual customers leave when their loyalty and switching cost are low, are also applicable to corporate customers and suggests that VOC data indicating customers' needs are very effective for predicting their behavior.

Research on Chinese Microblog Sentiment Classification Based on TextCNN-BiLSTM Model

  • Haiqin Tang;Ruirui Zhang
    • Journal of Information Processing Systems
    • /
    • 제19권6호
    • /
    • pp.842-857
    • /
    • 2023
  • Currently, most sentiment classification models on microblogging platforms analyze sentence parts of speech and emoticons without comprehending users' emotional inclinations and grasping moral nuances. This study proposes a hybrid sentiment analysis model. Given the distinct nature of microblog comments, the model employs a combined stop-word list and word2vec for word vectorization. To mitigate local information loss, the TextCNN model, devoid of pooling layers, is employed for local feature extraction, while BiLSTM is utilized for contextual feature extraction in deep learning. Subsequently, microblog comment sentiments are categorized using a classification layer. Given the binary classification task at the output layer and the numerous hidden layers within BiLSTM, the Tanh activation function is adopted in this model. Experimental findings demonstrate that the enhanced TextCNN-BiLSTM model attains a precision of 94.75%. This represents a 1.21%, 1.25%, and 1.25% enhancement in precision, recall, and F1 values, respectively, in comparison to the individual deep learning models TextCNN. Furthermore, it outperforms BiLSTM by 0.78%, 0.9%, and 0.9% in precision, recall, and F1 values.

다중 압력분포 기반의 착석 자세 분류를 위한 CNN 모델 구현 (Implementation of CNN Model for Classification of Sitting Posture Based on Multiple Pressure Distribution)

  • 서지윤;노윤홍;정도운
    • 융합신호처리학회논문지
    • /
    • 제21권2호
    • /
    • pp.73-78
    • /
    • 2020
  • 근골격 질환은 착석 자세로 업무 및 학업을 장시간 진행하거나 잘못된 자세 습관으로 발생하는 경우가 많다. 일상생활에서 근골격 질환을 예방하기 위해서는 실시간 착석자세 모니터링을 통해 잘못된 자세를 바른 자세로 유도하는 것이 가장 중요하다. 본 논문에서는 의자에 밀착된 착석 정보를 무 구속적으로 검출하기 위하여 다채널 압력센서 기반의 자세 측정 시스템과 사용자의 착석 자세 분류를 위한 CNN 모델을 제안한다. 제안된 CNN 모델은 착석 자세 정보를 기반으로 압력분포에 따른 사용자의 5가지 자세 분석이 가능하다. 필드테스트를 통한 자세 분류 신경망의 성능평가를 위하여 10명의 피실험자를 대상으로 분류결과에 대한 정확도, 재현율, 정밀도 및 조화 평균을 확인하였다. 실험 결과, 99.84%의 accuracy, 99.6%의 recall, 99.6%의 precision, 99.6%의 F1을 확인하였다.

임베디드 보드에서의 CNN 모델 압축 및 성능 검증 (Compression and Performance Evaluation of CNN Models on Embedded Board)

  • 문현철;이호영;김재곤
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.200-207
    • /
    • 2020
  • CNN 기반 인공신경망은 영상 분류, 객체 인식, 화질 개선 등 다양한 분야에서 뛰어난 성능을 보이고 있다. 그러나, 많은 응용에서 딥러닝(Deep Learning) 모델의 복잡도 및 연산량이 방대해짐에 따라 IoT 기기 및 모바일 환경에 적용하기에는 제한이 따른다. 따라서 기존 딥러닝 모델의 성능을 유지하면서 모델 크기를 줄이는 인공신경망 압축 기법이 연구되고 있다. 본 논문에서는 인공신경망 압축기법을 통하여 원본 CNN 모델을 압축하고, 압축된 모델을 임베디드 시스템 환경에서 그 성능을 검증한다. 성능 검증을 위해 인공지능 지원 맞춤형 칩인 QCS605를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대해서 원 CNN 모델과 압축 CNN 모델의 분류성능과 추론시간을 비교 분석한다. 본 논문에서는 이미지 분류 CNN 모델인 MobileNetV2, ResNet50 및 VGG-16에 가지치기(pruning) 및 행렬분해의 인공신경망 압축 기법을 적용하였고, 실험결과에서 압축된 모델이 원본 모델 분류 성능 대비 2% 미만의 손실에서 모델의 크기를 1.3 ~ 11.2배로 압축했을 뿐만 아니라 보드에서 추론시간과 메모리 소모량을 각각 1.2 ~ 2.1배, 1.2 ~ 3.8배 감소함을 확인했다.