• 제목/요약/키워드: CNN structure

검색결과 179건 처리시간 0.021초

패션 의류 영상 분류 딥러닝 (Fashion Clothing Image Classification Deep Learning)

  • 신성윤;왕광싱;신광성;이현창
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.676-677
    • /
    • 2022
  • 본 논문에서는 패션 의류 이미지의 빠르고 정확한 분류를 달성하기 위해 최적화된 동적 붕괴 학습률과 개선된 모델 구조를 가진 딥 러닝 모델을 기반으로 하는 새로운 방법을 제안한다. Fashion-MNIST 데이터 셋에서 제안된 모델을 사용하여 실험을 수행하고 CNN, LeNet, LSTM 및 BiLSTM의 방법과 비교한다.

  • PDF

합성곱 신경망 네트워크 구조 변화에 따른 숫자 인식률 비교 (Comparison of Number Recognition Rates According to Changes in Convolutional Neural Structure)

  • 이종찬;김영현;송특섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.397-399
    • /
    • 2022
  • 딥러닝을 적용한 기술 중 숫자 인식으로 예를 들 수 있다. 숫자 인식을 통하여 여러 분야에서 활용이 되고 있다. 숫자 인식을 가능하게 한 알고리즘 중 합성곱 신경망이 있다. 합성곱 신경망은 다양한 데이터들을 인식하는 데 사용되고 있다. MNIST 숫자 데이터셋을 활용하여 합성곱 신경망 구현 과정 중 깊게 레이어층을 쌓을수록 성능향상을 기대해볼 수 있다. 본 논문에서는 합성곱 레이어를 추가함으로써 성능향상을 76.96%에서 98.87의 정확도가 산출되어 약 21.91%의 정확도가 향상됨을 확인하였다.

  • PDF

팽창된 잔차 합성곱신경망을 이용한 KOMPSAT-3A 위성영상의 융합 기법 (A Pansharpening Algorithm of KOMPSAT-3A Satellite Imagery by Using Dilated Residual Convolutional Neural Network)

  • 최호성;서두천;최재완
    • 대한원격탐사학회지
    • /
    • 제36권5_2호
    • /
    • pp.961-973
    • /
    • 2020
  • 본 논문에서는 CNN (Convolutional Neural Network) 기반의 영상융합 기법을 제안하고자 하였다. 딥러닝 구조의 성능을 향상시키기 위하여, CNN 기법에서 대표적인 합성곱(convolution) 방법으로 알려진 팽창된 합성곱(dilated convolution) 모델을 활용하여 모델의 깊이와 복잡성을 증대시키고자 하였다. 팽창된 합성곱을 기반으로 하여 학습과정에서의 효율을 향상시키기 위하여 잔차 네트워크(residual network)도 활용하였다. 또한, 본 연구에서는 모델학습을 위하여 전통적인 L1 노름(norm) 기반의 손실함수와 함께, 공간 상관도를 활용하였다. 본 연구에서는 전정색 영상만을 이용하거나 전정색 영상과 다중분광 영상을 모두 활용하여 구조에 적용한 DRNet을 개발하여 실험을 수행하였다. KOMPSAT-3A를 활용한 전정색 영상과 다중분광 영상을 이용한 DRNet은 융합영상의 분광특성에 과적합되는 결과를 나타냈으며, 전정색 영상만을 이용한 DRNet이 기존 기법들과 비교하여 융합영상의 공간적 특성을 효과적으로 반영함을 확인하였다.

CNN 모델과 FMM 신경망을 이용한 동적 수신호 인식 기법 (Dynamic Hand Gesture Recognition Using CNN Model and FMM Neural Networks)

  • 김호준
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.95-108
    • /
    • 2010
  • 본 연구에서는 동영상으로부터 동적 수신호 패턴을 효과적으로 인식하기 위한 방법론으로서 복합형 신경망 모델을 제안한다. 제안된 모델은 특징추출 모듈과 패턴분류 모듈로 구성되는데, 이들 각각을 위하여 수정된 구조의 CNN 모델과, WFMM 모델을 도입한다. 또한 목표물의 움직임 정보에 기초한 시공간적 템플릿 구조의 데이터표현을 소개한다. 본 논문에서는 우선 수신호 패턴 데이터에서 특징점의 시간적 변이 및 공간적 변이에 의한 영향을 보완하기 위하여 3차원 수용영역 구조로 확장된 CNN 모델을 제시한다. 이어서 패턴분류 단계를 위하여 가중치를 갖는 구조의 FMM 신경망 모델을 소개하고, 신경망의 구조와 동작특성에 관해 기술한다. 또한 제안된 모델이 기존의 FMM 신경망에서 중첩 하이퍼박스의 축소과정에서 발생하는 학습효과의 왜곡현상을 개선할 수 있음을 보인다. 응용으로 가전제품 원격제어 문제를 전제하여 간략화된 수신호패턴 인식 문제에 적용한 실험결과로부터 제안된 이론의 타당성을 고찰한다.

딥러닝 기반 균열 추출 기법을 통한 수압 파쇄 균열 형상 분석 (Morphological Analysis of Hydraulically Stimulated Fractures by Deep-Learning Segmentation Method)

  • 박지민;김광염;윤태섭
    • 한국지반공학회논문집
    • /
    • 제39권8호
    • /
    • pp.17-28
    • /
    • 2023
  • 본 연구에서는 화강암 시편을 대상으로 파쇄 유체의 점성과 주입 속도를 변화시키며 실내 수압 파쇄 실험을 수행하였고, 3D X-ray CT 촬영을 통해 파쇄 후 시편 내부를 관찰하였다. 이미지 처리에 탁월한 성능을 보이는 합성곱 신경망(Convolutional Neural Network, CNN) 기반 Nested U-Net 모델 구조를 활용하여 CT 이미지 내 수압 파쇄 균열 추출을 수행하였고, 복잡한 형상의 미세균열을 정교하게 추출할 수 있었다. CNN 기반 모델로 추출된 균열을 3차원으로 재구성하여 균열의 부피, 두께, 굴곡도, 균열면 거칠기를 분석하였다. 그 결과 파쇄 유체의 점성이 클수록 균열 부피와 두께가 증가하였고, 굴곡도와 균열면의 거칠기가 감소하는 경향을 보였다. 또한 균열면의 굴곡도와 거칠기 이방성이 존재함을 확인할 수 있었다. 본 연구는, CNN 기반의 균열 추출 모델을 활용해 전통적인 이미지 처리 방법보다 정교한 균열 추출을 수행하고, 이를 기반으로 수압 파쇄 균열의 정량 분석을 성공적으로 수행하였다.

질감 분석과 CNN을 이용한 잡음에 강인한 돼지 호흡기 질병 식별 (Noise-Robust Porcine Respiratory Diseases Classification Using Texture Analysis and CNN)

  • 최용주;이종욱;박대희;정용화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.91-98
    • /
    • 2018
  • 집단으로 사육되는 돼지 농장에서 돼지 소모성 질환의 자동 탐지는 매우 중요한 문제이다. 특히, 밀집된 돈사에서 사육되는 돼지들의 호흡기 질환은 축산 농가의 막대한 경제적 손실을 야기하는 대표적 질병들 중 하나이다. 본 논문에서는 소리 신호 해석에 기반하여 돼지의 호흡기 질환을 조기 탐지 및 식별하는 잡음에도 강인한 시스템을 제안한다. 제안하는 시스템은, 먼저 1차원의 소리 신호를 2차원의 회색조 영상으로 변환한 후, DNS기법으로 질감 특징 정보를 갖는 이미지를 생성한다. 마지막으로, 이를 CNN에 입력함으로써 잡음에도 강인한 돼지 호흡기 질병 탐지 및 식별 시스템을 구현하고자 한다. 실제 국내 돈사에서 취득한 돼지의 발성음을 이용하여 제안하는 시스템의 성능을 실험적으로 검증한바, 제안된 시스템은 경제적인 비용(저가의 소리 센서)과 시스템 정확도(96.0% 정확도)로 다양한 잡음 환경에서도 돼지의 호흡기 질병들을 탐지할 수 있음을 실험적으로 확인하였다. 제안된 시스템은 독자적인 혹은 기존 방법들의 보완책으로 사용될 수 있다.

객체의 움직임을 고려한 탐색영역 설정에 따른 가중치를 공유하는 CNN구조 기반의 객체 추적 (Object Tracking based on Weight Sharing CNN Structure according to Search Area Setting Method Considering Object Movement)

  • 김정욱;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제20권7호
    • /
    • pp.986-993
    • /
    • 2017
  • Object Tracking is a technique for tracking moving objects over time in a video image. Using object tracking technique, many research are conducted such a detecting dangerous situation and recognizing the movement of nearby objects in a smart car. However, it still remains a challenging task such as occlusion, deformation, background clutter, illumination variation, etc. In this paper, we propose a novel deep visual object tracking method that can be operated in robust to many challenging task. For the robust visual object tracking, we proposed a Convolutional Neural Network(CNN) which shares weight of the convolutional layers. Input of the CNN is a three; first frame object image, object image in a previous frame, and current search frame containing the object movement. Also we propose a method to consider the motion of the object when determining the current search area to search for the location of the object. Extensive experimental results on a authorized resource database showed that the proposed method outperformed than the conventional methods.

GP-GPU를 이용한 보행자 추론 CNN (Pedestrian Inference Convolution Neural Network Using GP-GPU)

  • 정준모
    • 전기전자학회논문지
    • /
    • 제21권3호
    • /
    • pp.244-247
    • /
    • 2017
  • 본 논문에서는 GP-GPU를 활용한 보행자 추론 컨볼루션 뉴럴 네트워크를 구현했다. CNN은 구조를 정한 후, 학습에서 얻은 가중치를 이용해 기존 연구인 256개의 스레드를 가지는 GP-GPU를 활용해 추론을 수행했다. 학습에는 Inter i7-4470 CPU와 Matlab을 사용했다. Dataset은 Daimler Pedestrian Dataset을 사용했다. GP-GPU는 PCIe를 이용해 PC로부터 제어를 받으며, FPGA로 동작한다. 각 레이어의 depth와 size에 따라 스레드를 할당했다. 풀링 레이어의 경우는 over warpping pooling을 사용했기 때문에 횡영역과 종영역에 추가적인 연산을 수행했다. 한 번의 추론에는 약 12ms가 걸린다.

CNN-LSTM Coupled Model for Prediction of Waterworks Operation Data

  • Cao, Kerang;Kim, Hangyung;Hwang, Chulhyun;Jung, Hoekyung
    • Journal of Information Processing Systems
    • /
    • 제14권6호
    • /
    • pp.1508-1520
    • /
    • 2018
  • In this paper, we propose an improved model to provide users with a better long-term prediction of waterworks operation data. The existing prediction models have been studied in various types of models such as multiple linear regression model while considering time, days and seasonal characteristics. But the existing model shows the rate of prediction for demand fluctuation and long-term prediction is insufficient. Particularly in the deep running model, the long-short-term memory (LSTM) model has been applied to predict data of water purification plant because its time series prediction is highly reliable. However, it is necessary to reflect the correlation among various related factors, and a supplementary model is needed to improve the long-term predictability. In this paper, convolutional neural network (CNN) model is introduced to select various input variables that have a necessary correlation and to improve long term prediction rate, thus increasing the prediction rate through the LSTM predictive value and the combined structure. In addition, a multiple linear regression model is applied to compile the predicted data of CNN and LSTM, which then confirms the data as the final predicted outcome.

A review and comparison of convolution neural network models under a unified framework

  • Park, Jimin;Jung, Yoonsuh
    • Communications for Statistical Applications and Methods
    • /
    • 제29권2호
    • /
    • pp.161-176
    • /
    • 2022
  • There has been active research in image classification using deep learning convolutional neural network (CNN) models. ImageNet large-scale visual recognition challenge (ILSVRC) (2010-2017) was one of the most important competitions that boosted the development of efficient deep learning algorithms. This paper introduces and compares six monumental models that achieved high prediction accuracy in ILSVRC. First, we provide a review of the models to illustrate their unique structure and characteristics of the models. We then compare those models under a unified framework. For this reason, additional devices that are not crucial to the structure are excluded. Four popular data sets with different characteristics are then considered to measure the prediction accuracy. By investigating the characteristics of the data sets and the models being compared, we provide some insight into the architectural features of the models.