• 제목/요약/키워드: 경량화 딥러닝 모델

검색결과 56건 처리시간 0.029초

Text Classification Using Heterogeneous Knowledge Distillation

  • Yu, Yerin;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.29-41
    • /
    • 2022
  • 최근 딥 러닝 기술의 발전으로 방대한 텍스트 데이터를 사전에 학습한 우수한 성능의 거대한 모델들이 다양하게 고안되었다. 하지만 이러한 모델을 실제 서비스나 제품에 적용하기 위해서는 빠른 추론 속도와 적은 연산량이 요구되고 있으며, 이에 모델 경량화 기술에 대한 관심이 높아지고 있다. 대표적인 모델 경량화 기술인 지식증류는 교사 모델이 이미 학습한 지식을 상대적으로 작은 크기의 학생 모델에 전이시키는 방법으로 다방면에 활용 가능하여 주목받고 있지만, 당장 주어진 문제의 해결에 필요한 지식만을 배우고 동일한 관점에서만 반복적인 학습이 이루어지기 때문에 기존에 접해본 문제와 유사성이 낮은 문제에 대해서는 해결이 어렵다는 한계를 갖는다. 이에 본 연구에서는 궁극적으로 해결하고자 하는 과업에 필요한 지식이 아닌, 보다 상위 개념의 지식을 학습한 교사 모델을 통해 지식을 증류하는 이질적 지식증류 방법을 제안한다. 또한, 사이킷런 라이브러리에 내장된 20 Newsgroups의 약 18,000개 문서에 대한 분류 실험을 통해, 제안 방법론에 따른 이질적 지식증류가 기존의 일반적인 지식증류에 비해 학습 효율성과 정확도의 모든 측면에서 우수한 성능을 보임을 확인하였다.

심층신경망의 더블 프루닝 기법의 적용 및 성능 분석에 관한 연구 (Application and Performance Analysis of Double Pruning Method for Deep Neural Networks)

  • 이선우;양호준;오승연;이문형;권장우
    • 융합정보논문지
    • /
    • 제10권8호
    • /
    • pp.23-34
    • /
    • 2020
  • 최근 인공지능 딥러닝 분야는 컴퓨팅 자원의 높은 연산량과 가격문제로 인해 상용화에 어려움이 존재했다. 본 논문은 더블 프루닝 기법을 적용하여 심층신경망 모델들과 다수의 데이터셋에서의 성능을 평가하고자 한다. 더블 프루닝은 기본의 네트워크 간소화(Network-Slimming)과 파라미터 프루닝(Parameter-Pruning)을 결합한다. 이는 기존의 학습에 중요하지 않는 매개변수를 절감하여 학습 정확도를 저해하지 않고 속도를 향상시킬 수 있다는 장점이 있다. 다양한 데이터셋 학습 이후에 프루닝 비율을 증가시켜, 모델의 사이즈를 감소시켰다. NetScore 성능 분석 결과 MobileNet-V3가 가장 성능이 높게 나타났다. 프루닝 이후의 성능은 Cifar 10 데이터셋에서 깊이 우선 합성곱 신경망으로 구성된 MobileNet-V3이 가장 성능이 높았고, 전통적인 합성곱 신경망으로 이루어진 VGGNet, ResNet또한 높은 폭으로 성능이 증가함을 확인하였다.

합성곱 신경망을 적용한 Optical Camera Communication 시스템 성능 분석 (Performance Analysis of Optical Camera Communication with Applied Convolutional Neural Network)

  • 김종인;박현선;김정현
    • 스마트미디어저널
    • /
    • 제12권3호
    • /
    • pp.49-59
    • /
    • 2023
  • 차세대 무선 통신기술로 알려져 있는 Optical Camera Communication(OCC)은 많은 연구가 진행 되고 있다. 이러한 OCC 기술은 통신 환경에 의해 성능이 좌우되며 이를 개선하기 위해 다양한 전략이 연구되고 있다. 그중 가장 두각을 나타내고 있는 방법은 딥러닝 기술을 사용하여 OCC의 수신기에 CNN을 적용하는 방법이다. 하지만 대부분의 연구에서는 CNN을 단순히 송신기를 검출하는데 사용하고 있다. 본 논문에서는 CNN을 송신기 검출 뿐만 아니라 Rx 복조 시스템에 적용하여 실험한다. 그리고 OCC 시스템의 데이터 이미지는 다른 이미지 데이터셋과는 다르게 비교적 분류가 간단하기 때문에 대부분의 CNN 모델에서 높은 정확도의 결과가 나타날 것이라는 가설을 세웠다. 가설을 증명하기 위해 OCC 시스템을 설계 및 구현하여 데이터를 수집하였고 12가지의 다양한 CNN 모델에 적용하여 실험했다. 실험 결과 파라미터수가 많은 고성능의 CNN 모델 뿐만 아니라 경량화 CNN 모델에서도 99% 이상의 정확도를 달성하였고 이를 통해 스마트폰과 같은 저성능 계산 장치에 OCC 시스템 적용이 가능함을 확인했다.

모바일 단말에서 실시간으로 동작하는 초고해상화 기술 개발 (Real-time Single Image Super Resolution in Mobile Devices)

  • 김성제;정진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.42-43
    • /
    • 2022
  • 본 논문은 모바일 단말에서 실시간으로 동작하는 딥러닝 기반 경량 초고해상화 기술에 관한 내용이다. 대용량 3차원 메쉬 모델의 비실시간 압축은 실시간 스트리밍 응용 시나리오에서 제약점으로 작용하고 있고, 본 논문에서는 두 입력 텐서의 차원을 일치시켜야 하는 element-wise 덧셈 대신 concatenation을 활용해 연산량을 개선하고, float-to-int8 양자화 과정에서 발생하는 오차를 줄이기 위해 weight clipping 및 regularization 기법을 활용해 초고해상화 화질 성능을 개선하였다. 제안하는 알고리즘은 기존 모바일 초고해상화 기술을 화질 측면에서 0.12dB, 처리 속도 측면에서 13.6ms 개선하였고, Mobile AI & AIM 2022 실시간 이미지 초고해상화 대회에서 1등을 수상하였다.

  • PDF

객체 검출을 위한 트랜스포머와 공간 피라미드 풀링 기반의 YOLO 네트워크 (Transformer and Spatial Pyramid Pooling based YOLO network for Object Detection)

  • 권오준;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.113-116
    • /
    • 2021
  • 일반적으로 딥러닝 기반의 객체 검출(Object Detection)기법은 합성곱 신경망(Convolutional Neural Network, CNN)을 통해 입력된 영상의 특징(Feature)을 추출하여 이를 통해 객체 검출을 수행한다. 최근 자연어 처리 분야에서 획기적인 성능을 보인 트랜스포머(Transformer)가 영상 분류, 객체 검출과 같은 컴퓨터 비전 작업을 수행하는데 있어 경쟁력이 있음이 드러나고 있다. 본 논문에서는 YOLOv4-CSP의 CSP 블록을 개선한 one-stage 방식의 객체 검출 네트워크를 제안한다. 개선된 CSP 블록은 트랜스포머(Transformer)의 멀티 헤드 어텐션(Multi-Head Attention)과 CSP 형태의 공간 피라미드 풀링(Spatial Pyramid Pooling, SPP) 연산을 기반으로 네트워크의 Backbone과 Neck에서의 feature 학습을 돕는다. 본 실험은 MSCOCO test-dev2017 데이터 셋으로 평가하였으며 제안하는 네트워크는 YOLOv4-CSP의 경량화 모델인 YOLOv4s-mish에 대하여 평균 정밀도(Average Precision, AP)기준 2.7% 향상된 검출 정확도를 보인다.

  • PDF

모바일 환경에서 지하공간객체의 경량화를 위한 단순화 방법 (Simplification Method for Lightweighting of Underground Geospatial Objects in a Mobile Environment)

  • 김종훈;김용태;고훈준
    • 산업융합연구
    • /
    • 제20권12호
    • /
    • pp.195-202
    • /
    • 2022
  • 지하공간정보지도 관리 시스템은 지하공간의 다양한 지하시설물을 3D 메쉬 데이터로 통합하고, 모바일 환경에서 지하시설물의 3D 이미지와 위치를 확인할 수 있도록 지원한다. 그러나 모바일 환경에서 실행되는 일정 지역 안에는 다양한 지하시설물이 존재할 수 있고 층층히 겹쳐 보일 수 있어서 모바일 환경에서 실행하는데 시간이 오래 걸리는 문제가 있다. 본 논문에서는 가시성에서 문제가 되지 않는 범위 내에서 3D 메쉬 데이터의 정점의 개수를 줄여서 데이터의 크기를 줄임으로써 모바일 환경에서 실행 시간을 줄일 수 있는 방법으로 딥러닝 기반 K-means 정점 클러스터링 알고리즘을 제안한다. 첫번째로 우리가 제안하는 방법은 딥러닝 Encoder-Decoder 기반의 모델을 통하여 정재된 정점의 특징 정보를 얻고, 두번째로 특징 정보를 K-means 정점 클러스터링을 통하여 서로 비슷한 정점끼리 묶어서 단순화를 하였다. 실험결과 제안한 방법으로 다양한 지하시설물들의 정점을 30%까지 줄였을 때, 이미지 모형이 약간의 변형은 발생하였지만 사라지는 부분은 없어서 모바일 환경에서 확인하는데 문제가 없었다.

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.

대조학습 방법을 이용한 주행패턴 분석 기법 연구 (Research on Driving Pattern Analysis Techniques Using Contrastive Learning Methods)

  • 정회준;김승하;김준희;권장우
    • 한국ITS학회 논문지
    • /
    • 제23권1호
    • /
    • pp.182-196
    • /
    • 2024
  • 자동차 보급과 교통 시설 발달로 인한 문제에 대응하여, ADAS와 같은 운전 보조 기술이 주목받고 있다. 최근에는 스마트폰 내장 센서를 사용한 운전패턴 분석 방법론이 개발되었다. 이 연구에서는 레이블 없이 대조학습을 통해 운전패턴의 특징을 학습하고 변화점을 감지하는 새로운 방법을 제안한다. 이 방법은 운전패턴 분류에도 확장 가능하여, 매우 적은 레이블링 데이터만으로 높은 분류 성능을 달성할 수 있음은 물론 적용 차량이 달라지는 도메인 변화 문제에 민감하게 반응하지 않아 일반화된 성능을 달성할 수 있다는 장점을 가지고 있다. 또한 본 연구에서는 추후 스마트폰 적용성을 고려하여 6가지 대표적인 경량화 딥러닝 모델에 대해 제안하는 방법을 적용하고 비교분석하여 추후 스마트폰 기반의 시스템 개발에 활용할 수 있도록 하였다.

멀티 테스크 CNN의 경량화 모델을 이용한 차량 및 차선의 동시 검출 (Concurrent Detection for Vehicles and Lanes Using Light-Weight Model of Multi-Task CNN)

  • 신현식;김형원;홍상욱
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.367-373
    • /
    • 2022
  • 딥러닝 기반 자율 주행 기술이 발전함에 따라 다양한 목적의 인공지능 모델이 연구되었다. 연구된 여러 모델들을 동시에 구동하여 자율주행 시스템을 개발한다. 그러나 동시에 인공지능 모델을 사용하면서 많은 하드웨어 자원 소비가 증가한다. 이를 해결하기 위해 본 논문은 백본 모델을 공유하며 다중 태스크를 고속으로 수행할 수 있는 Multi-Task CNN 모델을 제안한다. 이를 통해 AI모델을 사용하기 위한 백본 수의 증가를 해결할 수 있었습니다. 제안하는 CNN 모델은 기존 모델 대비 50% 이상 웨이트 파라미터 수를 감소시키며, 3배 이상의 FPS 속도를 향상시켰다. 또한, 차선인식은 Instance segmentation 기반으로 차선검출 및 차선별 Labeling을 모두 출력한다. 그러나 기존 모델에 비해 정확도가 감소하는 부분에 대해서는 추가적인 연구가 필요하다.

사물인터넷 기기 고장 진단을 위한 그래프 신경망 모델 기반 분류 방법 (Classification Method based on Graph Neural Network Model for Diagnosing IoT Device Fault)

  • 김진영;선준호;윤성훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.9-14
    • /
    • 2022
  • 각종 기기들이 연결되는 사물인터넷(internet of things) 시스템에서 중요한 부품의 고장은 경제적, 인명의 손실을 야기할 수 있다. 시스템 내에서 발생하는 고장으로 인한 손실을 줄이기 위해 고장 검진 기술이 IoT에서 중요한 기술로써 여겨지고 있다. 본 논문에서는 그래프 신경망 기반 방법을 사용하여 시스템 내의 설비에서 취득된 진동 데이터의 특징을 추출하여 고장 여부를 판단하고 유형을 분류하는 방법을 제안한다. 딥러닝 모델의 학습을 위해, CWRU(case western reserve university)에서 취득된 고장 데이터 셋을 입력 데이터로 사용한다. 제안하는 모델의 분류 정확도 성능을 확인하기 위해 기존 제안된 합성곱 신경망(convolutional neural networks) 기반 분류 모델과 제안된 모델을 비교한다. 시뮬레이션 결과, 제안된 모델은 불균등하게 나누어진 데이터에서 기존 모델보다 분류 정확도를 약 5% 향상 시킬 수 있는 것을 확인하였다. 이후 연구로, 제안하는 모델을 경량화해서 분류 속도를 개선할 예정이다.