• Title/Summary/Keyword: 비전모델

Search Result 545, Processing Time 0.025 seconds

Compression of CNN Using Low-Rank Approximation and CP Decomposition Methods (저계수행렬 근사 및 CP 분해 기법을 이용한 CNN 압축)

  • Moon, Hyeon-Cheol;Moon, Gi-Hwa;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.133-135
    • /
    • 2020
  • 최근 CNN(Convolutional Neural Network)은 영상 분류, 객체 인식 등 다양한 비전 분야에서 우수한 성능을 보여주고 있으나, CNN 모델의 계산량 및 메모리가 매우 커짐에 따라 모바일 또는 IoT(lnternet of Things) 장치와 같은 저전력 환경에 적용되기에는 제한이 따른다. 따라서, CNN 모델의 임무 성능을 유지하연서 네트워크 모델을 압축하는 기법들이 연구되고 있다. 본 논문에서는 행렬 분해 기술인 저계수행렬 근사(Low-rank approximation)와 CP(Canonical Polyadic) 분해 기법을 결합하여 CNN 모델을 압축하는 기법을 제안한다. 제안하는 기법은 계층의 유형에 상관없이 하나의 행렬분해 기법만을 적용하는 기존의 기법과 달리 압축 성능을 높이기 위하여 CNN의 계층 타입에 따라 두 가지 분해 기법을 선택적으로 적용한다. 제안기법의 성능검증을 위하여 영상 분류 CNN 모델인 VGG-16, ResNet50, 그리고 MobileNetV2 모델 압축에 적용하였고, 모델의 계층 유형에 따라 두 가지의 분해 기법을 선택적으로 적용함으로써 저계수행렬 근사 기법만 적용한 경우 보다 1.5~12.1 배의 동일한 압축율에서 분류 성능이 향상됨을 확인하였다.

  • PDF

Deep Learning Models for Autonomous Crack Detection System (자동화 균열 탐지 시스템을 위한 딥러닝 모델에 관한 연구)

  • Ji, HongGeun;Kim, Jina;Hwang, Syjung;Kim, Dogun;Park, Eunil;Kim, Young Seok;Ryu, Seung Ki
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.5
    • /
    • pp.161-168
    • /
    • 2021
  • Cracks affect the robustness of infrastructures such as buildings, bridge, pavement, and pipelines. This paper presents an automated crack detection system which detect cracks in diverse surfaces. We first constructed the combined crack dataset, consists of multiple crack datasets in diverse domains presented in prior studies. Then, state-of-the-art deep learning models in computer vision tasks including VGG, ResNet, WideResNet, ResNeXt, DenseNet, and EfficientNet, were used to validate the performance of crack detection. We divided the combined dataset into train (80%) and test set (20%) to evaluate the employed models. DenseNet121 showed the highest accuracy at 96.20% with relatively low number of parameters compared to other models. Based on the validation procedures of the advanced deep learning models in crack detection task, we shed light on the cost-effective automated crack detection system which can be applied to different surfaces and structures with low computing resources.

Three-Dimensional Convolutional Vision Transformer for Sign Language Translation (수어 번역을 위한 3차원 컨볼루션 비전 트랜스포머)

  • Horyeor Seong;Hyeonjoong Cho
    • The Transactions of the Korea Information Processing Society
    • /
    • v.13 no.3
    • /
    • pp.140-147
    • /
    • 2024
  • In the Republic of Korea, people with hearing impairments are the second-largest demographic within the registered disability community, following those with physical disabilities. Despite this demographic significance, research on sign language translation technology is limited due to several reasons including the limited market size and the lack of adequately annotated datasets. Despite the difficulties, a few researchers continue to improve the performacne of sign language translation technologies by employing the recent advance of deep learning, for example, the transformer architecture, as the transformer-based models have demonstrated noteworthy performance in tasks such as action recognition and video classification. This study focuses on enhancing the recognition performance of sign language translation by combining transformers with 3D-CNN. Through experimental evaluations using the PHOENIX-Wether-2014T dataset [1], we show that the proposed model exhibits comparable performance to existing models in terms of Floating Point Operations Per Second (FLOPs).

Real-time Marker-free Motion Capture System to Create a 3D Virtual Human Model (3차원 가상 인체 생성을 위한 실시간 마커프리 모션캡쳐 시스템)

  • 김성은;이란희;박창준;이인호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05d
    • /
    • pp.1093-1098
    • /
    • 2002
  • 본 연구실에서 개발한 MIMIC(Motion Interface & Motion Information Capture system)은 동작자의 동작을 획득하고, 동작의 의미를 이해할 수 있도록 설계된 시스템이다. 비전 센서로부터 입력된 영상을 분석하여 동작자의 머리와 두 손, 두 발의 정보를 찾는다. 그리고, 이 정보를 기반으로 팔꿈치나 무릎 등의 중간 관절을 추정한 후 20개의 관절을 가지는 3차원 인체 모델을 구성한다. 이 인체 모델은 동작자의 동작을 실시간으로 흉내낸다. 그러므로, 기존의 마커프리 모션캡쳐 시스템과 달리 완벽한 인체를 구성하기 위한 중간 관절까지 생성함으로써 동작자의 동작을 더욱 자연스럽게 구현할 수 있다.

  • PDF

우리나라의 낙농단지 규모에 알맞는 소형사료가공시설의 모델 개발

  • 박경규;김태욱
    • Proceedings of the Korean Society for Bio-Environment Control Conference
    • /
    • 1993.10a
    • /
    • pp.21-22
    • /
    • 1993
  • 현재 축산 낙농가에 급여되는 배합사료는 공장의 비전문화에 따르는 생산효율의 저하, 가축 사육농가의 조사료 및 부원료의 생산지의 조사료 및 부산물 사료를 고려하지 않은 배합비율, 과다한 투자 비용에 따르는 생산원가의 상승 등의 여러가지 문제들을 가지고 있다. 이러한 문제들을 해결하기 위한 하나의 방안으로 지역별로 또는 낙농단지별로 규모에 알맞는 소규모 젖소ㆍ비육우 전용 사료가공시설의 모델을 6가지 개발하였으며, (중략)

  • PDF

Color Space Classification by Using Additive Competitive Learning (가산 경쟁학습을 이용한 컬러공간의 분류)

  • Park, Yong-Hoon;Cho, Yong-Gun;Kang, Hoon
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.125-128
    • /
    • 2003
  • 생물학적 비전 시스템에서 컬러정보는 윤곽정보와 함께 가장 주요한 정보이다. 본 논문에서는 컬러공간의 분류를 위해 향상된 가산 경쟁학습 모델을 제안하며, 제안된 가산 경쟁학습 모델을 사용하여 컬러공간의 분류를 효과적으로 할 수 있다는 것을 보였다.

  • PDF

Development of Fender Segmentation System for Port Structures using Vision Sensor and Deep Learning (비전센서 및 딥러닝을 이용한 항만구조물 방충설비 세분화 시스템 개발)

  • Min, Jiyoung;Yu, Byeongjun;Kim, Jonghyeok;Jeon, Haemin
    • Journal of the Korea institute for structural maintenance and inspection
    • /
    • v.26 no.2
    • /
    • pp.28-36
    • /
    • 2022
  • As port structures are exposed to various extreme external loads such as wind (typhoons), sea waves, or collision with ships; it is important to evaluate the structural safety periodically. To monitor the port structure, especially the rubber fender, a fender segmentation system using a vision sensor and deep learning method has been proposed in this study. For fender segmentation, a new deep learning network that improves the encoder-decoder framework with the receptive field block convolution module inspired by the eccentric function of the human visual system into the DenseNet format has been proposed. In order to train the network, various fender images such as BP, V, cell, cylindrical, and tire-types have been collected, and the images are augmented by applying four augmentation methods such as elastic distortion, horizontal flip, color jitter, and affine transforms. The proposed algorithm has been trained and verified with the collected various types of fender images, and the performance results showed that the system precisely segmented in real time with high IoU rate (84%) and F1 score (90%) in comparison with the conventional segmentation model, VGG16 with U-net. The trained network has been applied to the real images taken at one port in Republic of Korea, and found that the fenders are segmented with high accuracy even with a small dataset.

Implementation of Distribution Outage Prediction Algorithm Using GIS (GIS를 이용한 배전설비고장예측 알고리즘의 구현)

  • Bae, Myung-Suc
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2002.03a
    • /
    • pp.89-94
    • /
    • 2002
  • 본 논문에서는 배전분야 설비관리 시스템을 대상으로 배전설비 고장시 GIS 기능을 이용하여 고장설비를 예측할 수 있는 방법과 구현 실례를 소개하고자 한다. 배전설비관리를 위한 지리정보 데이터 모델은 가공과 지중, 전기와 비전기, 점형과 선형의 특성을 가지는 배전설비의 특성을 분석하여 모델링된다. 모델링의 결과 생성된 데이터베이스는 실세계에 존재하는 대부분의 객체에 대한 정보를 포함하고 있으므로 매우 크고 그 구조 또한 복잡하다. 그러므로 응용프로그램이 필요로 하는 데이터를 추출하기 위하여 많은 시간이 요구된다. 그러나 고장복구업무를 위한 시스템은 사용자의 만족도를 위하여 추론의 정확성과 더불어 응답속도를 최소화하는 것이 필수조건이다. 이를 위하여 GIS 데이터베이스 모델을 좀 더 개량할 필요가 있으며, 본 논문에서는 이에 대한 한가지 방안으로 배전설비의 GIS 모델의 축약된 형태인 관계형 데이터베이스 모델을 제시한다. 고장점 추론은 이렇게 만들어진 축약모델을 이용하여 진행되며 고장신고 고객별로 회선, 개폐기, 변압기, 인입주 등 정보를 추출하고 추출된 설비들의 계통상 위치의 유사성을 추론하여 최종 예측점을 파악한다.

  • PDF

유통이 희망이다 - "과거는 잊고 우리 업종에 맞는 경쟁력을 갖추어라"

  • 한국자동판매기공업협회
    • Vending industry
    • /
    • v.11 no.1
    • /
    • pp.44-48
    • /
    • 2012
  • 자판기 유통의 화려한 과거는 전설이 되어 버렸다. 기계판매 및 운영시장이 부진을 면치 못하는 현실에서 "아 옛날이여~"만 부르짖으면 무슨 소용이 있겠는가? 과거는 잊고 열악한 시장에 맞는 경쟁력을 갖추는 게 중요하다. 여기 시장 변화에 맞는 발 빠른 변신으로 유통업의 생존 모델을 제시하는 업체가 있다. 경기가 특히 안 좋은 전라도 시장, 그 속에서도 굳건히 유통업의 비전을 제시하는 서부자판기를 전격 탐방했다.

  • PDF

A Study on the Method for Converting the Unit Database from Training-model into Analysis-model : Focused on the 'Chang-Jo21' and 'Vision21' model (훈련용 워게임 모델의 부대 DB를 분석용 워게임 모델에 재사용하기 위한 변환방법 연구 : 창조21모델과 비전21모델을 중심으로)

  • Lee, Yong-Bok;Park, Min-Hyoung;Kim, Yeek-Hyun
    • Journal of the Korea Society for Simulation
    • /
    • v.28 no.2
    • /
    • pp.159-167
    • /
    • 2019
  • In the field of defense M&S, we are actively pursuing researches that interoperable multiple war game models to simulate various combat environments at the same time. Although the 'unit DB(Database)' for operating the war game models is originated from the identical data, it has been recognized that the method of expressing the attribute of the data is different and the cross reference is impossible. As a result, it makes unnecessary time and effort in establishing the same unit DB in the organizations that operate the war game model. In this study, a method of reusing the unit DB of the training war game model to the analysis war game model with similar resolution and simulated logic was applied to the actual field. For this purpose, we defined the procedure for converting the unit DB by analyzing metadata of the 'Chang-Jo21', a combat training model for corps and division, and the 'Vision21', an analysis model for corps and division operation plan. And we introduced an algorithm that can map different metadata of two unit DBs. This study was meaningful as the first attempt to map and integrate heterogeneous metadata semantically for the reuse of unit DB between different war game models in defense M&S field. Also, it provided implications for the necessity of paradigm shift that reuse of the unit DB between two different war game models is possible and the need for standardization of the unit DB metadata in the defense M&S filed.