• 제목/요약/키워드: vision training

검색결과 421건 처리시간 0.023초

화장품 물체 인식을 위한 Two-Stage 딥러닝 기반 알고리즘 (Two-Stage Deep Learning Based Algorithm for Cosmetic Object Recognition)

  • 김종민;서대호
    • 산업경영시스템학회지
    • /
    • 제46권4호
    • /
    • pp.101-106
    • /
    • 2023
  • With the recent surge in YouTube usage, there has been a proliferation of user-generated videos where individuals evaluate cosmetics. Consequently, many companies are increasingly utilizing evaluation videos for their product marketing and market research. However, a notable drawback is the manual classification of these product review videos incurring significant costs and time. Therefore, this paper proposes a deep learning-based cosmetics search algorithm to automate this task. The algorithm consists of two networks: One for detecting candidates in images using shape features such as circles, rectangles, etc and Another for filtering and categorizing these candidates. The reason for choosing a Two-Stage architecture over One-Stage is that, in videos containing background scenes, it is more robust to first detect cosmetic candidates before classifying them as specific objects. Although Two-Stage structures are generally known to outperform One-Stage structures in terms of model architecture, this study opts for Two-Stage to address issues related to the acquisition of training and validation data that arise when using One-Stage. Acquiring data for the algorithm that detects cosmetic candidates based on shape and the algorithm that classifies candidates into specific objects is cost-effective, ensuring the overall robustness of the algorithm.

Multi-type Image Noise Classification by Using Deep Learning

  • Waqar Ahmed;Zahid Hussain Khand;Sajid Khan;Ghulam Mujtaba;Muhammad Asif Khan;Ahmad Waqas
    • International Journal of Computer Science & Network Security
    • /
    • 제24권7호
    • /
    • pp.143-147
    • /
    • 2024
  • Image noise classification is a classical problem in the field of image processing, machine learning, deep learning and computer vision. In this paper, image noise classification is performed using deep learning. Keras deep learning library of TensorFlow is used for this purpose. 6900 images images are selected from the Kaggle database for the classification purpose. Dataset for labeled noisy images of multiple type was generated with the help of Matlab from a dataset of non-noisy images. Labeled dataset comprised of Salt & Pepper, Gaussian and Sinusoidal noise. Different training and tests sets were partitioned to train and test the model for image classification. In deep neural networks CNN (Convolutional Neural Network) is used due to its in-depth and hidden patterns and features learning in the images to be classified. This deep learning of features and patterns in images make CNN outperform the other classical methods in many classification problems.

합성곱 신경망 기반의 딥러닝에 의한 수치표면모델의 객체분류 (Semantic Classification of DSM Using Convolutional Neural Network Based Deep Learning)

  • 이대건;조은지;이동천
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.435-444
    • /
    • 2019
  • 최근 딥러닝(DL)은 여러 분야에서 급속도로 활용되고 있으며, 특히 영상으로부터 객체를 인식하여 분류하고 인식하기 위한 컴퓨터비전 분야에서 활발하게 연구가 진행되고 있다. 영상분야에서는 주로 합성곱 신경망(CNN)을 이용한 딥러닝 모델의 성능 향상에 주력하고 있다. 대부분의 합성곱 신경망은 영상을 학습시켜 영상분류 및 객체인식에 활용하고 있지만, 본 논문에서는 독일 사진측량, 원격탐사 및 공간정보학회(DGPF)가 구축하고 국제 사진측량 및 원격탐사학회(ISPRS)가 제공하는 데이터 셋 중에서 수치표면모델(DSM)과 이 데이터로부터 생성한 경사 및 주향 정보를 효율성과 성능이 우수하다고 평가받는 합성곱 신경망기반의 SegNet 모델에 적용하여 객체를 분류하고 분석하였다. 딥러닝은 고사양의 컴퓨터 시스템과 다량의 학습 데이터와 라벨 데이터가 필요하고, 다수의 시행착오에 의한 풍부한 경험이 요구된다. 또한 본 논문에서는 한정된 수량의 데이터로부터 효율적인 학습을 위한 데이터 생성 방법을 제시하고 수치표면모델을 분류하였다. 분석 결과 수치표면모델 데이터와 이로부터 도출한 부가적인 데이터를 딥러닝 모델에 적용해도 객체를 타당한 정확도로 분류할 수 있음을 확인하였다.

21세기 신 에너지 가스 하이드레이트 연구 및 기술개발 현황 : 국내의 중장기 개발 방향 (An overview of R&D for the natural gas hydrate of new energy in the 21st century : a vision of the multi-year project in Korea)

  • 이영철;백영순;조병학;박기환;류병재
    • 한국석유지질학회지
    • /
    • 제7권1_2
    • /
    • pp.19-27
    • /
    • 1999
  • 에너지 자원의 빈국인 한국은 에너지 자원의 기본적인 사용량 중에서 절대적인 양을 차지하는 석유 및 천연가스를 $100{\%}$수입에 의존하고 있다. 정부가 유사시 즉각적으로 실시하여야 할 중요한 역할 중의 하나가 이와 같은 유용한 에너지 자원을 다양하게 확보하는 것이다. 가스 하이드레이트는 천연가스와 다론 형태의 에너지로서 그 매장량이 해양이나 영구동토지역 등 전세계적으로 분포되어 있으므로 가까운 미래의 천연가스 대체 자원으로서 주목을 받고 있다. 특히 한반도 주변의 동해에 많은 양의 가스 하이드레이트가 매장되어 있을 것으로 기대된다 따라서 이 논문에서는 국내외 연구 및 기술개발 동향을 검토하여 탄성파 탐사를 통한 해석, 가스 하이드레이트의 특성 및 물리적인 물성, 그리고 가스 하이드레이트의 활용 기술 등에 관련된 국내의 중장기적인 가스 하이드레이트의 기본적인 연구 및 기술개발에 대하여 전체적인 프로젝트의 개요를 설명하였다.

  • PDF

딥러닝 기반 영상처리 기법 및 표준 운동 프로그램을 활용한 비대면 온라인 홈트레이닝 어플리케이션 연구 (Non-face-to-face online home training application study using deep learning-based image processing technique and standard exercise program)

  • 신윤지;이현주;김준희;권다영;이선애;추윤진;박지혜;정자현;이형석;김준호
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.577-582
    • /
    • 2021
  • 최근 AR, VR 및 스마트 디바이스 기술의 발전에 따라 피트니스 산업에서도 비대면 환경을 기반으로 한 서비스 수요가 증가하고 있다. 비대면 온라인 홈트레이닝 서비스는 기존의 오프라인 서비스에 비해 시간과 장소의 제약이 없다는 장점이 있으나 운동 기구의 부재 및 사용자의 정확한 운동 자세 유지여부, 운동량의 측정이 어려운 단점이 존재한다. 본 연구에서는 이러한 단점을 보완할 수 있는 표준 운동 프로그램을 개발하고 딥러닝 기반 신체 자세 추정 영상처리를 통하여 새로운 비대면 홈트레이닝 어플리케이션 알고리즘을 제안한다. 본 연구의 알고리즘 기반 어플리케이션을 활용한다면 표준 운동 프로그램 영상의 트레이너를 사용자가 직접 보고 따라하면서 사용자 스스로 자세를 교정하며 정확한 운동이 가능하다. 나아가 본 연구의 알고리즘을 용도에 맞게 커스터마이징 한다면 공연, 영화, 동아리 활동, 컨퍼런스 분야로의 적용도 가능할 것이다.

네일 미용사 국가기술 자격증 취득 동향에 관한 연구 (A Study on the Trend of Acquiring National Technology Certificate of Nail Beautician)

  • 박장순
    • 산업융합연구
    • /
    • 제20권3호
    • /
    • pp.81-87
    • /
    • 2022
  • 본 연구는 네일 미용사 국가기술 자격증 취득 전후의 수강생에 대한 실태 및 자격증 취득 동향을 조사하고, 자격증 취득을 위한 효율적인 교육방안과 수강생 역량에 따른 체계적인 데이터 구축의 기초자료를 제공할 목적이다. 광주광역시 거주 네일미용 수강생을 대상으로 네일미용 산업체 경력에 따른 각 변인 간의 네일 미용사 국가기술 자격증 취득 동향에 대해 통계 패키지 프로그램 SPSS v 18.0을 활용하였다. 분석 결과 여성(80.8%), 미혼(70.8%), 20대(47.7%), 초대졸 또는 대졸(26.2%), 학생(42.3%)의 비중이 높게 나타났다. 그리고 네일 미용사 국가기술 자격증 취득을 위한 성별(性別)에 따른 기간과 비용의 교차분석 결과 Pearson 카이제곱 유의확률(p)이 각각 .416와 .899로 남녀 간 차이가 있다는 결론이 도출되었다. 네일미용 산업체 현장 경력은 자격증 취득을 위한 교육 기간, 수강비용, 교육기관, 응시경험(p<.001) 등에서 모두 유의미한 정(+)의 영향을 미치는 것으로 나타났다. 본 연구결과를 토대로 네일미용 마케팅의 발전 도모와 향후 지향해야 할 네일 미용업의 건설적인 비전 제시가 필요할 것으로 판단된다.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

샴 네트워크를 사용하여 추적 레이블을 사용하지 않는 다중 객체 검출 및 추적기 학습에 관한 연구 (Training of a Siamese Network to Build a Tracker without Using Tracking Labels)

  • 강정규;송유승;민경욱;최정단
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.274-286
    • /
    • 2022
  • 이동객체 추적은 컴퓨터 비전 분야에서 오랜 시간 동안 연구가 진행되어 온 분야로 자율주행이나 운전 보조 시스템 등의 시스템에서 아주 중요한 역할을 수행하고 있다. 이동객체 추적 기술은 일반적으로 객체를 검출하는 검출기와 검출된 객체를 추적하는 추적기의 결합으로 이루어져 있다. 검출기는 다양한 데이터셋이 공개되어 사용되고 있기 때문에 쉽게 좋은 모델을 학습할 수 있지만, 추적기의 경우 상대적으로 공개된 데이터셋도 적고 직접 데이터셋을 구성하는 것도 검출기 데이터셋에 비해 굉장히 오랜 시간을 소요한다. 이에 검출기를 따로 개발하고, 별도의 추적기를 학습 기반이 아닌 방식을 활용하여 개발하는 경우가 많은데 이런 경우 두 개의 시스템이 차례로 작동하게 되어 전체 시스템의 속도를 느리게 하고 앞단의 검출기의 성능이 변할 때마다 별도로 추적기 또한 조정해줘야 한다는 단점이 있다. 이에 본 연구는 검출용 데이터셋만을 사용하여 검출과 추적을 동시에 수행하는 모델을 구성하는 방법을 제안한다. 데이터 증강 기술과 샴 네트워크를 사용하여 단일 이미지에서 객체를 검출 및 추적하는 방법을 연구하였다. 공개 데이터셋에 실험을 진행하여 학습 결과 높은 속도로 작동하는 이동객체 검출 및 추적기를 학습할 수 있음을 검증하였다.

Stable diffusion의 기저 모델에 따른 콘크리트 손상 영상의 생성 품질 비교 연구 (A Study on Generation Quality Comparison of Concrete Damage Image Using Stable Diffusion Base Models)

  • 심승보
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제28권4호
    • /
    • pp.55-61
    • /
    • 2024
  • 최근 들어 노후화된 콘크리트 구조물의 비중이 점차 늘어나는 추세다. 이는 대다수의 구조물이 기대수명에 근접하고 있기 때문이다. 이 같은 구조물은 정확한 점검과 지속적인 관리가 필수적으로 요구되며, 철저한 점검이 이루어지지 않을 경우 본래의 기능과 성능이 저하되어 안전사고로 이어질 수 있음은 자명한 사실이다. 따라서 딥러닝과 컴퓨터 비전을 이용한 객관적인 점검 기술에 대한 연구가 활발하기 이뤄지고 있다. 특히 고해상도는 미세한 균열뿐만 아니라 박락과 철근 노출까지 정확하게 관찰할 수 있으며, 딥러닝을 통해서 자동화 탐지가 가능하다는 장점이 있다. 딥러닝은 다양하고 다수의 훈련 데이터가 있어야지만 높은 탐지 성능을 보장할 수 있지만, 콘크리트의 표면 손상은 비정상 장면으로 일반적으로 촬영하여 확보할 수 있는 데이터가 아니므로 훈련 데이터의 수는 부족할 수밖에 없다. 이러한 한계를 극복하기 위해서 이 연구에서는 stable diffusion을 통해 균열, 박락, 철근 노출을 포함하고 있는 콘크리트 표면 손상 영상을 생성하는 방법을 제안했다. 이는 문자열과 영상이 쌍을 이룬 데이터로 새로운 손상 영상을 합성하는 방법이다. 이를 위해서 총 678장의 훈련 데이터 세트를 구축했고, low rank adaptation을 통해서 fine-tuning을 수행했다. 이때 stable diffusion의 세 가지 기저 모델에 따른 생성 영상의 품질을 비교했다. 결과적으로 가장 다양하고 고품질의 콘크리트 손상 영상을 합성하는 방법을 완성했다. 이 연구는 향후 데이터 부족 문제 해결에 기여하여 딥러닝 기반 손상 탐지 알고리즘의 정확도 향상에 긍정적인 영향을 미칠 것으로 기대한다.

Improving Test Accuracy on the MNIST Dataset using a Simple CNN with Batch Normalization

  • Seungbin Lee;Jungsoo Rhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권9호
    • /
    • pp.1-7
    • /
    • 2024
  • 본 논문은 MNIST 데이터셋을 활용한 손글씨 숫자 인식에서 합성곱 신경망(CNN)과 배치정규화(BN)를 결합한 모델을 제안한다. LeCun et al.의 LeNet-5 모델의 성과를 뛰어넘는 것을 목표로 6계층 신경망 구조를 설계하였다. 제안된 모델은 28×28 픽셀 이미지를 입력으로 받아 합성곱, 맥스 풀링, 완전연결계층을 거쳐 처리하며, 특히 배치정규화계층을 도입하여 학습 안정성과 성능을 향상시켰다. 실험에서는 60,000개의 훈련 이미지와 10,000개의 테스트 이미지를 사용하였으며, Momentum 최적화 알고리즘을 적용하였다. 모델 구성에서는 30개의 필터, 필터 사이즈 5×5, 패딩 0, 스트라이드 1을 사용하였고, ReLU 활성화 함수를 채택하였다. 훈련 과정에서는 미니배치 사이즈 100, 총 20 에포크, 학습률 0.1로 설정하였다. 결과적으로 제안된 모델은 99.22%의 테스트 정확도를 달성하여 LeNet-5의 99.05%를 상회하였으며, F1-score 0.9919를 기록하여 모델의 성능을 입증하였다. 또한, 본 논문에서 제안한 6계층 모델은 LeCun et al.의 LeNet-5(7계층 모델)와 Ji, Chun and Kim(10계층 모델)이 제안한 모델보다 더 단순한 구조로 모델의 효율성을 강조하였다. 본 연구의 결과는 AI 비전 검사기 등 실제 산업 응용에서 활용 가능성을 보여주며, 특히 스마트팩토리에서 부품의 불량 상태를 판별하는 데 효과적으로 적용될 수 있을 것으로 기대된다.