• 제목/요약/키워드: Vision Box

검색결과 69건 처리시간 0.021초

딥러닝 알고리즘 기반 교통법규 위반 공익신고 영상 분석 시스템 (Analysis System for Public Interest Report Video of Traffic Law Violation based on Deep Learning Algorithms)

  • 최민성;문미경
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.63-70
    • /
    • 2023
  • 고화질 블랙박스의 확산과 '스마트 국민제보', '안전신문고' 등 모바일 애플리케이션의 도입에 따른 영향으로 교통법규 위반 공익신고가 급증하였으며, 이로 인해 이를 처리할 담당 경찰 인력은 부족한 상황이 되었다. 본 논문에서는 교통법규 위반 공익신고 영상 중, 가장 많은 비중을 차지하는 차선위반에 대해 딥러닝 알고리즘을 활용하여 자동 검출할 수 있는 시스템의 개발내용에 관해 기술한다. 본 연구에서는 YOLO 모델과 Lanenet 모델을 사용하여 차량과 실선 객체를 인식하고 deep sort 알고리즘을 사용하여 객체를 개별로 추적하는 방법, 그리고 차량 객체의 바운딩 박스와 실선 객체의 범위가 겹치는 부분을 인식하여 진로변경 위반을 검출하는 방법을 제안한다. 본 시스템을 통해 신고된 영상에 대해 교통법규 위반 여부를 자동 분석해줌으로써 담당 경찰 인력 부족난을 해소할 수 있을 것으로 기대한다.

헬멧 착용 여부 및 쓰러짐 사고 감지를 위한 AI 영상처리와 알람 시스템의 구현 (Implementation of an alarm system with AI image processing to detect whether a helmet is worn or not and a fall accident)

  • 조용화;이혁재
    • 융합신호처리학회논문지
    • /
    • 제23권3호
    • /
    • pp.150-159
    • /
    • 2022
  • 본 논문은 실시간 영상 분석을 통해서 산업현장에서 활동하는 여러 근로자의 영상 객체를 추출해 내고, 추출된 이미지로 부터 개별 영상 분석을 통해 헬멧의 착용 여부와 낙상 사고 여부를 확인하는 방법을 구현한다. 근로자의 영상 객체를 탐지하기 위해서 딥러닝 기반 컴퓨터 비전 모델인 YOLO를 사용하였으며, 추출된 이미지를 이용하여 헬멧의 착용여부를 판단하기 위해 따로 5,000장의 다양한 헬멧 학습 데이터 이미지를 만들어서 사용하였다. 또한, 낙상사고 여부를 판단하기 위해서 Mediapipe의 Pose 실시간 신체추적 알고리즘을 사용하여 머리의 위치를 확인하고 움직이는 속도를 계산하여 쓰러짐 여부를 판단하였다. 결과에 신뢰성을 주기위한 방법으로 YOLO의 바운딩 박스의 크기를 구하여 객체의 자세를 유추하는 방법을 추가하고 구현하였다. 최종적으로 관리자에게 알림 서비스를 위하여 텔레그램 API Bot과 Firebase DB 서버를 구현하였다.

Development of AI-based Smart Agriculture Early Warning System

  • Hyun Sim;Hyunwook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.67-77
    • /
    • 2023
  • 본 연구는 스마트팜 환경에서 진행된 혁신적인 연구로, 딥러닝을 기반으로 한 질병 및 해충 탐지 모델을 개발하고, 이를 지능형 사물인터넷(IoT) 플랫폼에 적용하여 디지털 농업 환경 구현의 새로운 가능성을 탐색하였다. 연구의 핵심은 Pseudo-Labeling, RegNet, EfficientNet 등 최신 ImageNet 모델과 전처리 방식을 통합하여, 복잡한 농업 환경에서 다양한 질병과 해충을 높은 정확도로 탐지하는 것이었다. 이를 위해 앙상블 학습 기법을 적용하여 모델의 정확도와 안정성을 극대화했으며, 평균 정밀도(mAP), 정밀도, 재현율, 정확도, 박스 손실 등의 다양한 성능 지표를 통해 모델을 평가하였다. 또한, SHAP 프레임워크를 활용하여 모델의 예측 기준에 대한 깊은 이해를 도모하였고, 이를 통해 모델의 결정 과정을 보다 투명하게 만들었다. 이러한 분석은 모델이 어떻게 다양한 변수들을 고려하여 질병 및 해충을 탐지하는지에 대한 중요한 통찰력을 제공하였다.

가상 현실 게임 환경에서의 가상 손 제어를 위한 사용자 손 인식 방법 (A Method of Hand Recognition for Virtual Hand Control of Virtual Reality Game Environment)

  • 김부년;김종호;김태영
    • 한국게임학회 논문지
    • /
    • 제10권2호
    • /
    • pp.49-56
    • /
    • 2010
  • 본 논문에서는 사용자의 손을 인식하여 가상현실 게임 환경에서 가상의 손을 제어할 수 있는 방법을 제안한다. 카메라를 통해 획득한 영상을 통하여 사용자의 손 이동과 가리키는 방향에 대한 정보를 획득하고 이를 이용하여 가상의 손을 게임 화면에 나타낸다. 사용자의 손의 움직임은 가상의 손이 물건을 선택하고 옮기도록 하는 입력 인터페이스로 활용할 수 있다. 제안하는 방법은 비전 기반 손 인식 기법으로 먼저 RGB 컬러영역에서 HSV 컬러영역으로 입력영상을 변환하고 H, S 값에 대한 이중 임계값과 연결 요소 분석을 이용하여 손 영역을 분할한다. 다음으로 분할된 영역에 대하여 0, 1차 모멘트를 적용하고 이를 이용하여 손 영역에 대한 무게 중심점을 구한다. 구해진 무게중심점은 손의 중심에 위치하게 되며, 분할된 손 영역의 픽셀 집합 중 무게중심점으로부터 멀리 떨어진 픽셀들을 손가락의 끝점으로 인식한다. 마지막으로 무게중심점과 손 끝점에 대한 벡터를 통하여 손의 축을 구한다. 인식 안정성과 성능을 높이기 위하여 누적 버퍼를 이용한 떨림 보정과 경계상자를 이용한 처리 영역을 설정하였다. 본 논문의 방법은 기존의 비전 기술을 통한 손 인식 방법들에 비하여 별도의 착용 마커를 두지 않고 실시간으로 처리가 가능하다. 다양한 입력 영상들에 대한 실험 결과는 제안 기법으로 정확하게 손을 분할하고, 안정된 인식 결과를 고속으로 처리할 수 있음을 보여주었다.

스마트 기기에 의해 전자기기별 차단전력문턱치 설정기능이 장착된 자동대기전력 차단콘센트 구현 (Implementation of the automatic standby power blocking socket outlet having a blocking power threshold per electronic device by the smart machine)

  • 오창선;박찬영;김동회;김기택
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.481-489
    • /
    • 2014
  • 본 논문에서는 차단전력문턱치에 의해 대기전력을 감소시키는 자동대기전력 차단콘센트를 구현하였다. 여기서 대기전력은 사용하고 있지 않은 전자제품에 콘센트가 꽂아져 있는 경우, 흐르는 전력을 뜻한다. 제안한 콘센트의 경우 PC(Personal Computer)나 모바일 폰과 같은 스마트 기기로 실시간 전력량을 확인 할 수 있을 뿐만 아니라 차단전력문턱치를 직접 제어할 수 있기 때문에 어떤 전자기기든 각 대기 전력에 맞게 차단전력문턱치를 설정하여 확실하게 대기전력을 차단할 수 있다. 소프트웨어는 비주얼 스튜디오, 코드 비젼, SN8 C 스튜디오로 코딩을 했으며, 하드웨어는 크게 ATmega128, SN8F27E93S, USB to UART, 릴레이로 구성되어 있다. 모의실험결과, 제안된 방법과 기존 방법에서 먼저 휴대폰을 비교해보면 대기전력값이 큰 차이가 없지만 컴퓨터, 에어컨, 특히 셋톱박스의 경우에는 기존 방법에 의한 대기 전력이 제안된 시스템에 의한 대기전력보다 많은 소모됨을 알 수 있다. 따라서 제안된 차단콘센트는 대기전력 측면에서 우수한 성능을 나타냄을 알 수 있다.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

데이터 증강 및 앙상블 기법을 이용한 딥러닝 기반 GPR 공동 탐지 모델 성능 향상 연구 (Improving the Performance of Deep-Learning-Based Ground-Penetrating Radar Cavity Detection Model using Data Augmentation and Ensemble Techniques)

  • 최용욱;서상진;장한길로;윤대웅
    • 지구물리와물리탐사
    • /
    • 제26권4호
    • /
    • pp.211-228
    • /
    • 2023
  • 방조제의 모니터링에는 지구물리학적 비파괴 검사인 GPR (Ground Penetrating Radar) 탐사가 주로 이용된다. GPR 반응은 상황에 따라 복잡한 양상을 보이므로 자료의 처리와 해석은 전문가의 주관적 판단에 의존하며, 이는 오 탐지의 가능성을 불러옴과 동시에 시간이 오래 걸린다는 단점이 있다. 따라서 딥 러닝을 이용하여 GPR 탐사자료의 공동을 탐지하는 다양한 연구들이 수행되고 있다. 딥 러닝 기반 방법은 데이터 기반 방법으로써 풍부한 자료가 필요하나 GPR 탐사의 경우 비용 등의 이유로 학습에 이용할 현장 자료가 부족하다. 따라서 본 논문에서는 데이터 증강 전략을 이용하여 딥 러닝 기반 방조제 GPR 탐사자료 공동 탐지 모델을 개발하였다. 다년간 동일한 방조제에서 탐사 자료를 사용하여 데이터 세트를 구축하였으며, 컴퓨터 비전 분야의 객체 탐지 모델 중 YOLO (You Look Only Once) 모델을 이용하였다. 데이터 증강 전략을 비교 및 분석함으로써 최적의 데이터 증강 전략을 도출하였고, 초기 모델 개발 후 앵커 박스 클러스터링, 전이 학습, 자체 앙상블, 모델 앙상블 기법을 단계적으로 적용하여 최종 모델 도출 후 성능을 평가하였다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.

들뢰즈 체계의 형성 배경에 대한 연구 - 칸트 선험철학 체계 그 심연으로부터의 역류 - (A Study Concerning the Background of Formation in Deleuze's System)

  • 김대현
    • 대순사상논총
    • /
    • 제37집
    • /
    • pp.329-355
    • /
    • 2021
  • 본 논문은 들뢰즈 체계의 형성이 칸트 체계의 '순수이성의 이상'이 역류한 결과임을 밝히고자 함을 목적으로 한다. 그의 주저인 『차이와 반복』 내에서 그의 체계를 해석하는 주요 키워드를 포착하고 이것을 통해 들뢰즈의 초월적 경험주의 체계와 칸트의 선험철학 체계 사이의 상호 변양의 양상을 살피고자 한다. 들뢰즈 체계를 해석하는 선행연구 가운데 반헤겔적인 측면에 초점이 맞추어져 있는 경향이 있는데 들뢰즈가 구축하고 있는 사유의 전개 방식을 직접적으로 추적하기 위해서는 그 출발점을 칸트로 삼아야 함이 타당하다. 근본적으로 들뢰즈는 사유의 전체 지반을 두고 볼 때 헤겔과 출발점에 있어 다르다. 물론 헤겔의 정신철학 내부에 담겨 있는 변증법적 생성의 힘을 들뢰즈도 가지고 있지만 그것이 적용되는 체계적 환경이 이미 다른 것이다. 헤겔은 의식과 세계의 선행된 기원으로부터 출발하는 원본과 복사본의 체계라면 들뢰즈는 선행된 기원으로부터 출발하지 않고 오직 복사본으로부터 출발한다. 들뢰즈 체계의 이러한 특성은 경험주의의 관념적 유희의 권리에 있다. 그의 저서에서 그가 경험주의를 언급하고 경험주의의 전통을 수용한 칸트를 언급하고 자신의 철학을 초월적 경험주의라고 명명하는 것을 보면 짐작할 수 있는 사실이다. 따라서, 칸트 선험철학 체계의 역류 결과로서의 들뢰즈 체계에 대해 알아보기 위해 그 역류 과정을 조감해보는 것이 본 논문의 주된 흐름이다. 칸트 체계를 역류하는 과정에서 칸트가 조율해 놓은 경험주의와 합리주의의 절묘한 동거와 그로부터 얻어지는 현실적 인식의 적확성은 들뢰즈에 의해 파괴되고 뒤섞이면서 경험 세계의 풍요의 환영으로 변양된다. 인식의 과학적 적확성으로부터 풍요의 환영, 들뢰즈의 입장에서 인식 체계를 조율하는 두 방식에 대해서 철학자는 선택의 권리를 가질 수 있으며 또한 정당성의 문제이기보다 의식을 통해 추구하는 가치를 기준으로 스스로가 취할 수 있는 선택의 문제인 것이다. 들뢰즈의 선택은 결국 칸트가 숨겨둔 심연의 판도라 상자를 열고 현실의 표층으로 상승시킨 결과를 낳는다.