• 제목/요약/키워드: 영상기반AI

검색결과 245건 처리시간 0.027초

헬멧 착용 여부 및 쓰러짐 사고 감지를 위한 AI 영상처리와 알람 시스템의 구현 (Implementation of an alarm system with AI image processing to detect whether a helmet is worn or not and a fall accident)

  • 조용화;이혁재
    • 융합신호처리학회논문지
    • /
    • 제23권3호
    • /
    • pp.150-159
    • /
    • 2022
  • 본 논문은 실시간 영상 분석을 통해서 산업현장에서 활동하는 여러 근로자의 영상 객체를 추출해 내고, 추출된 이미지로 부터 개별 영상 분석을 통해 헬멧의 착용 여부와 낙상 사고 여부를 확인하는 방법을 구현한다. 근로자의 영상 객체를 탐지하기 위해서 딥러닝 기반 컴퓨터 비전 모델인 YOLO를 사용하였으며, 추출된 이미지를 이용하여 헬멧의 착용여부를 판단하기 위해 따로 5,000장의 다양한 헬멧 학습 데이터 이미지를 만들어서 사용하였다. 또한, 낙상사고 여부를 판단하기 위해서 Mediapipe의 Pose 실시간 신체추적 알고리즘을 사용하여 머리의 위치를 확인하고 움직이는 속도를 계산하여 쓰러짐 여부를 판단하였다. 결과에 신뢰성을 주기위한 방법으로 YOLO의 바운딩 박스의 크기를 구하여 객체의 자세를 유추하는 방법을 추가하고 구현하였다. 최종적으로 관리자에게 알림 서비스를 위하여 텔레그램 API Bot과 Firebase DB 서버를 구현하였다.

인공지능 기반 영상 콘텐츠 생성 기술 동향 (Artificial Intelligence-Based Video Content Generation)

  • 손정우;한민호;김선중
    • 전자통신동향분석
    • /
    • 제34권3호
    • /
    • pp.34-42
    • /
    • 2019
  • This study introduces artificial intelligence (AI) techniques for video generation. For an effective illustration, techniques for video generation are classified as either semi-automatic or automatic. First, we discuss some recent achievements in semi-automatic video generation, and explain which types of AI techniques can be applied to produce films and improve film quality. Additionally, we provide an example of video content that has been generated by using AI techniques. Then, two automatic video-generation techniques are introduced with technical details. As there is currently no feasible automatic video-generation technique that can generate commercial videos, in this study, we explain their technical details, and suggest the future direction for researchers. Finally, we discuss several considerations for more practical automatic video-generation techniques.

구글 버텍스 AI을 이용한 치과 X선 영상진단 유용성 평가 (Preliminary Test of Google Vertex Artificial Intelligence in Root Dental X-ray Imaging Diagnosis)

  • 정현자
    • 한국방사선학회논문지
    • /
    • 제18권3호
    • /
    • pp.267-273
    • /
    • 2024
  • 본 연구에서는 코딩없이 인공지능 학습 모델을 개발할 수 있는 클라우드 기반의 버텍스 AI 플렛폼을 이용하여 비전문가인 일반인들이 손쉽게 인공지능 학습 모델을 개발하였고 임상적 적용가능성을 확인하였다. 학습용 데이터는 캐글 사이트에 공개된 총9개 치과 질환, 2,999장 치근병 X선 영상을 사용하였고, 무작위로 학습, 검증 및 테스트 데이터 이미지를 분류하였다. 버텍스 AI의 기본 학습모델 워크플로우에서 학습 파이프라인을 사용하여 하이퍼 파라미터 조정작업을 통해 영상분류, 멀티레이블 학습을 수행하였다. Auto ML을 수행한 결과 AUC가 0.967, 정밀도는 95.6%, 재현율은 95.2%로 나타났으며, 학습된 인공지능 모델이 임상적 진단에 충분한 의미가 있음을 확인하였다.

신뢰성 영상자료를 위한 어노테이션 기법 (Annotation Method for Reliable Video Data)

  • 강윤희;권태언
    • Journal of Platform Technology
    • /
    • 제12권1호
    • /
    • pp.77-84
    • /
    • 2024
  • 최근 인공지능 활용 증가로 조직 내부의 AI TRiSM 보장 데이터 관리가 중요해지고 있으며, 이에 따라 데이터 신뢰성 확보는 데이터 기반 의사결정의 필수 요구사항으로 등장하였다. 생성된 디지털 콘텐츠는 신뢰성을 갖지 않는 인터넷을 통해 디지털 콘텐츠 저장소가 위치한 클라우드에 전송되어 다양하게 활용된다. 그러나 기존의 디지털 콘텐츠 시스템은 자료훼손에 따른 내용 수정을 확인하는 데이터 이상감지 기능을 제공하기 쉽지 않다. 이 논문에서는 데이터 어노테이션의 기능 확장을 통해 영상데이터의 신뢰성을 보증하기 위한 기법을 설계한다. 설계된 어노테이션 기법은 webUI 방식으로 gRPC 기반 요청 및 응답을 처리할 수 있도록 프로토타입을 구성하여 주어진 영상의 분류 레이블 및 머클트리를 생성한다.

  • PDF

열화상 카메라를 활용한 딥러닝 기반의 1·3종 차량 분류 (Class 1·3 Vehicle Classification Using Deep Learning and Thermal Image)

  • 정유석;정도영
    • 한국ITS학회 논문지
    • /
    • 제19권6호
    • /
    • pp.96-106
    • /
    • 2020
  • 본 연구에서는 루프 센서를 통한 교통량 수집방식의 오류를 해결하기 위해 1종(승용차)과 3종(일반 트럭)의 구분이 어려운 부분 및 영상 이미지의 단점을 보완하기 위해 도로변에 열화상 카메라를 설치하여 영상 이미지를 수집하였다. 수집된 영상 이미지를 레이블링 단계를 거쳐 1종(승용차)과 3종(일반 트럭)의 학습데이터를 구성하였다. 정지영상을 대상으로 labeling을 진행하였으며, 총 17,536대의 차량 이미지(640x480 pixel)에 대해 시행하였다. 열화상 영상 기반의 차종 분류를 달성하기 위해 CNN(Convolutional Neural Network)을 이용하였으며, 제한적인 데이터량과 품질에도 불구하고 97.7%의 분류정확도를 나타내었다. 이는 AI 영상인식 기반의 도로 교통량 데이터 수집 가능성을 보여주는 것이라 판단되며, 향후 더욱더 많은 학습데이터를 축적한다면 12종 차종 분류가 가능할 것이다. 또한, AI 기반 영상인식으로 도로 교통량의 12종 차종뿐만 아니라 다양한(친환경 차량, 도로 법규 위반차량, 이륜자동차 등) 차종 분류를 할 수 있을 것이며, 이는 국가정책, 연구, 산업 등의 통계 데이터로 활용도가 높을 것으로 판단된다.

영상보안 구조 기반의 지능형 독거노인 모니터링 시스템 (Intelligent Monitoring System for Solitary Senior Citizens with Vision-Based Security Architecture)

  • 김수희;정영우;정유리;이승은
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.639-641
    • /
    • 2022
  • 사회적으로 고령화 문제가 심화되면서, 독거노인 모니터링 시스템에 관한 연구가 활발히 진행되고 있다. 일반적으로 모니터링 시스템은 영상, 센서, 계측값 등의 정보를 바탕으로 서버에서 연산을 수행하여, 사용자에게 모니터링 서비스를 제공한다. 서버를 이용하는 시스템의 구조상 데이터 유출의 위험이 존재하며, 데이터 보안을 고려한 설계가 필수적이다. 본 논문에서는 영상보안 구조 기반의 지능형 독거노인 모니터링 시스템을 제안한다. 제안하는 시스템은 Edge AI 모듈을 사용하여 카메라 모듈과 서버 간의 통신을 차단하는 구조를 통해 높은 보안성을 보장한다. Edge AI 모듈은 Verilog HDL로 설계되었으며, Field Programmable Gate Array (FPGA)를 통해 기능을 구현하였다. 본 시스템을 검증하기 위해 5,144개의 프레임 데이터에 대해 실험하였으며, 사람의 움직임이 일정 시간 감지되지 않았을 때 위험 감지 신호가 올바르게 발생하는 것을 확인하였다.

  • PDF

위성영상 이미지를 활용한 연구 동향 및 데이터셋 리뷰 (Research Trends and Datasets Review using Satellite Image)

  • 김세형;채정우;강주영
    • 스마트미디어저널
    • /
    • 제11권1호
    • /
    • pp.17-30
    • /
    • 2022
  • 기존 컴퓨터 비전의 연구 동향과 마찬가지로, 위성영상을 이용한 연구도 GPU 기반의 컴퓨터 연산능력과 이미지 처리와 관련된 딥러닝 방법론의 발전으로 많이 이루어지고 있다. 그로 인해 다양한 분야에 위성영상이 활용되고 있고, 위성 영상을 활용에 관한 연구도 증가하고 있다. 본 연구에서는 위성영상의 연구 활용 분야와 위성영상을 활용한 연구에 이용할 수 있는 데이터셋에 대해 소개하도록 한다. 먼저, 위성영상을 활용한 연구를 수집하여 연구 방법에 따라 분류하였다. 크게 분류 기반 연구와 회귀 기반 연구로 분류하였고, 그 이외의 방법으로 활용한 논문들을 정리하였다. 다음으로 위성영상을 활용한 연구들에서 이용한 데이터셋을 정리하였다. 본 연구에서는 데이터셋의 정보와 연구에서의 활용 방법에 대해 제안한다. 이와 함께 최근 AI hub에서 개방한 국내 위성영상 데이터셋의 정리와 활용 방안에 대해 소개한다. 마지막으로, 위성 이미지 관련 연구의 한계점과 앞으로의 동향을 간략하게 제시하였다.

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

AWGN 환경에서 가우시안 분포 기반의 퍼지 가중치를 사용한 스위칭 필터 알고리즘 (Switching Filter Algorithm using Fuzzy Weights based on Gaussian Distribution in AWGN Environment)

  • 천봉원;김남호
    • 한국정보통신학회논문지
    • /
    • 제26권2호
    • /
    • pp.207-213
    • /
    • 2022
  • 최근 IoT 기술과 AI의 성능향상에 따라 폭넓은 분야에서 자동화와 무인화가 진행되고 있으며, 사물인식과 객체분류 등 자동화의 기반이 되는 영상처리에 대한 관심이 높아지고 있다. 영상의 잡음 제거는 영상에 기반한 시스템에서 전처리 단계로 사용하는 중요한 과정으로 다양한 연구가 진행되었으나, 대부분의 경우 에지와 같은 고주파 성분에서 스무딩 효과에 의해 디테일한 정보를 보존하기 어렵다는 단점이 있다. 본 논문은 AWGN(additive white Gaussian noise)에 훼손된 영상을 가우시안 분포에 기반한 퍼지 가중치를 사용하여 복원하는 알고리즘을 제안한다. 제안한 알고리즘은 필터링 마스크와 잡음 추정치를 서로 비교하여 필터링 과정을 스위칭하였으며, 영상의 저주파 및 고주파 성분에 따라 퍼지 가중치를 계산하여 영상을 복원하였다.

보행 보조 로봇의 환경 인지를 위한 의미론적 영상 분할 기법에 관한 준비 연구 (A Preliminary Study on Semantic Segmentation Techniques for Environment Recognition of Walking Assistant Robot)

  • 이서영;박지성;김강건
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.841-844
    • /
    • 2021
  • 보행 환경 인지 기술은 보행 보조 로봇의 지능화를 위한 핵심 기술 중 하나다. 이 논문은 국내 보행 환경에 대한 보행 보조 로봇의 인지 지능을 고도화하는 방법으로 심층 학습 기반의 의미론적 영상 분할 기법을 고려한다. 이 논문은 국내 보행 환경에 대한 기존 영상 분할 기법의 성능을 비교 분석하고, 국내 보행 환경에 적합한 영상 분할 기술의 개발 방향과 인지 센서의 구성 및 배치에 대해 논한다.