• 제목/요약/키워드: AI Image Recognition

검색결과 126건 처리시간 0.03초

온디바이스 AI 비전 모델이 탑재된 지능형 엣지 컴퓨팅 기기 개발 (Development of an intelligent edge computing device equipped with on-device AI vision model)

  • 강남희
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.17-22
    • /
    • 2022
  • 본 논문에서는 지능형 엣지 컴퓨팅을 지원할 수 있는 경량 임베디드 기기를 설계하고, 영상 기기로부터 입력되는 이미지에서 객체를 실시간으로 빠르게 검출할 수 있음을 보인다. 제안하는 시스템은 산업 현장이나 군 지역과 같이 사전에 설치된 인프라가 없는 환경에 적용되는 지능형 영상 관제 시스템이나 드론과 같은 자율이동체에 탑재된 영상 보안 시스템에 적용될 수 있다. 지능형 비전 인지 시스템이 확산 적용되기 위해 온디바이스 AI(On-Device Artificial intelligence) 기술 적용 필요성이 증대되고 있다. 영상 데이터 취득 장치에서 가까운 엣지 기기로의 컴퓨팅 오프 로딩은 클라우드를 중심으로 수행되는 인공지능 서비스 대비 적은 네트워크 및 시스템 자원으로도 빠른 서비스 제공이 가능하다. 또한, 다양한 해킹 공격에 취약한 공격 표면의 감소와 민감한 데이터의 유출을 최소화 할 수 있어 다양한 산업에 안전하게 적용될 수 있을것으로 기대된다.

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

딥러닝을 이용한 스마트 안전 축사 관리 방안 (The Management of Smart Safety Houses Using The Deep Learning)

  • 홍성화
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.505-507
    • /
    • 2021
  • 영상 인식 기술은 인공지능 기술을 기반으로 인식하고자하는 객체의 형상, 객체 주변의 환경변화 및 객체 회전에 의한 인식 능력 저하를 보완할 수 있는 객체특징점 및 특징 기술자를 생성하고, 생성된 특징 기술자를 이용하여, 영상 객체를 인식하는 기술로, 일반적으로 영상에 나타난 객체를 인식하는 기술을 뜻한다. 스마트 안전 축사에서 전력소비 및 화재 발생 복합 환경 분석을 위해 설치되는 전력화재 관리 디바이스를 통합 관리함으로써 축사 전력 사용의 효율성 향상 및 전기 사용의 과부화로 발생할 수 있는 사고를 방지하여 축산 농가의 이익 증대 및 피해를 최소화하고 안전하고 최적화된 지능형 스마트 안전 축사를 개발하여 보급하는데 요구되는 전력 관리 프레임워크를 구현하는데 목적이 있다.

  • PDF

YOLOv5에서 가상 번호판 생성을 통한 차량 번호판 인식 시스템에 관한 연구 (A Study on Vehicle License Plate Recognition System through Fake License Plate Generator in YOLOv5)

  • 하상현;정석찬;전영준;장문석
    • 한국산업융합학회 논문집
    • /
    • 제24권6_2호
    • /
    • pp.699-706
    • /
    • 2021
  • Existing license plate recognition system is used as an optical character recognition method, but a method of using deep learning has been proposed in recent studies because it has problems with image quality and Korean misrecognition. This requires a lot of data collection, but the collection of license plates is not easy to collect due to the problem of the Personal Information Protection Act, and labeling work to designate the location of individual license plates is required, but it also requires a lot of time. Therefore, in this paper, to solve this problem, five types of license plates were created using a virtual Korean license plate generation program according to the notice of the Ministry of Land, Infrastructure and Transport. And the generated license plate is synthesized in the license plate part of collectable vehicle images to construct 10,147 learning data to be used in deep learning. The learning data classifies license plates, Korean, and numbers into individual classes and learn using YOLOv5. Since the proposed method recognizes letters and numbers individually, if the font does not change, it can be recognized even if the license plate standard changes or the number of characters increases. As a result of the experiment, an accuracy of 96.82% was obtained, and it can be applied not only to the learned license plate but also to new types of license plates such as new license plates and eco-friendly license plates.

퍼지 가중치와 잡음판단을 이용한 복합잡음에 훼손된 영상의 복원 알고리즘 (Image Restoration Algorithm Damaged by Mixed Noise using Fuzzy Weights and Noise Judgment)

  • 천봉원;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.133-135
    • /
    • 2022
  • IoT 및 AI기술과 매체의 발전에 따라 다양한 디지털 장비가 사용되고 있으며, 무인화와 자동화가 급속도로 진행되고 있다. 특히 스마트 팩토리와 자율주행기술 및 지능형 CCTV와 같은 분야에서는 높은 수준의 영상처리 기술이 요구되고 있다. 하지만 영상에 존재하는 잡음은 에지 검출이나 객체 인식과 같은 과정에 영향을 미치고 있으며, 시스템의 정확성과 신뢰도 저하를 야기한다. 본 논문에서는 복합잡음에 훼손된 영상을 복원하기 위해 퍼지 가중치를 사용한 필터링 알고리즘 제안한다. 제안한 알고리즘은 잡음 판단을 사용하여 기준값을 구했으며, 퍼지가중치를 적용하여 최종출력을 계산한다. 제안한 알고리즘의 성능을 검증하기 위해 시뮬레이션을 진행하였으며, 기존 필터 알고리즘과 결과영상을 비교하여 평가하였다.

  • PDF

IoT 센서와 AI 카메라를 융합한 급경사지 상태 분석 시스템 개발 (Development of a Slope Condition Analysis System using IoT Sensors and AI Camera)

  • 이승주;정기연;이태훈;김영석
    • 한국지반신소재학회논문집
    • /
    • 제23권2호
    • /
    • pp.43-52
    • /
    • 2024
  • 최근 이상기후로 인한 급경사지 붕괴 위험이 증가되고 있으며, 급경사지 붕괴 위험의 사전 예측 및 경보 전파가 이루어지지 않아 인명과 재산 피해가 발생할 수 있다. 본 논문에서는 급경사지의 상태를 평가하기 위해 IoT 센서와 AI 기반 카메라를 융합한 급경사지 분석 시스템을 개발하였다. 시스템을 개발하기 위하여 급경사지 지반조건을 고려한 계측센서 하드웨어 및 펌웨어 설계, AI 기반 영상 분석 알고리즘 설계, 그리고 예·경보 솔루션 및 시스템 제작을 수행하였다. IoT 센서의 데이터와 AI 카메라 영상 분석을 통해 센서 데이터의 오차를 최소화하고, 데이터의 신뢰성을 향상시키고자 하였다. 또한 실제 급경사지에 적용하여 정확도(신뢰도)를 평가하였다. 그 결과, 센서 계측 오류는 0.1° 이내로 유지되었으며 계측 데이터의 전송률은 95%이상이었다. AI 기반의 영상 분석 시스템은 야간에도 부분 인식률 99%의 높은 성능을 나타내었다. 본 연구결과는 다양한 사회간접자본(SOC) 시설의 급경사지 상태 분석 및 스마트 유지관리 분야에도 적용할 수 있을 것으로 판단된다.

광주광역시의 AI 특화분야를 위한 실용적인 접근 사례 제시 (Presenting Practical Approaches for AI-specialized Fields in Gwangju Metro-city)

  • 차병래;차윤석;박선;신병춘;김종원
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.55-62
    • /
    • 2021
  • 광주광역시의 3대 주력산업인 자동차 산업, 에너지 산업, 그리고 AI/헬스케어 산업 등에 응용 가능한 AI 활용 사례로 준지도 학습, 전이 학습, 그리고 연합 학습의 머신러닝을 적용하며, 더불어 주력산업을 위한 AI 서비스를 위한 ML 전략을 정립하였다. AI 서비스의 ML 전략을 기반으로 실용적 접근 사례들을 제시하고자 하며, 준지도 학습의 접근 사례는 자동차 영상 인식 기술에 활용하며, 전이 학습의 접근 사례는 헬스케어 분야의 당뇨병성 망막병증 검출에 활용하고자 하며, 마지막으로 연합 학습의 접근 사례는 전력 수요 예측에 활용하고자 한다. 이러한 접근 사례들을 싱글보드 Raspberry Pi, Jaetson Nano, Intel i-7 등의 하드웨어를 기반으로 성능 테스트를 진행함과 동시에 실용적인 접근 사례들의 유효성을 검증하였다.

다중 스펙트럼 객체 감지를 위한 고주파 교환 네트워크 (High-Frequency Interchange Network for Multispectral Object Detection)

  • 박선후;윤준석;유석봉;한승회
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1121-1129
    • /
    • 2022
  • RGB 이미지를 활용하는 다양한 객체 인식 분야에서 조도가 어둡거나 특정 물체에 의해 가려진 환경에서의 RGB 이미지는 객체 인식 성능 저하를 일으킨다. IR 이미지는 가시광선이 아닌 적외선 파동을 감지하기 때문에 이러한 환경에서 강인한 객체 인식 성능을 가질 수 있고, RGB-IR 이미지 쌍을 가지고 각자의 강점을 결합 하는 것을 통해 객체 인식 성능을 향상시킬 수 있다. 본 논문에서는 RGB-IR 이미지 쌍의 강점만을 결합하여 객체 인식 성능을 향상시키는 다중 스펙트럼 융합 모델인 high-frequency interchange network (HINet)을 제안한다. HINet은 RGB-IR 이미지 간 주요 정보를 교환하기 위해 두 가지 객체 인식 모델을 mutual high-frequency transfer (MHT)를 이용하여 연결하였다. MHT에서는 RGB-IR 이미지 쌍 각각을 discrete cosine transform (DCT) 스펙트럼 도메인으로 변환하여 고주파 정보를 추출한다. 추출된 고주파 정보는 서로의 네트워크에 전달되어 객체 인식성능 향상을 위해 활용되어 진다. 실험 결과는 제안하는 네트워크의 우수성을 보이며 다중 스펙트럼 객체 인식 성능을 향상시키는 것을 확인할 수 있다.

A Vehicle Recognition Method based on Radar and Camera Fusion in an Autonomous Driving Environment

  • Park, Mun-Yong;Lee, Suk-Ki;Shin, Dong-Jin
    • International journal of advanced smart convergence
    • /
    • 제10권4호
    • /
    • pp.263-272
    • /
    • 2021
  • At a time when securing driving safety is the most important in the development and commercialization of autonomous vehicles, AI and big data-based algorithms are being studied to enhance and optimize the recognition and detection performance of various static and dynamic vehicles. However, there are many research cases to recognize it as the same vehicle by utilizing the unique advantages of radar and cameras, but they do not use deep learning image processing technology or detect only short distances as the same target due to radar performance problems. Radars can recognize vehicles without errors in situations such as night and fog, but it is not accurate even if the type of object is determined through RCS values, so accurate classification of the object through images such as cameras is required. Therefore, we propose a fusion-based vehicle recognition method that configures data sets that can be collected by radar device and camera device, calculates errors in the data sets, and recognizes them as the same target.

화재 탐지 영역의 이미지와 동영상 인식 사이 인공지능 모델 성능 비교 연구 (A Comparative Study on Artificial in Intelligence Model Performance between Image and Video Recognition in the Fire Detection Area)

  • 이정록;이대웅;정서현;정상
    • 한국재난정보학회 논문집
    • /
    • 제19권4호
    • /
    • pp.968-975
    • /
    • 2023
  • 연구목적: 화재 탐지시 불꽃/연기의 오탐지율이 높은 것을 확인하고 오탐지율을 낮추기 위해 화재 상황을 인식하여 분류하는 방법과 데이터셋을 제안하고자 한다. 연구방법: 동영상을 학습데이터로 활용하여 화재 상황의 특징을 추출하여 분류모델에 적용하고, 평가는 한국정보화진흥원(NIA)에서 진행하는 화재 데이터셋을 이용하여 Yolov8, Slowfast의 모델 성능을 비교 및 분석하였다. 연구결과: YOLO는 배경의 영향에 따라 탐지 성능이 민감하게 변화하며, 화재의 규모가 너무 크거나 작을 때에도 화재를 제대로 감지하지 못했다. SlowFast는 동영상의 시간 축을 같이 학습하기 때문에 비정형 객체에 대해 주변이 흐리거나 밝아 형상을 명확하게 유추할 수 없는 상황에서도 우수하게 화재를 탐지하는 것을 확인했다. 결론: 화재 탐지율은 이미지 데이터 방식보다는 동영상 기반의 인공지능 인식(Detection) 모델을 활용했을 때 더 적절했음을 확인했다.