• 제목/요약/키워드: vision AI

검색결과 154건 처리시간 0.03초

헬멧 착용 여부 및 쓰러짐 사고 감지를 위한 AI 영상처리와 알람 시스템의 구현 (Implementation of an alarm system with AI image processing to detect whether a helmet is worn or not and a fall accident)

  • 조용화;이혁재
    • 융합신호처리학회논문지
    • /
    • 제23권3호
    • /
    • pp.150-159
    • /
    • 2022
  • 본 논문은 실시간 영상 분석을 통해서 산업현장에서 활동하는 여러 근로자의 영상 객체를 추출해 내고, 추출된 이미지로 부터 개별 영상 분석을 통해 헬멧의 착용 여부와 낙상 사고 여부를 확인하는 방법을 구현한다. 근로자의 영상 객체를 탐지하기 위해서 딥러닝 기반 컴퓨터 비전 모델인 YOLO를 사용하였으며, 추출된 이미지를 이용하여 헬멧의 착용여부를 판단하기 위해 따로 5,000장의 다양한 헬멧 학습 데이터 이미지를 만들어서 사용하였다. 또한, 낙상사고 여부를 판단하기 위해서 Mediapipe의 Pose 실시간 신체추적 알고리즘을 사용하여 머리의 위치를 확인하고 움직이는 속도를 계산하여 쓰러짐 여부를 판단하였다. 결과에 신뢰성을 주기위한 방법으로 YOLO의 바운딩 박스의 크기를 구하여 객체의 자세를 유추하는 방법을 추가하고 구현하였다. 최종적으로 관리자에게 알림 서비스를 위하여 텔레그램 API Bot과 Firebase DB 서버를 구현하였다.

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.

컬러 정보를 이용한 무인항공기에서 실시간 이동 객체의 카메라 추적 (The Camera Tracking of Real-Time Moving Object on UAV Using the Color Information)

  • 홍승범
    • 한국항공운항학회지
    • /
    • 제18권2호
    • /
    • pp.16-22
    • /
    • 2010
  • This paper proposes the real-time moving object tracking system UAV using color information. Case of object tracking, it have studied to recognizing the moving object or moving multiple objects on the fixed camera. And it has recognized the object in the complex background environment. But, this paper implements the moving object tracking system using the pan/tilt function of the camera after the object's region extraction. To do this tracking system, firstly, it detects the moving object of RGB/HSI color model and obtains the object coordination in acquired image using the compact boundary box. Secondly, the camera origin coordination aligns to object's top&left coordination in compact boundary box. And it tracks the moving object using the pan/tilt function of camera. It is implemented by the Labview 8.6 and NI Vision Builder AI of National Instrument co. It shows the good performance of camera trace in laboratory environment.

Towards a Ubiquitous Robotic Companion: Design and Implementation of Ubiquitous Robotic Service Framework

  • Ha, Young-Guk;Sohn, Joo-Chan;Cho, Young-Jo;Yoon, Hyun-Soo
    • ETRI Journal
    • /
    • 제27권6호
    • /
    • pp.666-676
    • /
    • 2005
  • In recent years, motivated by the emergence of ubiquitous computing technologies, a new class of networked robots, ubiquitous robots, has been introduced. The Ubiquitous Robotic Companion (URC) is our conceptual vision of ubiquitous service robots that provide users with the services they need, anytime and anywhere in ubiquitous computing environments. To realize the vision of URC, one of the essential requirements for robotic systems is to support ubiquity of services: that is, a robot service must be always available even though there are changes in the service environments. Specifically robotic systems need to be automatically interoperable with sensors and devices in current service environments, rather than statically preprogrammed for them. In this paper, the design and implementation of a semantic-based ubiquitous robotic space (SemanticURS) is presented. SemanticURS enables automated integration of networked robots into ubiquitous computing environments exploiting Semantic Web Services and AI-based planning technologies.

  • PDF

SHAP를 이용한 이미지 어노테이션 자동화 프로세스 연구 (A Study on Image Annotation Automation Process using SHAP for Defect Detection)

  • 정진형;심현수;김용수
    • 산업경영시스템학회지
    • /
    • 제46권1호
    • /
    • pp.76-83
    • /
    • 2023
  • Recently, the development of computer vision with deep learning has made object detection using images applicable to diverse fields, such as medical care, manufacturing, and transportation. The manufacturing industry is saving time and money by applying computer vision technology to detect defects or issues that may occur during the manufacturing and inspection process. Annotations of collected images and their location information are required for computer vision technology. However, manually labeling large amounts of images is time-consuming, expensive, and can vary among workers, which may affect annotation quality and cause inaccurate performance. This paper proposes a process that can automatically collect annotations and location information for images using eXplainable AI, without manual annotation. If applied to the manufacturing industry, this process is thought to save the time and cost required for image annotation collection and collect relatively high-quality annotation information.

웹 구축 보조 시스템에 대한 GUI 객체 감지 및 대규모 언어 모델 활용 연구 (A Study on the Web Building Assistant System Using GUI Object Detection and Large Language Model)

  • 장현철;장형국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.830-833
    • /
    • 2024
  • As Large Language Models (LLM) like OpenAI's ChatGPT[1] continue to grow in popularity, new applications and services are expected to emerge. This paper introduces an experimental study on a smart web-builder application assistance system that combines Computer Vision with GUI object recognition and the ChatGPT (LLM). First of all, the research strategy employed computer vision technology in conjunction with Microsoft's "ChatGPT for Robotics: Design Principles and Model Abilities"[2] design strategy. Additionally, this research explores the capabilities of Large Language Model like ChatGPT in various application design tasks, specifically in assisting with web-builder tasks. The study examines the ability of ChatGPT to synthesize code through both directed prompts and free-form conversation strategies. The researchers also explored ChatGPT's ability to perform various tasks within the builder domain, including functions and closure loop inferences, basic logical and mathematical reasoning. Overall, this research proposes an efficient way to perform various application system tasks by combining natural language commands with computer vision technology and LLM (ChatGPT). This approach allows for user interaction through natural language commands while building applications.

현악사중주 공연의 역사와 미래: 미디어와 인공지능을 활용한 융합 공연의 가능성에 대하여 (The History and Future of String Quartet Performances: Examining the Possibility of Convergent Performances Employing Media and Artificial Intelligence)

  • 박은지
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.697-706
    • /
    • 2023
  • 본 연구는 현악사중주의 역사를 살펴보고, 현대에 제시된 융합 공연을 분석하여 미래의 청중이 수용할만한 새로운 공연의 패러다임을 제안하는 것을 목표로 한다. 연구의 과정에서는 과거와 현대의 현악사중주가 어떻게 발전했는지를 면밀하게 살펴보고, 그 과정에서 나타난 청중의 변화에 관하여 분석한다. 더불어 현대 현악사중주의 기술 융합 공연 사례로부터 새로운 청중의 수요에 따른 오늘날의 클래식 공연산업이 어떠한 변화를 맞을 수 있을지를 모색한다. 연구의 결과로 현대의 현악사중주는 미디어와 AI 기술의 융합을 통한 새롭고 독창적인 방향의 공연이 필요하다는 결론을 내렸다.

IT 기술을 활용한 노인돌봄서비스 사례 및 개발 동향 (Cases of health care services for the elderly using IT technology and future development directions)

  • 김한별;김지홍;이성모;최훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.496-498
    • /
    • 2022
  • 초고령사회의 진입에 따라 시니어 헬스 케어를 위한 IT 기술과 보건 의료 산업의 융합형 스마트 헬스 케어가 고령화 시대 독거노인 문제의 해결책으로 급부상 중이다. AI를 활용한 비대면 돌봄 서비스의 발전은 일부 국가가 아닌 세계적 경향으로 AI 인공지능 기술을 이용한 노인 돌봄 서비스의 형태는 급격히 변화하고 있다. 국내 역시 초고령화 사회의 진입을 앞두고 있으며 1인 가구가 증가함으로 인해 독거노인 돌봄과 관련하여 노인 복지 인력 부족 문제가 사회 이슈로 대두되고 있다. IT 기술을 이용한 노인 돌봄 서비스는 편리하다는 장점뿐만 아니라 노인 돌봄 노동자의 인력난 등의 장기적인 사회적 문제점을 해소해 줄 비전으로 제시된다. 따라서 고령층을 위한 노인 돌봄 서비스의 사례 연구와 초고령화 시대의 대책으로써 노인 돌봄 서비스의 발전 방향이 제안하고자 한다.

  • PDF

AI 및 IoT 기반 스마트팜 병충해 예측시스템 개발: YOLOv5 및 Isolation Forest 모델 적용 연구 (Development of AI and IoT-based smart farm pest prediction system: Research on application of YOLOv5 and Isolation Forest models)

  • 박미경;심현
    • 한국전자통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.771-780
    • /
    • 2024
  • 본 연구에서는 딸기 농장을 대상으로 YOLOv5 아키텍처를 기반으로 한 컴퓨터 비전 모델과 Isolation Forest Classifier를 적용하여 병충해를 실시간으로 감지 및 예측하는 시스템을 개발하였다. 모델 성능 평가 결과, YOLOv5 모델은 평균 정밀도(mAP 0.5) 78.7%, 정확도 92.8%, 재현율 90.0%, F1 점수 76%로 높은 예측 성능을 나타냈다. 본 시스템은 딸기 농장뿐만 아니라 다른 작물과 다양한 환경에도 적용할 수 있도록 설계되었다. 토마토 농장에서 수집된 데이터를 기반으로 새로운 AI 모델을 학습한 결과, 주요 병충해인 역병과 황화병에 대한 예측 정확도가 85% 이상으로 나타났으며, 기존 모델보다 예측 정확도가 10% 이상 향상되었다.

이미지 기반의 식물 인식 기술 동향 (Trends of Plant Image Processing Technology)

  • 윤여찬;상종희;박수명
    • 전자통신동향분석
    • /
    • 제33권4호
    • /
    • pp.54-60
    • /
    • 2018
  • In this paper, we analyze the trends of deep-learning based plant data processing technologies. In recent years, the deep-learning technology has been widely applied to various AI tasks, such as vision (image classification, image segmentation, and so on) and natural language processing because it shows a higher performance on such tasks. The deep-leaning method is also applied to plant data processing tasks and shows a significant performance. We analyze and show how the deep-learning method is applied to plant data processing tasks and related industries.