• 제목/요약/키워드: AI Image Recognition

검색결과 126건 처리시간 0.03초

영상인식 기반 학습공간 혼잡도 분석 앱 개발 (Image Recognition-based Learning Space Congestion Analysis App Development)

  • 이주연;이영찬;김민성;조민성;민홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.179-180
    • /
    • 2024
  • 영상에서 객체를 인식하는 다양한 알고리즘이 제안되고 있으며 인식된 결과를 통해 새로운 서비스를 사용자에게 제공하는 사례가 늘어나고 있다. 본 논문에서는 카메라를 탑재한 임베디드 기기에서 영상을 촬영하고 촬영된 영상에서 의자와 사람을 탐지하여 학습공간의 혼잡도를 분석하는 앱을 설계하고 구현하였다. 구현 과정에서 실험을 통해 실시간성 확보 여부와 의자를 통한 빈자리 분할이 가능하다는 것과 앱에서도 모니터링 할 수 있다는 것을 검증하였다.

딥러닝을 이용한 음식 이미지 분류 기술 개발 (Food Image Classification using Deep Learning)

  • 이가경;임세연;양진이;유민정;김선옥
    • 한국빅데이터학회지
    • /
    • 제8권2호
    • /
    • pp.133-140
    • /
    • 2023
  • 본 연구는 20대와 한국인을 대상으로 한 건강관리 애플리케이션의 음식 이미지 분류 모델을 개선하는 것을 목표로 진행되었다. AI Hub에서 546,194개의 이미지를 수집하여 175개의 음식 클래스를 구성하였으며, ResNet 인공지능 모델을 학습하고 검증하였다. 추가적으로, 실제 촬영한 음식 이미지에 대한 인식 정확도가 상대적으로 낮게 나타나는 원인에 대해 고찰하고, 이를 해결하기 위한 방안으로 모델 성능을 최적화를 위한 다양한 방법을 분석하였다.

내장형 인공지능 프로세서를 위한 성능 분석기 (Performance Analyzer for Embedded AI Processor)

  • 황동현;윤영현;한창엽;이승은
    • 인터넷정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.149-157
    • /
    • 2020
  • 최근 인공지능에 대한 관심이 높아짐에 따라 인공지능 프로세서를 하드웨어로 구현하는 연구가 활발히 진행되고 있다. 하지만 인공지능 프로세서는 기존에 기능 검증을 위한 프로세서 시뮬레이션 외에 애플리케이션 단계에서 인공지능 프로세서가 해당 애플리케이션에 적합한지에 대한 성능 검증이 추가로 필요하다. 본 논문에서는 인공지능 프로세서를 활용한 애플리케이션 성능 검증과 프로세서의 한계점을 탐색할 수 있는 내장형 인공지능 프로세서를 위한 성능 분석기를 제안한다. 본 논문은 내장형 인공지능 프로세서를 위한 성능 분석기를 구현하기 위하여 기존에 구현된 인공지능 프로세서의 구조를 분석하고 이를 기반으로 인공지능 프로세서를 모사하는 내장형 인공지능 프로세서를 위한 성능 분석기를 구현한다. 내장형 인공지능 프로세서를 위한 성능 분석기를 활용해 이미지 인식, 음성 인식 애플리케이션에서 인공지능 프로세서의 성능 분석 및 한계점을 탐색하고, 제한된 메모리 크기 안에서 인공지능 프로세서의 구조를 최적화한다.

영상 기반 위치 인식을 위한 대규모 언어-이미지 모델 기반의 Bag-of-Objects 표현 (Large-scale Language-image Model-based Bag-of-Objects Extraction for Visual Place Recognition)

  • 정승운;박병재
    • 센서학회지
    • /
    • 제33권2호
    • /
    • pp.78-85
    • /
    • 2024
  • We proposed a method for visual place recognition that represents images using objects as visual words. Visual words represent the various objects present in urban environments. To detect various objects within the images, we implemented and used a zero-shot detector based on a large-scale image language model. This zero-shot detector enables the detection of various objects in urban environments without additional training. In the process of creating histograms using the proposed method, frequency-based weighting was applied to consider the importance of each object. Through experiments with open datasets, the potential of the proposed method was demonstrated by comparing it with another method, even in situations involving environmental or viewpoint changes.

멀티모달 패션 추천 대화 시스템을 위한 개선된 트랜스포머 모델 (Improved Transformer Model for Multimodal Fashion Recommendation Conversation System)

  • 박영준;조병철;이경욱;김경선
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.138-147
    • /
    • 2022
  • 최근 챗봇이 다양한 분야에 적용되어 좋은 성과를 보이면서 쇼핑몰 상품 추천 서비스에도 챗봇을 활용하려는 시도가 많은 이커머스 플랫폼에서 진행되고 있다. 본 논문에서는 사용자와 시스템간의 대화와 패션 이미지 정보에 기반해 사용자가 원하는 패션을 추천하는 챗봇 대화시스템을 위해, 최근 자연어처리, 음성인식, 이미지 인식 등의 다양한 AI 분야에서 좋은 성능을 내고 있는 트랜스포머 모델에 대화 (텍스트) 와 패션 (이미지) 정보를 같이 사용하여 추천의 정확도를 높일 수 있도록 개선한 멀티모달 기반 개선된 트랜스포머 모델을 제안하며, 데이터 전처리(Data preprocessing) 및 학습 데이터 표현(Data Representation)에 대한 분석을 진행하여 데이터 개선을 통한 정확도 향상 방법도 제안한다. 제안 시스템은 추천 정확도는 0.6563 WKT(Weighted Kendall's tau)으로 기존 시스템의 0.3372 WKT를 0.3191 WKT 이상 크게 향상시켰다.

Development and Evaluation of the V-Catch Vision System

  • Kim, Dong Keun;Cho, Yongjoo;Park, Kyoung Shin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.45-52
    • /
    • 2022
  • 체감형 스포츠 게임은 센서나 카메라를 이용하여 사용자의 신체 움직임을 추적하고 현실감을 느끼게 하는 운동 게임이다. 최근 체감형 스포츠 게임을 학교 체육활동에 사용하기 위해 가상현실 실내 스포츠룸 시스템을 설치하고 있다. 그러나 이러한 시스템은 주로 화면 터치 사용자 상호작용을 사용한다. 본 연구에서는 2차원 벽 터치 인터랙션이 아닌 3차원 공간에서 사용자의 움직임을 추적할 수 있도록 AI 이미지 인식 기술을 사용하는 브이캐치 비전 시스템을 개발했다. 그리고 본 시스템의 운동 효과를 알아보기 위하여 사용성 평가 실험을 진행했다. 실험에서 피험자에게 혈중 산소 포화도와 실시간 심박변이와 키넥트 골격 이동량, 각도 변화량을 측정하여 정량적 운동 효과를 살펴보았다. 실험 결과 브이캐치 비젼 시스템 사용 시 통계적으로 유의미한 심박수 증가와 신체 움직임양 증가로 운동 효과가 있었던 것으로 나타났다. 실험후 설문조사 주관적 평가 결과에서 대부분의 피실험자들은 이 시스템을 사용한 운동이 재미있고 만족스러워했다.

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.

저화질 안면 이미지의 화질 개선를 통한 안면 특징점 검출 모델의 성능 향상 (Enhancing the performance of the facial keypoint detection model by improving the quality of low-resolution facial images)

  • 이경욱;이예진;박종혁
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.171-187
    • /
    • 2023
  • 저화소의 감시카메라와 같은 촬영 장비를 통해 사람의 얼굴을 인식할 경우, 화질이 낮아 얼굴을 포착하기 어렵다는 문제점이 있다. 이렇게, 사람의 얼굴을 인식하기 어렵다면 범죄용의자나 실종자를 특정해내지 못하는 등의 문제가 발생할 수 있다. 기존 이미지 속 안면 인식에 관한 연구들에서는 정제된 데이터셋을 사용하였기 때문에 다양한 환경에서의 성능을 가늠하기 어렵다는 한계가 존재한다. 이에, 본 논문에서는 저화질 이미지에서 안면 인식 성능이 떨어지는 문제를 해결하기 위해 다양한 환경을 고려한 저화질 안면 이미지에 대해 화질 개선을 수행하여 고화질 이미지를 생성한 뒤, 안면 특징점 검출의 성능 향상시키는 방법을 제안한다. 제안 방법의 현실 적용 가능성을 확인하기 위해 전체 이미지에서 사람이 상대적으로 작게 나타나는 데이터셋을 선정하여 실험을 수행하였다. 또한 마스크 착용 상황을 고려한 안면 이미지 데이터셋을 선정하여, 현실 문제로의 확장 가능성을 탐구하였다. 안면 이미지의 화질을 개선하여 특징점 검출 모델의 성능을 측정한 결과, 개선 후 안면의 검출 여부는 마스크를 착용하지 않은 이미지의 경우 평균 3.47배, 마스크를 착용한 경우 평균 9.92배로 성능 향상을 확인할 수 있었다. 안면 특징점에 대한 RMSE는 마스크를 착용한 이미지의 경우 평균 8.49배 감소, 마스크를 착용하지 않은 경우 평균 2.02배 감소한 것을 확인할 수 있었다. 이에, 화질 개선을 통해 저화질로 포착된 안면 이미지에 대한 인식률을 높여 제안 방법의 활용 가능성을 확인할 수 있었다.

이미지 잡음에 강인한 CNN 기반 건물 인식 방법 (CNN-based Building Recognition Method Robust to Image Noises)

  • 이효찬;박인학;임태호;문대철
    • 한국정보통신학회논문지
    • /
    • 제24권3호
    • /
    • pp.341-348
    • /
    • 2020
  • 인간의 눈과 같이 이미지에서 유용한 정보를 추출하는 기능은 인공지능 컴퓨터 구현에 필수적인 인터페이스 기술이다. 이미지에서 건물을 인식하여 추론하는 기술은 다양한 형태의 건물 외관, 계절에 따른 주변 잡음 이미지의 변화, 각도 및 거리에 따른 왜곡 등으로 다른 이미지 인식 기술 보다 인식률이 떨어진다. 지금까지 제시된 컴퓨터 비전(Computer Vision) 기반의 건물 인식 알고리즘들은 건물 특성을 수작업으로 정의하기 때문에 분별력과 확장성에 한계가 있다. 본 논문은 최근 이미지 인식에 유용한 딥러닝의 CNN(Convolutional Neural Network) 모델을 활용하는데 건물 외관에 나타나는 변화, 즉 계절, 조도, 각도 및 원근에 의해 떨어지는 인식률을 향상시키는 새로운 방법을 제안한다. 건물 전체 이미지와 함께 건물의 특징을 나타내는 부분 이미지들, 즉 창문이나 벽재 이미지의 데이터 세트를 함께 학습시키고 건물 인식에 활용함으로써 일반 CNN 모델 보다 건물 인식률을 약 14% 향상됨을 실험으로 증명하였다.

구조형상 공간상관을 고려한 인공지능 기반 변위 추정 (Estimation of Displacements Using Artificial Intelligence Considering Spatial Correlation of Structural Shape)

  • 신승훈;김지영;우종열;김대건;진태석
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.1-7
    • /
    • 2023
  • 본 논문에서는 구조물의 부분 변위값으로 전체 구조물의 변위 형상을 예측할 수 있는 인공지능 학습기법을 개발하였으며, 개발된 기술의 성능을 실험을 통해 평가하였다. 3차원 공간에서 변위 형상 및 노드 위치 좌표의 특성을 학습에 반영할 수 있는 Image-to-Image 변위 형상 학습과 위치 특징을 결합한 변위 상관 학습 방법을 제시하였다. 개발된 인공지능 학습방법의 성능을 평가하기 위해 목업 구조 실험을 진행하였고, 3D 스캔으로 측정한 변위값과 인공지능으로 예측한 결과를 비교하였다. 비교 결과 인공지능 예측 결과는 3D 스캔 측정 결과에 비해 5.6~5.9%의 오차율을 보여 적정 성능을 보였다.