• 제목/요약/키워드: Learning Object

검색결과 1,545건 처리시간 0.037초

Unity ML-Agents Toolkit을 활용한 대상 객체 추적 머신러닝 구현 (Implementation of Target Object Tracking Method using Unity ML-Agent Toolkit)

  • 한석호;이용환
    • 반도체디스플레이기술학회지
    • /
    • 제21권3호
    • /
    • pp.110-113
    • /
    • 2022
  • Non-playable game character plays an important role in improving the concentration of the game and the interest of the user, and recently implementation of NPC with reinforcement learning has been in the spotlight. In this paper, we estimate an AI target tracking method via reinforcement learning, and implement an AI-based tracking agency of specific target object with avoiding traps through Unity ML-Agents Toolkit. The implementation is built in Unity game engine, and simulations are conducted through a number of experiments. The experimental results show that outstanding performance of the tracking target with avoiding traps is shown with good enough results.

A New CSR-DCF Tracking Algorithm based on Faster RCNN Detection Model and CSRT Tracker for Drone Data

  • Farhodov, Xurshid;Kwon, Oh-Heum;Moon, Kwang-Seok;Kwon, Oh-Jun;Lee, Suk-Hwan;Kwon, Ki-Ryong
    • 한국멀티미디어학회논문지
    • /
    • 제22권12호
    • /
    • pp.1415-1429
    • /
    • 2019
  • Nowadays object tracking process becoming one of the most challenging task in Computer Vision filed. A CSR-DCF (channel spatial reliability-discriminative correlation filter) tracking algorithm have been proposed on recent tracking benchmark that could achieve stat-of-the-art performance where channel spatial reliability concepts to DCF tracking and provide a novel learning algorithm for its efficient and seamless integration in the filter update and the tracking process with only two simple standard features, HoGs and Color names. However, there are some cases where this method cannot track properly, like overlapping, occlusions, motion blur, changing appearance, environmental variations and so on. To overcome that kind of complications a new modified version of CSR-DCF algorithm has been proposed by integrating deep learning based object detection and CSRT tracker which implemented in OpenCV library. As an object detection model, according to the comparable result of object detection methods and by reason of high efficiency and celerity of Faster RCNN (Region-based Convolutional Neural Network) has been used, and combined with CSRT tracker, which demonstrated outstanding real-time detection and tracking performance. The results indicate that the trained object detection model integration with tracking algorithm gives better outcomes rather than using tracking algorithm or filter itself.

고해상도 단순 이미지의 객체 분류 학습모델 구현을 위한 개선된 CNN 알고리즘 연구 (Study of Improved CNN Algorithm for Object Classification Machine Learning of Simple High Resolution Image)

  • 이협건;김영운
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.41-49
    • /
    • 2023
  • CNN(Convolutional Neural Network) 알고리즘은 인공신경망 구현에 활용되는 대표적인 알고리즘으로 기존 FNN(Fully connected multi layered Neural Network)의 문제점인 연산의 급격한 증가와 낮은 객체 인식률을 개선하였다. 그러나 IT 기기들의 급격한 발달로 최근 출시된 스마트폰 및 태블릿의 카메라에 촬영되는 이미지들의 최대 해상도는 108MP로 약 1억 8백만 화소이다. 특히 CNN 알고리즘은 고해상도의 단순 이미지를 학습 및 처리에 많은 비용과 시간이 요구된다. 이에 본 논문에서는 고해상도 단순 이미지의 객체 분류 학습모델 구현을 위한 개선된 CNN 알고리즘을 제안한다. 제안하는 알고리즘은 고해상도의 이미지들의 학습모델 생성 시간을 감소하기 위해 CNN 알고리즘의 풀링계층의 Max Pooling 알고리즘 연산을 위한 인접 행렬 값을 변경한다. 변경한 행렬 값마다 4MP, 8MP, 12MP의 고해상도 이미지들의 처리할 수 있는 학습 모델들을 구현한다. 성능평가 결과, 제안하는 알고리즘의 학습 모델의 생성 시간은 12MP 기준 약 36.26%의 감소하고, 학습 모델의 객체 분류 정확도와 손실률은 기존 모델 대비 약 1% 이내로 오차 범위 안에 포함되어 크게 문제가 되지 않는다. 향후 본 연구에서 사용된 학습 데이터보다 다양한 이미지 종류 및 실제 사진으로 학습 모델을 구현한 실질적인 검증이 필요하다.

무인 항공기를 이용한 밀집영역 자동차 탐지 (Vehicle Detection in Dense Area Using UAV Aerial Images)

  • 서창진
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.693-698
    • /
    • 2018
  • 본 논문은 최근 물체탐지 분야에서 실시간 물체 탐지 알고리즘으로 주목을 받고 있는 YOLOv2(You Only Look Once) 알고리즘을 이용하여 밀집 영역에 주차되어 있는 자동차 탐지 방법을 제안한다. YOLO의 컨볼루션 네트워크는 전체 이미지에서 한 번의 평가를 통해서 직접적으로 경계박스들을 예측하고 각 클래스의 확률을 계산하고 물체 탐지 과정이 단일 네트워크이기 때문에 탐지 성능이 최적화 되며 빠르다는 장점을 가지고 있다. 기존의 슬라이딩 윈도우 접근법과 R-CNN 계열의 탐지 방법은 region proposal 방법을 사용하여 이미지 안에 가능성이 많은 경계박스를 생성하고 각 요소들을 따로 학습하기 때문에 최적화 및 실시간 적용에 어려움을 가지고 있다. 제안하는 연구는 YOLOv2 알고리즘을 적용하여 기존의 알고리즘이 가지고 있는 물체 탐지의 실시간 처리 문제점을 해결하여 실시간으로 지상에 있는 자동차를 탐지하는 방법을 제안한다. 제안하는 연구 방법의 실험을 위하여 오픈소스로 제공되는 Darknet을 사용하였으며 GTX-1080ti 4개를 탑재한 Deep learning 서버를 이용하여 실험하였다. 실험결과 YOLO를 활용한 자동차 탐지 방법은 기존의 알고리즘 보다 물체탐지에 대한 오버헤드를 감소 할 수 있었으며 실시간으로 지상에 존재하는 자동차를 탐지할 수 있었다.

Online Multi-Object Tracking by Learning Discriminative Appearance with Fourier Transform and Partial Least Square Analysis

  • Lee, Seong-Ho;Bae, Seung-Hwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.49-58
    • /
    • 2020
  • 본 연구는 온라인 다중 객체 추적 환경에서 모든 객체의 상태(예. 위치 및 크기) 및 identifications (IDs)를 추적하는 문제를 다룬다. 프레임들 간 검출 결과들을 연관하여 객체들의 궤도를 점진적으로 완성하는 tracking-by-detection 접근법을 기반으로 온라인 다중 객체 추적 문제를 해결하고자 한다. 정확한 온라인 연관을 수행하기 위해 이산 푸리에 변환과 부분 최소 제곱법(partial least square, PLS) 분석을 기반으로 하는 새로운 온라인 외형 학습 방법을 제안한다. 즉, 먼저 주파수 도메인에서 추적에 용이한 객체 특징량을 추출하기 위해 추적 객체에 대한 이미지를 푸리에 이미지로 변환한다. 나아가 객체간의 주파수 특징을 보다 잘 구별할 수 있도록 PLS기반 부분 공간을 학습한다. 제안된 외형 학습을 최신 신뢰도 기반 연관 기법과 결합하였고, 다중 객체 추적평가 분야에서 국제적으로 공인된 MOT 벤치마크 챌린지 데이터 셋에서 최신 다중 객체 추적 알고리즘과 비교평가를 수행하였다.

차량 감시영상에서 그림자 제거를 통한 효율적인 차종의 학습 및 분류 (Efficient Learning and Classification for Vehicle Type using Moving Cast Shadow Elimination in Vehicle Surveillance Video)

  • 신욱선;이창훈
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.1-8
    • /
    • 2008
  • 일반적으로 감시영상에서 움직이는 물체들은 배경빼기 혹은 프레임 차를 이용하여 추출된다. 하지만 객체에 의해서 만들어지는 그림자는 심각한 탐지의 오류를 야기시킬 수 있다. 특히, 도로 상에 설치된 감시카메라로부터 획득된 영상으로부터 차량 정보를 분석할 때, 차량에 의해서 생성되는 그림자로 인하여 차량의 모양을 왜곡시켜 부정확한 결과를 만든다. 때문에 그림자의 제거는 감시 영상 내에서의 정확한 객체 추출을 위해서 반드시 필요하다. 본 논문은 도로감시영상 내에서 움직이는 차량의 차종판별 성능을 향상시키기 위한 움직이는 객체 내에 만들어지는 그림자를 제거한다. 제거된 객체의 영역은 소실점을 이용하여 3차원 객체로 피팅(Fitting)한 후 측정된 데이터를 감독 학습하여 원하는 차종 판별결과를 얻는데 사용한다. 실험은 3가지 기계학습 방법{IBL, C4.5, NN(Neural Network)}을 이용하여 그림자의 제거가 차종의 판별성능에 미치는 결과의 평가한다.

딥러닝과 센서를 이용한 서비스용 로봇 팔의 설계 (Design of Robot Arm for Service Using Deep Learning and Sensors)

  • 박명숙;김규태;구모세;고영준;김상훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권5호
    • /
    • pp.221-228
    • /
    • 2022
  • 인공지능 기술의 적용으로 로봇이 실생활에서 효율성 높은 서비스를 제공할 수 있게 되었다. 본 연구에서는 단순 반복적 작업을 하는 산업용 매니퓰레이터와 달리 서비스 로봇 분야에서 장소의 제약 없이 단독으로 또는 협업하여 사용하기 위한 6자유도 로봇 팔의 설계방법과 지능적인 물체 검출 및 이동 방법을 제시하고 성능을 검증하였다. 로봇 팔에 포함된 임베디드 보드의 ROS 환경에서 깊이 카메라와 딥러닝을 이용하여 로봇팔은 물체를 검출하고, 역기구학 해석을 통해 물체 영역으로 이동한다. 또한 물체와 접촉 시 힘센서 값의 분석을 통해 물체를 정확히 잡고 이동하는 동작이 가능하게 하였다. 제작한 로봇 팔에 대한 성능검증을 위하여 딥러닝과 영상처리를 통한 물체의 정확한 위치 산출, 모터 제어 및 물체 분리에 대한 실험을 하였으며, 실제 동작 여부를 확인하기 위하여 카페에서 흔히 사용하는 다양한 컵들을 분리하는 실험을 수행하였다.

모바일 교육 시스템을 위한 효율적인 영상 검색 구축 (Effective Image Retrieval for the M-Learning System)

  • 한은정;박안진;정기철
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.658-670
    • /
    • 2006
  • 교육 매개체의 디지털화를 위해 정보 통신망과 기술을 본격적으로 교육에 도입함으로써 교육의 패러다임이 e-learning(electronics learning)으로 이동하고 있다. 그러나 e-learning 콘텐츠는 컴퓨터가 있는 장소에서만 제공받을 수 있기 때문에, 언제 어디서나 사용자가 원할 때 교육받기 힘든 단점이 있으며, 기존 오프라인 콘텐츠를 e-learning 콘텐츠로 재구성하기 위해 많은 비용과 시간이 소요된다. 본 논문에서는 정적인 2차원 시각 정보만을 제공하는 기존 오프라인 콘텐츠의 그림 영상에 모바일 기기를 이용하여 동적인 인터랙션과 다양한 멀티미디어 정보를 융합할 수 있는 교육용 모바일 콘텐츠 (education mobile contents: EMC) 시스템을 제안한다. 제안된 영어 교육 콘텐츠는 기존 오프라인 콘텐츠의 그림 영상을 저해상도 카메라가 장착된 모바일 기기로 인식하기 위해 모양 기반의 영상 검색 방법을 이용하며, 수행속도와 크기와 기울기 변화에 강건한 시작점 일치를 통한 차분 체인코드 (differential chain code)를 사용한 DTW(dynamic time warping)를 이용한다. EMC는 모바일 기기를 이용하여 장소에 상관없이 오프라인 콘텐츠에 적합한 온라인 콘텐츠를 빠르고 정확하게 제공할 수 있다.

  • PDF

비디오 모니터링 환경에서 정확한 돼지 탐지 (Accurate Pig Detection for Video Monitoring Environment)

  • 안한세;손승욱;유승현;서유일;손준형;이세준;정용화;박대희
    • 한국멀티미디어학회논문지
    • /
    • 제24권7호
    • /
    • pp.890-902
    • /
    • 2021
  • Although the object detection accuracy with still images has been significantly improved with the advance of deep learning techniques, the object detection problem with video data remains as a challenging problem due to the real-time requirement and accuracy drop with occlusion. In this research, we propose a method in pig detection for video monitoring environment. First, we determine a motion, from a video data obtained from a tilted-down-view camera, based on the average size of each pig at each location with the training data, and extract key frames based on the motion information. For each key frame, we then apply YOLO, which is known to have a superior trade-off between accuracy and execution speed among many deep learning-based object detectors, in order to get pig's bounding boxes. Finally, we merge the bounding boxes between consecutive key frames in order to reduce false positive and negative cases. Based on the experiment results with a video data set obtained from a pig farm, we confirmed that the pigs could be detected with an accuracy of 97% at a processing speed of 37fps.

딥러닝 기반 객체 인식을 활용한 퍼스널 모빌리티 안전 보조 시스템 개발 (Development of Personal Mobility Safety Assistants using Object Detection based on Deep Learning)

  • Kwak, Hyeon-Seo;Kim, Min-Young;Jeon, Ji-Yong;Jeong, Eun-Hye;Kim, Ju-Yeop;Hyeon, So-Dam;Jeong, Jin-Woo
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.486-489
    • /
    • 2021
  • Recently, the demand for the use of personal mobility vehicles, such as an electric kickboard, is increasing explosively because of its high portability and usability. However, the number of traffic accidents caused by personal mobility vehicles has also increased rapidly in recent years. To address the issues regarding the driver's safety, we propose a novel approach that can monitor context information around personal mobility vehicles using deep learning-based object detection and smartphone captured videos. In the proposed framework, a smartphone is attached to a personal mobility device and a front or rear view is recorded to detect an approaching object that may affect the driver's safety. Through the detection results using YOLOv5 model, we report the preliminary results and validated the feasibility of the proposed approach.