• 제목/요약/키워드: Target-object Recognition

검색결과 130건 처리시간 0.026초

YOLOX와 OC-SORT 기반의 효율적인 소 행동 인식을 통한 승가 운동 감지시스템 (A climbing movement detection system through efficient cow behavior recognition based on YOLOX and OC-SORT)

  • 위리;김남호
    • 스마트미디어저널
    • /
    • 제12권7호
    • /
    • pp.18-26
    • /
    • 2023
  • 본 연구에서는 YOLOX와 OC-SORT를 기반으로 한 소 행동 인식시스템을 제시하였다. YOLOX는 실시간으로 목표를 감지하고 소의 위치와 행동 정보를 제공한다. OC-SORT 모듈은 비디오에서 소를 추적하고 고유 ID를 할당하는 역할을 한다. 양적 분석 모듈은 소의 행동과 위치 정보를 분석한다. 실험 결과, 우리의 시스템은 목표 감지와 추적에서 높은 정확도와 정밀도를 보여주었다. YOLOX의 평균 정확도(AP)는 82.2%, 평균 재현율(AR)는 85.5%, 매개변수 양은 54.15M, 계산량은 194.16GFLOP이었다. OC-SORT는 복잡한 환경과 가림막 상황에서도 높은 정밀도의 실시간 목표 추적을 유지할 수 있었다. 소의 운동 변화와 승가행동의 빈도를 분석함으로써, 제안 시스템은 소의 발정 행동을 더 정확하게 판별하는데 도움을 줄 수 있다.

표적 구분을 위한 ISAR 영상 기법에 대한 연구 (A Study on ISAR Imaging Algorithm for Radar Target Recognition)

  • 박종일;김경태
    • 한국전자파학회논문지
    • /
    • 제19권3호
    • /
    • pp.294-303
    • /
    • 2008
  • ISAR(Inverse Synthetic Aperture Radar) 영상은 표적에 대한 RCS(Radar Cross Section)를 2차원 공간에 표현하며, 표적구분에 이용될 수 있다. 2차원 IFFT(Inverse fast Fourier Transform)를 이용하여 쉽고 빠르게 ISAR 영상을 만들 수 있다. 하지만 IFFT를 이용하여 만든 ISAR 영상은 측정된 주파수 대역 폭과 각도 영역이 작아질 경우 해상도가 떨어지게 된다. 이를 해결하기 위해 AR(Auto Regressive), MUSIC(Multiple SIgnal Classification), Modified MUSIC과 같은 고해상도 스펙트럼 예측 기법을 이용하여 주파수 대역 폭과 각도 영역이 작아도 높은 해상도의 ISAR 영상을 만들 수 있다. 본 논문에서는 IFFT, AR, MUSIC, Modified MUSIC 기법을 적용하여 만든 ISAR 영상을 이용하여 표적 구분에 이용하고, 표적 구분에 적절한 ISAR 영상을 얻기 위한 고해상도 기법을 연구한다. 그리고 표적 구분 결과를 보여준다.

STAR-24K: A Public Dataset for Space Common Target Detection

  • Zhang, Chaoyan;Guo, Baolong;Liao, Nannan;Zhong, Qiuyun;Liu, Hengyan;Li, Cheng;Gong, Jianglei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.365-380
    • /
    • 2022
  • The target detection algorithm based on supervised learning is the current mainstream algorithm for target detection. A high-quality dataset is the prerequisite for the target detection algorithm to obtain good detection performance. The larger the number and quality of the dataset, the stronger the generalization ability of the model, that is, the dataset determines the upper limit of the model learning. The convolutional neural network optimizes the network parameters in a strong supervision method. The error is calculated by comparing the predicted frame with the manually labeled real frame, and then the error is passed into the network for continuous optimization. Strongly supervised learning mainly relies on a large number of images as models for continuous learning, so the number and quality of images directly affect the results of learning. This paper proposes a dataset STAR-24K (meaning a dataset for Space TArget Recognition with more than 24,000 images) for detecting common targets in space. Since there is currently no publicly available dataset for space target detection, we extracted some pictures from a series of channels such as pictures and videos released by the official websites of NASA (National Aeronautics and Space Administration) and ESA (The European Space Agency) and expanded them to 24,451 pictures. We evaluate popular object detection algorithms to build a benchmark. Our STAR-24K dataset is publicly available at https://github.com/Zzz-zcy/STAR-24K.

3차원 LiDAR 점군 데이터에서의 가상 차량 데이터 생성을 위한 구면 점 추적 기법 (Spherical Point Tracing for Synthetic Vehicle Data Generation with 3D LiDAR Point Cloud Data)

  • 이상준;김학일
    • 방송공학회논문지
    • /
    • 제28권3호
    • /
    • pp.329-332
    • /
    • 2023
  • 딥러닝 네트워크를 이용한 3차원 객체 인식 기술은 자율주행 기술 개발에 있어 대상 객체의 종류 뿐만 아니라 센서로부터의 거리도 인식할 수 있기 때문에 장애물 탐지를 위해 많이 개발되고 있다. 하지만 3차원 객체 인식 모델의 경우 원거리 객체에 대한 탐지 성능이 근거리 객체에 대한 인식 성능보다 낮아 차량의 안전을 확보하는 데에 치명적인 문제가 발생할 수 있다. 본 논문에서는 가상의 3차원 차량 데이터를 생성해 모델 학습에 사용되는 데이터셋에 추가하여 3차원 객체 인식 모델의 성능, 특히 원거리의 객체에 대한 성능을 향상시키는 기술을 소개한다. 3차원 라이다 센서 데이터의 특성을 활용한 구면 점 추적 기법을 사용하여 실제 차량과 매우 유사한 가상 차량을 생성하였고, 생성한 가상 차량 데이터를 사용하여 원거리뿐만 아니라 모든 거리 영역 범위에서의 객체 인식 성능을 향상시킴으로써 가상 데이터의 학습 유효성을 입증하였다.

도로표지 정보 활용을 위한 도로표지 인식 및 지오콘텐츠 생성 기법 (Road Sign Recognition and Geo-content Creation Schemes for Utilizing Road Sign Information)

  • 성택영;문광석;이석환;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제19권2호
    • /
    • pp.252-263
    • /
    • 2016
  • Road sign is an important street furniture that gives some information such as road conditions, driving direction and condition for a driver. Thus, road sign is a major target of image recognition for self-driving car, ADAS(autonomous vehicle and intelligent driver assistance systems), and ITS(intelligent transport systems). In this paper, an enhanced road sign recognition system is proposed for MMS(Mobile Mapping System) using the single camera and GPS. For the proposed system, first, a road sign recognition scheme is proposed. this scheme is composed of detection and classification step. In the detection step, object candidate regions are extracted in image frames using hybrid road sign detection scheme that is based on color and shape features of road signs. And, in the classification step, the area of candidate regions and road sign template are compared. Second, a Geo-marking scheme for geo-content that is consist of road sign image and coordinate value is proposed. If the serious situation such as car accident is happened, this scheme can protect geographical information of road sign against illegal users. By experiments with test video set, in the three parts that are road sign recognition, coordinate value estimation and geo-marking, it is confirmed that proposed schemes can be used for MMS in commercial area.

CNN 모델과 FMM 신경망을 이용한 동적 수신호 인식 기법 (Dynamic Hand Gesture Recognition Using CNN Model and FMM Neural Networks)

  • 김호준
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.95-108
    • /
    • 2010
  • 본 연구에서는 동영상으로부터 동적 수신호 패턴을 효과적으로 인식하기 위한 방법론으로서 복합형 신경망 모델을 제안한다. 제안된 모델은 특징추출 모듈과 패턴분류 모듈로 구성되는데, 이들 각각을 위하여 수정된 구조의 CNN 모델과, WFMM 모델을 도입한다. 또한 목표물의 움직임 정보에 기초한 시공간적 템플릿 구조의 데이터표현을 소개한다. 본 논문에서는 우선 수신호 패턴 데이터에서 특징점의 시간적 변이 및 공간적 변이에 의한 영향을 보완하기 위하여 3차원 수용영역 구조로 확장된 CNN 모델을 제시한다. 이어서 패턴분류 단계를 위하여 가중치를 갖는 구조의 FMM 신경망 모델을 소개하고, 신경망의 구조와 동작특성에 관해 기술한다. 또한 제안된 모델이 기존의 FMM 신경망에서 중첩 하이퍼박스의 축소과정에서 발생하는 학습효과의 왜곡현상을 개선할 수 있음을 보인다. 응용으로 가전제품 원격제어 문제를 전제하여 간략화된 수신호패턴 인식 문제에 적용한 실험결과로부터 제안된 이론의 타당성을 고찰한다.

인간의 일상동작 인식을 위한 동작 데이터 모델링과 가시화 기법 (Activity Data Modeling and Visualization Method for Human Life Activity Recognition)

  • 최정인;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제15권8호
    • /
    • pp.1059-1066
    • /
    • 2012
  • 오늘날 스마트폰의 발전으로 스마트폰 내장 센서를 통해 사용자의 개인 정보를 쉽게 파악 할 수 있고 원한다면 사용자의 위치를 실시간으로 알아낼 수 있다. 그리하여 센서를 통해 추출된 데이터를 통해 동작인식과 생활 패턴 인식에 관한 연구가 급증하고 있다. 본 논문에서는 기존의 동작 인식 연구에서 추출되는 데이터를 정형화하기 위해 동작 데이터를 모델링하였다. 본 논문의 일상 동작 모델링은 이론적 분석이다. 동작을 크게 두 가지로 분류시켜 가속도 센서만으로 인식 가능한 기본 동작을 물리적 동작으로 정의하고 그 외 목적과 대상, 장소를 포함하는 모든 동작을 논리적 동작으로 분류시켰다. 모델링 된 데이터를 기반으로 각 동작의 특성에 맞게 가시화 하는 방안을 제안하였다. 본 연구를 통해 인간의 일상생활을 동작별로 간편하게 표준화 할 수 있고 기존의 동작 인식 연구에서 추출되는 동작 데이터를 사용자의 요구에 따라 가시화 할 수 있다.

Fuzzy C-means와 CONDENSATION을 이용한 객체 검출 및 추적 시스템 (An Object Detection and Tracking System using Fuzzy C-means and CONDENSATION)

  • 김종호;김상균;황구선;안상호;강병두
    • 한국산업정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.87-98
    • /
    • 2011
  • 동영상에서의 움직이는 객체 검출과 추적은 객체 식별, 상황인식, 지능형 영상 감시 시스템 등 많은 시각 기반 응용 시스템에서 기본적이고 필수적인 전처리 작업이다. 본 논문에서는 배경과 조명이 실시간으로 변화하는 상황에서 움직이는 객체를 빠르고 정확하게 추출하고 움직이는 객체가 다른 물체에 가려지는 경우에도 강인하게 객체를 추적하는 방법을 제안한다. 객체의 효과적인 검출을 위해서 효과적인 고유 공간과 Fuzzy C-means(FCM) 를 결합하여 사용하고 검출된 객체를 강인하게 추적하기 위해 Conditional Density Propagation (CONDENSATION) 알고리즘을 사용한다. 먼저 Principal Component Analysis(PCA)를 이용하여 배경 영상에서 수집한 학습데이터를 주성분(Principal component)으로 선형변환 한다. 주성분들의 고유 특성에 대한 해석을 통하여 객체와 배경에 대하여 판별 능력이 우수한 주성분을 선별하여 고유 배경을 구성한다. 다음으로 이전단계에서 구성된 고유 벡터와 입력 영상을 결합한 연산 결과를 FCM의 입력 값으로 사용해서 객체를 검출한다. 최종적으로 검출된 객체의 좌표를 CONDENSATION의 입력으로 사용해서 객체를 추적한다. 고정된 카메라에서 조명변화와 배경변화에 적용 가능한 시스템을 구현하기 위해 고정된 카메라에서 움직이는 다양한 객체가 포함된 영상을 수집하여 학습데이터로 구성하여 사용하였다. 실험 결과에 따르면 제안하는 방법이 조명변화와 배경변화 그리고 객체의 부분적 움직임에 모두 강인하게 객체를 검출하고 다른 물체나 배경에 의해 객체가 일부 가려지더라도 객체를 추적함을 보여준다.

An Analysis on the Properties of Features against Various Distortions in Deep Neural Networks

  • Kang, Jung Heum;Jeong, Hye Won;Choi, Chang Kyun;Ali, Muhammad Salman;Bae, Sung-Ho;Kim, Hui Yong
    • 방송공학회논문지
    • /
    • 제26권7호
    • /
    • pp.868-876
    • /
    • 2021
  • Deploying deep neural network model training performs remarkable performance in the fields of Object detection and Instance segmentation. To train these models, features are first extracted from the input image using a backbone network. The extracted features can be reused by various tasks. Research has been actively conducted to serve various tasks by using these learned features. In this process, standardization discussions about encoding, decoding, and transmission methods are proceeding actively. In this scenario, it is necessary to analyze the response characteristics of features against various distortions that may occur in the data transmission or data compression process. In this paper, experiment was conducted to inject various distortions into the feature in the object recognition task. And analyze the mAP (mean Average Precision) metric between the predicted value output from the neural network and the target value as the intensity of various distortions was increased. Experiments have shown that features are more robust to distortion than images. And this points out that using the feature as transmission means can prevent the loss of information against the various distortions during data transmission and compression process.

Design of a Recognizing System for Vehicle's License Plates with English Characters

  • Xing, Xiong;Choi, Byung-Jae;Chae, Seog;Lee, Mun-Hee
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제9권3호
    • /
    • pp.166-171
    • /
    • 2009
  • In recent years, video detection systems have been implemented in various infrastructures such as airport, public transportation, power generation system, water dam and so on. Recognizing moving objects in video sequence is an important problem in computer vision, with applications in several fields, such as video surveillance and target tracking. Segmentation and tracking of multiple vehicles in crowded situations is made difficult by inter-object occlusion. In the system described in this paper, the mean shift algorithm is firstly used to filter and segment a color vehicle image in order to get candidate regions. These candidate regions are then analyzed and classified in order to decide whether a candidate region contains a license plate or not. And then some characters in the license plate is recognized by using the fuzzy ARTMAP neural network, which is a relatively new architecture of the neural network family and has the capability to learn incrementally unlike the conventional BP network. We finally design a license plate recognition system using the mean shift algorithm and fuzzy ARTMAP neural network and show its performance via some computer simulations.