• 제목/요약/키워드: Target-object Recognition

검색결과 130건 처리시간 0.028초

Hand Mouse System Using a Pre-defined Gesture for the Elimination of a TV Remote Controller

  • Kim, Kyung-Won;Bae, Dae-Hee;Yi, Joonhwan;Oh, Seong-Jun
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제1권2호
    • /
    • pp.88-94
    • /
    • 2012
  • Many hand gesture recognition systems using advanced computer vision techniques to eliminate the need for a TV remote controller have been proposed. Nevertheless, some issues still remain, such as high computational complexity and insufficient information on the target object and background. Moreover, none of the proposed techniques consider how to enter the control mode of the system. This means that they may need a TV remote controller to enter the control mode. This paper proposes a hand mouse system using a pre-defined gesture with high background adaptability. By doing so, a remote controller to enter the control mode of the IPTV system can be eliminated.

  • PDF

Robust 2-D Object Recognition Using Bispectrum and LVQ Neural Classifier

  • HanSoowhan;woon, Woo-Young
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.255-262
    • /
    • 1998
  • This paper presents a translation, rotation and scale invariant methodology for the recognition of closed planar shape images using the bispectrum of a contour sequence and the learning vector quantization(LVQ) neural classifier. The contour sequences obtained from the closed planar images represent the Euclidean distance between the centroid and all boundary pixels of the shape, and are related to the overall shape of the images. The higher order spectra based on third order cumulants is applied to tihs contour sample to extract fifteen bispectral feature vectors for each planar image. There feature vector, which are invariant to shape translation, rotation and scale transformation, can be used to represent two0dimensional planar images and are fed into a neural network classifier. The LVQ architecture is chosen as a neural classifier because the network is easy and fast to train, the structure is relatively simple. The experimental recognition processes with eight different hapes of aircraft images are presented to illustrate the high performance of this proposed method even the target images are significantly corrupted by noise.

  • PDF

YOLOv5 based Anomaly Detection for Subway Safety Management Using Dilated Convolution

  • Nusrat Jahan Tahira;Ju-Ryong Park;Seung-Jin Lim;Jang-Sik Park
    • 한국산업융합학회 논문집
    • /
    • 제26권2_1호
    • /
    • pp.217-223
    • /
    • 2023
  • With the rapid advancement of technologies, need for different research fields where this technology can be used is also increasing. One of the most researched topic in computer vision is object detection, which has widely been implemented in various fields which include healthcare, video surveillance and education. The main goal of object detection is to identify and categorize all the objects in a target environment. Specifically, methods of object detection consist of a variety of significant techniq ues, such as image processing and patterns recognition. Anomaly detection is a part of object detection, anomalies can be found various scenarios for example crowded places such as subway stations. An abnormal event can be assumed as a variation from the conventional scene. Since the abnormal event does not occur frequently, the distribution of normal and abnormal events is thoroughly imbalanced. In terms of public safety, abnormal events should be avoided and therefore immediate action need to be taken. When abnormal events occur in certain places, real time detection is required to prevent and protect the safety of the people. To solve the above problems, we propose a modified YOLOv5 object detection algorithm by implementing dilated convolutional layers which achieved 97% mAP50 compared to other five different models of YOLOv5. In addition to this, we also created a simple mobile application to avail the abnormal event detection on mobile phones.

지식 그래프와 딥러닝 모델 기반 텍스트와 이미지 데이터를 활용한 자동 표적 인식 방법 연구 (Automatic Target Recognition Study using Knowledge Graph and Deep Learning Models for Text and Image data)

  • 김종모;이정빈;전호철;손미애
    • 인터넷정보학회논문지
    • /
    • 제23권5호
    • /
    • pp.145-154
    • /
    • 2022
  • 자동 표적 인식(Automatic Target Recognition, ATR) 기술이 미래전투체계(Future Combat Systems, FCS)의 핵심 기술로 부상하고 있다. 그러나 정보통신(IT) 및 센싱 기술의 발전과 더불어 ATR에 관련이 있는 데이터는 휴민트(HUMINT·인적 정보) 및 시긴트(SIGINT·신호 정보)까지 확장되고 있음에도 불구하고, ATR 연구는 SAR 센서로부터 수집한 이미지, 즉 이민트(IMINT·영상 정보)에 대한 딥러닝 모델 연구가 주를 이룬다. 복잡하고 다변하는 전장 상황에서 이미지 데이터만으로는 높은 수준의 ATR의 정확성과 일반화 성능을 보장하기 어렵다. 본 논문에서는 이미지 및 텍스트 데이터를 동시에 활용할 수 있는 지식 그래프 기반의 ATR 방법을 제안한다. 지식 그래프와 딥러닝 모델 기반의 ATR 방법의 핵심은 ATR 이미지 및 텍스트를 각각의 데이터 특성에 맞게 그래프로 변환하고 이를 지식 그래프에 정렬하여 지식 그래프를 매개로 이질적인 ATR 데이터를 연결하는 것이다. ATR 이미지를 그래프로 변환하기 위해서, 사전 학습된 이미지 객체 인식 모델과 지식 그래프의 어휘를 활용하여 객체 태그를 노드로 구성된 객체-태그 그래프를 이미지로부터 생성한다. 반면, ATR 텍스트는 사전 학습된 언어 모델, TF-IDF, co-occurrence word 그래프 및 지식 그래프의 어휘를 활용하여 ATR에 중요한 핵심 어휘를 노드로 구성된 단어 그래프를 생성한다. 생성된 두 유형의 그래프는 엔터티 얼라이먼트 모델을 활용하여 지식 그래프와 연결됨으로 이미지 및 텍스트로부터의 ATR 수행을 완성한다. 제안된 방법의 우수성을 입증하기 위해 웹 문서로부터 227개의 문서와 dbpedia로부터 61,714개의 RDF 트리플을 수집하였고, 엔터티 얼라이먼트(혹은 정렬)의 accuracy, recall, 및 f1-score에 대한 비교실험을 수행하였다.

RBFNNs 패턴분류기와 객체 추적 알고리즘을 이용한 얼굴인식 및 추적 시스템 설계 (Design of Face Recognition and Tracking System by Using RBFNNs Pattern Classifier with Object Tracking Algorithm)

  • 오승훈;오성권;김진율
    • 전기학회논문지
    • /
    • 제64권5호
    • /
    • pp.766-778
    • /
    • 2015
  • In this paper, we design a hybrid system for recognition and tracking realized with the aid of polynomial based RBFNNs pattern classifier and particle filter. The RBFNN classifier is built by learning the training data for diverse pose images. The optimized parameters of RBFNN classifier are obtained by Particle Swarm Optimization(PSO). Testing data for pose image is used as a face image obtained under real situation, where the face image is detected by AdaBoost algorithm. In order to improve the recognition performance for a detected image, pose estimation as preprocessing step is carried out before the face recognition step. PCA is used for pose estimation, the pose of detected image is assigned for the built pose by considering the featured difference between the previously built pose image and the newly detected image. The recognition of detected image is performed through polynomial based RBFNN pattern classifier, and if the detected image is equal to target for tracking, the target will be traced by particle filter in real time. Moreover, when tracking is failed by PF, Adaboost algorithm detects facial area again, and the procedures of both the pose estimation and the image recognition are repeated as mentioned above. Finally, experimental results are compared and analyzed by using Honda/UCSD data known as benchmark DB.

정확히 재가중되는 온라인 전체 에러율 최소화 기반의 객체 추적 (Object Tracking Based on Exactly Reweighted Online Total-Error-Rate Minimization)

  • 장세인;박충식
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.53-65
    • /
    • 2019
  • 영상 기반의 보안 시스템의 증가함에 따라 각 용도마다 다른 다양한 객체들에 대한 처리들이 중요해지고 있다. 객체 추적은 객체 인식, 검출과 같은 작업들과 함께 필수적인 작업으로 다뤄진다. 이 객체 추적을 달성하기 위해서 다양한 머신러닝이 적용될 수 있다. 성공적인 분류기로써 전체 에러율 최소화(total-error-rate minimization) 기반의 방법론이 사용될 수 있다. 이 전체 에러율 최소화 기반의 방법론은 오프라인 학습을 기반으로 하고 있다. 객체 추적은 실시간으로 처리하며 갱신해야하는 것이 필수적이므로 온라인 학습(online learning)을 기반으로 하는 것이 적합하다. 온라인 전체 에러율 최소화 방법론이 개발되었지만 점근적으로 재가중되는(approximately reweighted) 작업이 포함되어 에러를 누적시킬 수 있다는 단점이 있다. 본 논문에서는 정확하게 재가중되는(exactly reweighted) 방법론을 제안하면서 온라인 전체 에러율 최소화가 달성되었다. 이 제안된 온라인 학습 방법론을 객체 추적에 적용하여 총 8개의 데이터베이스에서 다른 추적 방법론들 보다 좋은 성능이 달성되었다.

2D Human Pose Estimation based on Object Detection using RGB-D information

  • Park, Seohee;Ji, Myunggeun;Chun, Junchul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권2호
    • /
    • pp.800-816
    • /
    • 2018
  • In recent years, video surveillance research has been able to recognize various behaviors of pedestrians and analyze the overall situation of objects by combining image analysis technology and deep learning method. Human Activity Recognition (HAR), which is important issue in video surveillance research, is a field to detect abnormal behavior of pedestrians in CCTV environment. In order to recognize human behavior, it is necessary to detect the human in the image and to estimate the pose from the detected human. In this paper, we propose a novel approach for 2D Human Pose Estimation based on object detection using RGB-D information. By adding depth information to the RGB information that has some limitation in detecting object due to lack of topological information, we can improve the detecting accuracy. Subsequently, the rescaled region of the detected object is applied to ConVol.utional Pose Machines (CPM) which is a sequential prediction structure based on ConVol.utional Neural Network. We utilize CPM to generate belief maps to predict the positions of keypoint representing human body parts and to estimate human pose by detecting 14 key body points. From the experimental results, we can prove that the proposed method detects target objects robustly in occlusion. It is also possible to perform 2D human pose estimation by providing an accurately detected region as an input of the CPM. As for the future work, we will estimate the 3D human pose by mapping the 2D coordinate information on the body part onto the 3D space. Consequently, we can provide useful human behavior information in the research of HAR.

서비스 로봇의 물체 탐색 성능 향상을 위한 베이지안 네트워크 결합 기반 물체 관계 모델링 (Object Relationship Modeling based on Bayesian Network Integration for Improving Object Detection Performance of Service Robots)

  • 송윤석;조성배
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.817-822
    • /
    • 2005
  • 최근 실내 환경에서 로봇의 서비스를륵 위해 영상 정보를 사용하기 인한 인구가 활발하다. 과거의 영상 처리 전근 방법은 미리 정의된 기하학적 모델에 기반 하기에, 이를 실내 환경과 같은 가변적인 환경에 적용할 시 성능이 저하된다. 이에 지식을 기반으로 불확실성을 해결하여 영상 인식 성능을 높이기 위한 다양한 연구가 진행되어 왔다. 본 논문에서는 실내에서 활동하는 서비스 로봇의 물체 인식 성능을 향상시키기 위해, 대상 물체가 다른 물체에 의서 가려져 있는 경우 대상물체의 존재 여부를 추론하기 위한 베이지안 네트워크 모델링 방법을 제안한다. 제안하는 방법은 물체간이 관계를 모델링하여 발견된 물체를 통해 대상 물체를 추론할 수 있게 하였다. 이를 위해 작은 규모의 베이지안 네트워크(프리미티브 베이지안 네트워크)를 위한 설계 방법을 정의하고 이를을 다시 상황에 맞게 결합하였다. 실험은 설계된 모델의 성능을 검증하기 위해 수행되었는데, 5가지 장소에서 $82.8\%$의 정확도를 보여주었다.

집적 영상을 이용한 가려진 표적의 복원과 인식 (Occluded Object Reconstruction and Recognition with Computational Integral Imaging)

  • 이동수;염석원;김신환;손정영
    • 한국광학회지
    • /
    • 제19권4호
    • /
    • pp.270-275
    • /
    • 2008
  • 본 논문에서는 집적 영상의 획득과 복원을 통하여 장애물에 가려진 물체를 인식하는 기술은 제안하고 구현하였다. 집적 영상의 복원은 해당되는 화소 세기의1차 확률적 특성인 평균으로 구한다. 복원평면까지의 거리는 2차 확률적 특성인 표준 편차를 이용하여 구하고3차원 물체의 경계(edge)를 검출한다. 표준 편차의 합을 최소로 하는 거리에서 복원된 영상을 표적인식에 이용한다. 표적인식은 주성분 분석(principle component analysis, PCA) 분류기를 복원된 영상에 적용하였다. 표적 분류에 대한 판정은 분류기에 의해서 투영된 클래스의 평균 특징 벡터와 테스트 특징 벡터간의 유클리드 거리(Euclidean distance)를 이용한다. 실험 및 시뮬레이션을 통하여 가려진 표적을 본 논문에서 제안한 방법을 통하여 오차 없이 분류하였다.

안내 로봇을 향한 관람객의 행위 인식 기반 관심도 추정 (Estimating Interest Levels based on Visitor Behavior Recognition Towards a Guide Robot)

  • 이예준;김주현;정의정;김민규
    • 로봇학회논문지
    • /
    • 제18권4호
    • /
    • pp.463-471
    • /
    • 2023
  • This paper proposes a method to estimate the level of interest shown by visitors towards a specific target, a guide robot, in spaces where a large number of visitors, such as exhibition halls and museums, can show interest in a specific subject. To accomplish this, we apply deep learning-based behavior recognition and object tracking techniques for multiple visitors, and based on this, we derive the behavior analysis and interest level of visitors. To implement this research, a personalized dataset tailored to the characteristics of exhibition hall and museum environments was created, and a deep learning model was constructed based on this. Four scenarios that visitors can exhibit were classified, and through this, prediction and experimental values were obtained, thus completing the validation for the interest estimation method proposed in this paper.