• Title/Summary/Keyword: video recognition

Search Result 696, Processing Time 0.026 seconds

Preprocessing Methods for Action Recognition Model in 360-degree ERP Video (360 도 ERP 영상에서 행동 인식 모델 성능 향상을 위한 전처리 기법)

  • Park, Eun-Soo;Ryu, Jaesung;Kim, Seunghwan;Ryu, Eun-Seok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.252-255
    • /
    • 2019
  • 본 논문에서 Equirectangular projection(ERP) 영상을 행동 인식 모델에 입력하기전 제안하는 전처리를 통하여 성능을 향상시키는 것을 보인다. ERP 영상의 특성상 행동 인식을 하는데 불필요한 영역이 일반적인 2D 카메라로 촬영한 영상보다 많다. 또한 행동 인식은 사람이 Object of Interest(OOI)이다. 따라서 객체 인식모델로 인간 객체를 인식한 후 Region of Interest(ROI)를 추출하여 불필요한 영역을 없애고, 왜곡 또한 줄어든다. 본 논문에서 제안하는 기법으로 전처리 후 CNN-LSTM 모델로 성능을 테스트했다. 제안하는 방법으로 전처리를 한 데이터와 하지 않은 데이터로 행동 인식을 한 정확도로 비교하였으며 제안하는 기법으로 전처리 한 데이터로 행동 인식을 한 경우 데이터의 특성에 따라 다르지만, 최대 61%까지 성능향상을 보였다.

  • PDF

The System of Motion Recognition using Augmented Reality (증강현실을 이용한 모션 인식 시스템)

  • Nam, Il-Ho;Ryu, Young-Kee
    • Proceedings of the KIEE Conference
    • /
    • 2008.10b
    • /
    • pp.505-506
    • /
    • 2008
  • Motion capture system that is used in movies and games today requires large equipments and expensive that it is still not common as a reasonable family game. Therefore, this research project focused on solving these problems mentioned above and move on to develop a new type of approach and by using reasonable family use USB camera and augmented reality to develop a bodily sensation motion capture system which can be used in making a video game. In order to develop this, I used a pair of Marker which can be placed on both hands and one USB camera and the image that was extracted in real time goes through the AR toolkit and ed the 3D coordinates of data and developed a motion capture system.

  • PDF

A study of Real-Time Face Recognition using Web CAM and Ideal Hair style Adaption Method (웹캠을 이용한 실시간 얼굴인식과 이상적 헤어스타일 적용방법에 관한 연구)

  • Kang, Nam-Soon
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.2
    • /
    • pp.532-539
    • /
    • 2010
  • This paper suggests the system for searching and application is to be in combination between existing hair art area and Image/Video processing area. This proposed system usually saves various hair types into a database, then, users send images of their face over the internet by using WebCam. Finally, they can find the hair types for users.

Face Detection by Eye Detection with Progressive Thresholding

  • Jung, Ji-Moon;Kim, Tae-Chul;Wie, Eun-Young;Nam, Ki-Gon
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 2005.06a
    • /
    • pp.1689-1694
    • /
    • 2005
  • Face detection plays an important role in face recognition, video surveillance, and human computer interface. In this paper, we present a face detection system using eye detection with progressive thresholding from a digital camera. The face candidate is detected by using skin color segmentation in the YCbCr color space. The face candidates are verified by detecting the eyes that is located by iterative thresholding and correlation coefficients. Preprocessing includes histogram equalization, log transformation, and gray-scale morphology for the emphasized eyes image. The distance of the eye candidate points generated by the progressive increasing threshold value is employed to extract the facial region. The process of the face detection is repeated by using the increasing threshold value. Experimental results show that more enhanced face detection in real time.

  • PDF

Hand Gesture based Manipulation of Meeting Data in Teleconference (핸드제스처를 이용한 원격미팅 자료 인터페이스)

  • Song, Je-Hoon;Choi, Ki-Ho;Kim, Jong-Won;Lee, Yong-Gu
    • Korean Journal of Computational Design and Engineering
    • /
    • v.12 no.2
    • /
    • pp.126-136
    • /
    • 2007
  • Teleconferences have been used in business sectors to reduce traveling costs. Traditionally, specialized telephones that enabled multiparty conversations were used. With the introduction of high speed networks, we now have high definition videos that add more realism in the presence of counterparts who could be thousands of miles away. This paper presents a new technology that adds even more realism by telecommunicating with hand gestures. This technology is part of a teleconference system named SMS (Smart Meeting Space). In SMS, a person can use hand gestures to manipulate meeting data that could be in the form of text, audio, video or 3D shapes. Fer detecting hand gestures, a machine learning algorithm called SVM (Support Vector Machine) has been used. For the prototype system, a 3D interaction environment has been implemented with $OpenGL^{TM}$, where a 3D human skull model can be grasped and moved in 6-DOF during a remote conversation between distant persons.

A Facial Image Segmentation for Video Coding and its Recognition Based on DWT

  • Lim, Chun-Hwan;Park, Jong-An
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.3B
    • /
    • pp.338-346
    • /
    • 2001
  • 이 논문에서는 잡음에 대해 유연성이 있는 신경망과 차영상법-DCT를 이용한 얼굴인식 알고리즘을 제안한다. 동일환경(조도의 세기, 얼굴에서 카메라까지의 거리)에서 연속적으로 두 개의 영상을 캡쳐했다. 이 때 한 영상은 얼굴을 포함하지 않고 다른 영상은 얼굴을 포함하게 된다. 차영상 방법을 이용하여 두 개의 이미지로부터 얼굴영상과 배경영상을 분리하고 그 다움에 분리된 얼굴영역에서 사각영역을 추출하여 이 영역을 얼굴의 특징영역으로 이용하였다. 이 사각 영역은 눈, 코, 입, 눈썹 등이 포함된다. 다음으로 이 영역에 대해 DWT 연산을 수행한후 특징 백터를 추출하였고, 추출된 특징벡터는 정규화 되어 신경망의 입력벡터로 사용되었다. 시뮬레이션 결과 학습된 얼굴영상에 대해서는 100% 인식률을 보였고 학습되지 않는 얼굴 영상에 대해서는 92.25%의 인식률을 보였다.

  • PDF

Proposal of Image Noise Improvement Algorithm for Implementing Hand Gestures

  • Moon, Yu-Sung;Choi, Ung-Se;Kim, Jung-Won
    • Journal of IKEEE
    • /
    • v.23 no.4
    • /
    • pp.1465-1468
    • /
    • 2019
  • The image noise improvement algorithm proposed in this paper extracts the boundary line by using the window of the binarized image to detect the gesture motion. Boundary line blurring is prevented by improving Gaussian noise generated during video output. To improve gesture recognition in low-light environments, an image noise enhancement algorithm has been designed to provide an output image close to the base image. Analyzing the experimental results, we found almost 10% improvement in the results compared to the results of the existing Median filter.

Extraction text-region's pixel on caption of video (동영상에 삽입된 자막 내 문자영역화소추출)

  • An, Kwon-Jae;Kim, Gye-Young
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.01a
    • /
    • pp.43-45
    • /
    • 2011
  • 본 논문은 동영상 내 삽입된 자막을 문자인식이 가능하도록 문자영역을 이루는 화소를 추출하는 방법을 제안한다. 최초 자막영상을 통계학적 방법을 이용하여 색상극성을 결정한다. 이 후 색상극성에 따른 잡음제거 방법을 명암값기반과 형태학적기반으로 달리한다. 제안된 방법은 각 색상결정에 따른 적합한 잡음제거를 수행함으로서 추출된 화소들이 이루는 문자영역의 영상을 이용하여 문자인식을 수행하였을 때 기존방법보다 높은 문자인식률을 보였다.

  • PDF

Detection using Optical Flow and EMD Algorithm and Tracking using Kalman Filter of Moving Objects (이동물체들의 Optical flow와 EMD 알고리즘을 이용한 식별과 Kalman 필터를 이용한 추적)

  • Lee, Jung Sik;Joo, Yung Hoon
    • The Transactions of The Korean Institute of Electrical Engineers
    • /
    • v.64 no.7
    • /
    • pp.1047-1055
    • /
    • 2015
  • We proposes a method for improving the identification and tracking of the moving objects in intelligent video surveillance system. The proposed method consists of 3 parts: object detection, object recognition, and object tracking. First of all, we use a GMM(Gaussian Mixture Model) to eliminate the background, and extract the moving object. Next, we propose a labeling technique forrecognition of the moving object. and the method for identifying the recognized object by using the optical flow and EMD algorithm. Lastly, we proposes method to track the location of the identified moving object regions by using location information of moving objects and Kalman filter. Finally, we demonstrate the feasibility and applicability of the proposed algorithms through some experiments.

Face Detection and Recognition in MPEG Compressed Video (MPEG 압축 비디오 상에서의 얼굴 영역 추출 및 인식)

  • 여창욱;황본우;이성환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.452-454
    • /
    • 1998
  • 본 논문에서는 MPEG 압축 비디오 상에서 얼굴 영역을 추출하고 이를 인식하는 방법에 대하여 제안한다. 제안된 방법은 크게 MPEG 압축 비디오의 처리를 위한 축소된 DC 영상의 구성 단계, 축소된 DC 영상에서의 얼굴 영역 추출 단계, 그리고 얼굴 영역이 추출된 프레임에 대한 압축 복원 및 얼굴 인식의 3단계로 구성되어있다. DC 영상의 구성 단계에서는 압축 복원 없이 DCT 계수의 DC 값과 2개의 AC 값만을 사용하여 부분적인 2차원 역 DCT 변환을 이용한 방법을 사용하였으며, 얼굴 영역 추출 단계에서는 DC 영상에 대해 얼굴의 색상 및 형태 정보를 이용한 얼굴 후보 영역 추출 방법과 K-L 변환 및 역 변환의 오차에 의한 얼굴 영역 추출 방법을 사용하였다. 얼굴 인식 단계에서는 얼굴 영역이 추출된 프레임에 대하여 GOP 단위의 압축 복원을 수행한 후 고유 얼굴 영상을 이용한 방법으로 얼굴 인식을 수행하였다. 제안된 방법의 성능을 검증하기 위하여 뉴스와 드라마 MPEG 비디오를 대상으로 실험을 수행하였으며, 실험 결과 제안된 방법이 효율적임을 알 수 있었다.

  • PDF