• 제목/요약/키워드: Real-Time Computer Vision

검색결과 356건 처리시간 0.03초

Automatic face detection using chromaticity space and deformable templates

  • Lee, Kwansu;Lee, Sung-Oh;Lee, Byung-Ju;Park, Gwi-Tae
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.28.1-28
    • /
    • 2001
  • An automatic face recognition(AFR) of individuals is a significant problem in the development of computer vision. An AFR consists of two major parts which are detection of face region and recognition process, and the overall performance of AFR is determined by each. In this paper, the face region is acquired using chromaticity space, but this face region is a simple rectangle which doesn´t consider the shape information. By applying deformable templates to the face region, we can locate the position of the eyes in images. With the face region and the eye location information, more precise face region can be extract from the image. Because processing time is critical in real-time system, we use simplified eye templates and the modified energy function for the efficiency. We can get a good detection performance in experiments.

  • PDF

CCTV 영상 정보와 재난재해 인식 및 실시간 위기 대응 시스템의 융합에 관한 연구 (Research on the Convergence of CCTV Video Information with Disaster Recognition and Real-time Crisis Response System)

  • 김기봉;금기문;장창복
    • 한국융합학회논문지
    • /
    • 제8권3호
    • /
    • pp.15-22
    • /
    • 2017
  • 최첨단 과학기술 시대를 맞아 사람들은 재난재해 예경보 시스템 및 재난재해 대응 시스템들이 잘 갖추어져 있다고 믿고 있으나 세월호 사건 등에서 알 수 있듯이 현실에서는 제대로 된 재난재해 예경보 및 대응 시스템이 갖추어져 있지 않은 상황이다. 기존의 재난재해 예경보 시스템의 경우 대부분 효율성이 낮은 센서 정보를 기반으로 하고 있으며, 영상 정보는 모니터링 요원에 의해 수동적으로 감시되고 있다. 또한 인식된 재난 재해에 대해서도 어떻게 대응하고 처리할 것인지에 대한 대응 시스템과의 연계가 미흡하다. 이에 따라 본 논문에서 CCTV 영상정보를 기반으로 특정 재난재해의 발생여부 및 정도를 최대한 빠르고 정확하게 인식하고 위기대응 매뉴얼에 근거하여 이를 모든 관련부처나 담당자들에게 자동으로 통보함으로써 효과적인 위기대응이 가능한 CCTV 기반 재난재해 인식 및 실시간 위기 대응 기술을 제안한다.

PERSONAL SPACE-BASED MODELING OF RELATIONSHIPS BETWEEN PEOPLE FOR NEW HUMAN-COMPUTER INTERACTION

  • Amaoka, Toshitaka;Laga, Hamid;Saito, Suguru;Nakajima, Masayuki
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.746-750
    • /
    • 2009
  • In this paper we focus on the Personal Space (PS) as a nonverbal communication concept to build a new Human Computer Interaction. The analysis of people positions with respect to their PS gives an idea on the nature of their relationship. We propose to analyze and model the PS using Computer Vision (CV), and visualize it using Computer Graphics. For this purpose, we define the PS based on four parameters: distance between people, their face orientations, age, and gender. We automatically estimate the first two parameters from image sequences using CV technology, while the two other parameters are set manually. Finally, we calculate the two-dimensional relationship of multiple persons and visualize it as 3D contours in real-time. Our method can sense and visualize invisible and unconscious PS distributions and convey the spatial relationship of users by an intuitive visual representation. The results of this paper can be used to Human Computer Interaction in public spaces.

  • PDF

Determination of Object Similarity Closure Using Shared Neighborhood Connectivity

  • Radhakrishnan, Palanikumar;Arokiasamy, Clementking
    • 한국융합학회논문지
    • /
    • 제5권3호
    • /
    • pp.41-44
    • /
    • 2014
  • Sequential object analysis are playing vital role in real time application in computer vision and object detections.Measuring the similarity in two images are very important issue any authentication activities with how best to compare two independent images. Identification of similarities of two or more sequential images is also the important in respect to moving of neighborhoods pixels. In our study we introduce the morphological and shared near neighborhoods concept which produces a sufficient results of comparing the two images with objects. Considering the each pixel compare with 8-connectivity pixels of second image. For consider the pixels we expect the noise removed images are to be considered, so we apply the morphological transformations such as opening, closing with erosion and dilations. RGB of pixel values are compared for the two sequential images if it is similar we include the pixels in the resultant image otherwise ignore the pixels. All un-similar pixels are identified and ignored which produces the similarity of two independent images. The results are produced from the images with objects and gray levels. It produces the expected results from our process.

키넥트와 모바일 장치 알림 기반 온라인 모니터링 시스템 (Online Monitoring System based notifications on Mobile devices with Kinect V2)

  • 니욘사바에릭;장종욱
    • 한국정보통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1183-1188
    • /
    • 2016
  • 키넥트 센서 버전 2는 컴퓨터 비전과 엑스 박스와 같은 엔유아이 인터페이스로 마이크로소프트에서 출시한 카메라의 일종이다. 이는 높은 프레임 속도로 컬러 영상과 깊이 영상, 오디오 입력 및 스켈레톤 데이터를 취득 할 수 있다. 이러한 다양한 타입의 데이터 정보를 제공해 주기 때문에 이것은 다른 범위의 연구자들을 위한 리소스가 된다. 본 논문에서는 깊이 이미지를 사용하여 우리는 키넥트 범위내에서 특정 영역을 감시하는 시스템을 제시한다. 타켓 영역은 깊이의 최소, 최대 값의 크기에 따라서 그 공간을 모니터링 할 수 있다. 컴퓨터 비전 라이브러리 (Emgu CV)를 사용해서 만약 어떤 오브젝트가 타겟 영역에서 검출된다면 그것을 추적하고 키넥트 카메라는 RGB 이미지를 데이터베이스 서버에 전송한다. 따라서 안드로이드 플랫폼 기반 모바일 애플리케이션을 통해 키넥트 타켓 지역에서 수상한 움직임이 감지되었음을 사용자에게 통지하고 그 장면의 RGB 영상을 표시하기 위해 개발되었다. 사용자는 모니터링 영역 또는 제한 구역과 관련된 다른 경우에서 가치 있는 물건의 대해 최선의 방법으로 반응하고 실시간 통지를 얻는다.

Real-Time Comprehensive Assistance for Visually Impaired Navigation

  • Amal Al-Shahrani;Amjad Alghamdi;Areej Alqurashi;Raghad Alzahrani;Nuha imam
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.1-10
    • /
    • 2024
  • Individuals with visual impairments face numerous challenges in their daily lives, with navigating streets and public spaces being particularly daunting. The inability to identify safe crossing locations and assess the feasibility of crossing significantly restricts their mobility and independence. Globally, an estimated 285 million people suffer from visual impairment, with 39 million categorized as blind and 246 million as visually impaired, according to the World Health Organization. In Saudi Arabia alone, there are approximately 159 thousand blind individuals, as per unofficial statistics. The profound impact of visual impairments on daily activities underscores the urgent need for solutions to improve mobility and enhance safety. This study aims to address this pressing issue by leveraging computer vision and deep learning techniques to enhance object detection capabilities. Two models were trained to detect objects: one focused on street crossing obstacles, and the other aimed to search for objects. The first model was trained on a dataset comprising 5283 images of road obstacles and traffic signals, annotated to create a labeled dataset. Subsequently, it was trained using the YOLOv8 and YOLOv5 models, with YOLOv5 achieving a satisfactory accuracy of 84%. The second model was trained on the COCO dataset using YOLOv5, yielding an impressive accuracy of 94%. By improving object detection capabilities through advanced technology, this research seeks to empower individuals with visual impairments, enhancing their mobility, independence, and overall quality of life.

Gaussian Blending: Improved 3D Gaussian Splatting for Model Light-Weighting and Deep Learning-Based Performance Enhancement

  • Yeong-In Lee;Jin-Nyeong Heo;Ji-Hwan Moon;Ha-Young Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.23-32
    • /
    • 2024
  • NVS는 여러 각도와 위치에서 수집한 이미지를 이용해 3차원 공간을 재현하는 연구 분야로, 증강현실, 가상현실, 자율주행, 로봇 네비게이션 등에서 중요성이 커지고 있다. 최근 주목받는 3D-GS 방법론은 기존 NeRF 보다 고품질 장면 생성, 빠른 학습 시간, 실시간 렌더링이 가능하지만, Gaussian points의 밀도 조정 과정에서 전체 Gaussian points 수의 증가로 메모리 소모량 상승과 렌더링 속도가 저하되는 문제가 있다. 이를 개선하기 위해 본 논문에서는 불필요한 Gaussian points를 제거하여 메모리 효율성을 높이는 Gaussian blending 기법과 Gaussian points 감소로 인한 표현력 손실을 최소화하는 깊이 정보 반영 손실 함수를 제안하여 모델의 성능을 보완한다. 실험 결과, Tanks & Temples 벤치마크 데이터셋에서 성능을 유지하면서 Gaussian points 수를 최대 4% 감소시키는 효과를 확인하였다. 따라서 본 논문에서 제안한 방법론은 3D-GS 모델의 경량화 가능성을 실험적으로 증명하였다.

Real-Time Eye Detection and Tracking Under Various Light Conditions

  • Park Ho Sik;Nam Kee Hwan;Seol Jeung Bo;Cho Hyeon Seob;Ra Sang Dong;Bae Cheol Soo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.862-866
    • /
    • 2004
  • Non-intrusive methods based on active remote IR illumination for eye tracking is important for many applications of vision-based man-machine interaction. One problem that has plagued those methods is their sensitivity to lighting condition change. This tends to significantly limit their scope of application. In this paper, we present a new real-time eye detection and tracking methodology that works under variable and realistic lighting conditions. Based on combining the bright-pupil effect resulted from IR light and the conventional appearance-based object recognition technique, our method can robustly track eyes when the pupils are not very bright due to significant external illumination interferences. The appearance model is incorporated in both eyes detection and tracking via the use of support vector machine and the mean shift tracking. Additional improvement is achieved from modifying the image acquisition apparatus including the illuminator and the camera.

  • PDF

영상기반 자동항법을 위한 실시간 위치인식 및 지도작성 (Real-time Simultaneous Localization and Mapping (SLAM) for Vision-based Autonomous Navigation)

  • 임현;임종우;김현진
    • 대한기계학회논문집A
    • /
    • 제39권5호
    • /
    • pp.483-489
    • /
    • 2015
  • 본 논문에서는 넓은 지역에서의 영상기반 자동 항법을 위한 실시간 위치인식 및 지도작성 방법을 제안한다. 한 대의 카메라에서 입력된 영상으로부터 제안된 방법은 6 자유도 카메라 자세와 3 차원 특징점 위치를 연속적으로 계산한다. 제안된 방법은 넓은 지역을 주행하며 촬영된 영상에 적용하여 그 위치와 환경지도를 성공적으로 작성하였이다. 본 논문에서는 이진기술자(binary descriptor)와 수치-위상(metric-topological)지도 표현법을 사용하여 GPU 나 영상의 축소 없이 실시간 성능과 광범위한 지역에서의 회귀점 검출(loop detection)을 하였다. 제안된 방법은 여러 환경에서 촬영된 영상과, 해당 영상의 GPS 기준값과 비교하여 평가하였다.

HSV 컬러 영역을 이용한 실시간 손동작 검출 증강현실 퍼즐 게임 개발 (Development of an Augmented Reality Puzzle Game Detecting Hand Posture Using HSV Color Space in Real Time)

  • 김민혁;김영식
    • 한국게임학회 논문지
    • /
    • 제14권5호
    • /
    • pp.79-86
    • /
    • 2014
  • 증강현실 기술을 게임에 접목하려는 시도가 많이 이루어지고 있다. 본 논문에서는 실시간으로 스마트 기기의 카메라로부터 손동작 2차원 영상을 획득하고 HSV 컬러 영역을 활용하여 해당 색상의 물체 또는 신체를 실시간으로 검출해, 게임의 요소로 활용하여 즐길 수 있는 2D 퍼즐게임을 개발하였다. 이는 스마트 기기에 컴퓨터 비전을 접목한 형태의 게임으로, 교육 및 엔터테인먼트 환경에서 스마트 기기의 휴대성과 가상현실 체험의 현장감을 접목시킨 새로운 인터랙티브 기술이 될 것이다.