• Title/Summary/Keyword: 비디오 이미지

Search Result 446, Processing Time 0.032 seconds

Video Geographical Information Services using 4S-Van Camera Data (4S-Van 카메라 데이터를 이용한 비디오 지리정보 서비스)

  • Kim, Sung-Soo;Kim, Kyong-Ho;Lee, Jong-Hun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1811-1814
    • /
    • 2002
  • 본 논문에서는 3차원 데이터베이스와 4S-Van 에서 획득된 GPS 관련 데이터를 이용하여 사용자에게 비디오내의 지리 객체들의 정보를 제공해 줄 수 있는 미디어 GIS 시스템 구조로 제안한다. 비디오내의 지리객체에 대한 지리정보 서비스를 위해 실세계 비디오와 3차원 그래픽 세계를 매핑할 수 있는 가상 세계 매핑(VWM; Virtual World Mapping) 이라는 새로운 상호 운용적인 지리데이터 서비스 개념을 소개한다. 제안한 기법은 임의의 비디오 프레임에 대한 3차원 가상공간을 재구성하여 지리정보 및 소성정보를 쉽게 검색해 낼 수 있다. 또한, 2차원, 3차원, 미디어 데이터간의 상호연계 및 운용기능을 제공함으로써 기존의 지리정보시스템 분야의 새로운 패러다임을 제시한다. 가상 세계 매핑기법은 기존의 비디오에서 얻어진 이미지에 대한 별도의 이미지 프로세싱 과정 없이 지리정보를 서비스 할 수 있다는 장점을 가진다. 제안된 방법을 이용하여 비디오 영상을 스트리밍하면서 클라이언트가 지리 정보서비스 받을 수 있는 GeoVideo 서버 및 웹을 통해 서비스를 제공하는 GeoVideo 클라이언트 시스템을 구현하였다.

  • PDF

Fast Camera Pose Estimation from a Single Frame for Augmented Reality Applications (증강현실 시스템 구현을 위한 단일 프레임에서의 고속 카메라 위치추정)

  • Lee, Bum-Jong;Park, Jong-Seung;Sung, Mee-Young;Noh, Sung-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.7-14
    • /
    • 2006
  • 본 논문에서는 3D 복원과 카메라 측정과정 없이 정확하게 카메라 자세를 계산하고 가상객체를 비디오에 합성하기 위한 단일 프레임 기반의 고속 계산 기법을 제안한다. 객체의 로컬 좌표와 단일 이미지에서의 대응되는 이미지 좌표로부터 카메라 자세를 계산한다. 정사영 투영모델에서의 분해기법에 기반한 구조 계산 방법으로 카메라 자세의 고속 추정이 가능하다. 정사영 투영모델에 기반하기 때문에 참조점의 설정에 따라 정확도가 달라진다. 객체에 따라 참조점을 설정하여 정확한 카메라 자세를 계산하는 방법을 제안한다. 카메라 자세 및 물체의 형태는 단일 프레임 기반으로 수행되며 카메라 자세 추정 결과가 즉시 비디오 합성에 사용될 수 있도록 하였다. 제안하는 기법의 유효성 입증을 위해 실사 비디오에 기반한 증강현실시스템을 구현하고 카메라 자세 계산과 비디오 합성의 전체 과정을 단일 프레임에 기반하여 실험을 수행하고 제안 기법의 실용성을 보였다.

  • PDF

A Method of Multi-Scale Feature Compression for Object Tracking in VCM (VCM 의 객체추적을 위한 다중스케일 특징 압축 기법)

  • Yong-Uk Yoon;Gyu-Woong Han;Dong-Ha Kim;Jae-Gon Kim
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.10-13
    • /
    • 2022
  • 최근 인공지능 기술을 바탕으로 지능형 분석을 수행하는 기계를 위한 비디오 부호화 기술의 필요성이 요구되면서, MPEG 에서는 VCM(Video Coding for Machines) 표준화를 시작하였다. VCM 에서는 기계를 위한 비디오/이미지 압축 또는 비디오/이미지 특징 압축을 위한 다양한 방법이 제시되고 있다. 본 논문에서는 객체추적(object tracking)을 위한 머신비전(machine vision) 네트워크에서 추출되는 다중스케일(multi-scale) 특징의 효율적인 압축 기법을 제시한다. 제안기법은 다중스케일 특징을 단일스케일(single-scale) 특징으로 차원을 축소하여 형성된 특징 시퀀스를 최신 비디오 코덱 표준인 VVC(Versatile Video Coding)를 사용하여 압축한다. 제안기법은 VCM 에서 제시하는 기준(anchor) 대비 89.65%의 BD-rate 부호화 성능향상을 보인다.

  • PDF

Design of New Spatio-temporal Representation Scheme for Moving Objects in Video (비디오의 움직임 객체를 위한 새로운 시공간 표현 기법의 설계)

  • 심춘보;김남기;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.110-112
    • /
    • 2000
  • 이미지와는 달리, 비디오 데이터는 객체에 대한 움직임 정보(motion trajectory)를 가지고 있으며, 이러한 움직임 정보는 비디오 데이터만이 가지는 매우 중요한 특징으로 비디오 데이터에 대한 색인과 내용 기반 검색을 수행하는 데 있어 중요한 역할을 한다. 따라서, 본 논문에서는 비디오 데이터베이스에서 효율적인 내용기반 검색을 위해 하나의 객체에 대한 움직임 정보를 나타내는 single motion trajectory와 두 객체에 대한 움직임 정보를 나타내는 multiple motion trajectory를 위한 새로운 시공간 표현 기법을 제안한다. 아울러, 움직임 정보에 대한 사용자 질의에 대해 유사성을 측정하여 순위부여와 Time Interval을 지원하는 새로운 유사성 측정 알고리즘인 SIST와 SIMT를 제안한다.

  • PDF

Vehicle Speed Measurement using SAD Algorithm (SAD 알고리즘을 이용한 차량 속도 측정)

  • Park, Seong-Il;Moon, Jong-Dae;Ko, Young-Hyuk
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.14 no.5
    • /
    • pp.73-79
    • /
    • 2014
  • In this paper, we proposed the mechanism which can measure traffic flow and vehicle speed on the highway as well as road by using the video and image processing to detect and track cars in a video sequence. The proposed mechanism uses the first few frames of the video stream to estimate the background image. The visual tracking system is a simple algorithm based on the sum of absolute frame difference. It subtracts the background from each video frame to produce foreground images. By thresholding and performing morphological closing on each foreground image, the proposed mechanism produces binary feature images, which are shown in the threshold window. By measuring the distance between the "first white line" mark and the "second white line"mark proceeding, it is possible to find the car's position. Average velocity is defined as the change in position of an object divided by the time over which the change takes place. The results of proposed mechanism agree well with the measured data, and view the results in real time.

A Multimedia Database System using Indexing Agent (인덱싱 에이전트를 이용한 멀티미디어 데이터베이스 시스템)

  • Lee, Kwang-Hyoung;Lee, Chang-Soo;Lee, Jong-Hee;Oh, Hae-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.57-60
    • /
    • 2003
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템은 설계한다.

  • PDF

A Study on 3D Graphics Registration of Image Sequences using Planar Surface (평면을 이용한 이미지 시퀀스에서의 3D 그래픽 정합에 대한 연구)

  • 김주완;장병태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.190-192
    • /
    • 2003
  • 본 논문은 캘리브레이션 정보를 모르는 카메라로부터 얻은 시퀀스 영상에서 공간상에서 평면인 물체의영상 정보를 이용하여 카메라 내부 및 외부 파라미터를 추정하고, 이를 이용하여 가상의 3D 그래픽을 시퀀스 영상에 정합하는 방법을 제안한다. 제안된 방법은 기존의 방법에 비해 손쉽게 이미지에 가상의 3D 그래픽 오브젝트를 정합할 수 있으며, 눈에 보이는 정합오차를 최소화하며 DirectX와 같은 3D 그래픽 툴과 쉽게 연동이 되는 장정이 있다. 본 연구는 비디오와 같은 영상에 3D 영상을 합성하는 대화형 비디오 컨텐트 개발에 활용할 수 있을 것으로 기대된다.

  • PDF

Deepfake Detection with Mesoscopic Network (Mesoscopic Network를 이용한 딥페이크 감지 기법)

  • Lee, Hyeri;Yang, Huigyu;Choo, Hyunseung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.652-654
    • /
    • 2022
  • 소셜 미디어와 스마트폰의 대중화로 인해 디지털 이미지와 비디오를 만들어 내는 일이 매우 흔해졌다. 전통적인 이미지 포렌식 기술 압축 방법은 데이터를 손상시킨다는 점에서 비디오에 적용하기 부적절하다. 따라서 본 논문에서는 딥러닝과 MesoNet을 이용한 모델을 통해 참 혹은 거짓만 나타내는 기존의 결과 산출 방법에서 더 나아가 네가지의 분류 방법으로 딥페이크 감지 흐름을 살펴보고자 한다.

Analysys on Factors Affecting Velocity Errors On the Application of LSPIV (LSPIV를 적용시 오차발생 요인 분석)

  • Kim, Young-Sung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.1779-1783
    • /
    • 2008
  • 영상해석을 통한 흐름해석의 방법인 Large-Scale Particle Image Velocimetry (LSPIV)는 실험실내의 소규모 흐름해석에 이용하던 Particle Image Velocimetry (PIV)를 자연하천이나 실험실에서 넓은 영역($4m^2{\sim}45,000m^2$)에 적용할 수 있도록 확장시킨 것으로 지난 10여년전부터 세계적으로 널리 이에 대한 연구가 진행되고 있다. PIV는 seeding, illumination, recording 그리고 image processing으로 구성된다. LSPIV(Large Scale PIV)는 PIV의 기본원리를 근거로 하여 기존의 PIV에 비하여 실험실 내에서의 수리모형실험이나 일반 하천에서의 유속측정과 같은 큰 규모의 흐름해석을 할 수 있도록 seeding, illumination에 대한 조정이 필요 하고, 촬영된 image에 대한 왜곡을 없애는 작업이 필요하다. LSPIV는 PIV의 네 가지 단계를 포함하여 seeding, illumination, recording, image transformation, image processing 및 post-processing의 여섯 단계로 구성되어진다 (Li, 2002). LSPIV의 적용시 각 단계마다 유속계산시 오차를 발생시키는 27가지의 요인들이 존재하고 있는바 (Kim, 2006), 본 연구에서는 이들 중 실내의 실험실에서 파악이 가능한 인자들에 대해 그들 각각의 인자들이 유속 측정에 미치는 오차의 정도를 파악하고자 하였다. 본 연구에서는 LSPIV의 적용시 이용되는 이미지의 개수와 이미지 촬영시 적용된 이미지의 해상도에 따른 오차의 발생 정도를 조사하였다. 이미지 촬영에 있어서 비디오카메라를 이용할 경우 촬영시간에 따라 많은 수의 이미지를 취득할 수 있은바 이미지의 수에 따른 유속계산오차를 파악하고자 하였다. 또한 디지털 카메라를 이용할 경우 여러 가지 이미지 해상도를 이용할 수 있으므로 적용한 이미지 해상도에 따른 유속계산에 미치는 오차의 크기를 파악하고자 하였다. 이미지의 갯수가 유속계산시 미치는 오차의 영향의 정도를 조사하기 위해서 초당 30 frame을 촬영할 수 있는 비디오카메라를 이용하여 91초 동안 촬영된 이미지로부터 매 5번째의 이미지를 추출하여 455개의 이미지를 준비하였고 이로부터 이미지수를 10, 50, 100, 200, 300, 400의 순서로 증가시키면서 이미지 개수로부터 나타나는 유속계산 오차를 조사한 결과 이미지의 개수가 50매 이상인 경우는 이로 인한 오차가 1% 이하로 감소함을 파악하였다. 촬영된 이미지의 해상도가 유속계산시 미치는 영향을 조사하기 위해 디지털카메라를 적용하여 세가지 이미지 해상도(640*480, 1280*960, 2048*1536 pixel)로 변화시키면서 유속측정 오차를 분석한 결과 저해상도의 이미지를 이용한 경우 고해상도 이미지를 이용한 경우와 비교하여 3% 가량의 차이를 나타내었다.

  • PDF

A New Residual Attention Network based on Attention Models for Human Action Recognition in Video

  • Kim, Jee-Hyun;Cho, Young-Im
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.1
    • /
    • pp.55-61
    • /
    • 2020
  • With the development of deep learning technology and advances in computing power, video-based research is now gaining more and more attention. Video data contains a large amount of temporal and spatial information, which is the biggest difference compared with image data. It has a larger amount of data. It has attracted intense attention in computer vision. Among them, motion recognition is one of the research focuses. However, the action recognition of human in the video is extremely complex and challenging subject. Based on many research in human beings, we have found that artificial intelligence-like attention mechanisms are an efficient model for cognition. This efficient model is ideal for processing image information and complex continuous video information. We introduce this attention mechanism into video action recognition, paying attention to human actions in video and effectively improving recognition efficiency. In this paper, we propose a new 3D residual attention network using convolutional neural network based on two attention models to identify human action behavior in the video. An evaluation result of our model showed up to 90.7% accuracy.