• 제목/요약/키워드: video analysis

검색결과 2,495건 처리시간 0.03초

Development of Roadside Facility Management System with Video GIS Technology

  • Joo, In-Hak;Nam, Kwang-Woo;Yoo, Jae-Jun;Lee, Jong-Hun
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.169-174
    • /
    • 2002
  • In this paper, we suggest a new spatial information system called video GIS where video is used for spatial data construction and is integrated with map. We develop a prototype system of video GIS and apply it to roadside facility management. The main functions supported by the suggested system are data collection, coordinate calculation and conversion, data construction, analysis, searching, and browsing. The stereo images and corresponding position data are collected by a vehicle named 4S-Van that has GPS, IMU, and cameras. The 3-D coordinates of the objects in the images, such as road sign, signal lamp, and building, can be calculated and constructed from the collected data. The spatial objects are displayed on both image and map, and can be searched and browsed, which enables visual and realistic browsing and management of spatial objects. Compared to conventional field survey used in roadside facility management, the method enables faster, easier, and more efficient construction of spatial data. The suggested video GIS can be applied not only to roadside facility management but also to many similar projects of central or local governments that are related to GIS.

  • PDF

스포츠 장르 분석을 위한 스포츠 뉴스 비디오의 의미적 장면 분류 (Semantic Scenes Classification of Sports News Video for Sports Genre Analysis)

  • 송미영
    • 한국멀티미디어학회논문지
    • /
    • 제10권5호
    • /
    • pp.559-568
    • /
    • 2007
  • 앵커 장면 검출은 내용기반 뉴스 비디오 색인과 검색 시스템에서 비디오 장면의 의미적 파싱과 색인을 추출하는데 중요한 역할을 한다. 이 논문은 스포츠 뉴스의 단위 구조화를 위해서 뉴스 동영상에 존재하는 앵커 구간을 구분해내는 효율적인 알고리즘을 제안한다. 앵커 장면을 검출하기 위해서, 우선 MPEG4 압축 비디오에서 DCT 계수치와 모션 방향성 정보를 이용하여 앵커 후보 장면을 결정한다. 그리고 검출된 후보앵커 장면으로부터 영상처리 방법을 활용하여 뉴스 비디오를 앵커 장면과 비앵커(스포츠) 장면으로 분류한다. 제안된 방법은 앵커 장면 검출 실험에서 평균적으로 98%의 정확도와 재현율을 얻었다.

  • PDF

인터프레임 확률분포분석에 의한 비디오 감시 시스템 설계 구현 (Video Surveillance System Design and Realization with Interframe Probability Distribution Analyzation)

  • 류광렬;김자환
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1064-1069
    • /
    • 2008
  • 본 논문은 인터프레임 확률분포에 의한 비디오 감시 시스템 설계 구현에 관한 것이다. 시스템은 비디오 분석 알고리즘과 표준 JPEG 압축 알고리즘을 처리하기 위해 고성능 DSP 프로세서 기반으로 구현된다. 비디오 분석은 가중치, 평균, 분산의 3변량정규분포에 의한 인터프레임 확률분포 분석을 이용하여 특정 영역에 물체를 검출하는 알고리즘을 사용한다. 실험 결과, 시스템 처리시간이 D1$(720{\times}480)$ 영상 프레임 당 85ms 소요되었고 초당 12프레임 정도 처리한다. 규칙에 따른 특정영역 물체감시는 움직임 빠르지 않는 물체에 대해 100% 검출되었다.

A Local Feature-Based Robust Approach for Facial Expression Recognition from Depth Video

  • Uddin, Md. Zia;Kim, Jaehyoun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권3호
    • /
    • pp.1390-1403
    • /
    • 2016
  • Facial expression recognition (FER) plays a very significant role in computer vision, pattern recognition, and image processing applications such as human computer interaction as it provides sufficient information about emotions of people. For video-based facial expression recognition, depth cameras can be better candidates over RGB cameras as a person's face cannot be easily recognized from distance-based depth videos hence depth cameras also resolve some privacy issues that can arise using RGB faces. A good FER system is very much reliant on the extraction of robust features as well as recognition engine. In this work, an efficient novel approach is proposed to recognize some facial expressions from time-sequential depth videos. First of all, efficient Local Binary Pattern (LBP) features are obtained from the time-sequential depth faces that are further classified by Generalized Discriminant Analysis (GDA) to make the features more robust and finally, the LBP-GDA features are fed into Hidden Markov Models (HMMs) to train and recognize different facial expressions successfully. The depth information-based proposed facial expression recognition approach is compared to the conventional approaches such as Principal Component Analysis (PCA), Independent Component Analysis (ICA), and Linear Discriminant Analysis (LDA) where the proposed one outperforms others by obtaining better recognition rates.

E-Learning 제작 시 Flash Video의 효율성 (Flash Video Efficiency in Producing E-learning Contents)

  • 윤영두;최은영
    • 한국콘텐츠학회논문지
    • /
    • 제7권4호
    • /
    • pp.192-198
    • /
    • 2007
  • 정보통신기술의 발달로 인하여 e-learning산업은 급속히 팽창하고 있으며, 이외 함께 제작 기술의 발전도 빠르게 이루어지고 있다. 기존의 동영상 강의 제작의 큰 비중을 차지하던 Microsoft 사의 WMV(Window Media Video) 형식에서 최근에는 다른 동영상 파일에 비해 용량은 작지만 화질이 매우 우수한 포맷인 FLV(Flash video)으로 전환되고 있는 추세이다. 플래쉬 기반으로 이루어진 Flv는 윈도우, 리눅스 이외에도 대부분의 OS 환경과 브라우저에서 구동이 되며, 사용자가 별도의 플레이어 설치나 코덱 설치 과정 없이 재생을 할 수 있어 차세대 표준형, 개방형 플랫폼으로 개발자들의 관심을 끌고 있으나, 아직까지는 기존의 WMV 형식과 FLV간의 용량이나 화질의 비교, 제작시간 등에 대한 정확한 비교 분석에 관한 데이터가 나와 있지 않은 실정이다. 따라서 본 논문은 제작 방식에 따라 WMV와 FLV간의 데이터 비교 분석을 통하여 각기 특성에 맞는 제작 플랫폼을 설정하는데 가이드를 제시하고자 한다.

압축 영역에서의 양방향 예측 구조를 이용한 움직임 흐름 분석 (Motion Flow Analysis using Bi-directional Prediction-Independent Framework in MPEG Compressed Domain)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.13-22
    • /
    • 2004
  • 비디오 시퀀스는 일반적으로 다양한 움직임을 가지는 객체들로 구성되어 있기 때문에, 움직임 특징은 비디오 검색 등에서 매우 중요한 역할을 한다. 본 논문에서는 MPEG 압축 영상에서의 움직임 벡터를 비디오 영상의 움직임 표현 서술자로 활용하는 새로운 방법이 제안된다. 즉, 압축 영상에서의 다양한 움직임 벡터를 프레임이나 매크로블록 예측 구조에 관계없이 단일 움직임 방향만을 갖도록 하여, 이것을 해당 영상의 서술자로 활용한다. 이를 위하여, 본 논문에서는 양방향 예측 구조를 이용한 벡터 재해석 기법을 제안한다. 보통, 압축 영역에서의 각 프레임 움직임 해석 시, 움직임 벡터가 없는 I 프레임과 그 외 프레임들의 직접 비교는 불가능하지만, 제안 기법은 1, B, p 프레임 등의 모든 프레임에서 동등하게 벡터 해석을 할 수 있게 한다. 제안된 알고리즘은 압축 영상의 전체 복원과정 없이 매크로 블록 영역 상에서 처리함으로써 시간 손실을 줄이고 있으며, 실험 결과는 제안된 방법의 높은 성능을 잘 나타내어 주고 있다.

분산 VOD 시스템의 트래픽 분석과 계층적 프로그램 저장에 관한 연구 (A Study on Traffic Analysis and Hierarchical Program Allocation for Distributed VOD Systems)

  • 이태훈;김용득
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2080-2091
    • /
    • 1997
  • Video On Demand (VOD) 서비스는 광대역 종합 정보 통신망을 기반으로 하는 대화형 멀티미디어 서비스 중 가장 유용한 서비스로 인식되고 있다. 다수의 가입자가 각각 보고싶은 프로그램을 시청할 수 있는 요구 즉시형 VOD 시스템에서 중앙 비디오 서버만 둘 경우, 비디오 서버가 각 가입자와 점 대 점 연결을 이루면서 다량의 영상정보를 실시간으로 제공해야하기 때문에 가입자가 소수일 때는 서비스 가능하다. 그러나 가입자 수가 많아지면 프로그램 전송망과 비디오 서버에 집중되는 트래픽을 분산시키는 것은 매우 중요하다. 본 논문은 비디오 서버들의 분산 구성과 이들을 연결하는 전송망에 대해 분석하며, 제시한 전송망을 모델로 망 내 트래픽을 분석하고 지역 비디오 서버에 프로그램을 저장하는 방식을 제안한다. 이를 위해 수요량, 지역 비디오 서버의 수, 시청 선호 확률 등 트래픽 파라메터의 변화에 따른 지역 비디오 서버의 프로그램 저장량, 지역 비디오 서버간의 전송 트래픽량, 중앙 비디오 서버와 지역 비디오 서버간의 링크 트래픽량을 분석한다. 그리고, 프로그램 저장 비용, 지역 비디오 서버간 전송 비용, 중앙 비디오 서버와 지역 비디오 서버간 링크 비용으로 계산되는 총 비용을 최소로 하는 지역 비디오 서버의 적정 프로그램 저장량 결정한다.

  • PDF

MANET에서 비디오 전송 품질을 위한 Cross-layer 시뮬레이션과 분석 (Cross-layer Simulation and Analysis for Video Transmission Quality in MANET)

  • 윤협상
    • 한국시뮬레이션학회논문지
    • /
    • 제24권3호
    • /
    • pp.61-68
    • /
    • 2015
  • MANET(Mobile ad hoc networks)은 이동 단말로 구성된 동적인 자가 생성 네트워크를 의미한다. 본 연구에서는 MANET에서 비디오 전송 서비스를 다루고 있는 최근 연구를 보완하기 위한 개선된 cross-layer 접근 방법을 제시하고 있다. 본 연구는 ns-3 시뮬레이션을 통해 수행되며, 시뮬레이션에 소요되는 시간을 감안하여 효율적으로 각 계층의 주요 인자의 상호작용을 동시에 고려하기 위해 통계적 실험계획법을 활용하고자 한다. 제안된 cross-layer 접근 방법은 MANET 프로토콜 계층(물리, 네트워크, 전송 계층)과 응용 계층(비디오 인코더)를 동시에 인자로 다루고 있고, 반응 변수로는 객관적 비디오 품질 지표를 포함한다. 본 연구의 결과는 통제 불가능한 인자의 값에 따라 통제 가능한 인자를 설정하여 최적의 비디오 품질을 제공하는 MANET 비디오 전송 어플리케이션을 설계하는 기초 연구로써 활용될 수 있다.

시청자 관점에서의 UHD 콘텐츠 화질 비교 분석에 관한 연구 (A Study on the Comparative Analysis of UHD Video Quality from Audience Viewpoint)

  • 조용석;민동철;최성진
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.621-642
    • /
    • 2021
  • 본 논문에서는 현재 방송 중인 Full HD, Up-scaling UHD, 4K UHD Native의 세 가지 콘텐츠품질을 대상으로 일반 가정의 TV 시청거리인 2.5m 거리에서 55, 65, 75인치 세 가지 크기의 TV수상기를 이용하여 주관적 화질평가를 실시하였다. 본 화질평가 실험은 화질평가 응답이 부적합한 4명의 데이터를 제외한 169명의 데이터를 대상으로 SPSS 25.0를 이용하여 콘텐츠품질이 성별, 수상기 크기, 선호프로그램 장르에 따른 영향을 분석하였다. 또한 측정기를 통한 객관적 화질평가와 주관적 화질평가 결과도 비교 분석하였다.

몰입형 비디오 압축을 위한 스크린 콘텐츠 코딩 성능 분석 (Screen Content Coding Analysis to Improve Coding Efficiency for Immersive Video)

  • 이순빈;정종범;김인애;이상순;류은석
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.911-921
    • /
    • 2020
  • 최근 MPEG-I (Immersive) 그룹에서는 몰입형 비디오(Immersive Video)에 대한 표준화 프로젝트를 통해 압축 성능 탐색을 진행하고 있다. MIV(MPEG Immersive Video) 표준 기술은 다수의 시점 영상과 깊이 맵을 통한 깊이 맵 기반 이미지 렌더링(DIBR)을 바탕으로 제한적인 6DoF을 제공하고자 하는 기술이다. 현재 MIV에서는 바탕 시점(Basic View)과 각 시점의 고유한 영상 정보를 패치 단위로 모아둔 추가 시점(Additional View)으로 처리하는 모델을 채택하고 있다. MIV에서 생성된 아틀라스는 포함되는 시점의 성격에 따라 다른 영상의 특성을 나타내어 비디오 코덱의 압축 효율에 대한 고찰이 필요하다. 따라서 본 논문에서는 다양한 시점과 패치들이 반복되는 패턴에 착안하여 화면 내 블록 카피(IBC: intra block copy) 등의 압축 기법이 포함된 스크린 콘텐츠 코딩 툴에 대한 성능 비교 분석을 진행하여 복원 영상에서 최대 -15.74% Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다.