• 제목/요약/키워드: 비디오 프래임

검색결과 6건 처리시간 0.027초

다중 객체 기반 전송을 위한 최적화 적응 프래임워크 (An Optimal Adaptation Framework for Transmission of multiple Visual Objects)

  • 임정연;김문철
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.705-710
    • /
    • 2006
  • 인터넷의 성장과 함께 인터넷 상의 비디오 스트리밍은 콘텐츠 전달에 중요한 수단이 되었다. 기존의 비디오 전송 방식은 사용자 터미널에 하나의 압축된 비디오를 스트리밍하는 것이었으나 최근 다중 뷰 비디오 코딩은 다른 시각 각도에 비디오 스트리밍 서비스를 지원하는 새로운 어플리케이션이 되었다. 따라서 단일 비디오는 다른 초점을 갖는 여러 독립된 비디오 스트림으로 구성되며 이는 더 많은 대역폭을 요구한다. 하지만 시간에 따라 네트워크의 대역폭이 변하는 경우, 계획된 비트율에 따라 콘텐츠의 비트량을 조절하여 양질의 콘텐츠 제공을 보장하기 어렵다. 따라서 트랜스코딩은 가변적인 네트워크의 대역폭에 적응하기 위한 필수적인 처리 단계가 되었다. 본 논문에서는 동시에 다중 비디오의 선택 및 트랜스코딩을 함께 고려하는 최적화 방법을 기반으로 한 스트리밍 다중 뷰 비디오의 최적 적응 프래임워크를 제안한다. 최적화된 비디오 스트림의 집합은 네트워크 대역폭, 트랜스코딩 코스트와 같은 제한을 만족하고 최적의 인지적 화질을 갖도록 선택되거나 트랜스코딩될 수 있으며 이는 MCKP로 모델링될 수 있다. 또한 트랜스코딩시 R-D 커브 상에 최적의 점을 얻기 위해 분리계획법이 적용하며 결과를 비교 분석한다.

  • PDF

MPEG 압축 정보를 이용한 모자이크 구성 (A Composition of Mosaic Images based on MPEG Compressed Information)

  • 설정규;이승희;이준환
    • 한국통신학회논문지
    • /
    • 제28권1C호
    • /
    • pp.47-55
    • /
    • 2003
  • 본 논문에서는 압축된 MPEG2 비디오 스트림이 포함하고 있는 정보들을 이용하여 카메라의 움직임에 따른 연속적인 프래임의 변위를 추정하고 이를 기반으로 모자이크 이미지를 구성하는 방법을 제안한다. 제안된 방법에서는 MPEG의 매크로 블록 단위의 움직임 벡터로부터 근사적인 광 플로우(Optical Row)를 구성하고, 이를 이용하여 팬(Pan), 틸트(Tilt) 등의 카메라 동작에 따른 프래임의 변위량을 추출한다. 추정된 변위량은 모자이크 이미지를 구성하는데 있어서 연속되는 비디오 프래임의 기하학적인 변환을 결정한다. 본 논문의 모자이크 구성은 Nicolas가 제안한 분석적 가중치 등을 이용한 혼합(blending) 방법을 사용하였다. 실험결과 분석적인 가중치를 이용한 혼합방법은 평균이나 미디안에 의한 혼합방법보다 배경의 급격한 변화가 적으며 비디오 프래임의 정보를 충실히 활용함을 알 수 있었다. 구성된 모자이크는 압축정보를 디코딩하고 정확한 광플로우를 구성하는 방식에 비해 부호화 과정에 포함된 움직임 벡터를 이용하여 매크로 블록 단위의 근사적인 광플로우를 이용하기 때문에 계산량을 줄일 수 있다. 구성된 근사적인 모자이크는 비디오의 정보를 요약하고 있기 때문에 압축된 비디오 검색을 위한 대표 프레임 등에 사용될 수 있다.

다중 시각 객체 전송을 위한 최적화 적응 프래임워크 (An Optimal Adaptation Framework for Transmission of Multiple Visual Objects)

  • 임정연;김문철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.207-218
    • /
    • 2008
  • 인터넷의 발달과 함께 멀티미디어 스트리밍은 비디오 콘텐츠를 전달하는데 중요한 수단이 되었으며 스트리밍 되는 데이타의 양도 점점 증가하고 있다. 하지만 스트리밍의 양이 증가함에 따라 가변적 네트워크 대역폭을 갖는 IP 네트워크 환경 상에서 실시간 QoS를 보장하기 어려워진다. 본 논문에서는 한정된 가용 대역폭과 트랜스코딩 코스트를 고려하면서 동시에 다중 앵글 콘텐츠의 인지적 화질을 최대화하는 최적화 적응 프레임워크를 제안한다. 제안된 다중 앵글 서비스 프래임워크에서 사용자는 같은 이벤트에 대해 다른 뷰 앵글로 캡쳐된 다중 비디오 스트림들 중에 사용자가 원하는 뷰를 선택할 수 있다. 이러한 향상된 서비스는 시간에 따른 네트워크 대역폭 변화와 같은 네트워크의 스트리밍 문제를 수반한다. 이를 위해 본 논문에서는 제안된 비디오 적응 프래임워크에서 다중 앵글 비디오 콘텐츠는 주어진 대역폭에 맞게 전달하기 위해 다른 비트율로 인코딩되며 적절한 비디오 스트림이 선택되거나 트랜스코딩 될 수 있다고 가정한다. 각 사용자의 선호도에 따른 다양한 위치에서 캡쳐된 콘텐츠의 선택적 소비를 위해, 각 앵글에 제공되는 비트스트림은 다양한 비트율로 인코딩될 수 있고, 제약된 대역폭 환경에서 실시간으로 변하는 비트율에 최적화된 콘텐츠를 전송하기 위해 콘텐츠를 트랜스 코딩되거나 서브 비트스트림이 선택되도록 한다. 이러한 가정을 기반으로 제안된 최적화 적응 프래임워크에서 트랜스 코딩하는데 걸리는 시간을 트랜스코딩 코스트로 정의하고 주어진 트랜스코딩 코스트와 제한된 네트워크 대역폭을 만족하며 동시에 인지적 화질을 최대화하는 방법을 수식화 한다. 또한 제안된 방법의 효율성을 증명하기 위한 다양한 실험 결과를 보인다.

파티클 필터를 장착한 가중된 다중 인스턴스학습을 이용한 전방차량 추적 (Forward Vehicle Tracking Based on Weighted Multiple Instance Learning Equipped with Particle Filter)

  • 박근호;이준환
    • 한국지능시스템학회논문지
    • /
    • 제25권4호
    • /
    • pp.377-385
    • /
    • 2015
  • 본 논문에서는 파티클 필터를 장착하고 WMIL(Weighted Multiple Instance Learning)을 이용한 전방차량 추적 알고리즘을 제안하였다. 제안된 알고리즘에서 영상표현은 Haar-like 특징들을 사용하고 차량인식 결과는 추적하고자 하는 전방차량의 위치를 알아내는데 사용된다. 제안된 방식에서 WMIL과 파티클 필터를 결합하기 위해 기존의 외관모델을 이용한 추적에서 탐색영역에서 영상조각의 추적객체 신뢰도 맵을 계산하는 대신에 파티클 필터의 전파, 관측, 추정, 선택 그리고 분류기 훈련 등의 단계를 매 프래임 마다 순차적으로 수행하여 객체의 새로운 위치를 갱신하였다. 제안된 전방차량 추적방식은 실험을 통해 Ada-boost, MIL(Multiple Instance Learning)이나 WMIL 방법을 이용하는 추적에 비해 파티클 필터로 인해 계산량 증가는 불가피하나 추적의 질적인 정확도는 국도, 고속도로, 터널 및 시내도로 등의 실험 동영상에서 추적대상의 위치오차가 평균 4.5화소 정도로 기존의 추적방법들에 비해 크게 개선되는 것을 확인하였다.

CORBA 기반의 분산 오디오/비디오 스트림 서비스 프레임워크의 설계 및 구현 (Design and Implementation of a Distributed Audio/Video Stream Service Framework based on CORBA)

  • 김종현;노영욱;정기동
    • 정보처리학회논문지A
    • /
    • 제9A권2호
    • /
    • pp.207-216
    • /
    • 2002
  • 본 논문에서는 CORBA환경 하에서 오디오/비디오 스트림을 효율적으로 처리하고 제어하기 위한 분산 오디오/비디오 스트림 프래임워크의 설계와 구현에 관한 내용을 기술한다. 분산 오디오/비디오 스트림 서비스 프레임워크는 오디오/비디오 스트림의 효율적인 처리와 제어 그리고 전송을 위한 소프트웨어 구성 요소들을 분산 객체들로 설계한다. 그리고 오디오/비디오 데이터의 전송 효율을 최적화하기 위하여 제어 데이터와 미디어 데이터의 전송 경로를 분리한다. 분산 객체들은 IDL로 정의하며 JAVA로 구현한다. 그리고 미디어 데이터의 캡쳐, 재생 그리고 통신 채널 등 디바이스에 의존적인 기능들은 JMF에서 제공하는 컴포넌트들로 구현한다. 스트림 통신을 위한 분산 객체들 간의 연결설정과 제어 절차를 보여주며, 검증을 위하여 테스트 시스템을 구축하여 성능을 실험한다. 실험 결과 연결설정 지연은 TCP 연결에 비해 다소 지연을 가지나, 미디어 데이터의 전송은 RTP/UDP프로토콜을 사용하여 CORBA의 IIOP 프로토콜에 비해 최적화된 성능을 보여준다. 또한 미디어 데이터를 전송할 때 서비스 품질을 측정한 결과 만족할 만한 성능을 보여준다.

폭발장면 자동 검출을 위한 저급 수준 비디오 특징의 추상화 (Abstraction Mechanism of Low-Level Video Features for Automatic Retrieval of Explosion Scenes)

  • 이상혁;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.389-401
    • /
    • 2001
  • 본 논문에서는 MPEG형식의 영화 데이터를 대상으로 폭발 장면 자동 추출을 위한 저급 수준 비디오 내용정보의 추상화 방법을 제안하고, 실제 구현을 통하여 그 유용성을 보인다. 제안한 추상화 방법은 폭발시 발생하는 불꽃의 색이 노란색 톤을 가진다는 사실과, 불꽃이 나타나는 프레임은 같은 tit에 속하는 이웃한 프레임과는 화면 구성이 달라지게 되므로 움직임 에너지 값이 커지게 된다는 사실을 바탕으로 한다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프래임을 키 프레임으로 하다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프레임을 키 프레임으로 선택한 후 영역별 주 색깔(Dominant Color)를 추출한다. 이때 색 공간은 양자화를 통한 512색 중 노란색 톤을 가지는 48 색 범위로 정의한다. 이후 매 샷마다 첫 번째 프레임과 이웃한 프레임의 에지 이미지(Edge Image)를 추출하여 이들의 차이로써 움직임 에너지(Motion Energy)를 얻는다. 이 두 가지 정보, 즉 노란색 톤을 가지는 색 정보와, 같은 장면 내의 다른 샷의 움직임 에너지에 비해 큰 값의 움직임 에너지를 갖는 샷을 폭발장면이 포함된 장면으로 검출한다. 실험 결과에 의하면 검색 결과는 주어진 임계값에 의존적이나, Recall과 Precision에서 80% 이상의 검출률을 보이고 있다. 그러나 일반적인 폭발 장면은 찾기에는 노란색 불꽃을 보이지 않는 예외적인 경우가 발생하여 이를 추출하는데 어려움이 있었다. 앞으로 이러한 문제점등은 기존의 오디오 정보를 이용한 폭발 장면 검출 방법과 함께 이용함으로써 해결되어질 수 있을 것이다.

  • PDF