• 제목/요약/키워드: Scene Description

검색결과 72건 처리시간 0.028초

T-DMB 하이브리드 데이터 서비스 Part 1: 하이브리드 BIFS 기술 (T-DMB Hybrid Data Service Part 1: Hybrid BIFS Technology)

  • 임영권;김규헌;정제창
    • 방송공학회논문지
    • /
    • 제16권2호
    • /
    • pp.350-359
    • /
    • 2011
  • 1990년대 이후 방송 기술의 눈부신 발전은 고선명 방송 서비스의 도입으로 가정에서의 고화질 방송 서비스 제공을 가능하게 하였을 뿐만 아니라, 이동 방송 서비스의 등장으로 고속으로 이동하는 차량에서도 방송 서비스를 즐길 수 있도록 하였다. Terrestrial Digital Multimedia Broadcasting (T-DMB) 기술은 이동 방송 서비스 제공을 위해 개발된 기술 중 성공적으로 상용화된 기술 중 하나이다. 고속 이동체에서의 안정적인 방송 수신 기능 외에 T-DMB의 기술적 혁신 중 주목할 만한 것으로는 MPEG-4 표준에 기반 한 시스템 프레임워크를 들 수 있다. 이는 장면 기술(Scene Description) 및 그래픽 객체 표현 언어인 Binary Format for Scene (BIFS)와 객체(object) 개념의 멀티미디어 구성 요소 표현 방식인 Object Descriptor (OD) 프레임워크를 통해 대화형 데이터 서비스를 제공할 수 있다. 그런데, T-DMB 대화형 데이터 서비스에는 두 가지 근본적인 제약 사항이 존재한다. 첫 번째 제약 사항은 대화형 서비스를 위한 그래픽 데이터는 비디오 화면을 벗어날 수 없어 항상 비디오 화면 위에 중첩되어 표현되어야 한다는 것이다. 두 번째 제약 사항은 양방향 서비스를 위한 데이터는 항상 방송망을 통해서만 전송되어야 한다는 것이다. 이러한 제약 사항은 단말의 위치 정보나 사용자의 특성 정보를 반영한 개인 맞춤형 서비스 제공의 제약조건이 되고 있다. 본 논문에서는 이러한 제약 사항을 극복하기 위해 기존방송망 및 무선 인터넷 망을 통해 각각 전송되는 장면 기술 정보 뿐만 아니라, 단말의 저장 장치에 저장된 장면 기술 정보를 활용하는 T-DMB 하이브리드 데이터 서비스 방식을 제안하고 기존 T-DMB 데이터 서비스와의 역호환성을 보장하는 하이브리드 BIFS 기술을 제안한다.

MPEG-4 LASeR PMSI를 활용한 Secondary Device 기반 파노라믹 영상 슬라이드 쇼 재생 기술 (Slide-show of Panoramic Image through a Secondary Device by using MPEG-4 LASeR PMSI)

  • 박용철;김규헌
    • 방송공학회논문지
    • /
    • 제17권6호
    • /
    • pp.1014-1028
    • /
    • 2012
  • 최근 N 스크린 (n-screen) 과 secondary device이란 말이 사람들의 입에 자주 오르내린다. 또한 주위에서 자주 사용하는 기기를 통해 앞에서 말한 서비스를 직접 경험할 수도 있다. 하나의 멀티미디어 기술이면서 서비스 이름인 N 스크린이란 하나의 콘텐츠를 여러개의 기기에서 끊김 없이 연속적으로 즐길 수 있는 기술 또는 서비스이다. 그리고 secondary device란 주된 콘텐츠를 보여주는 main device와 연동하여 주된 콘텐츠에 관련된 추가 콘텐츠를 보여주는 보조 기기가 있는 서비스이다. 이러한 기술 및 서비스가 각 이동통신사 등에서 몇 년 전부터 거론되어 오고 있으며 현재 대중화된 다양한 멀티미디어 기기에 재조명되어 제공되고 있다. 그러나 현재의 이 서비스는 단순히 사용자가 정식 구매한 멀티미디어 콘텐츠를 자신의 기기가 아닌 이동통신사의 미디어 서버에 올려놓고 필요에 따라 인터넷을 통해 접근한다는 한계가 있다. 이에 본 논문에서는 장면의 동적인 업데이트를 위해 다양한 명령을 포함한 장면 서술정보를 제공 할 수 있는 국제 표준 규격인 MPEG-4 LASeR (Lightweight Application Scene Representation) PMSI (Presentation and Modification of Structured Information) 를 활용하여 사용자가 좀 더 효과적이고 다양하게 N 스크린 혹은 secondary device 서비스를 사용할 수 있는 방안을 제안한다.

Geometric Regualrization of Irregular Building Polygons: A Comparative Study

  • Sohn, Gun-Ho;Jwa, Yoon-Seok;Tao, Vincent;Cho, Woo-Sug
    • 한국측량학회지
    • /
    • 제25권6_1호
    • /
    • pp.545-555
    • /
    • 2007
  • 3D buildings are the most prominent feature comprising urban scene. A few of mega-cities in the globe are virtually reconstructed in photo-realistic 3D models, which becomes accessible by the public through the state-of-the-art online mapping services. A lot of research efforts have been made to develop automatic reconstruction technique of large-scale 3D building models from remotely sensed data. However, existing methods still produce irregular building polygons due to errors induced partly by uncalibrated sensor system, scene complexity and partly inappropriate sensor resolution to observed object scales. Thus, a geometric regularization technique is urgently required to rectify such irregular building polygons that are quickly captured from low sensory data. This paper aims to develop a new method for regularizing noise building outlines extracted from airborne LiDAR data, and to evaluate its performance in comparison with existing methods. These include Douglas-Peucker's polyline simplication, total least-squared adjustment, model hypothesis-verification, and rule-based rectification. Based on Minimum Description Length (MDL) principal, a new objective function, Geometric Minimum Description Length (GMDL), to regularize geometric noises is introduced to enhance the repetition of identical line directionality, regular angle transition and to minimize the number of vertices used. After generating hypothetical regularized models, a global optimum of the geometric regularity is achieved by verifying the entire solution space. A comparative evaluation of the proposed geometric regulator is conducted using both simulated and real building vectors with various levels of noise. The results show that the GMDL outperforms the selected existing algorithms at the most of noise levels.

MPEG-4 LASeR 장면기술을 활용한 효율적인 EPG 서비스 제공 방법 (Effective EPG service on the basis of using MPEG-4 LASeR scene description)

  • 박용철;김병철;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.188-191
    • /
    • 2011
  • 본 논문에서는 MPEG-4 LASeR (Lightweight Application Scene Representation) 장면기술을 활용하여 효과적인 EPG(Electronic Program Guide) 서비스를 제공하는 방안을 제안한다. EPG는 텔레비전 방송 프로그램의 편성표를 텔레비전 화면상에 표시하는 것으로, 텔레비전을 시청하는 사람은 이 편성표를 통해 원하는 프로그램을 선택하거나 시간, 제목, 채널, 장르 등을 기준으로 원하는 프로그램을 검색할 수 있는 서비스를 말한다. 국제 표준 규격인 MPEG-4에는 장면의 동적인 업데이트를 위해 다양한 명령을 포함한 장면 서술정보를 제공 할 수 있는 LASeR 기술을 제공하고 있다. 특히, LASeR 표준은 구조화된 정보의 표현 및 수정 방법을 제공하기 위한 방법으로 PMSI (Presentation Method & Structured Information)를 제정하였으며, 해당 기술은 장면 서술정보에서 구조화된 정보의 일부분을 참조하여 장면에 효과적으로 표현하는 것을 가능하게 해 준다. 본 논문에서는 MPEG-4 LASeR PMSI를 기존의 텍스트 중심의 단순 EPG에 적용하여 텍스트 뿐만이 아닌 이미지 비디오 등의 멀티미디어 데이터를 활용하여 보다 동적으로 EPG 서비스를 제공하는 방법에 대하여 제안한다.

  • PDF

범죄영화 「이중배상(Double Indemnity)」속 테마음악의 기능적 역할 (The Functional Role of Theme Music in the Crime Movie 「Double Indemnity」)

  • 최유미;이승연
    • 한국콘텐츠학회논문지
    • /
    • 제15권3호
    • /
    • pp.48-56
    • /
    • 2015
  • 1940년대 영화음악은 영화 속 장면의 상황 및 인물의 성격과 심리적 갈등을 내포하며 향후 범죄영화와 긴장감 유발 장면의 테마음악으로 표현되는 기능적 역할을 한다. 따라서 본 연구는 영화음악가 미클로스로자(Miklos Rozsa)가 참여한 영화 "이중배상"에 나오는 테마음악의 음악적 요소가 시간적 흐름에 따른 사건진행을 상징적 방법으로 구성가능하며 영상의 몰입을 위해 감성을 자극하고 상승을 유도하는 것을 입증한다.

비디오 부가데이터 서비스를 위한 지상파 DMB 시스템 개발 (The Development of Terrestrial DMB System for Video Associated Data Services)

  • 김현순;경일수;김상훈;김만식
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.541-553
    • /
    • 2006
  • 지상파 DMB (Digital Multimedia Broadcasting) 본 방송이 시작됨에 따라 고품질의 오디오, 비디오뿐만 아니라 부가 가치를 창출하기 위한 다양한 서비스 모델이 요구되고 있다. 본 논문은 이러한 서비스들 중 하나인 비디오 부가데이터 서비스를 위한 지상파 DMB 저작, 송출 시스템에 관한 것이다. 제안한 시스템은 국내 지상파 DMB 부가데이터 서비스 표준인 MPEG-4 BIFS(Binary Format for Scene) Core2D 장면서술 프로파일과 그래픽스 프로파일을 따른다. 본 시스템은 실시간 저작 수동 송출, 비실 시간 저작 자동 송출이라는 두 중요한 방송 요소를 제공하도록 설계되었으며, 양질의 콘텐츠를 효율적으로 제작하고 제작한 콘텐츠를 비디오 인코더와 연동하여 안정적으로 송출하는 데 중점을 두어 개발되었다. 제안한 시스템은 다양한 수신기와의 정합 실험을 통하여 그 성능을 입증하였으며, 추후 본 방송에 효율적으로 사용될 수 있을 것이다.

스토리보드 이미지 구성 분석 (The configuration analysis for the storyboard image)

  • 임운주
    • 디지털융복합연구
    • /
    • 제11권4호
    • /
    • pp.403-408
    • /
    • 2013
  • 시나리오를 이미지로 바꾸는 첫 단계인 스토리보드에서 나타난 이미지 구성 분석은 문자 해석에서 출발하여 시각적 현상 의미를 표현한다. 즉 텍스트가 가지고 있는 의미의 속성, 그리고 각 이미지의 상징성, 장면들의 관계에 새로운 의미를 부여하는 것이 스토리보드이다. 스토리보드의 의미작용을 파악하고자 이미지 해석과 내적 발화를 통해 분석하였다. 서술 담론의 해석적 차원에서 담론의 동시성은 다양한 정보를 동시다발적으로 묘사할 수 있고, 이러한 많은 정보들이 하나의 에피소드로 엮어지면서 관계성이 제시되었다. 서술 담론의 사건 시간은 주로 객관적이면서도 설명적으로 묘사되어지는 장면으로 등장인물이나 사건에 대한 정확한 정보를 제시하는 데 유용하게 사용되었다. 서술 담론의 시간 연속은 시간에 따른 흐름의 연속성 아래 다양한 공간들이나 이미지를 나타냄으로 하나의 에피소드로 나타났다. 내적 발화 측면에서 본 충돌 이미지는 각각의 파편화된 이미지들이 나타내는 상징적 효과들이 서로 충돌되거나 연결되어 의미를 생성하는 역할을 하였고, 공간의 연속성은 전혀 다른 공간들의 이미지들을 하나의 맥락으로 이어질 때 다른 상징을 나타내는 역할을 하며, 시간의 연속성 또한 각각의 이미지들이 나타내는 상징들을 시간의 흐름 속에서 해석하여 다른 상징성을 만들어 낸다. 이러한 연구 분석 결과를 보면 서술 담론 측면에서는 내러티브 구조에 따른 서술 담론을 표현하지만 내적 발화는 어떠한 서술적 구조가 아닌 관객이 가지고 있는 경험과 정보력을 바탕으로 그 시대에 널리 알려져 있는 문화적 시대적 배경을 통해 해석되어진다. 내적 발화에서 나타난 이미지들은 서로 연관성이 없는 장면들을 충돌시켜 증폭시키고, 다시 재해석하게 하여 총체적 상징성을 드러내는 것으로 나타났다.

다양한 단말에 맞춤형 서비스를 위한 적응적 장면 기술 방법 연구 (Adaptive Scene Description Method for Heterogeneous Devices)

  • 김병철;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.248-251
    • /
    • 2010
  • 현재의 멀티미디어 서비스는 기존의 텍스트 위주의 사용자 환경에서 벗어나 오디오, 비디오뿐만 아닌 이미지, 그래픽, 텍스트 및 미디어 관련 정보 등의 다양한 데이터를 포함하는 멀티미디어 서비스 환경으로 변화하고 있다. 이러한 멀티미디어 서비스는 과거 TV와 컴퓨터 등 한정된 기기에서만 제공되었지만, 최근 휴대폰, MP3 플레이어, PMP 등 미디어 기기의 발전에 따라, 다양한 단말을 대상으로 서비스를 확장하고 있다. 이러한 멀티미디어 서비스를 다양한 단말을 대상으로 제공하기 위하여, 기존의 기술에서는 동일한 콘텐츠를 각각의 단말의 환경에 따라 서로 다른 서비스를 통해 제공하였다. 그러나 IPTV와 홈 네트워크 시스템 등 방송과 통신이 융합되고, 유선과 무선 간에 자유롭게 데이터를 주고받는 환경에서 단말 마다 서로 다른 서비스를 제공하는 것은 서비스 시나리오의 복잡도를 높이고, 다양한 단말을 사용하는 사용자에게 통합되지 않은 서비스를 제공 받게 되는 결과를 가져오게 된다. 이에 본 논문에서는 콘텐츠의 메타데이터를 활용하여 동일한 멀티미디어 서비스를 단말기의 다양한 환경에 따라 맞춤형 서비스를 제공할 수 있는 방법인 적응적 장면 기술을 제시하고, 그 효율성에 관하여 검증한다.

  • PDF

AnoVid: 비디오 주석을 위한 심층 신경망 기반의 도구 (AnoVid: A Deep Neural Network-based Tool for Video Annotation)

  • 황지수;김인철
    • 한국멀티미디어학회논문지
    • /
    • 제23권8호
    • /
    • pp.986-1005
    • /
    • 2020
  • In this paper, we propose AnoVid, an automated video annotation tool based on deep neural networks, that automatically generates various meta data for each scene or shot in a long drama video containing rich elements. To this end, a novel meta data schema for drama video is designed. Based on this schema, the AnoVid video annotation tool has a total of six deep neural network models for object detection, place recognition, time zone recognition, person recognition, activity detection, and description generation. Using these models, the AnoVid can generate rich video annotation data. In addition, AnoVid provides not only the ability to automatically generate a JSON-type video annotation data file, but also provides various visualization facilities to check the video content analysis results. Through experiments using a real drama video, "Misaeing", we show the practical effectiveness and performance of the proposed video annotation tool, AnoVid.

사실적 장면 표현을 위한 렌더링 기술 동향 (The Recent Trends of Rendering Technologies for Realistic Scene Representation)

  • 장호욱;이인호
    • 전자통신동향분석
    • /
    • 제20권6호통권96호
    • /
    • pp.97-109
    • /
    • 2005
  • 컴퓨터를 이용하여 실물이나 가상의 객체를 형상화하고 움직임을 부여하는 컴퓨터 그래픽스(CG)는 현실과 구분할 수 없을 정도의 기술의 발전과 함께 영화, 게임, VR, 산업용 디스플레이, 화상통신 등 디지털 콘텐츠 전분야에서 활용폭이 넓어지고 있다. 렌더링은 CG에서 장면의 추상적인 3차원 description을 2차원 영상으로 생성하는 과정을 말하며, 생성되는 영상의 품질 및 제작시간을 결정하는 중요한 요소로 인식되고 있다. 과거에 비해 전역 조명 및 셰이딩 기술이 발전하면서 극도로 사실적인 영상의 생성이 가능하게 되었으나 이를 렌더링하는 것은 많은 시간을 필요로 하고 있어, 사실적인 영상을 고속으로 렌더링하기 위한 연구가 진행되고 있다. 본 고에서는 CG 제작 과정에서 널리 사용되고 있는 주요 렌더러들의 기능들과 미래의 기술 발전 방향을 분석한다.