• 제목/요약/키워드: media object service

검색결과 74건 처리시간 0.02초

다중 카메라 기반의 객체중심 맞춤형 영상 미디어 서비스를 위한 메타데이터 관리 시스템 구현 (Metadata Management System Implementation for Object-oriented Personalized Media Service based on Multiple Camera)

  • 변성우;이소민;이석필
    • 방송공학회논문지
    • /
    • 제19권5호
    • /
    • pp.631-639
    • /
    • 2014
  • 디지털 방송 서비스가 시작되고, 기존의 방송 서버에서 사용자에게 방송 콘텐츠를 제공하는 단 방향 방송이 아닌 통신망을 이용하여 사용자가 방송 서버에 정보를 전달하는 양 방향 방송서비스가 가능해졌다. 이에 사용자는 개인이 원하는 장면을 원하는 시간대에 시청하는 맞춤형 방송 서비스에 대한 요구가 생겨나게 되었다. 이러한 맞춤형 방송 서비스에서는 사용자가 입력한 데이터를 바탕으로 검색하기 위한 메타데이터 정보가 중요하다. 본 연구는 기존의 사용자가 원하는 장면별로 시청하는 맞춤형 방송 서비스에서 원하는 장면 뿐 만 아니라 사용자가 보고 싶은 객체를 원하는 카메라 시점에서 시청할 수 있는 객체 중심의 맞춤형 영상미디어 서비스를 위한 메타데이터에 관리 모듈에 대한 연구이다. 본 연구를 통하여 기존의 맞춤형 방송 서비스에 없었던 객체에 대한 세그먼트 정보를 제공해 줌으로써 사용자에게 시청의 폭을 넓혀 시청 만족도를 높일 수 있다.

A Proposal for Zoom-in/out View Streaming based on Object Information of Free Viewpoint Video

  • Seo, Minjae;Paik, Jong-Ho;Park, Gooman
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.929-946
    • /
    • 2022
  • Free viewpoint video (FVV) service is an immersive media service that allows a user to watch it from a desired location or viewpoint. It is composed of various forms according to the direction of the viewpoint of the provided video, and includes zoom in/out in the service. As consumers' demand for active watching is increasing, the importance of FVV services is expected to grow gradually. However, additional considerations are needed to seamlessly stream FVV service. FVV includes a plurality of videos, video changes may occur frequently due to movement of the viewpoint. Frequent occurrence of video switching or re-request another video can cause service delay and it also can lower user's quality of service (QoS). In this case, we assumed that if a video showing an object that the user wants to watch is selected and provided, it is highly likely to meet the needs of the viewer. In particular, it is important to provide an object-oriented FVV service when zooming in. When video zooming in in the usual way, it cannot be guaranteed to zoom in around the object. Zoom function does not consider about video viewing. It only considers the viewing screen size and it crop the video view as fixed screen location. To solve this problem, we propose a zoom in/out method of object-centered dynamic adaptive streaming of FVV in this paper. Through the method proposed in this paper, users can enjoy the optimal video service because they are provided with the desired object-based video.

무선 모바일 네트워크상에서 스트리밍 미디어 서비스를 위한 객체 버전 트랜스코딩 (Object version Transcoding for Streaming Media Service in Wireless Mobile Networks)

  • 이종득
    • 한국항행학회논문지
    • /
    • 제15권3호
    • /
    • pp.355-363
    • /
    • 2011
  • 무선 모바일 네트워크상에서 트랜스코딩은 지연을 줄이고, 스트림의 처리 성능을 향상시키는 중요한 메커니즘이다. 그러나 무선 모바일 스트리밍 미디어 서비스는 제한된 네트워크 대역폭과 자원 등으로 인하여 혼잡, 간섭 및 지연등과 같은 문제점이 발생하고 있다. 간섭과 지연은 QoS를 떨어뜨릴 뿐만 아니라 스트리밍 미디어 서비스의 응답성을 떨어뜨린다. 본 논문에서는 객체 버전 트랜스코딩 기법을 제안한다. 제안된 기법은 객체 버전들을 분석하여 트랜스코딩 그래프를 구축한다. 스트리밍을 효율적으로 제어하기 위하여 참조율 기반 제어 함수를 이용하며, 지연 절약을 위해 MVDS(Multiple Version Delay Saving)를 측정한다. 시뮬레이션 결과 제안된 기법이 다른 비교 결과 기법들에 비해서 지연율, 캐시 히트율이 증가됨을 보인다.

Method of extracting context from media data by using video sharing site

  • Kondoh, Satoshi;Ogawa, Takeshi
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.709-713
    • /
    • 2009
  • Recently, a lot of research that applies data acquired from devices such as cameras and RFIDs to context aware services is being performed in the field on Life-Log and the sensor network. A variety of analytical techniques has been proposed to recognize various information from the raw data because video and audio data include a larger volume of information than other sensor data. However, manually watching a huge amount of media data again has been necessary to create supervised data for the update of a class or the addition of a new class because these techniques generally use supervised learning. Therefore, the problem was that applications were able to use only recognition function based on fixed supervised data in most cases. Then, we proposed a method of acquiring supervised data from a video sharing site where users give comments on any video scene because those sites are remarkably popular and, therefore, many comments are generated. In the first step of this method, words with a high utility value are extracted by filtering the comment about the video. Second, the set of feature data in the time series is calculated by applying functions, which extract various feature data, to media data. Finally, our learning system calculates the correlation coefficient by using the above-mentioned two kinds of data, and the correlation coefficient is stored in the DB of the system. Various other applications contain a recognition function that is used to generate collective intelligence based on Web comments, by applying this correlation coefficient to new media data. In addition, flexible recognition that adjusts to a new object becomes possible by regularly acquiring and learning both media data and comments from a video sharing site while reducing work by manual operation. As a result, recognition of not only the name of the seen object but also indirect information, e.g. the impression or the action toward the object, was enabled.

  • PDF

Augmented Reality Service Based on Object Pose Prediction Using PnP Algorithm

  • Kim, In-Seon;Jung, Tae-Won;Jung, Kye-Dong
    • International Journal of Advanced Culture Technology
    • /
    • 제9권4호
    • /
    • pp.295-301
    • /
    • 2021
  • Digital media technology is gradually developing with the development of convergence quaternary industrial technology and mobile devices. The combination of deep learning and augmented reality can provide more convenient and lively services through the interaction of 3D virtual images with the real world. We combine deep learning-based pose prediction with augmented reality technology. We predict the eight vertices of the bounding box of the object in the image. Using the predicted eight vertices(x,y), eight vertices(x,y,z) of 3D mesh, and the intrinsic parameter of the smartphone camera, we compute the external parameters of the camera through the PnP algorithm. We calculate the distance to the object and the degree of rotation of the object using the external parameter and apply to AR content. Our method provides services in a web environment, making it highly accessible to users and easy to maintain the system. As we provide augmented reality services using consumers' smartphone cameras, we can apply them to various business fields.

CBQ 스케줄링을 이용한 홈게이트웨이 내 멀티미디어 플랫폼의 QoS 제공 (QoS Supporting for Media Platform located in Home Gateway using CBQ Scheduling)

  • 이호찬;신혜민
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.71-73
    • /
    • 2004
  • Recently many peoples served multimedia data from Internet. But characteristic of multimedia-object about that effect on weight and transport-time causes Streaming Application is restricted to high-quality-service. This research propose the Quality-of-service(QoS) supporting for Home Gateway that behaving Routing and media platform equipment, using CBQ Scheduling scheme. The QoS Supporting for Multimeda Service that using general Rouging policy is difficult because media platform locate in Home Gateway. Therefore this research propose Routing mechanism to QoS support of media platform located in Gateway using TCP based CBQ Control.

  • PDF

효율적인 서비스 품질을 위한 동적 시간형 멀티미디어 동기화 모델 (Dynamic Timed Multimedia Synchronization Model for Efficient Quality of Service)

  • 이근왕;오해석
    • 전자공학회논문지C
    • /
    • 제36C권10호
    • /
    • pp.75-80
    • /
    • 1999
  • 고품질의 서비스를 보장할 수 있는 멀티미디어 응용 소프트웨어를 효과적으로 개발하기 위해서는 연속 미디어의 동기화뿐만 아니라 비연속 미디어를 포함하는 동기화를 표현할 수 있는 멀티미디어 동기화 모델이 요구된다. 본 논문에서는 사용자의 이벤트 발생에 의해서 변화되는 동적 키 매체라는 특별한 객체 제어기를 갖게 된다. 이러한 이벤트는 발생시간과 주기를 예측할 수 없는 미디어가 된다. 이벤트 발생은 오디오뿐만 아니라 텍스트, 이미지도 키 매체로 선택하여 수행하는 역할을 한다 객체 제어기는 다음 전이에 정보를 전달하는 역할을 한다. 제안한 모델은 최대 허용 지터값과 최대 허용 스큐값을 재생시간에 포함하여 재생률을 향상시켰고, 시뮬레이션을 통해 제시한 방법의 타당성을 검증하였다.

  • PDF

사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법 (An User Controllable Object Audio File Format and Audio Scene Description)

  • 조충상;김제우
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.25-33
    • /
    • 2010
  • 최근의 오디오 기술은 사용자 중심으로 변화하고 있으며, 사용자의 환경과 의도에 따라 능동적으로 서비스가 이루어지는 대화형 오디오 서비스 시대로 변화하고 있다. 이에 맞추어 시장에서는 고품질 오디오 서비스를 위한 무손실 오디오 기술을 탑재한 멀티미디어 기기와 사용자가 선택적으로 악기를 조절할 수 있는 객체 오디오 음원 서비스가 이루어지고 있다. 본 논문에서는 사용자가 컨트롤 할 수 있는 실감 객체 오디오 파일 포맷을 설계하고 실감 정보를 낮은 복잡도에서 저장 매체와 전송 매체에 적용 가능한 오디오 장면 묘사 방법을 제안한다. 설계된 실감 객체 오디오 파일 포맷은 MPEG-4 파일 포맷을 기반으로 설계되었다. MPEG-4 파일 포맷은 MPEG-4에 속하는 고성능 오디오 코덱을 오디오 코덱 객체 번호를 통해서 쉽게 적용가능하다. 또한 오디오 객체 개수의 변화에 따라 파일 포맷의 트랙을 변화 시켜 사용하면 되므로 객체 오디오를 포함하기에 적절하다. 본 연구에서 개발된 파일 포맷은 실감 객체오디오 생성시 MPEG-4 오디오 코덱으로 압축된 객체 오디오, 실감 객체 오디오를 위한 오디오 장면 묘사 데이터를 독립적인 트랙으로 포함하고 있다. 포함된 오디오 장면 묘사 기법은 저장 매체를 위해 전체 오디오 장면에 적용되는 오디오 묘사 기법과 각각의 오디오 객체에 적용되는 오디오 묘사 기법을 노드 구조로 설계 하였으며, 전송 매체를 위해서 기본적인 객체 오디오 동작을 하기위한 필수 정보와 오디오 세부장면 묘사를 위한 정보로 분할하여 설계하였다. 이를 바탕으로 본 연구에서는 실감 객체 오디오 시뮬레이터를 개발하였다. 개발된 시뮬레이터는 객체 음원과 오디오 장면 묘사 정보를 부호화하여 MPEG-4 파일 포맷에 저장하며, 생성된 실감 객체 오디오 파일은 재생 모듈에서 오디오 객체에 입력 받은 사용자 정보와 오디오 장면 묘사 정보가 적용되어 사용자에게 몰입감이 높은 실감 오디오 서비스를 제공한다.

프록시 시스템에서 차별화된 스트리밍 미디어 서비스를 위한 퍼지 적합도 기반 트랜스 코딩 (Fuzzy Relevance-based Transcoding for Differentiated Streaming Media Service in the Proxy System)

  • 이종득
    • 한국산학기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.2785-2792
    • /
    • 2011
  • 프록시 시스템에서 지연, 혼잡, 간섭 등의 문제는 QoS(Quality of Service)를 떨어뜨릴 뿐만 아니라 또한 스트리밍 미디어 서비스의 응답성과 신뢰성을 떨어뜨린다. 본 논문에서는 이러한 문제를 해결하기 위하여 새로운 퍼지적합도 기반의 트랜스코딩 프록시 FRTP(Fuzzy Relevance-based Transcoding Proxy) 메커니즘을 제안한다. 제안된 FRTP메커니즘은 미디어 객체의 분할된 세그먼트 버전에 대한 퍼지 적합도를 분석하며, 분석된 퍼지 적합도에 따라 퍼지 적합도 트랜스코딩 그래프 FRTG(Fuzzy Relevance-based Transcoding Graph)를 생성한다. FRTG는 분할된 미디어 객체 세그먼트 버전들에 대한 트랜스코딩을 결정하게 되며, 결정된 트랜스코딩은 세그먼트 버전들 사이의 지연절약율 DSR(Delay Saving Ratios), 캐시 히트 정확률 CHPR(Cache Hit Precision Ratio), 그리고 캐시 히트 재현율 CHRR(Cache Hit Recall Ratio)을 향상시키게 된다. 제안된 기법의 성능을 알아보기 위하여 DSR, CHPR, 그리고 CHRR의 성능을 평가하였으며, 그 결과 제안된 기법이 비교 기법들에 비해서 DSR, CHPR, 그리고 CHRR의 성능이 향상됨을 알게 되었다.

단방향 맞춤형 방송 환경에서의 객체 캐루젤(Object Carousel) 기반의 TV-Anytime Metadata 전송 기법 (TV-Anytime metadata delivery method based on object carousel for unidirectional personalized broadcasting environment)

  • 김승현;임종태
    • 방송공학회논문지
    • /
    • 제9권4호
    • /
    • pp.297-304
    • /
    • 2004
  • TV-Anytime 규격은 맞춤형 방송 서비스를 위한 metadata의 표준을 규정하고 있다. 맞춤형 방송 서비스를 위해서는 metadata가 각 방송 시스템에 적합한 전송 방식을 사용하여 전송되는데, MPEG-2를 기반으로 하는 단방향 디지털 방송 환경에서는 섹션 (Sections), 데이터 캐루젤(Data Carousel)이나 객체 캐루젤(Object Carousel) 등의 방법으로 전송될 수 있다. 본 논문에서는 ATSC-ACAP이나 DVB-MHP와 같은 디지털 데이터 방송(Data Broadcasting)에서 사용되는 객체 캐루젤 전송 방식을 통해 TV-Anytime metadata을 전송하는 방법을 제시한다. 또한 객체 캐루젤을 이용한 TY-Anytime metadata의 전송을 ACAP 데이터 방송 단말기에 적용하여 구현한 예를 소개한다.