• 제목/요약/키워드: Audio and Video

검색결과 804건 처리시간 0.034초

시간 연속적인 스크린 이미지와 오디오의 스트리밍을 위한 멀티미디어 시스템 (Multimedia System for Streaming Time-Continuous Screen Images and Audio)

  • 황기태
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.181-190
    • /
    • 2002
  • 본 논문에서는 컴퓨터를 이용한 원격 강의, 원격 학습, 데모 화면 제작 등의 응용들에 필요한 동영상 멀티미디어 시스템을 제안한다. 이들 멀티미디어 응용들을 지원하기 위해서는 실세계 비디오를 다루는 동영상 시스템과는 달리, 시간적으로 변하는 컴퓨터 스크린과 오디오로 구성되는 동영상을 저작하고 재생하는 멀티미디어 시스템이 요구된다. 연속적으로 변하는 컴퓨터 스크린 이미지는 실세계 비디오의 크기와 영상 특성에 있어 차이점을 가지므로 기존의 MPEG 등과 같은 압축 알고리즘이 부적합하며 따라서 본 논문에서는 새로운 압축 알고리즘을 제안하고 멀티미디어 시스템을 설계 구현한 내용을 설명한다. 또한 본 논문에서 제안된 압축 알고리즘의 성능과 시스템 전체의 성능을 평가한 결과를 보인다.

HTML5 iframe 기반 상호작용형 융합 콘텐츠 저작을 위한 XML 데이터 모형 및 해석기 개발 (XML Data Model and Interpreter Development for Authoring Interactive Convergence Contents based on HTML5 iframe)

  • 이준정;홍준석;김우주
    • 한국콘텐츠학회논문지
    • /
    • 제20권12호
    • /
    • pp.250-265
    • /
    • 2020
  • N-Screen 환경에서 HTML5 표준 기반 콘텐츠 개발은 필연적이다. 그러나 높은 개발 비용과 개발 인프라 부족 등의 이유로 HTML5 조작형 콘텐츠 개발은 소극적이다. 이에 동영상, 오디오와 같은 멀티미디어 콘텐츠를 동적 조작 구현이 가능한 HTML5와 융합하여 사용자와 상호작용이 가능한 효율적인 콘텐츠 개발 모형을 제안하고자 한다. 제안 모형은 통합 제어용 플레이어를 포함한 HTML5 레이아웃 내에 멀티미디어와 iframe(inline frame) 영역을 구분 배치하도록 설계하였다. 상호작용형 HTML5 문서들은 화면 단위로 나누어 작성하여 iframe을 통하여 제공된다. HTML5의

채팅과 오디오의 다중 시구간 정보를 이용한 영상의 하이라이트 예측 (Video Highlight Prediction Using Multiple Time-Interval Information of Chat and Audio)

  • 김은율;이계민
    • 방송공학회논문지
    • /
    • 제24권4호
    • /
    • pp.553-563
    • /
    • 2019
  • 최근 개인방송 플랫폼을 통해 업로드 되는 콘텐츠가 증가함에 따라 시청자의 편의를 위해 하이라이트 영상을 제공하는 서비스에 대한 수요가 증가하고 있다. 이에 본 논문에서는 영상의 하이라이트 위치를 자동으로 예측하는 모델을 제안한다. 제안하는 모델은 채팅과 오디오 정보를 이용하며 양방향 LSTM을 사용해 영상의 흐름을 이해한다. 또한 콘텐츠의 종류에 따라 단기적 흐름과 함께 중장기적 흐름을 파악하는 다중 시구간 모델도 함께 제안한다. 제안한 모델은 개인방송 플랫폼을 통해 중계된 e스포츠와 야구경기 영상들을 이용하여 평가하였으며, 다중 시구간 정보를 활용하는 것이 하이라이트 예측에 유용함을 보였다.

DNN 학습을 이용한 퍼스널 비디오 시퀀스의 멀티 모달 기반 이벤트 분류 방법 (A Personal Video Event Classification Method based on Multi-Modalities by DNN-Learning)

  • 이유진;낭종호
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1281-1297
    • /
    • 2016
  • 최근 스마트 기기의 보급으로 자유롭게 비디오 컨텐츠를 생성하고 이를 빠르고 편리하게 공유할 수 있는 네트워크 환경이 갖추어지면서, 퍼스널 비디오가 급증하고 있다. 그러나, 퍼스널 비디오는 비디오라는 특성 상 멀티 모달리티로 구성되어 있으면서 데이터가 시간의 흐름에 따라 변화하기 때문에 이벤트 분류를 할 때 이에 대한 고려가 필요하다. 본 논문에서는 비디오 내의 멀티 모달리티들로부터 고수준의 특징을 추출하여 시간 순으로 재배열한 것을 바탕으로 모달리티 사이의 연관관계를 Deep Neural Network(DNN)으로 학습하여 퍼스널 비디오 이벤트를 분류하는 방법을 제안한다. 제안하는 방법은 비디오에 내포된 이미지와 오디오를 시간적으로 동기화하여 추출한 후 GoogLeNet과 Multi-Layer Perceptron(MLP)을 이용하여 각각 고수준 정보를 추출한다. 그리고 이들을 비디오에 표현된 시간순으로 재 배열하여 비디오 한 편당 하나의 특징으로 재 생성하고 이를 바탕으로 학습한 DNN을 이용하여 퍼스널 비디오 이벤트를 분류한다.

소리 파형을 이용한 다수 동영상간 시간축 동기화 기법 (Timeline Synchronization of Multiple Videos Based on Waveform)

  • 김신;윤경로
    • 방송공학회논문지
    • /
    • 제23권2호
    • /
    • pp.197-205
    • /
    • 2018
  • 파노라마 이미지는 현재 흔하게 사용되는 기술 중 하나이다. 하지만, 아직까지 파노라마 비디오 제작은 기술적 어려움이 존재한다. 360도 카메라와 같은 특수 카메라가 없을 경우, 파노라마 비디오 제작은 더욱 어려워진다. 파노라마 비디오를 제작하기 위해서는 여러 지점에서 촬영한 다수의 동영상의 시간축을 동기화할 필요가 있다. 하지만 카메라 내부 시계를 통한 시간축 동기화 기법은 내부 하드웨어 차이로 인해 오차가 발생할 수 있다. 이러한 문제를 해결하기 위해 영상 정보 또는 소리 정보를 이용한 다수 비디오 간 시간축 동기화 연구가 진행되었다. 하지만 영상 정보를 이용하는 경우 정확도와 프로세싱 시간에 문제가 있으며 소리 정보를 이용하는 경우 노이즈에 민감하거나 멜로디가 없으면 동기화가 없다는 문제점이 있다. 따라서 본 논문에서는 소리 파형을 이용한 다수 비디오 간 시간축 동기화 기법을 제안한다. 영상 정보 기반 시간축 동기화 기법보다 높은 동기화 정확도를 보여주며 시간적 효율성을 보여준다.

Wireless Audio Sharing (WASH) 시스템 설계 및 구현 (A Design and Implementation of a Wireless Audio Sharing (WASH) System)

  • 손지연;김명규;양일식;박준석
    • 한국정보과학회논문지:정보통신
    • /
    • 제33권2호
    • /
    • pp.139-148
    • /
    • 2006
  • 최근 근거리 무선 통신 기술의 발전과 함께 디지털 오디오 컨텐츠 및 기기들의 증가는 새로운 형태의 네트워크 기반 오디오 스트리밍 서비스를 제공할 수 있는 토대가 되고 있다. 본 논문에서는 블루투스와 무선랜을 통해 스테레오 오디오 컨텐츠를 복수의 사용자들이 공유하는 Wireless Audio Sharing(WASH) 시스템을 설계하고 구현한 내용을 기술한다. WASH 시스템은 단일 오디오 음원에 대해 복수개의 블루투스 수신기들이 공유하는 무선 오디오 공유 기능을 제공하며, 블루투스 오디오 기기와 근거리 망으로 연결된 Universal Plug and Play(UPnP) 스테레오 오디오 기기간의 오디오 스트림 연동 및 제어 기능을 제공한다. 이를 위해서 WASH 시스템은 단일 음원에 대해 다수의 블루투스 오디오 기기들이 수신하도록 블루투스의 스테레오 오디오 전송 프로파일을 확장하였으며, 블루투스 AV 구조 내에서 블루투스 기기들이 동작할 수 있도록 UPnP Audio/video (AV) 구조와 블루투스 확장 오디오 전송 프로파일을 결합하였다. 또한 본 논문에서는 리눅스 기반 노트북에WASH 시스템을 구현하여 오디오 품질을 측정하고 분석한 결과를 기술한다.

인터넷상에서의 실시간 주문형 비디오 설계 및 구현 (A Design and Iplementation of Real Time Video on Demand on Internet)

  • 이종철;탁영봉
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.7-10
    • /
    • 1998
  • In implementing real time video on demand(VOD), the increase of user on internet causes a network traffic congestion. In this paper, we programmed a CGI able to login in VOD home for limiting the number of user in solving the problem, and also applied and adaptive multimedia synchronization technique for controlling video and audio data in a network. In addition, a real time multimedia player was designed and implemented in a personal computer operating at Window95/98/NT.

  • PDF

MPEG-2 비디오 알고리즘을 이용한 비디오 데이터 압축 (Video Data Compression using the MPEG-2 Video Algorithm)

  • 남재열;이영선;이현주;김재곤;이상미;안치득
    • 한국통신학회논문지
    • /
    • 제18권8호
    • /
    • pp.1069-1082
    • /
    • 1993
  • ISO(International Organization for Standardization)는 디지탈 저장메체용의 비디오 및 관련 오디오 표준 개발을 시작 했는데, 그러한 표준화 노력은 MPEG(Moving Picture Experts Group)이라 명명되었으며 현재 ISO-IEC/JTC1/SC29/WG11이 공식 명칭이다. 현재 MPEG은 비디오 및 관련 오디오를 19Mbps급으로 압축할 수 있는 알고리즘들을 연구하고 있다. 본 논문에서는 MPEG-2 비디오 Test Model 2(TM2)를 이용한 비디오 압축 시뮬레이터 구현에 관하여 논하였고, MPEG 비디오 테스트 시퀸스를 이용한 시뮬레이션 결과를 통해 성능을 분석하였다. 또한 구현된 시뮬레이터를 HDTV 시퀸스 압축에도 적용하였다. 그리고 그 결과를 도표에 나타내었으며, 구현된 비디오 압축 시뮬레이터의 부호화 효율을 개선시킬 수 있는 방법들을 제안하였다.

  • PDF

1Mbps 이하 전술통신망에서의 소프트웨어 방식 화상회의 품질향상 연구 (A Research on Quality Improvement of Software-based Video Teleconferencing on the Tactical Communication Networks Less Than 1Mbps)

  • 김권희
    • 한국통신학회논문지
    • /
    • 제37권1C호
    • /
    • pp.63-75
    • /
    • 2012
  • 본 논문은 1Mbps 이하의 전술통신망 환경에서 소프트웨어 방식의 화상회의 운용방안을 연구하였다. 전술통신망 환경은 대역폭이 제한될 뿐만 아니라 불안정한 네트워크 상태로 데이터 손실과 전송지연 현상이 빈번히 발생한다. 또한 전술통신망을 기반으로 하는 지상전술지휘통제체계가 대역폭 사용의 우선권을 갖고 있기 때문에 화상회의가 사용할 수 있는 대역폭은 더욱 제한될 수밖에 없다. 본 논문에서는 이와 같은 전술통신망의 제한사항을 분석하고, 전술통신망 기반의 소프트웨어 방식 화상회의 품질향상 방안과 이를 적용한 실제 운용실험 결과를 함께 제시하였다. 손실패킷에 대한 재전송기법과 데이터 용량을 줄이기 위한 영상크기 축소를 우선적으로 적용하였다. 화상회의 운용을 위해서는 사용자 대역폭 보장이 최선의 해결방안이나 제한된 대역폭의 전술통신망에서는 영상 데이터 압축률 조정, 전송되는 영상 프레임 수 조정, 음성코덱 변경, 음성보정 데이터 사용 등을 최적화하여 화상회의 품질을 향상시킬 수 있다.