• 제목/요약/키워드: Audio and Video

검색결과 803건 처리시간 0.024초

XCRAB :내용 및 주석 기반의 멀티미디어 인덱싱과 검색 시스템 (XCRAB : A Content and Annotation-based Multimedia Indexing and Retrieval System)

  • 이수철;노승민;황인준
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.587-596
    • /
    • 2004
  • 최근들어 오디오, 비디오와 이미지 같은 다양한 디지털 멀티미디어 데이터의 인덱싱, 브라우징과 질의를 위한 새로운 형태의 시스템이 개발되었다. 이러한 시스템은 각 미디어 스트림을 실제 물리적 이벤트에 따라서 작은 유닛단위로 나누고, 물리적 이벤트들을 검색을 위해서 효율적으로 인덱스화 시킨다. 본 논문에서는 오디오-비주얼 데이터의 분석과 세그멘테이션을 위해서 각 데이터가 가지고 있는 오디오, 이미지, 비디오 특징을 이용하는 새로운 방법을 사용한다. 이것은 이미지나 비디오만을 분석했던 이전의 방법들을 문제점을 해결 할 수 있다. 본 논문에서는 이와 같은 방법을 이용하여 XCRAB이라고 불리는 웹 기반 멀티미디어 검색 시스템을 구현하였고, 성능평가를 위해서 여러가지 질의의 조합을 이용하여 실험을 하였다.

Low Peak Feature와 영상 Color를 이용한 유사 동영상 검색 (Similar Movie Retrieval using Low Peak Feature and Image Color)

  • 정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.51-58
    • /
    • 2009
  • 본 논문에서는 오디오의 Low Peak Feature와 영상의 Color 값을 이용하여 유사한 동영상을 찾는 알고리즘을 제안한다. 동영상 검색 시 영상 데이터 전체를 이용하면 많은 시간과 저장 공간이 필요하다. 게다가 같은 영상임에도 해상도 또는 코덱이 다른 경우 전혀 다른 영상으로 인식된다. 따라서 해상도와 코덱이 달라져도 변화가 크지 않은 오디오의 파형으로부터 강인한 Peak 특징을 추출하고, 그 위치의 영상 Color 값을 비교하여 유사한 동영상을 검색하는 방법을 제안한다. 제안 방법의 성능을 확인하기 위해 2,000개의 동영상 데이터를 수집하여 실험하였으며, 그 결과 97.7%의 검색 성공률을 나타내었다.

MPEG-4 시스템 기반의 다시점 전환 시스템 구조 및 재생기 구현 (Multi-View Point switch System Structure & Implementation of Video player in MPEG-4 based)

  • 이준철;이정원;장용석;김승호
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.80-93
    • /
    • 2007
  • 본 논문은 현재 MPEG-4의 3차원 오디오/비디오(3-Dimensional Audio Video, 3DAV) 기술표준에서 다시점 비디오(Multi-view video)서비스를 제공할 수 있는 객체기술자(Object Descriptor)와 기초스트림기술자(Elementary Stream Descriptor)의 구조를 제안한다. 기존의 MPEG-4 시스템 상에서 확장영역을 사용하여 다시점 동영상 서비스를 제공 할 수 있는 객체기술자와 기초스트림의 구조를 각각 정의 하여 분류한 후 각 경우에 대해 분석한다. 기존 시스템의 확장만으로 송수신측과 연계되어 상관관계가 고려된 다시점 비디오 서비스 제공하는 것이 부적합하다는 것을 보인다. 그리고 다시점 영상 전송시 수신측에서 각 시점간의 상관관계를 고려하여 시점 스위칭을 할 수 있는 새로운 객체 기술자를 추가한 구조를 제안한다. 이를 통하여 다시점 비디오 서비스에서 사용자 요구에 따른 시점 전환을 가능하게 하면서, 필요한 시점에 대한 정보만을 전송해서 수신측에 부하를 줄일 수 있다.

모바일 환경의 이동형 카메라를 이용한 사용자 저작 다시점 동영상의 제안 (User-created multi-view video generation with portable camera in mobile environment)

  • 성보경;박준형;여지혜;고일주
    • 디지털산업정보학회논문지
    • /
    • 제8권1호
    • /
    • pp.157-170
    • /
    • 2012
  • Recently, user-created video shows high increasing in production and consumption. Among these, videos records an identical subject in limited space with multi-view are coming out. Occurring main reason of this kind of video is popularization of portable camera and mobile web environment. Multi-view has studied in visually representation technique fields for point of view. Definition of multi-view has been expanded and applied to various contents authoring lately. To make user-created videos into multi-view contents can be a kind of suggestion as a user experience for new form of video consumption. In this paper, we show the possibility to make user-created videos into multi-view video content through analyzing multi-view video contents even there exist attribute differentiations. To understanding definition and attribution of multi-view classified and analyzed existing multi-view contents. To solve time axis arranging problem occurred in multi-view processing proposed audio matching method. Audio matching method organize feature extracting and comparing. To extract features is proposed MFCC that is most universally used. Comparing is proposed n by n. We proposed multi-view video contents that can consume arranged user-created video by user selection.

멀티미디어 DSP를 위한 AVS 비디오 복호화기 구현 (AVS Video Decoder Implementation for Multimedia DSP)

  • 강대범;심동규
    • 대한전자공학회논문지SP
    • /
    • 제46권5호
    • /
    • pp.151-161
    • /
    • 2009
  • Audio Video Standard (AVS)는 중국내의 멀티미디어 응용기기를 위해 개발된 오디오/비디오 압축 표준이다. AVS는 표준화 코덱 중 성능이 가장 우수한 것으로 알려진 H.264/AVC에 비해 낮은 복잡도의 비디오 알고리즘을 사용하면서도 비슷한 RD 성능을 보인다. AVS 비디오 코덱은 VGA급 이상의 영상을 타겟으로 하기 때문에 큰 해상도에서 압축효율이 좋은 $8{\times}8$ 단위 블록의 예측 및 변환 알고리즘을 사용한다. 현재 중국에서 IPTV 및 모바일 애플리케이션을 위한 코덱으로 AVS를 사용하는 비중이 높아지고 있어 국내의 기업 및 연구소에서도 AVS를 위한 애플리케이션 및 칩 개발을 위한 연구가 진행되고 있다. 본 연구에서는 AVS 비디오 복호화기 알고리즘을 분석하고 이를 바탕으로 하여 불필요한 메모리 연산이 없도록 AVS 비디오 복호화기를 구현하고 이를 TI의 Davinci EVM보드에서 최적화하였다. 또한, 제안한 복호화기에 고속의 VLD 알고리즘을 적용하고 linear assembly로 디블록킹 필터를 구현하는 등 DSP에 적합하도록 최적화를 진행하였다. 이를 통해 AVS의 참조 소프트웨어인 RM 5.2J 복호화기와 비교하여 $500%{\sim}700%$의 복호 속도 향상을 이루었다.

시선추적-뇌파 기반의 비디오 요약 생성 방안 연구 (Video Summarization Using Eye Tracking and Electroencephalogram (EEG) Data)

  • 김현희;김용호
    • 한국문헌정보학회지
    • /
    • 제56권1호
    • /
    • pp.95-117
    • /
    • 2022
  • 본 연구는 시선 및 뇌파 정보를 이용하여 오디오-비주얼(audio-visual, AV) 시맨틱스 기반의 동영상 요약 방법들을 개발하고 평가해 보았다. 이를 위해서 27명의 대학생들을 대상으로 시선추적과 뇌파 실험을 수행하였다. 평가 결과, 뇌파와 동공크기 데이터를 함께 사용한 방법의 평균 재현율(0.73)이 뇌파 또는 동공크기 데이터만을 사용한 방법의 평균 재현율(뇌파: 0.50, 동공크기: 0.68)보다 높게 나타났다. 또한 AV 시맨틱스 기반의 개인화된 동영상 요약의 평균 재현율(0.57)이 AV 시맨틱스 기반의 일반적인 동영상 요약의 평균 재현율(0.69)보다 낮게 나타난 원인들을 분석하였다. 끝으로, AV 시맨틱스 기반 동영상 요약 방법과 텍스트 시맨틱스 기반 동영상 요약 방법 간의 차이 및 특성도 비교분석해 보았다.

A Practical Digital Video Database based on Language and Image Analysis

  • Liang, Yiqing
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.24-48
    • /
    • 1997
  • . Supported byㆍDARPA′s image Understanding (IU) program under "Video Retrieval Based on Language and image Analysis" project.DARPA′s Computer Assisted Education and Training Initiative program (CAETI)ㆍObjective: Develop practical systems for automatic understanding and indexing of video sequences using both audio and video tracks(omitted)

  • PDF

체감형 미디어 서비스를 위한 공간음향 기술 동향 (Spatial Audio Technologies for Immersive Media Services)

  • 이용주;유재현;장대영;이미숙;이태진
    • 전자통신동향분석
    • /
    • 제34권3호
    • /
    • pp.13-22
    • /
    • 2019
  • Although virtual reality technology may not be deemed as having a satisfactory quality for all users, it tends to incite interest because of the expectation that the technology can allow one to experience something that they may never experience in real life. The most important aspect of this indirect experience is the provision of immersive 3D audio and video, which interacts naturally with every action of the user. The immersive audio faithfully reproduces an acoustic scene in a space corresponding to the position and movement of the listener, and this technology is also called spatial audio. In this paper, we briefly introduce the trend of spatial audio technology in view of acquisition, analysis, reproduction, and the concept of MPEG-I audio standard technology, which is being promoted for spatial audio services.

A/V용 적외선 송수신장치를 이용한 디지털 비트스트림 무선 통신 시스템 (Digital Bit Stream Wireless Communication System Using an Infrared Spatial Coupler for Audio/Video Signals)

  • 예창희;이광순;최덕규;송규익
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(1)
    • /
    • pp.309-312
    • /
    • 2001
  • In this paper, we proposed a system for bit stream wireless communication using audio/video infrared transceiver and implemented a circuit. The proposed transmitter system converted bit stream into analog signal format that is similar to NTSC. Then the analog signal can be transmitted by infrared spatial coupler for A/V signals. And the receiver system recover the bit stream by inverse process of transmitter.

  • PDF

멀티미디어 기반의 원격 이동 로봇 제어 시스템 (Remote Mobile robot control system using multimedia data)

  • 변재영;문호석;정재한;고성제
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(3)
    • /
    • pp.235-238
    • /
    • 2002
  • This paper presents a remote mobile robot system that transmits streaming video and audio over the lossy packet networks such as (Wireless) LAN. The error resilient video and audio packets are transmitted on the RTP/UDPfP Protocol stack. The mobile robot can be accessed by a certified user from the remoted area. Thus, the movement of mobile robot can be controlled by the operator observing the working surroundings.

  • PDF