• Title/Summary/Keyword: 비디오 기반 기술

Search Result 705, Processing Time 0.023 seconds

An Automatic Summarization System of Baseball Game Video Using the Caption Information (자막 정보를 이용한 야구경기 비디오의 자동요약 시스템)

  • 유기원;허영식
    • Journal of Broadcast Engineering
    • /
    • v.7 no.2
    • /
    • pp.107-113
    • /
    • 2002
  • In this paper, we propose a method and a software system for automatic summarization of baseball game videos. The proposed system pursues fast execution and high accuracy of summarization. To satisfy the requirement, the detection of important events in baseball video is performed through DC-based shot boundary detection algorithm and simple caption recognition method. Furthermore, the proposed system supports a hierarchical description so that users can browse and navigate videos in several levels of summarization. In this paper, we propose a method and a software system for automatic summarization of baseball game videos. The proposed system pursues fast execution and high accuracy of summarization. To satisfy the requirement, the detection of important events in baseball video is performed through DC-based shot boundary detection algorithm and simple caption recognition method. Furthermore, the proposed system supports a hierarchical description so that users can browse and navigate videos in several levels of summarization.

Video object segmentation and frame preprocessing for real-time and high compression MPEG-4 encoding (실시간 고압축 MPEG-4 부호화를 위한 비디오 객체 분할과 프레임 전처리)

  • 김준기;이호석
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.28 no.2C
    • /
    • pp.147-161
    • /
    • 2003
  • Video object segmentation is one of the core technologies for content-based real-time MPEG-4 encoding system. For real-time requirement, the segmentation algorithm should be fast and accurate but almost all existing algorithms are computationally intensive and not suitable for real-time applications. The MPEG-4 VM(Verification Model) has provided basic algorithms for MPEG-4 encoding but it has many limitations in practical software development, real-time camera input system and compression efficiency. In this paper, we implemented the preprocessing system for real-time camera input and VOP extraction for content-based video coding and also implemented motion detection to achieve the 180 : 1 compression rate for real-time and high compression MPEG-4 encoding.

Analysis of MPEG-4 Encoder for Object-based Video (실시간 객체기반 비디오 서비스를 위한 MPEG-4 Encoder 분석)

  • Kim Min Hoon;Jang Euee Seon;Lee Sun young;Moon Seok ju
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.1
    • /
    • pp.13-20
    • /
    • 2004
  • In this paper, we have analyzed the current MPEG-4 video encoding tools and proposed efcient coding techniques that reduce the complexity of the encoder. Until recently, encoder optimization without shape coding has been a major concern in video for wire/wireless low bit rate coding services. Recently, we found out that the computational complexity of MPEG-4 shape coding plays a very important role in the object-based coding through experiments. We have made an experiment whether we could get optimized object-based coding method through successfully combining latest optimized texture coding techniques with our proposed optimized shape coding techniques. In texture coding, we applied the MVFAST method for motion estimation. We chose not to use IVOPF(Intelligent VOP Formation) but to use TRB(Tightest Rectangular Boundary) for positioning VOP and, finally, to eliminate the spiral search of shape motion estimation to reduce the complexity in shape coding. As a result of experiment, our proposed scheme achieved improved time complexity over the existing reference software by $57.3\%$ and over the optimized method on which only shape coding was applied by $48.7\%$, respectively.

Toward a Key-frame Extraction Framework for Video Storyboard Surrogates Based on Users' EEG Signals (이용자 기반의 비디오 키프레임 자동 추출을 위한 뇌파측정기술(EEG) 적용)

  • Kim, Hyun-Hee;Kim, Yong-Ho
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.49 no.1
    • /
    • pp.443-464
    • /
    • 2015
  • This study examined the feasibility of using EEG signals and ERP P3b for extracting video key-frames based on users' cognitive responses. Twenty participants were used to collect EEG signals. This research found that the average amplitude of right parietal lobe is higher than that of left parietal lobe when relevant images were shown to participants; there is a significant difference between the average amplitudes of both parietal lobes. On the other hand, the average amplitude of left parietal lobe in the case of non-relevant images is lower than that in the case of relevant images. Moreover, there is no significant difference between the average amplitudes of both parietal lobes in the case of non-relevant images. Additionally, the latency of MGFP1 and channel coherence can be also used as criteria to extract key-frames.

Intra Block Copy Analysis to Improve Coding Efficiency for Immersive Video (몰입형 비디오 압축을 위한 화면 내 블록 카피 성능 분석)

  • Lee, Soonbin;Jeong, Jong-Beom;Ryu, Il-Woong;Kim, Sungbin;Kim, Inae;Ryu, Eun-Seok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.1-5
    • /
    • 2020
  • 최근 MPEG-I 그룹에서는 표준화가 진행중인 몰입형 미디어(Immersive Media)에 대한 압축 성능 탐색이 이루어지고 있다. 몰입형 비디오는 다수의 시점 영상과 깊이 맵을 통한 깊이 맵 기반 이미지 렌더링(DIBR)을 바탕으로 제한적 6DoF 을 제공하고자 하는 기술이다. 현재 MIV(Model for Immersive Video) 기술에서는 바탕 시점(Basic View)과 각 시점의 고유한 영상 정보를 패치 단위로 모아둔 추가 시점(Additional View)으로 처리하는 모델을 채택하고 있다. 그 중에서 추가 시점은 일반적인 영상과는 달리 시간적/공간적 상관성이 떨어지는 분절적인 형태로 이루어져 있어 비디오 인코더에 대해 최적화가 되어 있지 않으며, 처리 방법의 특성에 따라 자기 유사적인 형태를 지니게 된다. 따라서 MIV 에서 스크린 콘텐츠 코딩 성능과 함께 화면 내 블록 카피(IBC: intra block copy) 기술에 대한 성능을 분석 결과를 제시한다. IBC 미적용 대비 최대 7.56%의 Y-PSNR BD-rate 감소가 가능함을 확인하였으며, 영상의 특성에 따라 IBC 의 선택 비율을 확인하여 추가 시점의 효율적인 압축 형태를 고찰한다.

  • PDF

MXF Structure Supporting UHD Video for Contents Production in Cloud Computing Environments (클라우드 컴퓨팅환경에서 UHD 콘텐츠 제작을 위한 MXF 연구)

  • Go, Kyung-Hee;Cho, Suk-Hee;Choi, Jin-Soo;Chang, Il-Sick;Jang, Ho-Eun;Kim, A-Ra;Park, Goo-Man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.11a
    • /
    • pp.204-205
    • /
    • 2013
  • 본 논문은 클라우드 컴퓨팅환경에서 향후 TLS 기반 제작 및 편집의 중요성에 주목하여 UHD 콘텐츠 편집을 지원하는 MXF 구조에 관하여 논하였다. 기술의 발전으로 인해 화면의 해상도가 최소 4K UHD로 높아짐으로써 초고해상도 콘텐츠를 편집하기 위한 기술들이 필요하다. 이를 위해 대용량의 비디오 데이터를 높은 압축률로 부호화할 수 있는 기술이 지원되어야 한다. 본 논문에선 초고해상도로 인한 대용량의 UHD 비디오 제작을 위한 비트스트림을 지원하는 MXF의 에센스 콘테이너를 제안한다.

  • PDF

WBAN applications based on Bluetooth (블루투스 기반 WBAN 응용 시스템 개발)

  • Kim, Myeong-Gyu;Son, Ji-Yeon;Yang, Il-Sik;Park, Jun-Seok
    • Information and Communications Magazine
    • /
    • v.25 no.2
    • /
    • pp.47-53
    • /
    • 2008
  • 블루투스는 IETE 802.15 BAN스터디그룹에서 제안하는 다양한 WBAN 응용 시나리오를 이미 지원하고 있는 매우 성숙된 기술로서 향후 새로운 WBAN MAC/PHY의 시장 진입을 위해 블루투스 응용 방식에 대한 분석이 필요하다. 본 고에서는 블루투스를 활용한 WBAN 응용 서비스로서 생체 정보 모니터링, 원격 제어/IO와 착용형 멀티미디어 스트림 시스템 개발에 대하여 살펴본다. 생체 정보 모니터링이나 원격 제어/IO의 경우는 시스템 개발 초기엔 블루투스를 많이 활용하였으나 저전력을 위해 지그비 사용이 증가하고 있으며 더 나아가 새로운 WBAN 기술이 활용될 것으로 기대된다. 착용형 멀티미디어 스트림의 경우는 블루투스가 계속 발전할 것으로 예상된다. 본 고에서 기술하는 착용형 블루투스 오디오 시스템에서는 웨어러블 MP3 플레이어와 같은 개인용 음악 재생기를 확장하여 복수의 사용자가 무선으로 오디오를 공유한다. 착용형 블루투스 멀티미디어 시스템에서는PMP와 같은 국지 동영상 파일 재생기의 발전된 모습으로 비디오는 안경형이나 손목시계형 무선 디스플레이 장치에서 재생하고 오디오는 무선 헤드폰에서 비디오와 동기적으로 재생한다. 또한 국지 미디어뿐만 아니라 근거리 IP 무선망에 있는 미디어도 UPnP-Bluetooth 브리지를 통하여 스트리밍된다.

Implementation of a stereoscopic video web platform through A-Frame-based HMD devices (A-Frame 기반의 HMD 기기를 통한 stereoscopic 비디오 웹 플랫폼 구현)

  • Kim, Jiwon;Jeon, Soohyun;Kim, Dongho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.253-255
    • /
    • 2021
  • 근래에 메타버스가 크게 주목을 받으면서 VR 영상의 퀄리티가 중요해졌다. VR 실사 영상의 경우 HMD 로 시청할 때 모노 및 스테레오 환경으로 입체감을 느끼게 한다. 하지만 스테레오스코픽 비디오의 경우 제작자가 스테레오스코픽으로 촬영하지 않으면 제공하기 어렵다는 단점이 있다. 본 논문에서는 이를 해결하기 위해 RVS 를 Client 단에서 활용하여 제공하는 방식을 고려, 모든 장치에서 스테레오스코픽을 시청할 수 있는 웹 플랫폼을 aframe 프레임워크를 사용하여 제작하고, PC HMD 등 HMD 에서 웹 플랫폼 접근 시 생기는 제한을 해결하는 방법도 같이 서술한다.

  • PDF

A Parallel Streaming Server for the Realtime 3D Internet Broadcasting (병렬 스트리밍 서버 기반 실시간 3D 인터넷 방송 서비스)

  • Kang, Mi-Young
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.7
    • /
    • pp.879-884
    • /
    • 2020
  • In the conventional video file system, videos are stored in a high performance server which has mass storage hard disks or disk arrays. For 3D internet broadcasting, real time operations are required to transmit video files to many clients. This paper describes the design of the 3D internet broadcasting system which can provide realtime streaming service to many users in the 5G environment. In reality, unicast is used to transmit multimedia contents over the internet rather than IP multicast since IP multicast has its own drawbacks in deployment, security, maintenance and so on. In addition, multimedia broadcasting service system like VoD has difficulties in applying to 3D internet broadcasting system since it requires a large amount of system and network resources. In this work, we develop a 3D internet broadcasting system which can construct effective data delivery by minimizing performance-degrading factors.

Kernel-Based Video Frame Interpolation Techniques Using Feature Map Differencing (특성맵 차분을 활용한 커널 기반 비디오 프레임 보간 기법)

  • Dong-Hyeok Seo;Min-Seong Ko;Seung-Hak Lee;Jong-Hyuk Park
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.13 no.1
    • /
    • pp.17-27
    • /
    • 2024
  • Video frame interpolation is an important technique used in the field of video and media, as it increases the continuity of motion and enables smooth playback of videos. In the study of video frame interpolation using deep learning, Kernel Based Method captures local changes well, but has limitations in handling global changes. In this paper, we propose a new U-Net structure that applies feature map differentiation and two directions to focus on capturing major changes to generate intermediate frames more accurately while reducing the number of parameters. Experimental results show that the proposed structure outperforms the existing model by up to 0.3 in PSNR with about 61% fewer parameters on common datasets such as Vimeo, Middle-burry, and a new YouTube dataset. Code is available at https://github.com/Go-MinSeong/SF-AdaCoF.