• 제목/요약/키워드: Video/Audio Transfer

검색결과 35건 처리시간 0.073초

An Advanced Coding for Video Streaming System: Hardware and Software Video Coding

  • Le, Tuan Thanh;Ryu, Eun-Seok
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.51-57
    • /
    • 2020
  • Currently, High-efficient video coding (HEVC) has become the most promising video coding technology. However, the implementation of HEVC in video streaming systems is restricted by factors such as cost, design complexity, and compatibility with existing systems. While HEVC is considering deploying to various systems with different reached methods, H264/AVC can be one of the best choices for current video streaming systems. This paper presents an adaptive method for manipulating video streams using video coding on an integrated circuit (IC) designed with a private network processor. The proposed system allows to transfer multimedia data from cameras or other video sources to client. For this work, a series of video or audio packages from the video source are forwarded to the designed IC via HDMI cable, called Tx transmitter. The Tx processes input data into a real-time stream using its own protocol according to the Real-Time Transmission Protocol for both video and audio, then Tx transmits output packages to the video client though internet. The client includes hardware or software video/audio decoders to decode the received packages. Tx uses H264/AVC or HEVC video coding to encode video data, and its audio coding is PCM format. By handling the message exchanges between Tx and the client, the transmitted session can be set up quickly. Output results show that transmission's throughput can be achieved about 50 Mbps with approximately 80 msec latency.

모바일폰에서의 원격 영상 전송 기술에 관한 연구 (A study on remote video transmit technique of mobile phone)

  • 정종근;김철원
    • 한국정보통신학회논문지
    • /
    • 제10권10호
    • /
    • pp.1914-1919
    • /
    • 2006
  • 모바일에서의 영상전송의 문제점은 전송속도와 제어이다. 영상을 전송하기 위해서는 압축기법이 필요한데 압축을 위해서 H.263 코덱을 사용하였으며, 원격지에서 카메라를 효율적으로 제어하고, 실시간 접속 사용자 수를 증가시켰다. 본 연구에서는 통해 기존의 RF를 이용한 영상 전송시의 거리 제한 문제를 해결하였고, 최적의 영상과 오디오를 전송할 수 있었다.

DTV 화질향상을 위한 자막데이터 전송방법 (Caption Data Transmission Method for HDTV Picture Quality Improvement)

  • 한찬호
    • 한국멀티미디어학회논문지
    • /
    • 제20권10호
    • /
    • pp.1628-1636
    • /
    • 2017
  • Such as closed caption, ancillary data, electronic program guide(EPG), data broadcasting, and etc, increased data for service convenience cause to degrade video quality of high definition contents. This article propose a method to transfer the closed caption data of video contents without video quality degradation. Video quality degradation does not cause in video compression by the block image insertion of caption data in DTV essential hidden area. Additionally the proposed methods have advantage to synchronize video, audio, and caption from preinserted script without time delay.

효과적인 인간-로봇 상호작용을 위한 딥러닝 기반 로봇 비전 자연어 설명문 생성 및 발화 기술 (Robot Vision to Audio Description Based on Deep Learning for Effective Human-Robot Interaction)

  • 박동건;강경민;배진우;한지형
    • 로봇학회논문지
    • /
    • 제14권1호
    • /
    • pp.22-30
    • /
    • 2019
  • For effective human-robot interaction, robots need to understand the current situation context well, but also the robots need to transfer its understanding to the human participant in efficient way. The most convenient way to deliver robot's understanding to the human participant is that the robot expresses its understanding using voice and natural language. Recently, the artificial intelligence for video understanding and natural language process has been developed very rapidly especially based on deep learning. Thus, this paper proposes robot vision to audio description method using deep learning. The applied deep learning model is a pipeline of two deep learning models for generating natural language sentence from robot vision and generating voice from the generated natural language sentence. Also, we conduct the real robot experiment to show the effectiveness of our method in human-robot interaction.

병원 간 전원 상황에서 이동통신망을 이용한 음성화상정보통신 애플리케이션의 유용성에 관한 연구 (A feasibility study of audio-video communication application using mobile telecommunication in inter-hospital transfer situations)

  • 정주;김태한;강샛별
    • 한국응급구조학회지
    • /
    • 제23권1호
    • /
    • pp.125-134
    • /
    • 2019
  • Purpose: The aim of this study was to evaluate the usefulness of video communication with medical staff located at a remote location, through a communication application connected to a long term evolution (LTE) mobile communication network in a moving ambulance. Methods: In this study, we recruited patients who were transferred by mobile intensive care unit ambulance from one hospital to another. In the moving ambulance, the information of the patient was transferred to a physician using the application in real time. Recorded video files were evaluated by emergency physicians with experience in video direct medical control. Results: A total of 18 patients were evaluated, and the average score was 5.9 out of a possible 9. It was expected that applying the use of the technology to actual clinical sites would enable the sites to provide assistance. Conclusion: In this study, we confirmed the possibility of benefiting from the clinical field when using the video-audio communication application which is connected to the remote location in real time through the current LTE mobile communication network in the ambulance.

임베디드 리눅스를 이용한 하드디스크 레코더 및 원격 제어 구현에 관한 연구 (A Study on the Development of Hard Disk Recoder and Remote Control Using Embedded Linux)

  • 박승호;이종수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 하계학술대회 논문집 D
    • /
    • pp.2429-2431
    • /
    • 2004
  • In this paper, we have designed a remote controlable HDR System using all embedded linux board. The system is composed of three parts - a HDR System, a PC client program for remote control and a Nameserver for registering and aquisition of the IP address. The system is built in an embedded board using a linux kernel. With the Linux the system can support networking and file system for a hard disk management In addition, the system embeds a web-server and a ftp-server for remote manipulation and file transfer. And the hardwares of the system are controlled by the linux device driver mechanism. MPEG1/2 technique is used to compress TV tuner signal and external analog video/audio signal. And compressed data is stored in a hard disk. The data stored in the system is accesable through lan or internet. And RTP protocol is used to enable the system to service live stream of instant video/audio input.

  • PDF

차등 태스크 인터럽트 방식의 영상단말 시스템 (Visual Telephone System of Differential Task Interrupt Method)

  • 박배욱;정하재;오창석
    • 한국정보통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.739-746
    • /
    • 2002
  • 본 논문에서는 영상전화 서비스 수행을 위한 기존 플랫폼들의 문제점을 분석하고 이를 해결 할 수 있는 차등 태스크 인터럽트 방식의 멀티미디어 데이터 스트림 처리구조를 제안하고, 이 구조를 기반으로 하여 ITU-T H.320 표준규격과 국가별 차이 규격도 수용하는 영상단말 시스템을 설계하여 기존 시스템의 문제점을 보완하였다. 구현과 실험을 통해 기존 시스템의 구조나 방식보다 여러가지 성능 및 품질 측면에서 개선됨을 검증하였다.

고화질 멀티 모달 영상 합성을 통한 다중 콘텐츠 통합 애니메이션 방법 (Multicontents Integrated Image Animation within Synthesis for Hiqh Quality Multimodal Video)

  • 노재승;강진범
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.257-269
    • /
    • 2023
  • 최근 딥러닝 모델을 통해 사진이나 영상을 활용하여 영상 합성을 수행하는 것에 대한 요구가 높아지고 있다. 기존 영상 합성 모델의 경우 주어진 영상으로부터 모션 정보만을 전이하여 사진에 대한 애니메이션 효과를 생성하였다. 하지만 이러한 합성 모델의 경우 음성에 따른 립싱크가 불가능하다는 문제와 함께 합성 결과물의 화질이 떨어진다는 문제점이 있다. 문제를 해결하기 위해 본 논문에서는 이미지 애니메이션 기법을 기반으로 한 새로운 프레임워크에 대해 설명한다. 본 프레임워크에서는 합성하려는 사진과 영상, 그리고 오디오를 제공하면 사진의 인물 특징을 유지한 채 주어진 영상의 행동을 따라 움직이는 것뿐만 아니라 음성에 맞게 발화하는 모습도 함께 합성하여 모션 전이와 함께 립싱크를 수행한 합성 결과물을 생성한다. 또한 초해상화 기법을 영상 합성물에도 활용하여 더욱 고화질, 고해상도의 합성 결과물을 제공하도록 구성하였다.

영상 콘텐츠의 오디오 분석을 통한 메타데이터 자동 생성 방법 (Method of Automatically Generating Metadata through Audio Analysis of Video Content)

  • 용성중;박효경;유연휘;문일영
    • 한국항행학회논문지
    • /
    • 제25권6호
    • /
    • pp.557-561
    • /
    • 2021
  • 영상 콘텐츠를 사용자에게 추천하기 위해서는 메타데이터가 필수적인 요소로 자리 잡고 있다. 하지만 이러한 메타데이터는 영상 콘텐츠 제공자에 의해 수동적으로 생성되고 있다. 본 논문에서는 기존 수동으로 직접 메타데이터를 입력하는 방식에서 자동으로 메타데이터를 생성하는 방법을 연구하였다. 기존 연구에서 감정 태그를 추출하는 방법에 추가로 영화 오디오를 통한 장르와 제작국가에 대한 메타데이터 자동 생성 방법에 대해 연구를 진행하였다. 전이학습 모델인 ResNet34 인공 신경망 모델을 이용하여 오디오의 스펙트로그램으로부터 장르를 추출하고, 영화 속 화자의 음성을 음성인식을 통해 언어를 감지하였다. 이를 통해 메타데이터를 생성 인공지능을 통해 자동 생성 가능성을 확인할 수 있었다.

고소공포증 치료를 위한 가상현실 원격진료 시스템의 개발 (The Development of Virtual Reality Telemedicine System for Treatment of Acrophobia)

  • 류종현;백승화;백승은;홍성찬
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제52권4호
    • /
    • pp.252-257
    • /
    • 2003
  • Acrophobia is an abnormal fear of heights. Medications or cognitive-behavior methods have been mainly used as a treatment. Lately the virtual reality technology has been applied to that kind of anxiety disorders. A virtual environment provides patient with stimuli which arouses phobia, and exposing to that environment makes him having ability to over come the fear. Recently, the patient can take diagnose from a medical doctor in distance with the telemedicine system. The hospital and doctors can get the medical data, audio, video, signals in the actual examination room or operating room via a live interactive system. Audio visual and multimedia conference service, online questionary, ECG signal transfer system, update system are needed in this system. Virtual reality simulation system that composed with a position sensor, head mount display, and audio system, is also included in this telemedicine system. In this study, we tried this system to the acrophobia patient in distance.