• 제목/요약/키워드: Audio and Video

검색결과 804건 처리시간 0.026초

모바일폰에서의 원격 영상 전송 기술에 관한 연구 (A study on remote video transmit technique of mobile phone)

  • 정종근;김철원
    • 한국정보통신학회논문지
    • /
    • 제10권10호
    • /
    • pp.1914-1919
    • /
    • 2006
  • 모바일에서의 영상전송의 문제점은 전송속도와 제어이다. 영상을 전송하기 위해서는 압축기법이 필요한데 압축을 위해서 H.263 코덱을 사용하였으며, 원격지에서 카메라를 효율적으로 제어하고, 실시간 접속 사용자 수를 증가시켰다. 본 연구에서는 통해 기존의 RF를 이용한 영상 전송시의 거리 제한 문제를 해결하였고, 최적의 영상과 오디오를 전송할 수 있었다.

SERA Web-Viewer : 사용자 편의성을 향상시킨 웹 브라우저 설계 및 구현 (Sera Web-Viewer : a Convenience-Featured Web Browser)

  • 조영석;김재훈;장익현
    • 융합보안논문지
    • /
    • 제7권4호
    • /
    • pp.61-72
    • /
    • 2007
  • 우리는 웹 브라우저 사용자의 편의성 향상을 목표로 4가지 편의 기능이 통합된 브라우저인 SERA Web-Viewer를 개발하였다. 편의 기능으로는 VPV(Visited Page Viewer), APV(Aligned Page Viewer), USC(User Specified Capture)등이 추가되었으며 UCC(User Created Content)의 핵심 기술인 FLV(FLash Video file) 변환을 위한 VAC(Video and Audio Converter)를 부가기능으로 통합하였다. 편의 기능들은 사용자들이 웹 브라우저를 사용하며 가장 필요로 하는 기능들로 웹브라우저의 사용 빈도가 잦고 사용 시간이 긴 고급 사용자들을 대상으로 조사된 바에 따랐다. 위의 네 가지 통합 기능에 대한 구현 상의 알고리즘과 기술을 제안하였고, 인터넷 익스플로러 6.0의 렌더링(rendering) 기술을 이용한 MDI application 기반의 구현 방법을 코드를 통해 설명한다. 구현된 결과를 134명의 컴퓨터학 또는 멀티미디어 공학을 전공하는 학생들을 대상으로 실시한 설문조사의 결과와 비교하여 통합된 편의 기능들이 웹 브라우저 사용자들에게 실질적으로 도움을 줄 수 있다는 것을 보인다.

  • PDF

Latency Analysis of AVB Network and Optimization Design for Automotive

  • An, Byoungman;Kim, YoungSeop
    • 반도체디스플레이기술학회지
    • /
    • 제18권3호
    • /
    • pp.127-132
    • /
    • 2019
  • This paper presents an overview of automotive communication technologies, including related technology developments. We describe the latency of Audio Video Bridge (AVB) network as well as purpose the optimized design of the Ethernet network system for automotive. Our design plays a significant role in reducing the delay between components. The proposed approach on realistic test cases showed that there was a delay reduction, approximately 49.4%. It is expected that the optimization method for the actual automotive environment can greatly shorten the time period in the design and development process. The results obtained from the experiments on the delay time present in each function are reliable because average values are obtained through repeated actual tests for several months. It will greatly benefit the industry since analyzing the latency between each function in a short period of time is very important.

Real-time Camera and Video Streaming Through Optimized Settings of Ethernet AVB in Vehicle Network System

  • An, Byoungman;Kim, Youngseop
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권8호
    • /
    • pp.3025-3047
    • /
    • 2021
  • This paper presents the latest Ethernet standardization of in-vehicle network and the future trends of automotive Ethernet technology. The proposed system provides design and optimization algorithms for automotive networking technology related to AVB (Audio Video Bridge) technology. We present a design of in-vehicle network system as well as the optimization of AVB for automotive. A proposal of Reduced Latency of Machine to Machine (RLMM) plays an outstanding role in reducing the latency among devices. RLMM's approach to real-world experimental cases indicates a reduction in latency of around 41.2%. The setup optimized for the automotive network environment is expected to significantly reduce the time in the development and design process. The results obtained in the study of image transmission latency are trustworthy because average values were collected over a long period of time. It is necessary to analyze a latency between multimedia devices within limited time which will be of considerable benefit to the industry. Furthermore, the proposed reliable camera and video streaming through optimized AVB device settings would provide a high level of support in the real-time comprehension and analysis of images with AI (Artificial Intelligence) algorithms in autonomous driving.

고화질 멀티 모달 영상 합성을 통한 다중 콘텐츠 통합 애니메이션 방법 (Multicontents Integrated Image Animation within Synthesis for Hiqh Quality Multimodal Video)

  • 노재승;강진범
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.257-269
    • /
    • 2023
  • 최근 딥러닝 모델을 통해 사진이나 영상을 활용하여 영상 합성을 수행하는 것에 대한 요구가 높아지고 있다. 기존 영상 합성 모델의 경우 주어진 영상으로부터 모션 정보만을 전이하여 사진에 대한 애니메이션 효과를 생성하였다. 하지만 이러한 합성 모델의 경우 음성에 따른 립싱크가 불가능하다는 문제와 함께 합성 결과물의 화질이 떨어진다는 문제점이 있다. 문제를 해결하기 위해 본 논문에서는 이미지 애니메이션 기법을 기반으로 한 새로운 프레임워크에 대해 설명한다. 본 프레임워크에서는 합성하려는 사진과 영상, 그리고 오디오를 제공하면 사진의 인물 특징을 유지한 채 주어진 영상의 행동을 따라 움직이는 것뿐만 아니라 음성에 맞게 발화하는 모습도 함께 합성하여 모션 전이와 함께 립싱크를 수행한 합성 결과물을 생성한다. 또한 초해상화 기법을 영상 합성물에도 활용하여 더욱 고화질, 고해상도의 합성 결과물을 제공하도록 구성하였다.

삼차원 재구성을 위한 Data-Flow 기반의 프레임워크 (A data-flow oriented framework for video-based 3D reconstruction)

  • 김희관
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.71-74
    • /
    • 2009
  • The data-flow paradigm has been employed in various application areas. It is particularly useful where large data-streams must be processed, for example in video and audio processing, or for scientific visualization. A video-based 3D reconstruction system should process multiple synchronized video streams. The system exhibits many properties that can be targeted using a data-flow approach that is naturally divided into a sequence of processing tasks. In this paper we introduce our concept to apply the data-flow approach to a multi-video 3D reconstruction system.

Compression history detection for MP3 audio

  • Yan, Diqun;Wang, Rangding;Zhou, Jinglei;Jin, Chao;Wang, Zhifeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권2호
    • /
    • pp.662-675
    • /
    • 2018
  • Compression history detection plays an important role in digital multimedia forensics. Most existing works, however, mainly focus on digital image and video. Additionally, the existed audio compression detection algorithms aim to detect the trace of double compression. In real forgery scenario, multiple compression is more likely to happen. In this paper, we proposed a detection algorithm to reveal the compression history for MP3 audio. The statistics of the scale factor and Huffman table index which are the parameters of MP3 codec have been extracted as the detecting features. The experimental results have shown that the proposed method can effectively identify whether the testing audio has been previously treated with single/double/triple compression.

The Development of the USB-DMB Receiver

  • Park, Nho-Kyung;Jin, Hyun-Joon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권3E호
    • /
    • pp.74-78
    • /
    • 2004
  • As analog audio systems are changing to digital systems, the DAB (Digital Audio Broadcasting) is expected to provide CD quality audio, various data services with interactiveness and excellent mobile reception ability. The DMB (Digital Multimedia Broadcasting), as more advanced successor of the DAB, adds video capability on the audio and data services. The DAB system assures high quality audio services even when the reception is through portable and mobile receivers. In this paper, USB-DAB receiver and PCI-DMB receiver are designed and implemented. The DAB receiver and the DMB receiver incorporate with PC to make use of computational power and application software of Pc. This enables the developed system to be more flexible and to meet various applications easier.

영상 콘텐츠의 오디오 분석을 통한 메타데이터 자동 생성 방법 (Method of Automatically Generating Metadata through Audio Analysis of Video Content)

  • 용성중;박효경;유연휘;문일영
    • 한국항행학회논문지
    • /
    • 제25권6호
    • /
    • pp.557-561
    • /
    • 2021
  • 영상 콘텐츠를 사용자에게 추천하기 위해서는 메타데이터가 필수적인 요소로 자리 잡고 있다. 하지만 이러한 메타데이터는 영상 콘텐츠 제공자에 의해 수동적으로 생성되고 있다. 본 논문에서는 기존 수동으로 직접 메타데이터를 입력하는 방식에서 자동으로 메타데이터를 생성하는 방법을 연구하였다. 기존 연구에서 감정 태그를 추출하는 방법에 추가로 영화 오디오를 통한 장르와 제작국가에 대한 메타데이터 자동 생성 방법에 대해 연구를 진행하였다. 전이학습 모델인 ResNet34 인공 신경망 모델을 이용하여 오디오의 스펙트로그램으로부터 장르를 추출하고, 영화 속 화자의 음성을 음성인식을 통해 언어를 감지하였다. 이를 통해 메타데이터를 생성 인공지능을 통해 자동 생성 가능성을 확인할 수 있었다.

Intelligent User Pattern Recognition based on Vision, Audio and Activity for Abnormal Event Detections of Single Households

  • Jung, Ju-Ho;Ahn, Jun-Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.59-66
    • /
    • 2019
  • According to the KT telecommunication statistics, people stayed inside their houses on an average of 11.9 hours a day. As well as, according to NSC statistics in the united states, people regardless of age are injured for a variety of reasons in their houses. For purposes of this research, we have investigated an abnormal event detection algorithm to classify infrequently occurring behaviors as accidents, health emergencies, etc. in their daily lives. We propose a fusion method that combines three classification algorithms with vision pattern, audio pattern, and activity pattern to detect unusual user events. The vision pattern algorithm identifies people and objects based on video data collected through home CCTV. The audio and activity pattern algorithms classify user audio and activity behaviors using the data collected from built-in sensors on their smartphones in their houses. We evaluated the proposed individual pattern algorithm and fusion method based on multiple scenarios.