• Title/Summary/Keyword: MPEG/Audio

검색결과 322건 처리시간 0.025초

지상파 UHD 방송 MMT/ROUTE기반 브로드밴드 콘텐츠 삽입 기술 (Broadband Content Insertion Technology based on Terrestrial UHD Broadcasting MMT/ROUTE)

  • 김두환;이동관;김규헌
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.329-340
    • /
    • 2019
  • 최근 국내 지상파 UHD(Ultra-High Definition) 방송과 같은 고품질 AV(Audio-Video) 서비스가 증가하면서 그에 맞춰 방송 기술도 진화하게 되면서 방송 표준 또한 새롭게 정의하게 되었다. 또한, 네트워크 기술이 발달함에 따라, 콘텐츠가 해당 나라뿐 아니라 세계적으로 소비되고 있다. 그에 맞춰 국가 및 지역적 환경 등에 맞춰 적합한 콘텐츠를 제공하는 방안인 콘텐츠 삽입 기술이 필요할 것으로 보인다. 본 논문은 지상파 UHD 방송의 전송 표준 DASH(Dynamic Adaptive Streaming over HTTP)/ROUTE(Real time Object delivery Over Unidirectional Transport) 및 MMT(MPEG Media Transport)를 기반으로 방송망과 통신망의 이종 망 환경 하에 ATSC (Advanced Television Systems Committee) 3.0 Event Signaling 표준을 활용한 콘텐츠 삽입 서비스 시스템 모델 및 동기화 방안을 제안한다. 또한, 해당 서비스가 방송 표준을 만족하는 환경에서 동작함을 검증한다.

Multimodal Approach for Summarizing and Indexing News Video

  • Kim, Jae-Gon;Chang, Hyun-Sung;Kim, Young-Tae;Kang, Kyeong-Ok;Kim, Mun-Churl;Kim, Jin-Woong;Kim, Hyung-Myung
    • ETRI Journal
    • /
    • 제24권1호
    • /
    • pp.1-11
    • /
    • 2002
  • A video summary abstracts the gist from an entire video and also enables efficient access to the desired content. In this paper, we propose a novel method for summarizing news video based on multimodal analysis of the content. The proposed method exploits the closed caption data to locate semantically meaningful highlights in a news video and speech signals in an audio stream to align the closed caption data with the video in a time-line. Then, the detected highlights are described using MPEG-7 Summarization Description Scheme, which allows efficient browsing of the content through such functionalities as multi-level abstracts and navigation guidance. Multimodal search and retrieval are also within the proposed framework. By indexing synchronized closed caption data, the video clips are searchable by inputting a text query. Intensive experiments with prototypical systems are presented to demonstrate the validity and reliability of the proposed method in real applications.

  • PDF

Design of PSIP converter for data broadcasting service in the interoperable network of terrestrial and cable

  • Choi Ji Hoon;Lee Yong Ju;Park Min Sik;Choi Jin Soo;Hong Jin Woo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.562-566
    • /
    • 2004
  • In this paper, we propose a method for constructing terrestrial/cable PSIP converting system, so-called a PSIP converter, which is converting terrestrial PSIP into cable PSIP for a data broadcasting service in the interoperable network of terrestrial and cable, and define an interface between the PSIP converter and the OOB SI generator by using PMCP messages compliant to ATSC T3/S1. The exiting PSIP converter just converts terrestrial PSIP into cable PSIP compliant to ATSC and OCAP standard and transmits by a MPEG-2 TS format. That is to say, it is not for the digital data broadcasting but for the digital broadcasting. Say in other word, the proposed PSIP converter is designed to convert and transmit PSIP including DET information which is necessary data event information for data broadcasting service. In addition, the PSIP converter can support various types of PSIP information to the OOB SI generator by using PMCP messages defined by a hierarchical structure as per each channel, audio/video event, data event and so on.

  • PDF

음악 및 음성 신호의 융합 압축 기술 (Unified coding scheme of speech and music)

  • 오은미
    • 방송과미디어
    • /
    • 제16권4호
    • /
    • pp.59-71
    • /
    • 2011
  • 오디오와 음성 압축 기술적 근간은 서로 다르지만, 최근의 모바일 멀티미디어 기기 시장의 컨버전스 현상에 따라 압축하고자 하는 신호가 혼용되고 있으며, 비슷한 목표 전송률과 음질로 수렴하고 있다. 현재는 동일 기기에서 서로 다른 압축 기술을 적용하고 있으나, 음성과 음악이 동시에 서비스 되는 멀티미디어 기기에서는 단일 압축 방식으로 처리하고자 하는 이슈가 부각되고 있다. 특히, 스마트 폰 및 음악 콘텐츠 포탈 서비스의 대중화를 고려할 때, 음성 및 음악 신호 모두를 효율적으로 압축하는 음악 및 음성 신호의 융합 압축 기술이 더욱 필요해 보인다. 본 고에서는 MPEG 오디오 그룹에서 가장 최근 진행한 Unified Speech and Audio Coding(USAC)의 탄생 배경 및 표준화 현황을 소개한다. USAC는 64kbps 이하에서 기술적으로 최고 성능을 지닌 AMR-WB+ 및 HE-AAC v2보다도 우월한 음질을 보이며, 높은 비트율에서도 동등한 음질을 보장한다. 이런 우수한 음질에 기여한 USAC의 스위칭 구조와 더불어 기술적으로 향상된 주요 모듈인 파라미터 기반 스테레오 및 고주파 압축, 그리고 엔트로피 코딩 방식에 대해서 살펴 본다. 향후, 다양한 오디오 신호를 효율적으로 압축하는 USAC는 디지털 라디오, 모바일 TV, 그리고 오디오 북과 같은 사용자 시나리오에서 사용될 확률이 높아 보인다. 또한, USAC는 배경 잡음이나 배경 음악이 있는 경우에도 성능이 우수하기 때문에 YouTube 및 podcast 등과 같이 사용자가 콘텐츠를 생성할 때도 유용하게 사용 될 수 있다.

Implementation of efficient multi-view system through function distribution in digital multi-channel broadcasting service

  • Kwon, Myung-Kyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.17-24
    • /
    • 2017
  • In recent digital broadcasting, up to 250 channels are multiplexed and transmitted. The channel transmission is made in the form of MPEG-2 Transport Stream (TS) and transmits one channel (Video, Audio). In order to check if many broadcast channels are transmitted normally, in multi-channel multi-view system, ability of real-time monitoring is required. In order to monitor efficient multi-channel, a distributed system in which functions and load are distributed should be implemented. In the past, we used an inefficient system that gave all of the functionality to a piece of hardware, which limited the channel acceptance and required a lot of resources. In this paper, we implemented a distributed multi-view system which can reduce resources and monitor them economically through efficient function and load balancing. It is able to implement efficient system by taking charge of decoding, resizing and encoding function in specific server and viewer function in separate server. Through this system, the system was stabilized, the investment cost was reduced by 19.7%, and the wall monitor area was reduced by 52.6%. Experimental results show that efficient real-time channel monitoring for multi-channel digital broadcasting is possible.

덧셈과 쉬프트 연산을 사용한 MP3 IMDCT의 저전력 Systolic 구조 (A low-power systolic structure for MP3 IMDCT Using addition and shift operation)

  • 장영범;이원상
    • 한국통신학회논문지
    • /
    • 제29권10C호
    • /
    • pp.1451-1459
    • /
    • 2004
  • 이 논문에서는 MP3에 사용되는 32-point IMDCT 블록의 저전력 hard-wired 구조를 제안하였다. 행렬의 재배열을 통하여 16, 8, 4, 2, 1 cycle에 동작하는 5개의 multirate block을 유도함으로서 저전력 systolic 구조를 제안하였다. 각각의 sub-block들의 곱셈 구현은 덧셈기와 쉬프트로 구현하는 CSD(Cainmic signed digit) 방식을 채택하여 덧셈의 수를 줄임으로서 전력소모를 감소시켰다. 또한 각각의 sub-block들의 전력소모를 더욱 감소시키기 위하여 common sub-expression sharing 방식을 채용함으로서 덧셈의 연산량을 더욱 감소시킨 구조를 제안하였다. 그 결과, 2의 보수형을 사용하는 구조와 비교하여 58.4%의 상대 전력소모를 줄일 수 있었다. 또한 하드웨어 구현을 Verilog-HDL코팅을 통하여 시뮬레이션 함으로서 구조가 정확하게 동작함을 확인하였다.

휴대 전화에서 소프트웨어 기반의 비디오/오디오 플레이어 (Software Based Video/Audio Player on Mobile Handset)

  • 정진환;한상범;류은석;유혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.75-78
    • /
    • 2003
  • 최근의 휴대 전화는 단순한 음성 통신 기기 역할뿐만 아니라 데이터 통신 기기로도 쓰이고 있으며, CDMA-2000 망 보급으로 인하여 데이터 통신 대역폭이 멀티미디어 데이터를 처리 할 수 있을 만큼 증대되었다. 하지만 휴대 전화는 하드웨어 성능이 음성 통신 기기로 최적화되어 있고 매우 단순화된 실시간성 운영체제로 인해 이러한 대역폭을 활용할 수 있는 소프트웨어 방식의 비디오/오디오 플레이어 개발이 매우 힘들다. 특히, CDMA 방식의 휴대 전화에 사용되는 비선점형 운영체제인 REX 에서는 선점형 운영 체제에 적합한 다중 쓰레드 구조의 멀티미디어 응용 프로그램 제작이 어렵다. 또한, 널리 사용되는 비디오/오디오 표준(MPEG-x, H.26x, 등등)은 압축 최우선의 방식으로써 계산량이 매우 크기 때문에 휴대 전화에서 하드웨어 도움 없이 소프트웨어로만 재생하기에는 적합하지 않다. 본 논문에서는 이러한 문제를 해결하기 위해 먼저 휴대 전화의 하드웨어 자원과 시스템에 적합한 비디오/오디오 코덱에 대해 간략히 알아보고 비디오/오디오 동기화를 위해 이에 적합한 시스템 디코더와 소프트웨어 플레이어 구조를 제안한다. 또한 실제 휴대 전화에 적용하여 그 성능을 측정 한다.

  • PDF

휴대 전화를 위한 웨이블릿 기반의 비디오/오디오 플레이어 (Wavelet Based Video/Audio Player for Cellular Phone)

  • 정진환;한상범;류은석;유혁;김일진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.493-495
    • /
    • 2003
  • 최근의 휴대 전화는 단순한 음성 통신 기기 역할 뿐만 아니라 데이터 통신 기기로도 쓰이고 있으며, CDMA-2000 망 보급으로 인하여 데이터 통신 대역폭이 멀티미디어 데이터를 처리 할 수 있을 만큼 증대 되었다. 하지만 휴대 전화는 하드웨어 성능이 음성 통신 기기로 최적화 되어 있고 휴대성을 높이기 위해 저전력의 저 성능 프로세서를 탑재 하였기 때문에 소프트웨어 방식의 비디오/오디오 재생이 매우 힘들다. 특히. 널리 사용되는 비디오/오디오 표준(MPEG-x, H.26x, 등등)은 압축 최우선의 방식으로써 계산량이 매우 크기 때문에 휴대 전화에서 하드웨어 도움 없이 소프트웨어로만 재생하기에는 적합하지 않다. 본 논문에서는 이러한 문제를 해결하기 위해 먼저 일반 목적의 널리 사용되는 코덱의 문제점과 휴대전화의 하드웨어 자원에 관해 알아 보고, 연산량을 효과적으로 조절할 수 있는 웨이블릿 함수를 이용하여 휴대 전화 시스템에 적합한 비디오/오디오 코덱을 제안한다. 또한 비디오 디코딩에 필요한 연산을 측정하고 실제 휴대 전화에 적용하여 그 성능을 확인 한다.

  • PDF

차세대 통신망을 위한 G.729.1 광대역 음성 코덱을 활용한 인터넷 단말 구현 (Implementation of Internet Terminal using G.729.1 Wideband Speech Codec for Next Generation Network)

  • 소운섭;김대영
    • 한국통신학회논문지
    • /
    • 제33권10B호
    • /
    • pp.939-945
    • /
    • 2008
  • 본 논문에서는 차세대 통신망을 위한 G.729.1 광대역 음성 코덱을 활용한 인터넷 단말을 구현한 절차와 결과에 대해 기술하였다. 이러한 목적을 이루기 위해 먼저 음성 코덱 처리를 위한 DSP 기능을 가지며, 비디오 코덱 처리를 위한 향상된 멀티미디어 가속기 기능을 가진 고성능 RISC 응용 프로세서를 선택하였다. 단말 구현에 사용한 G.729.1 광대역 음성 코덱은 ITU-T에서 최근 표준화 된 것으로 G.729 음성 코덱 표준을 확장한 새로운 스케일러블 음성 및 오디오 코덱이다. G.729.1 코덱의 프로세서에서 처리 시간을 줄이고, 단말에 적용하기 위해 계산량이 많이 필요한 부분의 고정 소수점 C 코드를 어셈블리 언어로 변환하였다. 그 결과 원시 C 코드의 실행 시간을 약 80% 줄여서 단말에서 실시간으로 동작시켰다. 비디오 코덱은 프로세서의 eMMA 하드웨어에서 지원되는 H.263/MPEG-4 코덱을 사용하였다. 실제 망에 접속판 SIP 호 처리 시험에서 단 대 단 지연은 100ms 이하이고, PESQ 장비로 측정한 MOS 값은 평균 3.8 이었으며, 상용 단말들과의 연동 시험에서도 정상적으로 동작하였다.

법과학적 활용을 위한 삼성 스마트폰 음성 녹음 파일의 메타데이터 구조 및 속성 비교 분석 연구 (A comparative analysis of metadata structures and attributes of Samsung smartphone voice recording files for forensic use)

  • 안서영;유세희;김경화;홍기형
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.103-112
    • /
    • 2022
  • 스마트폰의 대중화로 인하여 근래 범죄의 증거자료로 제출되는 녹취 파일은 대부분 스마트폰을 통하여 생산되고 있으며, 스마트폰을 기반으로 한 녹음 파일의 무결성(위변조) 여부가 수사와 재판 과정에서 주요 쟁점으로 떠오르고 있다. 가장 높은 국내 시장 점유율을 가진 삼성 스마트폰은 통화 및 음성 녹음, 그리고 편집이 가능한 자체 음성녹음 편집 어플리케이션이 탑재되어 유통되고 있으며, 자체 어플리케이션을 통한 편집은 외부 어플리케이션을 통한 편집과 다르게 원본 파일과의 유사성이 높기에, 무결성을 입증하기 위해 더 정밀한 분석 기법 개발이 필요하다. 본 연구에서는 삼성 스마트폰 34개 기종에서 생성된 원본 녹음 파일과 자체 제공 음성녹음 편집 어플리케이션을 통한 편집 파일의 메타데이터 구조와 속성을 분석하여, 원본과 편집본 사이의 음성 파일 메타데이터 구조 및 속성 값에서 유의미한 차이가 있음을 확인하였다.