• Title/Summary/Keyword: 방송음악

Search Result 198, Processing Time 0.02 seconds

Deep Learning-based Speech Voice Separation Training To Enhance STT Performance (STT 성능 향상을 위한 딥러닝 기반 발화 음성 분리학습)

  • Kim, Bokyoung;Yang, Youngjun;Hwang, Yonghae;Kim, Kyuheon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.851-853
    • /
    • 2022
  • 인공지능을 활용한 다양한 딥러닝 기술의 보급과 상용화로 오디오 음성 인식 분야에서도 음성 인식의 정확도를 높이기 위한 다양한 연구가 진행되고 있다. 최근 STT 를 위한 음성 인식 엔진은 딥러닝 기술을 기반으로 과거에 비해 높은 정확도를 보이고 있다. 하지만 예능 프로그램, 드라마, 스포츠 방송 등과 같이 비음성 신호와 음성 신호가 함께 녹음되는 오디오의 경우 음성 인식 정확도가 크게 낮아지는 문제가 발생한다. 이에 본 연구에서는 다양한 장르의 오디오를 음성과 음악을 분리하는 딥러닝 모델을 활용하여 음성 신호와 비음성 신호로 분리하는 방법을 제시하고, STT 결과를 분석하여 음성 인식의 정확도를 높이기 위한 연구 방향을 제시한다.

  • PDF

Development of EDUTAINMENT Application on DMB Data Service (DMB 데이터 서비스에서의 유아 대상 EDUTAINMENT 어플리케이션 개발)

  • Kong, Shin;Kim, Hyo-Yong;Park, Tae-Jin;Choy, Yoon-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.223-228
    • /
    • 2007
  • 근래 주목받는 키워드인 유비쿼터스(Ubiquitous), UCC(User Created Contents) 등은 기술적 발달과 함께한 사람들의 행동 양식 변화를 잘 반영하고 있다. 기술적인 측면에서 모바일 환경으로의 진화는 사람들에게 시공간적 제약을 없애주었으며, '호모 루덴스'로 표현된 유희적 인간의 개념은 현대인의 행동 양식을 잘 표현했다. 이중 지상파 이동 멀티미디어 방송(Digital Multimedia Broadcasting, DMB)은 방송에 있어서 시공간적 제약을 없앤 대표적인 사례이며, 'EDUTAINMENT(에듀테인먼트)'는 교육에 유희를 결합한 실례라고 하겠다. 특히 DMB는 정보와 유희의 욕구를 기본적으로 충족시킬 수 있는 방송이라는 매체를 이용한다는 점에서 에듀테인먼트의 기술적 기반이 될 수 있으며, 이를 통해 저 연령의 학습자에게 유희와 교육을 동시에 제공함으로써, 학습효과를 높일 수 있는 장점이 있다. 본 논문에서는 DMB 시스템을 위한 유아 대상의 에듀테인먼트 어플리케이션을 설계하고, 구현한다. 이 어플리케이션을 위해 스토리텔링, 음악과 악기 선택 시스템, 타임라인 및 자유표면 게임 시스템 등 DMB 시스템에 적절하며, 에듀테인먼트의 조건을 충족하는 몇 가지 방법론을 제안하여 방송을 통해 콘텐츠와 대상자가 서로 상호작용 할 수 있도록 한다. 이를 위해서는 기존 방송의 음성, 영상 서비스를 넘어 상호작용의 필수적인 요소라고 할 수 있는 데이터 서비스를 요구하며, 이는 MPEG-4 Part 11: BIFS(Binary Format for Scenes) 기술을 기반으로 그 구현에는 VRML에 기초한 BT(BIFS Text) 언어를 사용한다.

  • PDF

Design and Implementation of content information enrichment service in the IPTV environment (IPTV 환경에서의 콘텐츠 정보 강화 서비스의 설계 및 구현)

  • Lee, Jong-Seol;Jang, Se-Jin;Lee, Seok-Pil
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.424-427
    • /
    • 2011
  • 방송 환경과 인터넷 환경이 융합되고 스마트 TV의 등장에 따라, 사용자는 복잡한 미디어 서비스 환경에 노출되었다. 이로 인해 사용자가 접하는 미디어 콘텐츠의 종류와 데이터의 양은 기하급수 적으로 증가 하고 있다. 웹과 인터넷을 기반으로 하는 정보기술은 모바일 전자 기술의 발달에 따라 데스크탑 이라는 공간적인 한계를 벗어나 유기적인 유비쿼터스 환경으로 변화하고 있으며, 정보 및 콘텐츠의 개념은 웹문서와 텍스트를 넘어서 UCC, 음악, 영화 등의 모바일 멀티미디어 콘텐츠들로까지 빠르게 확장되고 있다. 또한, N-스크린과 IPTV 서비스의 등장은 사용자로 하여금 장소와 시간에 관계없이 미디어를 취득할 수 있는 이득을 제공할 수 있으나 사용자가 선택은 더욱 힘들어 졌다. 방송 통신 융합 단말에서 콘텐츠에 대한 정보를 제공 받기 위해서는 TV-Anytime 인터페이스, MPEG Query Format 인터페이스, OPEN API 등이 사용 가능하다. TV-Anytime 인터페이스는 대용량 저장 장치를 갖는 방송 단말기에서 메타데이터를 제공 및 검색하기 위한 인터페이스를 제공하며, MPEG Query Format 인터페이스는 MPEG-7을 기반으로 하는 메타데이터를 검색하기 위한 인터페이스를 제공한다. 또한, OPEN API는 업체들을 중심으로 공개적으로 제공 되어지는 API로 개방과 참여를 목적으로 한다. 이에 본 논문에서는 사용자의 콘텐츠 사용 정보를 바탕으로 선호 정보를 생성하고, 이를 바탕으로 콘텐츠에 대해서 강화된 정보를 생성하기 위한 서비스를 설계 및 개발한다.

  • PDF

Design the Scene Coposition-Information using Multi-Source based on MMT-CI (MMT-CI 기반 멀티 소스를 활용한 효율적 장면구성정보 설계)

  • Hong, Ji-Ye;Kim, Kyuheon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.107-110
    • /
    • 2014
  • 방통융합시대가 도래함에 따라 방송망뿐만 아니라 IP망을 통해 콘텐츠를 소비할 수 있는 스마트TV의 보급이 급속히 확산되고 있다. 또한 영상과 음악 및 광고와 같은 멀티미디어 콘텐츠의 소비 환경이 한 화면에 한 가지의 미디어 서비스만 제공받는 환경에서 다양한 정보를 동시에 소비할 수 있는 환경으로 확대되면서 다양한 정보를 하나의 화면에서 혼용적으로 전달하기 위한 장면구성정보가 필요하게 되었다. 장면구성정보는 미디어가 소비되는 특정 시간과 해당 공간의 정보를 기술하므로써 다수의 미디어를 복합적으로 소비하는 방법으로, IP 기반에서도 여러 개의 화면을 통해 여러 소스의 콘텐츠를 소비하여 다양한 사용자 경험(User Experience)를 제공하고자 ISO/IEC JTC1/SC29/WG11(별칭 MPEG)에서는 방송서비스에서 방송망 및 IP망을 활용하여 멀티미디어 데이터를 전송할 때 사용하는 MPEG Media Transport(MMT)를 기반으로 장면구성정보를 제공하기 위한 MMT-Composition Information(MMT-CI)를 기술표준화하였다. 본 논문에서는 MMT-CI의 표준문서에 따라 W3C의 웹언어인 HTML5와 확장성 언어인 XML을 이용하여 멀티소스를 활용한 장면구성정보를 기술하는 것을 제안하고 장면구성서비스에 적용을 위한 플레이어를 구현 및 검증한다.

  • PDF

Effects of changes in banner size on acoustic environments in multipurpose halls for broadcasting (방송용 다목적 홀에서 배너 가변에 따른 음향 환경 변화)

  • Park, Ho-Cheul;Seo, Rosa;Seo, Chun-Ki;Jeon, Jin Yong
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.5
    • /
    • pp.558-567
    • /
    • 2019
  • When used for broadcasting, multipurpose halls need to accommodate various types of programs such as speeches, Korean traditional music, musicals, pop music, and concerts. Therefore, multipurpose halls must meet a wide range of electric and architectural acoustic demands. However, there are few ways to alter acoustic environments for multipurpose halls, given these different demands. The current study investigates the effects of banners on acoustic environments in the presence of an acoustic shell or electric acoustic system. The results indicate that the installation of a 15% banner of wall area could vary the range of reverberation time ($T_{30}$) by 0.12 s, EDT (Early Decay Time) by 0.15 s, clarity of music ($C_{80}$) by 0.76 dB, and clarity of speech ($D_{50}$) by 6.43 % under different measurement circumstances. A computer simulation that enlarges the banner size to 40 % of the wall area varies the reverberation time from 0.11 s to 0.55 s depending on the room environment.

A Study on Promotion Strategies for Examining Platforms of Convergence Contents (방송.통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠 육성 전략)

  • Park, Soo-Ile;Shin, Dong-Pil;Chun, Sang-Kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.197-202
    • /
    • 2009
  • 과학기술의 발달로 인한 사회 문화적 트렌드의 변화는 새로운 기회와 가능성을 제공해 주며, 정보통신기술은 통신과 방송, 통신과 콘텐츠 등 영역간의 경계를 허물며 융합을 가능하게 하고, 우리의 감성과 상상력을 자극하여 새로운 문화적 가능성을 열어주고 있다. 이러한 상황들은 방송 통신 융합이라는 이름으로 방송과 통신, TV와 PC 온라인과 오프라인 등의 모든 영역에서 다양한 노력이 진행되고 있다. 방송과 통신의 융합은 마치 역사상 신대륙의 개척 과정처럼 새로운 제품과 새로운 시장을 창출해내는 능력을 가지고 있기 때문에, 국내는 물론 세계의 모든 비즈니스 업체들은 이 기회의 땅을 향해 전력 질주하고 있다. 또한, 이에 따르는 콘텐츠의 융합 역시 괄목할만하며, 게임과 영화, 다큐멘터리와 드라마 등의 콘텐츠 간의 융합은 물론이고, 최근에는 모바일에서 영화를 제작하고, 게임과 소설 네트워크가 결합하고, 심지어는 게임 안에서 음악을 유통시키는 유통의 융합까지도 이뤄지고 있다. 이와 같은 다양한 융합의 확산은 미디어와 플랫폼의 등장뿐만 아니라 플랫폼 간 교차와 연결 및 통합이 가능한 미디어 전경(landscape)을 창출해 내고 있으며, 인터넷과 TV의 결합은 다양한 애플리케이션을 구현할 수 있는 전송 메커니즘을 서로 연결시켜 수많은 형태의 다중 플랫폼을 등장시키고 있다. 이로 인하여 방송 서비스와 인터넷 서비스가 네트워크나 전송 플랫폼의 구별 없이, 그리고 디바이스의 선택과 상관없이 활용되는 통합 플랫폼 환경이 폭 넓게 조성되고 있다. 따라서, 방송 통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠는 사용자의 요구 및 새로운 비즈니스 모텔에 대한 요구를 만족할 수 있어야 하며, 일관된 기술로 통선 및 서비스간의 호환성을 유지하는 인터페이스의 표준화가 이루어져야한다. 방송 통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠는 초고속 데이터 통신망을 활용하는 멀티미디어 및 IP 멀티캐스트 기능을 활용한 서비스들과 연계하여, 관련된 소재 산업들의 파급효과가 매우 크며, 관련 분야에 미치는 효과가 막대하므로, 이에 대한 적절한 육성전략을 고찰해보도록 한다.

  • PDF

Non-Dialog Section Detection for the Descriptive Video Service Contents Authoring (화면해설방송 저작을 위한 비 대사 구간 검출)

  • Jang, Inseon;Ahn, ChungHyun;Jang, Younseon
    • Journal of Broadcast Engineering
    • /
    • v.19 no.3
    • /
    • pp.296-306
    • /
    • 2014
  • This paper addresses a problem of non-dialog section detection for the DVS authoring, the goal of which is to find meaningful section from the broadcasting audio, where audio description can be inserted. The broadcasting audio involves the presence of various sounds so that it first discriminates between speech and non-speech for each audio frame. Proposed method jointly exploits the inter-channels structure and speech source characteristics of the broadcasting audio whose number of channel is stereo. Also, rule based post-processing is finally applied to detect the non-dialog section whose length is appropriate for audio description. Proposed method provides more accurate detection compared to conventional method. Experimental results on real broadcasting contents show that qualitative superiority of the proposed method.

Implementation of Content List Aggregation for Home Network (홈 네트워크에서 콘텐츠 통합 관리를 위한 Contents List Aggregation 구현)

  • Kum, Seung Woo;Kim, Kyoung Won;Lim, Tae Beom;Lee, Seok Pil
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.75-77
    • /
    • 2011
  • 최근 수년간 방송과 통신의 융합이 지속적으로 진행되고 있으며, 특히 홈 네트워크를 통한 방송 및 통신의 멀티미디어 콘텐츠의 공유 기기 시장이 비약적으로 성장하고 있다. 스마트폰을 비롯한 스마트 기기의 진보를 통하여 사진, 음악, 영상의 멀티미디어 콘텐츠에 대한 공유가 홈 네트워크 상에서 이루어 지고 있으며, 이러한 기술은 업계 표준으로 사용되고 있는 UPnP 및 DLNA에 기반하고 있다. 다만, 이러한 홈 네트워크 표준은 Peer-to-peer 네트워크를 근간으로 하고 있어 홈 네트워크 내에 복수의 서버가 있을 경우 사용자의 편의성이 상대적으로 약하다. 이에 본 논문은 홈 네트워크 내에서 콘텐츠 리스트를 통합 관리할 수 있는 Contents List Aggregation 서비스를 제안한다. 제안되는 서비스는 홈 네트워크 내의 미디어 서버들로부터 Contents List를 전송받아 통합된 형태로 저장 및 관리할 수 있으며, 기존 서비스와 호환성을 유지할 수 있다. 서비스의 제안과 함께 서비스를 지원하는 UPnP Device 및 Control Point의 서비스 시나리오, 그리고 서비스 연동에 대한 운용환경 및 사용예가 함께 제시되었다.

  • PDF

Music Identification Using Pitch Histogram and MFCC-VQ Dynamic Pattern (피치 히스토그램과 MFCC-VQ 동적 패턴을 사용한 음악 검색)

  • Park Chuleui;Park Mansoo;Kim Sungtak;Kim Hoirin
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.3
    • /
    • pp.178-185
    • /
    • 2005
  • This paper presents a new music identification method using probabilistic and dynamic characteristics of melody. The propo3ed method uses pitch and MFCC parameters as feature vectors for the characteristics of music notes and represents melody pattern by pitch histogram and temporal sequence of codeword indices. We also propose a new pattern matching method for the hybrid method. We have tested the proposed algorithm in small (drama OST) and broad (1.005 popular songs) search spaces. The experimental results on search areas of OST and 1,005 popular songs showed better performance of the proposed method over conventional methods. We achieved the performance improvement of average $9.9\%$ and $10.2\%$ in error reduction rate on each search area.

The Study on the Issue of K-Pop Major in Colleges and Opportunity for New Curriculum (전문대학의 K-Pop 전공 개설 및 교과과정에 관한 연구)

  • Oh, Han-Seng
    • Proceedings of the KAIS Fall Conference
    • /
    • 2012.05a
    • /
    • pp.91-93
    • /
    • 2012
  • 본 논문에서는 새롭게 떠오르고 있는 대중음악계의 K-Pop이라는 트렌드 속에서 전문대학이 이 특정한 분야의 학과 또는 전공을 개설하려고 하는 시도에 대한 제안적인 연구이다. 실용음악과와 방송연예과 등 기존의 유관 학과 및 전공과의 유사점과 차별성을 잘 활용하여 교과과정을 만든다면 K-Pop 전공이 대학에 개설되는 것이 불가능한 일은 아닐 것이다.

  • PDF