Kim, Bokyoung;Yang, Youngjun;Hwang, Yonghae;Kim, Kyuheon
Proceedings of the Korean Society of Broadcast Engineers Conference
/
2022.06a
/
pp.851-853
/
2022
인공지능을 활용한 다양한 딥러닝 기술의 보급과 상용화로 오디오 음성 인식 분야에서도 음성 인식의 정확도를 높이기 위한 다양한 연구가 진행되고 있다. 최근 STT 를 위한 음성 인식 엔진은 딥러닝 기술을 기반으로 과거에 비해 높은 정확도를 보이고 있다. 하지만 예능 프로그램, 드라마, 스포츠 방송 등과 같이 비음성 신호와 음성 신호가 함께 녹음되는 오디오의 경우 음성 인식 정확도가 크게 낮아지는 문제가 발생한다. 이에 본 연구에서는 다양한 장르의 오디오를 음성과 음악을 분리하는 딥러닝 모델을 활용하여 음성 신호와 비음성 신호로 분리하는 방법을 제시하고, STT 결과를 분석하여 음성 인식의 정확도를 높이기 위한 연구 방향을 제시한다.
Proceedings of the Korean Information Science Society Conference
/
2007.06c
/
pp.223-228
/
2007
근래 주목받는 키워드인 유비쿼터스(Ubiquitous), UCC(User Created Contents) 등은 기술적 발달과 함께한 사람들의 행동 양식 변화를 잘 반영하고 있다. 기술적인 측면에서 모바일 환경으로의 진화는 사람들에게 시공간적 제약을 없애주었으며, '호모 루덴스'로 표현된 유희적 인간의 개념은 현대인의 행동 양식을 잘 표현했다. 이중 지상파 이동 멀티미디어 방송(Digital Multimedia Broadcasting, DMB)은 방송에 있어서 시공간적 제약을 없앤 대표적인 사례이며, 'EDUTAINMENT(에듀테인먼트)'는 교육에 유희를 결합한 실례라고 하겠다. 특히 DMB는 정보와 유희의 욕구를 기본적으로 충족시킬 수 있는 방송이라는 매체를 이용한다는 점에서 에듀테인먼트의 기술적 기반이 될 수 있으며, 이를 통해 저 연령의 학습자에게 유희와 교육을 동시에 제공함으로써, 학습효과를 높일 수 있는 장점이 있다. 본 논문에서는 DMB 시스템을 위한 유아 대상의 에듀테인먼트 어플리케이션을 설계하고, 구현한다. 이 어플리케이션을 위해 스토리텔링, 음악과 악기 선택 시스템, 타임라인 및 자유표면 게임 시스템 등 DMB 시스템에 적절하며, 에듀테인먼트의 조건을 충족하는 몇 가지 방법론을 제안하여 방송을 통해 콘텐츠와 대상자가 서로 상호작용 할 수 있도록 한다. 이를 위해서는 기존 방송의 음성, 영상 서비스를 넘어 상호작용의 필수적인 요소라고 할 수 있는 데이터 서비스를 요구하며, 이는 MPEG-4 Part 11: BIFS(Binary Format for Scenes) 기술을 기반으로 그 구현에는 VRML에 기초한 BT(BIFS Text) 언어를 사용한다.
Proceedings of the Korean Society of Broadcast Engineers Conference
/
2011.07a
/
pp.424-427
/
2011
방송 환경과 인터넷 환경이 융합되고 스마트 TV의 등장에 따라, 사용자는 복잡한 미디어 서비스 환경에 노출되었다. 이로 인해 사용자가 접하는 미디어 콘텐츠의 종류와 데이터의 양은 기하급수 적으로 증가 하고 있다. 웹과 인터넷을 기반으로 하는 정보기술은 모바일 전자 기술의 발달에 따라 데스크탑 이라는 공간적인 한계를 벗어나 유기적인 유비쿼터스 환경으로 변화하고 있으며, 정보 및 콘텐츠의 개념은 웹문서와 텍스트를 넘어서 UCC, 음악, 영화 등의 모바일 멀티미디어 콘텐츠들로까지 빠르게 확장되고 있다. 또한, N-스크린과 IPTV 서비스의 등장은 사용자로 하여금 장소와 시간에 관계없이 미디어를 취득할 수 있는 이득을 제공할 수 있으나 사용자가 선택은 더욱 힘들어 졌다. 방송 통신 융합 단말에서 콘텐츠에 대한 정보를 제공 받기 위해서는 TV-Anytime 인터페이스, MPEG Query Format 인터페이스, OPEN API 등이 사용 가능하다. TV-Anytime 인터페이스는 대용량 저장 장치를 갖는 방송 단말기에서 메타데이터를 제공 및 검색하기 위한 인터페이스를 제공하며, MPEG Query Format 인터페이스는 MPEG-7을 기반으로 하는 메타데이터를 검색하기 위한 인터페이스를 제공한다. 또한, OPEN API는 업체들을 중심으로 공개적으로 제공 되어지는 API로 개방과 참여를 목적으로 한다. 이에 본 논문에서는 사용자의 콘텐츠 사용 정보를 바탕으로 선호 정보를 생성하고, 이를 바탕으로 콘텐츠에 대해서 강화된 정보를 생성하기 위한 서비스를 설계 및 개발한다.
Proceedings of the Korean Society of Broadcast Engineers Conference
/
2014.11a
/
pp.107-110
/
2014
방통융합시대가 도래함에 따라 방송망뿐만 아니라 IP망을 통해 콘텐츠를 소비할 수 있는 스마트TV의 보급이 급속히 확산되고 있다. 또한 영상과 음악 및 광고와 같은 멀티미디어 콘텐츠의 소비 환경이 한 화면에 한 가지의 미디어 서비스만 제공받는 환경에서 다양한 정보를 동시에 소비할 수 있는 환경으로 확대되면서 다양한 정보를 하나의 화면에서 혼용적으로 전달하기 위한 장면구성정보가 필요하게 되었다. 장면구성정보는 미디어가 소비되는 특정 시간과 해당 공간의 정보를 기술하므로써 다수의 미디어를 복합적으로 소비하는 방법으로, IP 기반에서도 여러 개의 화면을 통해 여러 소스의 콘텐츠를 소비하여 다양한 사용자 경험(User Experience)를 제공하고자 ISO/IEC JTC1/SC29/WG11(별칭 MPEG)에서는 방송서비스에서 방송망 및 IP망을 활용하여 멀티미디어 데이터를 전송할 때 사용하는 MPEG Media Transport(MMT)를 기반으로 장면구성정보를 제공하기 위한 MMT-Composition Information(MMT-CI)를 기술표준화하였다. 본 논문에서는 MMT-CI의 표준문서에 따라 W3C의 웹언어인 HTML5와 확장성 언어인 XML을 이용하여 멀티소스를 활용한 장면구성정보를 기술하는 것을 제안하고 장면구성서비스에 적용을 위한 플레이어를 구현 및 검증한다.
Park, Ho-Cheul;Seo, Rosa;Seo, Chun-Ki;Jeon, Jin Yong
The Journal of the Acoustical Society of Korea
/
v.38
no.5
/
pp.558-567
/
2019
When used for broadcasting, multipurpose halls need to accommodate various types of programs such as speeches, Korean traditional music, musicals, pop music, and concerts. Therefore, multipurpose halls must meet a wide range of electric and architectural acoustic demands. However, there are few ways to alter acoustic environments for multipurpose halls, given these different demands. The current study investigates the effects of banners on acoustic environments in the presence of an acoustic shell or electric acoustic system. The results indicate that the installation of a 15% banner of wall area could vary the range of reverberation time ($T_{30}$) by 0.12 s, EDT (Early Decay Time) by 0.15 s, clarity of music ($C_{80}$) by 0.76 dB, and clarity of speech ($D_{50}$) by 6.43 % under different measurement circumstances. A computer simulation that enlarges the banner size to 40 % of the wall area varies the reverberation time from 0.11 s to 0.55 s depending on the room environment.
Proceedings of the Korean Society of Computer Information Conference
/
2009.01a
/
pp.197-202
/
2009
과학기술의 발달로 인한 사회 문화적 트렌드의 변화는 새로운 기회와 가능성을 제공해 주며, 정보통신기술은 통신과 방송, 통신과 콘텐츠 등 영역간의 경계를 허물며 융합을 가능하게 하고, 우리의 감성과 상상력을 자극하여 새로운 문화적 가능성을 열어주고 있다. 이러한 상황들은 방송 통신 융합이라는 이름으로 방송과 통신, TV와 PC 온라인과 오프라인 등의 모든 영역에서 다양한 노력이 진행되고 있다. 방송과 통신의 융합은 마치 역사상 신대륙의 개척 과정처럼 새로운 제품과 새로운 시장을 창출해내는 능력을 가지고 있기 때문에, 국내는 물론 세계의 모든 비즈니스 업체들은 이 기회의 땅을 향해 전력 질주하고 있다. 또한, 이에 따르는 콘텐츠의 융합 역시 괄목할만하며, 게임과 영화, 다큐멘터리와 드라마 등의 콘텐츠 간의 융합은 물론이고, 최근에는 모바일에서 영화를 제작하고, 게임과 소설 네트워크가 결합하고, 심지어는 게임 안에서 음악을 유통시키는 유통의 융합까지도 이뤄지고 있다. 이와 같은 다양한 융합의 확산은 미디어와 플랫폼의 등장뿐만 아니라 플랫폼 간 교차와 연결 및 통합이 가능한 미디어 전경(landscape)을 창출해 내고 있으며, 인터넷과 TV의 결합은 다양한 애플리케이션을 구현할 수 있는 전송 메커니즘을 서로 연결시켜 수많은 형태의 다중 플랫폼을 등장시키고 있다. 이로 인하여 방송 서비스와 인터넷 서비스가 네트워크나 전송 플랫폼의 구별 없이, 그리고 디바이스의 선택과 상관없이 활용되는 통합 플랫폼 환경이 폭 넓게 조성되고 있다. 따라서, 방송 통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠는 사용자의 요구 및 새로운 비즈니스 모텔에 대한 요구를 만족할 수 있어야 하며, 일관된 기술로 통선 및 서비스간의 호환성을 유지하는 인터페이스의 표준화가 이루어져야한다. 방송 통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠는 초고속 데이터 통신망을 활용하는 멀티미디어 및 IP 멀티캐스트 기능을 활용한 서비스들과 연계하여, 관련된 소재 산업들의 파급효과가 매우 크며, 관련 분야에 미치는 효과가 막대하므로, 이에 대한 적절한 육성전략을 고찰해보도록 한다.
This paper addresses a problem of non-dialog section detection for the DVS authoring, the goal of which is to find meaningful section from the broadcasting audio, where audio description can be inserted. The broadcasting audio involves the presence of various sounds so that it first discriminates between speech and non-speech for each audio frame. Proposed method jointly exploits the inter-channels structure and speech source characteristics of the broadcasting audio whose number of channel is stereo. Also, rule based post-processing is finally applied to detect the non-dialog section whose length is appropriate for audio description. Proposed method provides more accurate detection compared to conventional method. Experimental results on real broadcasting contents show that qualitative superiority of the proposed method.
Proceedings of the Korean Society of Broadcast Engineers Conference
/
2011.07a
/
pp.75-77
/
2011
최근 수년간 방송과 통신의 융합이 지속적으로 진행되고 있으며, 특히 홈 네트워크를 통한 방송 및 통신의 멀티미디어 콘텐츠의 공유 기기 시장이 비약적으로 성장하고 있다. 스마트폰을 비롯한 스마트 기기의 진보를 통하여 사진, 음악, 영상의 멀티미디어 콘텐츠에 대한 공유가 홈 네트워크 상에서 이루어 지고 있으며, 이러한 기술은 업계 표준으로 사용되고 있는 UPnP 및 DLNA에 기반하고 있다. 다만, 이러한 홈 네트워크 표준은 Peer-to-peer 네트워크를 근간으로 하고 있어 홈 네트워크 내에 복수의 서버가 있을 경우 사용자의 편의성이 상대적으로 약하다. 이에 본 논문은 홈 네트워크 내에서 콘텐츠 리스트를 통합 관리할 수 있는 Contents List Aggregation 서비스를 제안한다. 제안되는 서비스는 홈 네트워크 내의 미디어 서버들로부터 Contents List를 전송받아 통합된 형태로 저장 및 관리할 수 있으며, 기존 서비스와 호환성을 유지할 수 있다. 서비스의 제안과 함께 서비스를 지원하는 UPnP Device 및 Control Point의 서비스 시나리오, 그리고 서비스 연동에 대한 운용환경 및 사용예가 함께 제시되었다.
This paper presents a new music identification method using probabilistic and dynamic characteristics of melody. The propo3ed method uses pitch and MFCC parameters as feature vectors for the characteristics of music notes and represents melody pattern by pitch histogram and temporal sequence of codeword indices. We also propose a new pattern matching method for the hybrid method. We have tested the proposed algorithm in small (drama OST) and broad (1.005 popular songs) search spaces. The experimental results on search areas of OST and 1,005 popular songs showed better performance of the proposed method over conventional methods. We achieved the performance improvement of average $9.9\%$ and $10.2\%$ in error reduction rate on each search area.
본 논문에서는 새롭게 떠오르고 있는 대중음악계의 K-Pop이라는 트렌드 속에서 전문대학이 이 특정한 분야의 학과 또는 전공을 개설하려고 하는 시도에 대한 제안적인 연구이다. 실용음악과와 방송연예과 등 기존의 유관 학과 및 전공과의 유사점과 차별성을 잘 활용하여 교과과정을 만든다면 K-Pop 전공이 대학에 개설되는 것이 불가능한 일은 아닐 것이다.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.