통합 검색 | Korea Science

음악 분석을 이용한 클라이언트 중심의 키프레임 생성 시스템 (Client-driven Animated Keyframe Generation System Using Music Analysis)

무즈타바 굴람;김선대;박은수;김승환;유재성;류은석
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 하계학술대회
- /
- pp.173-175
- /
- 2019
Animated images formats such as WebP are highly portable graphics formats that are being used everywhere on the Internet. Despite their small sizes and duration, WebP image previews the video without watching the entire content with minimum bandwidth. This paper proposed a novel method to generate personalized WebP images in the client side using its computation resources. The proposed system automatically extracts the WebP image from climax point using music analysis. Based on user interest, the system predicts the genre using Convolutional Neural Network (CNN). The proposed method can easily integrate with streaming platforms such as YouTube, Netflix, Hulu, and others.
PDF

고품질 스테레오 음악을 위한 오디오 워터마크 정보 삽입/추출 기술 (An Embedding /Extracting Method of Audio Watermark Information for High Quality Stereo Music)

배경율
- 지능정보연구
- /
- 제24권2호
- /
- pp.21-35
- /
- 2018
본 논문에서는 스테레오 음악에 오디오 워터마크를 삽입하기 위한 알고리즘을 제안하였다. 스테레오 음악은 2개의 채널을 갖고 있기 때문에 기존 워터마킹 기술은 일반적으로 각 채널을 독립적으로 생각하고 처리하는 경우가 많다. 그러나 스테레오를 모노로 변환하는 과정에서 워터마크의 손실이 발생하는 경우가 많이 발생할 수 있다. 제안한 알고리즘은 스테레오를 모노로 변환하더라도 워터마크의 손실이 발생하지 않도록 워터마크를 삽입할 때 스테레오와 모노변환의 특성을 이용하였다. 제안된 알고리즘에 사용된 오디오 워터마크는 "Copyright"와 "Copy_free"라는 두 가지 정보를 터보코드를 이용하여 생성하였다. 두 워터마크는 9바이트(72비트)로 이루어져 있으며, 오류정정을 위하여 터보코드를 적용하면 222비트로 삽입해야 하는 정보량이 늘어난다. 222비트의 워터마크는 추가적인 오류에 강인하도록 1024비트로 확장하여 최종적으로 스테레오 음악에 삽입할 워터마크로 사용하였다. 평균적으로 SNR은 40dB를 넘어서서 전통적인 양자화 방식보다 10dB 이상의 음질 개선을 가져왔다. 이는 상대적으로 10배의 음질 개선도를 의미하는 것으로 매우 유의미한 결과이다. 또한 워터마크의 추출에 필요한 샘플길이는 1초 이내의 길이면 충분히 추출이 가능하고, 128Kbps의 비트레이트를 갖는 MP3 압축에 대해서도 모두 1초 이내 길이의 음악 샘플로부터 워터마크의 완전한 추출이 가능하였다. 전통적인 양자화 방식이 10초 길이의 샘플을 이용해도 대부분 워터마크의 추출에 실패한 것에 비하면 1/10에 불과한 길이로 워터마크의 추출이 가능하다.
https://doi.org/10.13088/jiis.2018.24.2.021 인용 PDF KSCI

콘텐츠 플랫폼의 수익모델 혁신 전략에 대한 고찰 (Reinventing the revenue model for the content platform)

최광헌;김준익
- 디지털콘텐츠학회 논문지
- /
- 제18권7호
- /
- pp.1267-1280
- /
- 2017
본 연구는 개인 창작자와 사용자의 권한과 자유도가 강화된 콘텐츠 플랫폼에서 수익모델의 변화에 주목하였다. 이에 새로운 콘텐츠 플랫폼의 작동 원리와 개체간의 관계변화를 마누엘 카스텔의 네트워크 사회이론과 창조적 수용자에 의한 커뮤니케이션 이론을 적용하여 이해하고 분석하고자 하였다. 본 연구의 결과로, 새로운 커뮤니케이션 방식의 콘텐츠 플랫폼에서는 콘텐츠의 창작과 플랫폼 사업자의 수익 증진이 동시에 자연스럽게 이루어지기 때문에 인위적인 통제보다는 네트워크 안의 구성원들 사이에 자발적으로 일어나는 활발한 커뮤니케이션이 중요한 역할을 한다는 것을 알 수 있었다. 이는 콘텐츠 플랫폼 비즈니스의 주체는 어디까지나 사용자인 인간이며, 인간 본연의 특성인 자유로운 놀이 환경을 보장해 주는 것이 플랫폼 이용자들의 콘텐츠 창작과 건강한 소비 활동을 증진시킬 수 있음을 확인하였다.
https://doi.org/10.9728/dcs.2017.18.7.1267 인용 PDF KSCI

스트리밍 환경에서 게임 영상 제작 분석 (Analysis of Game Video Production in Streaming Media Environment)

이건박;유석호;현승훈
- 산업융합연구
- /
- 제20권5호
- /
- pp.69-76
- /
- 2022
본 연구에서는 스트리밍 기술에 대한 연구를 통해 각 플랫폼에서의 게임 영상의 특징과 기능을 정리했다. 게임 영상은 게임을 소재로 하여 마케팅과 게임플레이 방법 전파 등의 목적으로 게임콘텐츠 자체와 관계성이 높다. 영상 길이가 짧고 전파도 간편하다. 게임 영상 내용의 주된 유형은 게임 해설, 게임전략, 웃기기, 모방하기, 뮤직비디오, 게임 정보. 게임홍보동영상 기능 등으로 게임에 대한 직·간접적 홍보로서 제작자와 이용자에게 각각의 이유로 활용되어진다. 이 글은 게임 영상의 제작 주체와 제작 조건 등을 제작과정 중심으로 분석하였다. 제작 주체는 직업 창작자, 비 직업 창작자와 일반 사용자로 나뉘며, 게임 동영상 제작 동기는 주로 경제적 실리를 얻기 위해, 게임 영상 제작 방식은 게임 중 무작위로 생성되는 것과 사전 기획 후 촬영하는 것 두 가지다. 게임 동영상에 대한 실례를 통해 제작 과정을 추출 제시하였다.
https://doi.org/10.22678/JIC.2022.20.5.069 인용 PDF

음악과 플레이리스트의 메타데이터를 활용한 하이브리드 음악 추천 시스템에 관한 연구 (Research on hybrid music recommendation system using metadata of music tracks and playlists)

이현태;임규건
- 지능정보연구
- /
- 제29권3호
- /
- pp.145-165
- /
- 2023
추천 시스템은 인터넷의 발달로 급격하게 증가하는 정보의 양으로 인해 생긴 정보 선택의 어려움을 소비자에게 덜어주고 각 개인의 취향에 맞는 정보를 효율적으로 보여주는 중요한 역할을 한다. 특히, E-commerce와 OTT 기업은 상품과 콘텐츠 양이 급격하게 증가하면서 추천 시스템의 도움 없이는 인기 있는 상품만 소비되는 현상을 극복하지 못한다. 이러한 현상을 극복하고 고객 개인 취향에 맞는 정보 혹은 콘텐츠를 제공해 고객의 소비를 유도하기 위해 추천 시스템의 연구가 활발히 진행되고 있다. 일반적으로 유저(user)의 과거 행동 이력을 활용한 협업 필터링이 유저가 선호한 콘텐츠의 정보를 활용하는 콘텐츠 기반 필터링에 비해 높은 성능을 보여준다. 하지만 협업 필터링은 과거 행동 데이터가 부족한 유저에 대해서는 추천의 성능이 낮아지는 콜드 스타트(Cold Start) 문제를 겪게 된다. 본 논문에서는 카카오 아레나 경진대회에서 주어진 음악 스트리밍 서비스 멜론의 플레이리스트 데이터를 기반으로 앞에서 언급한 콜드 스타트 문제를 해결할 수 있는 하이브리드 음악 추천 시스템을 제시했다. 본 연구에서는 플레이리스트에 수록된 곡 목록과 각 음악과 플레이리스트의 메타데이터를 활용해 절반 혹은 전부 가려진 플레이리스트의 다른 수록 곡을 예측하는 것을 목표로 하였다. 이를 위해 플레이리스트 안에 곡이 있는 경우와 아예 곡이 없는 경우를 나눠서 추천을 진행하였다. 플레이리스트 안에 곡이 있는 경우에는 해당 플레이리스트의 곡 목록과 각 곡의 메타데이터를 활용하기 위해 LightFM을 활용하였다. 그 다음에 Item2Vec을 활용해 플레이리스트에 있는 수록 곡과 태그 및 제목의 임베딩 벡터를 생성하고 이를 추천에 활용하였다. 최종적으로 LightFM과 Item2Vec 모델의 앙상블을 통해 최종 추천 결과를 생성하였다. 플레이리스트 안에 곡이 없고 태그 혹은 제목만이 존재할 경우에는 플레이리스트의 메타데이터인 태그와 제목을 FastText를 활용해 사전 학습을 시켜 생성된 플레이리스트 벡터를 기반으로 플레이리스트 간의 유사도를 활용하여 추천을 진행하였다. 이렇게 추천한 결과, 기존 Matrix Factorization(MF)에서 해결하지 못한 콜드 스타트 문제를 해결할 수 있었을 뿐만 아니라 곡과 플레이리스트의 메타데이터를 활용해 기존 MF 모델인 ALS와 BPR 그리고 Word2Vec 기반으로 추천해 주는 Item2Vec 기술보다 높은 추천 성능을 낼 수 있었다. 또한, LightFM을 토대로 다양한 곡의 메타데이터를 실험한 결과, 여러 메타데이터 중에서 아티스트 정보를 단독으로 활용한 LightFM 모델이 다른 메타데이터를 활용한 LightFM 모델들과 비교해 가장 높은 성능을 보여준다는 것을 확인할 수 있었다.
https://doi.org/10.13088/jiis.2023.29.3.145 인용 PDF

모바일 기기내의 비디오 코덱에서 DCT 계수와 움직임 벡터의 암호화를 이용한 저작권 보호 (Copyright Protection using Encryption of DCT Coefficients and Motion Vector in Video Codec of Mobile Device)

권구락;김영로
- 디지털산업정보학회논문지
- /
- 제4권1호
- /
- pp.41-46
- /
- 2008
With widespread use of the Internet and improvements in streaming media and compression technology, digital music, video, and image can be distributed instantaneously across the Internet to end-users. However, most conventional Digital Right Management are often not secure and fast enough to process the vast amount of data generated by the multimedia applications to meet the real-time constraints. In this paper, we propose the copyright protection using encryption of DCT coefficients and motion vector in MPEG-4 video codec of mobile device. This paper presents a new Digital Rights Management that modifies the Motion Vector of Macroblock for mobile device. Experimental results indicate that the proposed DRM can not only achieve very low cost of the encryption but also enable separable authentication to individual mobile devices such as Portable Multimedia Player and Personal Digital Assistants. The performance of the proposed methods have low complexity and low increase of bit rate in overhead.
https://doi.org/10.17662/ksdim.2008.4.1.041 인용 PDF

스트림 서버에서 자원 사용 우선순위 결정을 위한 시뮬레이션 연구 (Simulation Study on the Stream Server for Deciding the Priority for Using Resources)

박진원
- 한국시뮬레이션학회논문지
- /
- 제12권4호
- /
- pp.95-102
- /
- 2003
Stream servers are for supplying multimedia stream data to users through the internet such as movies and music without discontinuation. A typical stream server is designed roughly by considering the characteristics of stream services and by employing processors, memory, PCI bus, Ethernet, TOE and disks. This study focuses on deciding the priority for using resources such as PCI bus, buffer memory and TOE buffer, which have limited capacities in a typical stream server. When the priorities for using limited resources are not given properly, the stream servers may not even function as originally designed. The simulation study shows that the top priority for using PCI bus for normal streaming services should be given to the operation that sends data from buffer memory to TOE buffer. Giving priority for using PCI bus to other operation such as sending data from disks to memory results in a deadlock phenomenon.
PDF

플렛폼 독립적인 HTML5 기반의 음원 스트리밍 웹서비스 개발 (Development of the platform independent music streaming web services based HTML5)

최재성;권한글;박시홍;백태산
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2014년도 추계학술발표대회
- /
- pp.955-957
- /
- 2014
HTML5에 들어서면서 웹서비스 구현에 보편적으로 사용되는 신기술들이 속속들이 나오고 있다. 브라우저 자체적인 그래픽 구현을 위한 Canvas/SVG, 멀티미디어와 관련된 audio, video, webaudio API 등이 추가되었고, 이로 인해 HTML5는 웹 환경에 더 빠르고 정교하며 편리한 인터페이스를 제공해 주었다. 이 중 아직도 표준화가 진행 중이거나 많은 브라우저에서 지원하지 않아 섣불리 사용 할 수 없는 기술들 또한 상당 수 존재한다. 본 논문에서 HTML5기술들을 활용하여 다양한 플랫폼에서 공통적으로 동작되는 플랫폼 독립적인 음원 스트리밍 웹서비스를 개발한다.
https://doi.org/10.3745/PKIPS.y2014m11a.955 인용 PDF

지능형 서비스 로봇을 위한 잡음에 강인한 문맥독립 화자식별 시스템 (Noise Robust Text-Independent Speaker Identification for Ubiquitous Robot Companion)

김성탁;지미경;김회린;김혜진;윤호섭
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2008년도 학술대회 1부
- /
- pp.190-194
- /
- 2008
본 논문은 지능형 서비스 로봇의 여러 기술들 중에서 기본적인 기술인 화자식별 기술에 관한 내용이다. 화자식별 기술은 화자의 음성신호를 이용하여 등록된 화자들 중에서 가장 유사한 화자를 찾아내는 것이다. 기존의 mel-frequency cepstral coefficient 를 이용한 화자식별 시스템은 무잡음 환경에서는 높은 성능을 보장하지만 잡음환경에서는 성능이 급격하게 떨어진다. 이렇게 잡음환경에서 성능이 떨어지는 요인은 등록환경과 식별환경이 다른 불일치문제 때문이다. 본 논문에서는 불일치문제를 해결하기 위해 relative autocorrelation sequence mel-frequency cepstral coefficient 를 사용하였다. 또한, 기존의 relative autocorrelation sequence mel-frequency cepstral coefficient 의 제한된 정보문제와 잔여잡음문제를 해결하기 위해 멀티스트리밍 방법과 멀티스트리밍 방법에 특정벡터 재결합 방법을 결합한 하이브리드 방법을 제한 하였다. 실험결과 제한된 방법들이 기존의 특정벡터보다 잡음환경에서 높은 화자식별 성능을 보여주었다.
PDF

음원 내 보컬 주파수 대역 분석에 기반한 음향기기 추천시스템 (A system for recommending audio devices based on frequency band analysis of vocal component in sound source)

김정현;석철민;김민주;김수연
- 한국산업정보학회논문지
- /
- 제27권6호
- /
- pp.1-12
- /
- 2022
음원 스트리밍 서비스와 Hi-Fi 시장이 성장함에 따라 다양한 음향기기들이 출시되고 있다. 이로 인해 소비자들의 제품 선택에 대한 폭은 넓어졌지만 자신의 음악적 취향과 일치하는 제품을 찾기는 더욱 어려워졌다. 본 연구에서는 사용자가 선호하는 음원으로부터 보컬 성분을 추출하고 이를 토대로 사용자에게 가장 적합한 음향기기를 추천하는 시스템을 제안하였다. 이를 위해 먼저 원본 음원을 Python의 Spleeter Library를 통해 분리하여 보컬 음원을 추출하고 제조사의 음향기기의 주파수 대역 데이터를 수집한 결과를 각각 격자 그래프로 나타내었다. 추출한 보컬 음원의 주파수 대역과 음향기기의 주파수 대역 측정치 데이터를 비교하기 위한 지표로서 Matching Gap Index(MGI)를 제안하였다. 산출된 MGI 값을 토대로 사용자 선호와의 유사도가 가장 높은 음향기기를 추천한다. 추천 결과는 음향 전문업체에서 제공하는 장르별 Equalizer 데이터를 이용하여 검증하였다.
https://doi.org/10.9723/jksiis.2022.27.6.001 인용 PDF KSCI

검색결과 58건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)