• 제목/요약/키워드: object-based audio content

검색결과 11건 처리시간 0.022초

채널 기반에서 객체 기반의 오디오 콘텐츠로의 변환을 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법 (Non-uniform Linear Microphone Array Based Source Separation for Conversion from Channel-based to Object-based Audio Content)

  • 전찬준;김홍국
    • 방송공학회논문지
    • /
    • 제21권2호
    • /
    • pp.169-179
    • /
    • 2016
  • 오늘날 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화기로 MPEG-H에 대한 표준화가 진행되고 있다. 향후 방송용 오디오 콘텐츠는 채널 기반 오디오 콘텐츠에서 진화하여 객체 기반 오디오 콘텐츠까지도 포함하게 될 예정이다. 이에 따라, 채널 기반 오디오 콘텐츠의 객체 기반 오디오 콘텐츠로의 유기적인 변환이 필요한 실정이다. 본 논문에서는 이러한 유기적인 변환을 실현 가능하게 할 수 있는 비균등 선형 마이크로폰 어레이 기반의 음원분리 기법을 제안한다. 제안된 기법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 분석된 시간차에 따라 주파수별로 특정 방위각에 위치한 입력 오디오 신호의 spectral magnitude를 예측한다. 이후, azimuth와 width 파라메타를 조정함으로써 객체 오디오 생성을 위한 음원을 분리한다. 제안된 음원분리 기법의 성능을 평가하기 위하여 객관적 음원분리 지표 및 분리정확도를 측정하였고, 최소 분산 무손실 응답 빔형성기와 독립 성분 분석 기법 등 기존 음원분리 기법과의 그 성능을 비교하였다. 비교 결과, 제안된 기법이 기존 음원분리 기법들에 비하여 우수한 음원분리 성능을 보이는 것을 알 수 있었다.

다중 스트림을 이용한 객체기반 MPEG-4 컨텐트의 적응 기법 (Adaptation for Object-based MPEG-4 Content with Multiple Streams)

  • 차경애
    • 한국산업정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.69-81
    • /
    • 2006
  • In this paper, an adaptive algorithm is proposed in streaming MPEG-4 contents with fluctuating resource amount such as throughput of network conditions. In the area of adaptive streaming issue, a lot of researches have been made on how to represent encoded media(such as video) bitstream in scalable way. By contrast, MPEG-4 supports object-based multimedia content which is composed of various types of media streams such as audio, video, image and other graphical elements. Thus, it can be more effective to provide individual media streams in scalable way for streaming object-based content to heterogeneous environment. The proposed method provides the multiple media streams corresponding to an object with different qualities and bit rate in order to support object based scalability to the MPEG-4 content. In addition, an optimal selection of the multiple streams for each object to meet a given constraint is proposed. The selection process is adopted a multiple choice knapsack problem with multi-step selection for the MPEG-4 objects with different scalability levels. The proposed algorithm enforces the optimal selection process to maintain the perceptual qualities of more important objects at the best effort. The experimental results show that the set of selected media stream for presenting objects meets a current transmission condition with more high perceptual quality.

  • PDF

UHDTV를 위한 실감 오디오 재현 기술 (A Study on Realistic Sound Reproduction for UHDTV)

  • 장대영;서정일;이용주;유재현;박태진;이태진
    • 방송공학회논문지
    • /
    • 제20권1호
    • /
    • pp.68-81
    • /
    • 2015
  • 최근 부품기술 및 미디어 처리기술의 발전과 함께 HDTV를 이을 UHDTV 서비스가 곧 도래할 것이라는 예상이 기정사실화되고 있다. 이에 따라 HDTV에서 5.1채널 서라운드 사운드를 제공했던 오디오 기술도 UHDTV 시대의 도래와 함께 어떠한 서비스를 제공하여야 할지 고민하여야 할 시점에 와 있다. 그러나 현실은 HDTV의 5.1채널 사운드 포맷조차도 가정에서의 설치 및 유지의 어려움으로 인해 시장에서의 고전을 면치 못하고 있다. 한편, 영화 사운드 시장에서는 오랫동안 사용되고 있던 5.1, 7.1 채널 사운드 포맷이 돌비 ATMOS, IOSONO, AURO3D 등 천정 사운드와 객체기반 오디오를 포함하는 하이브리드 오디오 기술이 잇달아 도입되면서 일대 격변기를 맞이하고 있다. 이러한 객체기반 오디오 기술은 홈씨어터 및 방송 오디오 시장에서도 도입이 확실시되고 있는 실정이며, 이러한 오디오 기술의 변화는 유연성이 결여된 채널기반 오디오의 기술 발전 및 시장 성장의 활로를 개척하는 호기가 될 것으로 전망된다. 따라서 본 논문에서는 UHDTV 방송에 적합한 실감 오디오 기술에 대한 고찰과 이와 관련된 하이브리드 오디오 기술의 콘텐츠 포맷 및 가정에서의 재현 방안에 대해서 기술하고 향후 전망을 고찰해 보고자 한다.

AR기반 영어학습을 위한 효과적 콘텐츠 구성 방향에 대한 연구 (A study of effective contents construction for AR based English learning)

  • 김영섭;전수진;임상민
    • 정보통신설비학회논문지
    • /
    • 제10권4호
    • /
    • pp.143-147
    • /
    • 2011
  • The system using augmented reality can save the time and cost. It is verified in various fields under the possibility of a technology by solving unrealistic feeling in the virtual space. Therefore, augmented reality has a variety of the potential to be used. Generally, multimodal senses such as visual/auditory/tactile feed back are well known as a method for enhancing the immersion in case of interaction with virtual object. By adapting tangible object we can provide touch sensation to users. a 3D model of the same scale overlays the whole area of the tangible object; thus, the marker area is invisible. This contributes to enhancing immersive and natural images to users. Finally, multimodal feedback also creates better immersion. In this paper, sound feedback is considered. By further improving immersion learning augmented reality for children with the initial step learning content is presented. Augmented reality is in the intermediate stages between future world and real world as well as its adaptability is estimated more than virtual reality.

  • PDF

지상파 UHD 방송 MMT/ROUTE기반 브로드밴드 콘텐츠 삽입 기술 (Broadband Content Insertion Technology based on Terrestrial UHD Broadcasting MMT/ROUTE)

  • 김두환;이동관;김규헌
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.329-340
    • /
    • 2019
  • 최근 국내 지상파 UHD(Ultra-High Definition) 방송과 같은 고품질 AV(Audio-Video) 서비스가 증가하면서 그에 맞춰 방송 기술도 진화하게 되면서 방송 표준 또한 새롭게 정의하게 되었다. 또한, 네트워크 기술이 발달함에 따라, 콘텐츠가 해당 나라뿐 아니라 세계적으로 소비되고 있다. 그에 맞춰 국가 및 지역적 환경 등에 맞춰 적합한 콘텐츠를 제공하는 방안인 콘텐츠 삽입 기술이 필요할 것으로 보인다. 본 논문은 지상파 UHD 방송의 전송 표준 DASH(Dynamic Adaptive Streaming over HTTP)/ROUTE(Real time Object delivery Over Unidirectional Transport) 및 MMT(MPEG Media Transport)를 기반으로 방송망과 통신망의 이종 망 환경 하에 ATSC (Advanced Television Systems Committee) 3.0 Event Signaling 표준을 활용한 콘텐츠 삽입 서비스 시스템 모델 및 동기화 방안을 제안한다. 또한, 해당 서비스가 방송 표준을 만족하는 환경에서 동작함을 검증한다.

MPEG-4 표준을 이용한 멀티미디어 스트리밍 시스템 구현 (Implementation of A Multimedia Streaming System using MPEG-4)

  • 임동근;이정우;김선태;마평수;호요성
    • 방송공학회논문지
    • /
    • 제6권3호
    • /
    • pp.215-224
    • /
    • 2001
  • 최근 멀티미디어 분야의 연구개발 동향은 주로 비디오와 오디오 신호의 개별적인 부호화에 치중하던 이전의 기술적 동향에서 벗어나, 비디오, 오디오, 텍스트 등과 같은 여러 종류의 신호에 대하여 시간상 동기일치를 고려하여 다중화하는 시스템 기술의 중요성이 더욱 증가하고 있다. MPEG-4 영상압축 표준은 영상의 내용에 대한 이해를 바탕으로 내용기반 부호화에 중점을 두고 있다. 이 내용기반 부호화에서는 각 미디어 데이터 자체를 개체 단위로 나누어 처리할 수 있기 때문에 사용자의 의도에 따라 다양한 형태의 조작과 디스플레이가 가능하며 그 응용 분야가 매우 넓다. 본 논문에서는 MPEG-4 표준의 시스템 규격과 파일 포맷에 따라 구현된 멀티미디어 서비스 시스템을 기술하였다. 구현된 기술은 멀티미디어 데이터의 스트리밍, DVD, 영상전자메일, 디지털 방송과 같은 다양한 멀티미디어 서비스에 응용될 수 있는 기반 기술로서 그 중요성을 가진다.

  • PDF

CNN-based Visual/Auditory Feature Fusion Method with Frame Selection for Classifying Video Events

  • Choe, Giseok;Lee, Seungbin;Nang, Jongho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1689-1701
    • /
    • 2019
  • In recent years, personal videos have been shared online due to the popular uses of portable devices, such as smartphones and action cameras. A recent report predicted that 80% of the Internet traffic will be video content by the year 2021. Several studies have been conducted on the detection of main video events to manage a large scale of videos. These studies show fairly good performance in certain genres. However, the methods used in previous studies have difficulty in detecting events of personal video. This is because the characteristics and genres of personal videos vary widely. In a research, we found that adding a dataset with the right perspective in the study improved performance. It has also been shown that performance improves depending on how you extract keyframes from the video. we selected frame segments that can represent video considering the characteristics of this personal video. In each frame segment, object, location, food and audio features were extracted, and representative vectors were generated through a CNN-based recurrent model and a fusion module. The proposed method showed mAP 78.4% performance through experiments using LSVC data.

미술관의 해석과 소통의 모색 (Exploring Practices of Interpretation and Communication in Art Museums)

  • 김은영
    • 미술이론과 현장
    • /
    • 제2호
    • /
    • pp.147-168
    • /
    • 2004
  • This study examined the role of interpretation with various practices in art museums to seek a new meaning and a concept of art museum today. The exploration of interpretation would he a starting point to discuss about on art museums with professionals in each art-related field. While museums recognize the concept of interpretation and the scope of the functions in different levels, the study focused on the practices of collecting and exhibiting that will entrust the museum new realms of activities toward the audience. In particular, its emphases are set force on the information on the collections via the museum's web sites, interpretation policies, and theories and methodologies in exhibition development. Art museum websites well reflect how museums utilize the new medium to enhance the understanding of art works by providing in-depth art historical information, comprehensive contexts, and subject/concept based search methods. In recent decades, these have enacted changes to expand dimensions of interpretive functions in most museums, particularly in the United States and others. In an administrative perspective, Tate Gallery Interpretation Policy became an good example how an art museum put its interpretation philosophy as the basis of interpreting collection and public programs. Tate established functions of intrepretation and education not only within a task-based team but also as an intrer-divisional coorperation to provide an interpretation scheme of information provisions such as guide brochure, audio tour, multimedia content, and library. New environment and trends of museum exhibition, and its development processes stem from communication theories, object interpretation philosophy, display strategies, and various evaluation techniques through audiences, with the communication theories of Shannon and Weaver, Berlo's SMCR(Source-Message-Channel-Receiver) models were perceived as to understand the mechanism to communicate museum exhibits to visitors Suzan vogel's insight into object display strategy helped to conceive the mechanism of object recontextualization. She emphasized that the museum's practice to construe opinions and impressions through object display should be discreet and critical, therefore, the professionals to plan the exhibition should reveal the intention and their practices. For a prevailing new methodology from the field, the interpretive exhibition development processes are articulated as the front-end, formative, and summative evaluation, futhermore the team process in industrial product management models was adapted. These have turned out to be more interactive with visitors and effective to communicate the exhibition concepts and messages, hence resulting in enriched museum experiences. Finally the study concluded that understanding the aspects of interpretation should help art museums to set a framework for current practices to expand its public dimension. It can provide curators with a critical view to website planning and its content. And obviously, the interpretive exhibition development methodology will lead museum exhibition developers to be skilled in its current approaches to thematic exhibition concerning diverse subjects and topics.

  • PDF

문맥을 고려한 예제 기반 동영상 검색 알고리즘 (Content Based Video Retrieval by Example Considering Context)

  • 박주현;낭종호;김경수;하명환;정병희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권12호
    • /
    • pp.756-771
    • /
    • 2003
  • 효율적인 동영상 검색 방법은 많은 양의 동영상 데이터를 관리하는 디지털 비디오 라이브러리 시스템에서 필수적으로 요구되는 기능이다. 본 논문에서는 샷 단위 동영상을 문맥, 전경, 배경, 오디오로 나누어 비교하여 질의 동영상과 비슷한 동영상을 찾아내는 예제 기반 동영상 검색 알고리즘을 제안하였고, 제안한 알고리즘에 따라서 저작 및 검색도구를 구현하였다. 샷간의 관계 정보 즉, 문맥을 고려한다는 것은 인접한 샷들 간의 오디오, 움직임 정보들과 같은 저급 수준 내용 정보 간에 변화 패턴을 비교한다는 것이다. 두 번째 비교 요소인 전경은 움직이는 객체들의 집합을 의미하고, 세 번째 비교 요소인 배경은 전경을 제외한 나머지 비디오 정보를 의미한다. 이러한 비교 방법은 동영상 제작 과정에 근거한 것으로써 사용자로 하여금 직관적인 비교를 할 수 있게 한다. 또한 질의 신을 직접 구성할 수 있게 하였고, 각각의 비교요소에 가중치를 부여할 수 있도록 하여서 사용자의 검색의도를 자유롭게 반영할 수 있도록 하였다. 본 논문에서는 동영상이 가지고 있는 의미 정보를 검색에 완전히 반영하지는 못하지만, 문맥을 통해서 부분적인 의미 정보를 사용할 수 있도록 하였으며, 질의 신 구성과 직관적인 비교 요소를 사용함으로써 사용자의 검색 의도를 최대한 반영하고자 하였다.

MPEG-4 영상의 화질 개선에 관한 연구 (Image Enhancement Techniques for MPEG-4)

  • 김태근;신정호;백준기
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.169-181
    • /
    • 1997
  • 초고속압축률, 내용기반 부호화, 객체 단위의 계층적 구조로 대표되는 MPEG-4, 비디오의 화질 개선 기술에 관하여 논의한다. 화질 개설은 크게 두 가지로 나누어 압축과정에서 발생하는 화질 열화(degradation) 요인을 제거하고, 제한되어 있는 공간 및 시간적 해상도를 향상시키는 기술을 제안한다. 첫째 화질 열화의 제거를 위해서, 다시 MPEG-4 비디오 압축 기술을 크게 MPEG-2와 공통되는 부분과 차별되는 부분으로 나눈 후, 전자에 대해서는 이미 개발되어 있는 화질 개선을 적용하고, 후자에 대해서는 새로운 수학적 모델을 제시하여 복원이 가능하게 한다. 둘째 공간적 해상도 향상을 위해서는 다채널 영상보건(multichannel interpolation) 기법의 구현을 위한 일반화된 구조를 제안하고, 시간 해상도 향상을 위해서는 기존의 프레임률 향상 기법을 정리한다. MPEG-4 표준 제정 단계에서 매우 다양한 고려가 이루어지고 있지만, 가장 중요한 화질에 대해서는 상대적으로 제약이 많지 않기 때문에, 사용화 단계에서 화질 개선 기술의 추가가 매우 중요할 것으로 예상된다.

  • PDF