• 제목/요약/키워드: 3-D MUSIC

검색결과 127건 처리시간 0.025초

Adaptive TCX Windowing Technology for Unified Structure MPEG-D USAC

  • Lee, Tae-Jin;Beack, Seung-Kwon;Kang, Kyeong-Ok;Kim, Whan-Woo
    • ETRI Journal
    • /
    • 제34권3호
    • /
    • pp.474-477
    • /
    • 2012
  • The MPEG-D unified speech and audio coding (USAC) standardization process was initiated by MPEG to develop an audio codec that is able to provide consistent quality for mixed speech and music contents. The current USAC reference model structure consists of frequency domain (FD) and linear prediction domain (LPD) core modules and is controlled using a signal classifier tool. In this letter, we propose an LPD single-mode USAC structure using an adaptive widowing-based transform-coded excitation module. We tested our system using official test items for all mono-evaluation modes. The results of the experiment show that the objective and subjective performances of the proposed single-mode USAC system are better than those of the FD/LPD dual-mode USAC system.

대학교 학생식당의 소음저감을 위한 실내소음 실태분석 (Analysis on Indoor Noise Condition of Cafeteria in University Campus)

  • 최윤정;이선아;김혜경
    • 한국실내디자인학회:학술대회논문집
    • /
    • 한국실내디자인학회 2007년도 춘계학술대회 논문집
    • /
    • pp.85-88
    • /
    • 2007
  • This research is a case study for improving the sound environmental quality of cafeteria in university campus. The purpose of the study is to investigate the present condition of physical level, type, and source of indoor noise by comparison with a restaurant near campus. Methods were field survey with measurement on equivalent and instant noise level and observation on noise type, and questionnaire survey to 60 students users. Surveys were carried out in the 8th and the 14th of December 2005. The results are as follows. 1) Indoor noise levels of the cafeteria were measured as $67.2{\sim}76.6$(average 73.3) dB(A)Leq5min and $60.3{\sim}90.5$(average 71.2) dB(A), but noise levels of the restaurant were $61.6{\sim}70.4$(average 66.9) dB(A)Leq5min and $59.8{\sim}70.6$(average 64.9) dB(A). 2) The users's responses on major noise type were 'noise by handling equipment and tableware', 'noise by moving chairs', and 'taking noise' in cafeteria, but 'taking noise' and 'background music' in restaurant. 3) It was found that the differences of indoor noise condition between with 2 subjects were caused by finishing materials, kitchen division type, and furniture type.

  • PDF

Maximum Power Waveform Design for Bistatic MIMO Radar System

  • Shin, Hyuksoo;Yeo, Kwang-Goo;Yang, Hoongee;Chung, Youngseek;Kim, Jongman;Chung, Wonzoo
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제3권4호
    • /
    • pp.167-172
    • /
    • 2014
  • In this paper we propose a waveform design algorithm that localizes the maximum output power in the target direction. We extend existing monostatic radar optimal waveform design schemes to bistatic multiple-input multiple-output (MIMO) radar systems. The algorithm simultaneously calculates the direction of departure (DoD) and the direction of arrival (DoA) using a two-dimensional multiple signal classification (MUSIC) method, and successfully localizes the maximum transmitted power to the target locations by exploiting the calculated DoD. The simulation results confirm the performance of the proposed algorithm.

디지털 문화컨텐츠 제작을 위한 발전 방안 연구 (A Study on Development of the Digital Curture Contents Production)

  • 박만수;노현준;방기천
    • 디지털콘텐츠학회 논문지
    • /
    • 제5권4호
    • /
    • pp.300-305
    • /
    • 2004
  • 2000년 디지털 문화컨텐츠산업 현황은 게임과 영화부분에서 상당한 고부가가치 성장을 하였으나, 애니메이션 및 캐릭터, 음반 시장은 경기 침체로 둔화된 모습을 보였다. 디지털 문화컨텐츠산업 중에서도 애니메이션 산업은 영상과 캐릭터 관련 사업의 영역뿐만이 아니라 저작권 사업영역 까지도 확장성과 막대한 부가가치 증대 가능성이 높은 다중문화컨텐츠 사업으로 업계에서 주목을 받고 있다. 하지만 2D애니메이션의 급격한 하향세와 해외 3D애니메이션의 강세로 소수의 성공적인 프로젝트를 제외하고는 아직 안정적인 시장구조가 연계되지 못하고 있다. 따라서, 본 연구는 국내 3D애니메이션 산업에 시장구조의 근본논리를 찾아내서 분석하고 조사하여 해외 벤치마킹을 통한 대안을 제시하는 것이 이 연구의 목적이다. 이러한 디지털 문화컨텐츠 산업의 3D 애니메이션 분야의 발전 연구 방법의 모델로서 업계에 적용한다면 효과적인 제작이 이루어 질 것으로 기대된다.

  • PDF

국악을 소재로 한 디지털 콘텐츠의 특징 (Characteristics of digital contents related to Korean traditional music)

  • 손주희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.531-534
    • /
    • 2022
  • 최근 국악계가 지향하는 국악의 발전 방향은 국악의 대중화 및 현대화에 초점이 맞춰져있다. 이에 국악인들은 창작 국악, 크로스 오버 국악 등의 새로운 국악을 연주하는 공연을 진행해오고 있으나 타 분야의 기술 융합을 통한 국악 관련 콘텐츠 개발의 측면에서 제작된 디지털 콘텐츠들은 두각을 드러내지 못했다. 다수의 선행연구에서는 국악 소재 디지털 콘텐츠에 관한 학술적 연구가 미미하다고 언급하며 이에 대한 연구의 필요성을 강조했다. 이에 따라 본 연구는 국악 소재 디지털 콘텐츠의 특징에 관한 사례연구를 진행했다. 사례조사 범위는 국내 스마트폰 보급이 본격화 된 2009년부터 2022년까지로 설정하여 해당 자료를 수집했다. 본 연구의 분석기준은 사례를 크게 콘텐츠의 기능적 측면과 내용적 측면으로 나누어 국악과의 연계성을 분석하는 데에 집중했다. 연구 결과 팬데믹으로 인한 언택트 형태의 온라인 국악 교육 콘텐츠가 주를 이루었고, 정보 콘텐츠와 교육 콘텐츠의 사례가 모두 이에 해당했다. 공연 콘텐츠는 LED 기술을 사용한 의상을 입은 퍼포먼스형 공연의 형태와 3D 미디어 아트가 주가 되는 음악회의 형태가 있고, 오락 콘텐츠는 리듬 게임과 스토리텔링형 게임으로 나눌 수 있었다. 본 연구는 선행연구에서 언급한 국악 콘텐츠 연구의 한계점을 해소하고자 수집한 자료를 본 연구의 분석 기준에 적용하여 특징을 도출하는 데에 그치지 않고 더 나아가 향후 국악 소재 디지털 콘텐츠가 개발되어야 할 방향을 제안했다는 점에서 연구의 의의를 지닌다. 또한 사례의 연도별 추이를 파악하였으므로 국악을 소재로 한 콘텐츠 제작 사례에 관한 연구를 진행하는 향후 연구자들에게 기초자료로서 도움이 될 것으로 사료된다.

  • PDF

립모션 기반의 윈도우즈 애플리케이션 제어 모델에 관한 연구 (A Study on the Windows Application Control Model Based on Leap Motion)

  • 김원
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.111-116
    • /
    • 2019
  • 최근 컴퓨터 능력의 급속한 발전으로 인간과 컴퓨터간의 상호 작용을 편리하게 연결할 수 있는 많은 기술들이 연구되고 있는 상황으로, 전통적인 입력장치를 사용한 GUI에서 3D 모션, 햅틱, 멀티 터치와 같은 신체를 이용한 NUI로 패러다임이 변화되고 있는 추세이다. 인간의 동작을 센서를 이용하여 컴퓨터에 전달하는 많은 연구가 이루어지고 있으며, 3D 객체를 획득할 수 있는 광학 센서의 개발과 더불어 산업 및 의료 분야, 사용자 인터페이스 분야 등으로 응용 범위가 확장되고 있다. 본 논문에서는 립모션을 기반으로 사용자의 손동작에 따라 기본 입력장치인 마우스를 대신하여 제스처를 통한 타 프로그램 실행 및 윈도우즈 제어가 가능하며, 안드로이드 앱과 융합하여 메인 클라이언트와 연결을 통하여, 음성인식과 버튼을 사용해 각종 미디어와 음성 명령 기능을 통한 제어가 가능한 모델을 제안한다. 제안 모델을 통하여 영상, 음악과 같은 인터넷 미디어를 클라이언트 컴퓨터 뿐만 아니라 앱을 통한 원거리 제어가 가능하여, 편리하게 미디어를 시청할 수 있을 것으로 기대된다.

다중표적의 효과적인 3차원 위치추정 알고리듬 (An Efficient Algorithm for Localizing 3D Narrowband Multiple Sources)

  • 이철목;이종환;이수형;윤경식;이균경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.228-231
    • /
    • 1999
  • 3차원 공간상의 표적의 위치는 방위각, 고각, 거리의 세가지요소로 나타내어 질 수 있다. 이 논문에서는 등각적 선배열 센서로 이루어진 3개의 부분센서배열을 이용한 3차원 표적의 위치추정 알고리듬을 제안하였다. 원거리 표적의 방위각 추정 알고리듬으로 근거리 표적의 방위각을 추정하면 추정된 방위각은 실제 근거리 표적의 방위각과 고각과 거리의 비선형 대수적 관계식으로 주어진다. 제안한 알고리듬은 3개의 부분센서배열에서 각각 표적을 원거리에 있다고 가정하고 원거리입체각을 추정하여 위의 대수적 관계식을 얻은 후 이들 관계식을 연립하여 실제 근거리 표적의 위치를 추정하였다. 다중표적의 경우 각각의 부분센서배열에서 추정한 원거리입체각이 어떤 표적에 대한 추정치인지 연관시켜주는 알고리듬이 필요하다. 이 논문에서는 추정한 원거리입체각의 모든 조합으로부터 3차원 MUSIC 스펙트럼값을 비교하여 그 중 표적의 개수만큼을 선별하여 다중표적의 위치를 추정하였다.

  • PDF

2차 창작기능과 사용자 자유도개선을 제공하는 음악 플레이어의 개발 (Development of a music player that provides fanwork-design system and professional player functions easily for users)

  • 이희준;김진관
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.71-74
    • /
    • 2017
  • 본 연구에서 제작한 음악 플레이어인 Symphony(이하 심포니)는 사용자의 음악적인 공감을 돕고, 그에 따른 음악을 기반으로 한 2차 창작의 접근성과 자유도를 높여주는 기능을 포함하는 복합적인 프로그램이다. 기존 플레이어는 음원의 유통과 선별적 재생에만 초점을 두는 경향이 있는데, 심포니는 음악 플레이어의 개념을 사용자 입장에서 확장하여 가사 시스템, 춤 시스템, 플레이어 스킨, 사운드 비주얼라이저, DSP 설정 및 실시간 DSP 스크립팅 등을 추가하거나 개선하였다.

  • PDF

슬랫천장이 소규모실의 음향에 미치는 영향 (The effect of a slat ceiling on the acoustics of a small performance space)

  • 오예닮;이효진;정대업
    • 한국음향학회지
    • /
    • 제37권5호
    • /
    • pp.363-368
    • /
    • 2018
  • 최근 슬랫형 천장은 음악전용공연장인 음악당에서부터 공항대합실을 포함한 다양한 규모와 용도의 건물에서 그 적용범위가 확대되고 있다. 그러나 이와 같은 구조의 활용에 따른 공간의 실내음향에 미치는 영향에 관한 연구가 거의 없어 공간의 계획 시 활용 가능한 자료가 거의 없다. 본 연구에서는 1/20 축소모형실험을 통하여 shoe-box 형태의 소규모 공연장에서 슬랫형 천장의 적용이 객석의 음향에 미치는 영향을 측정 분석하였다. 실험은 슬랫의 간격 및 설치높이 변화의 조합에 따른 6가지 설치조건들을 대상으로 하였으며, 잔향시간 ($T_{30}$), 명료도 ($D_{50}$$C_{80}$), 그리고 음의 세기 (G 및 $G_{80}$) 측면에서 그 영향을 분석하였다.

Towards Low Complexity Model for Audio Event Detection

  • Saleem, Muhammad;Shah, Syed Muhammad Shehram;Saba, Erum;Pirzada, Nasrullah;Ahmed, Masood
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.175-182
    • /
    • 2022
  • In our daily life, we come across different types of information, for example in the format of multimedia and text. We all need different types of information for our common routines as watching/reading the news, listening to the radio, and watching different types of videos. However, sometimes we could run into problems when a certain type of information is required. For example, someone is listening to the radio and wants to listen to jazz, and unfortunately, all the radio channels play pop music mixed with advertisements. The listener gets stuck with pop music and gives up searching for jazz. So, the above example can be solved with an automatic audio classification system. Deep Learning (DL) models could make human life easy by using audio classifications, but it is expensive and difficult to deploy such models at edge devices like nano BLE sense raspberry pi, because these models require huge computational power like graphics processing unit (G.P.U), to solve the problem, we proposed DL model. In our proposed work, we had gone for a low complexity model for Audio Event Detection (AED), we extracted Mel-spectrograms of dimension 128×431×1 from audio signals and applied normalization. A total of 3 data augmentation methods were applied as follows: frequency masking, time masking, and mixup. In addition, we designed Convolutional Neural Network (CNN) with spatial dropout, batch normalization, and separable 2D inspired by VGGnet [1]. In addition, we reduced the model size by using model quantization of float16 to the trained model. Experiments were conducted on the updated dataset provided by the Detection and Classification of Acoustic Events and Scenes (DCASE) 2020 challenge. We confirm that our model achieved a val_loss of 0.33 and an accuracy of 90.34% within the 132.50KB model size.