• 제목/요약/키워드: object audio

검색결과 95건 처리시간 0.031초

MP3 태그의 XML 확장을 이용한 동기화된 재생 시스템 (Synchronized MP3 Playing System Using XML Extension of MP3 Tag)

  • 곽미라;조동섭
    • 정보처리학회논문지B
    • /
    • 제9B권1호
    • /
    • pp.67-76
    • /
    • 2002
  • 고품질의 오디오 표준인 MP3포맷의 사용이 증가하면서, 오디오 데이터 외에 작곡가, 가사 등의 관련정보를 함께 저장하려는 요구가 나타났고 이를 만족하는 태깅 시스템들이 등장했다. 특히 ID3 vl 태그와 Lyrics3 v2 태그를 함께 사용하는 태깅 방법이 많이 사용되고 있다. 그러나 이 태그들은 MP3 파일 내에서 오디오 스트림의 뒷부분에 기록되므로, 이러한 태깅 방법이 적용된 MP3 파일이 스트리밍 방식으로 전달되는 경우 사용자는 전체 스트림이 로컬 시스템에 전송되기 전까지 태그 정보를 볼 수 없다. 또한 태그 정보들 중 오디오 스트림에 시간적으로 동기화된 정보들은 동기화의 기능을 잃는다. 본 논문에서는 원격지로부터 전달되는 MP3 파일의 재생시 태그 정보가 무시되는 문제를 해결하였다. XML을 사용하여 MP3 오디오 객체를 모델링하였고, 그 요소들의 시간관계성과 동기성을 HTML+TIME 방식으로 표현하는 XSL 문서를 설계하여 오디오 데이터가 시간성과 동기성을 가지고 웹 상에서 재생되도록 하였다.

New Interactive TV Service Model based on the MPEG-4 System

  • Kim, Jongho;Jechang Jeong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.125-128
    • /
    • 2002
  • In this paper, a new interactive TV service model is proposed. The MPEG-4 system is specified for composing and managing various object streams including user interactions. The data broadcasting model supporting user interactions is designed using MPEG-4 system in our proposal. We evaluate possibility of proposed service model using simulation player. This player supports MPEG-2 TS which contains MPEG-2 video and AC-3 audio streams as a main service and MPEC-4 system data as interactive services as well as user specific EPG information, and XML data, etc as supplemetary services. The player also supports a multi-channel environment. The synchronization between audio and visual data is achieved by DTS and PTS in TS.

  • PDF

디지털 미디어 콘텐츠 방송 시스템 구현 (Implementation of the Broadcasting System for Digital Media Contents)

  • 신재흥;김홍열;이상철
    • 전기학회논문지
    • /
    • 제57권10호
    • /
    • pp.1883-1887
    • /
    • 2008
  • Most of digital media contents are composed with video and audio, picture and animation informations. Sometime, there is some deviation of information recognition quality for the video and audio information according to information receiver's characteristics or the understanding. But visual information using the text provide most clear and accurate ways for information recognition to human being. In this paper, we propose a new broadcasting system(BSDMC) to transmit clear and accurate meaning of the digital media contents. We implement general-purpose components to display the video, picture, text and symbol simultaneously. Only plug-in and call these components with proper parameters on the application developing tool, we can easily develop the multimedia contents broadcasting system. These components are implemented based on the object-oriented framework and modular structure so that increase the reusability and can be develop other applications quick and reliable.

증강현실에서 객체와 오디오의 상호작용 (Interaction between Object and Audio in Augmented Reality)

  • 조현욱;이종근;이승진;이종혁
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.611-614
    • /
    • 2011
  • 최근 멀티미디어 기술의 발달, 특히 음향 기술의 급격한 발달과 더불어 고품질 오디오에 대한 요구와 함께보다 현실감 있는 오디오를 재생하기 위한 실감 오디오기술 개발이 요구되고 있다. 이러한 요구를 만족시키기 위해 사용자의 가상현실 및 증강현실에서 실감나는 오디오 효과를 제공해 줄 수 있는 3차원 오디오에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 증강현실에서 좀 더 나은 오디오 기술을 적용하여 실감나는 오디오 효과를 제공해 줄 수 있는 방법을 연구하고자 하였다. 연구한 내용은 가상세계와 실제세계의 현실감을 제공하기 위하여 마커 위에 띄워진 3D 모델의 움직임에 따라서 움직임에 맞는 사운드. 즉, 거리, 각도 등의 변화에 따른 사운드의 크기 및 피치 변화를 줄 수 있도록 하였다.

  • PDF

실내 환경에서 Chirp Emission과 Echo Signal을 이용한 심층신경망 기반 객체 감지 기법 (DECODE: A Novel Method of DEep CNN-based Object DEtection using Chirps Emission and Echo Signals in Indoor Environment)

  • 남현수;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.59-66
    • /
    • 2021
  • 인간은 오감 (시각, 청각, 후각, 촉각, 미각) 중 시각 및 청각 정보를 위주로 사용하여 주변 물체를 인식한다. 최신의 객체 인식과 관련한 주요 연구에서는 주로 이미지센서 정보를 이용한 분석에 초점이 맞추어져 있다. 본 논문에서는 다양한 chirp 오디오 신호를 관측공간에 방출하고 2채널 수신센서를 통해 echo를 수집하여 스펙트럼 이미지로 변화시킨 후 딥러닝을 기반으로 이미지 학습 알고리즘을 이용하여 3D 공간상의 객체 인식 실험을 진행하였다. 본 실험은 무향실의 이상적 조건이 아닌 일반적인 실내 환경에서 발생하는 잡음 및 echo가 있는 환경에서 실험을 진행하였고 echo를 통해 객체 인식률을 83% 정확도로 물체의 위치 추정할 수 있었다. 또 한 추론 결과를 관측공간과 3D Sound 공간 신호로 mapping 하여 소리로 출력하여 3D 사운드의 학습을 통해 소리를 통한 시각 정보를 얻을 수 있었다. 이는 객체 인식 연구를 위해서 이미지 정보와 함께 다양한 echo 정보의 활용이 요구된다는 의미이며 이런 기술을 3D 사운드를 통한 증강현실 등에 활용 가능할 것이다.

교차 예측 기반의 보컬 추정 방법을 이용한 SAOC Karaoke 모드에서의 음질 향상 기법에 대한 연구 (Quality Improvement of Karaoke Mode in SAOC using Cross Prediction based Vocal Estimation Method)

  • 이동금;박영철;윤대희
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.227-236
    • /
    • 2013
  • 본 논문에서는 SAOC의 Karaoke 모드의 출력 신호 내에 존재하는 잔여 보컬 성분을 추정하여 억제시킴으로써 음질을 향상시킬 수 있는 알고리듬을 제안하였다. 잔여 보컬 성분은 Karaoke 모드 환경으로 합성된 신호와 Solo 모드로 새로 합성된 신호를 서로 교차 예측하여 추정될 수 있다. 그러나, 두 신호는 모두 같은 다운 믹스 신호로부터 합성되는 신호이므로, 두 신호간의 높은 상관성으로 인하여 가라오케 신호내의 잔여 보컬 성분뿐만 아니라 음악 성분도 함께 제거된다. 이러한 열화를 해결하기 위해, 본 논문에서는 교차 예측 과정에서 심리 음향적 특성을 고려한 예측 방해 신호를 적용하였으며, 이 신호의 크기는 심리음향모델의 마스킹 특성에 따라 음악적 음질의 열화가 최소화되도록 적응적으로 설정되었다. 실험은 보컬 객체가 포함된 음악 신호에 대해서 객관적 및 주관적 음질평가를 수행하였으며, 전체적으로 성능 향상이 있음을 확인하였다.

AR기반 영어학습을 위한 효과적 콘텐츠 구성 방향에 대한 연구 (A study of effective contents construction for AR based English learning)

  • 김영섭;전수진;임상민
    • 정보통신설비학회논문지
    • /
    • 제10권4호
    • /
    • pp.143-147
    • /
    • 2011
  • The system using augmented reality can save the time and cost. It is verified in various fields under the possibility of a technology by solving unrealistic feeling in the virtual space. Therefore, augmented reality has a variety of the potential to be used. Generally, multimodal senses such as visual/auditory/tactile feed back are well known as a method for enhancing the immersion in case of interaction with virtual object. By adapting tangible object we can provide touch sensation to users. a 3D model of the same scale overlays the whole area of the tangible object; thus, the marker area is invisible. This contributes to enhancing immersive and natural images to users. Finally, multimodal feedback also creates better immersion. In this paper, sound feedback is considered. By further improving immersion learning augmented reality for children with the initial step learning content is presented. Augmented reality is in the intermediate stages between future world and real world as well as its adaptability is estimated more than virtual reality.

  • PDF

비전 기반 피아노 자동 채보 시스템 (Vision-Based Piano Music Transcription System)

  • 박상욱;박시현;박천수
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.249-253
    • /
    • 2019
  • 현재 상용화된 악보 채보 프로그램은 오디오 정보를 기반으로 채보를 진행한다. 이러한 기존 채보 프로그램은 환경 의존성, 장비 의존성, 시간 지연이라는 단점을 지니고 있다. 본 논문은 기존의 오디오를 이용하여 채보를 방식을 지양하고, 연주 영상을 분석하여 채보를 진행하는 컴퓨터 비전 기반 악보 채보 시스템을 제안한다. 제안하는 악보 채보 시스템은 대중화된 스마트폰 카메라를 활용하여 피아노 연주를 촬영하고, 이를 분석하여 자동으로 전자 악보인 미디파일을 생성하는 방식으로 동작한다. 컴퓨터 실험에서 제안하는 악보 채보 시스템은 95.6%의 정확도로 연주된 음계를 채보하는 것으로 조사되었다.

엑셀을 활용한 일차함수의 과정 - 대상관점 형성에 대한 사례연구 (A Case Study on Formation of the Process - Object Perspective of Linear Function using Excel)

  • 이광상
    • 한국학교수학회논문집
    • /
    • 제10권2호
    • /
    • pp.263-288
    • /
    • 2007
  • 본 연구는 수학 7-가, 수학 8-가 교과서의 함수단원 분석을 통해 지필환경의 제한점을 알아본 후 탐구용 소프트웨어인 엑셀이 학생들의 일차함수의 과정-대상관점 형성 과정에 어떠한 영향을 미치는지 알아보는 것이다. 엑셀을 활용한 교수 실험은 학습능력 수준이 다른 다섯 명의 학생을 선정하여 중학교에서 다루고 있는 함수관련 내용을 중심으로 실시하였다. 교수실험은 5차시로 이루어졌으며, 각 학생의 활동 과정을 녹화, 녹음한 내용과 학생과의 면담, 관찰, 활동지 등을 분석하였다. 교수실험 결과, 엑셀을 활용해 식과 표와 그래프를 다양하게 조작한 역동적 탐구활동은 일차함수의 과정관점과 대상관점을 형성하는 데 중요한 비계설정(scaffolding) 역할을 했다.

  • PDF

Conformer 모델을 이용한 물체 표면 재료의 특성에 따른 가속도 신호 기반 햅틱 질감 인식 (Acceleration signal-based haptic texture recognition according to characteristics of object surface material using conformer model)

  • 김형국;정동기;김진영
    • 한국음향학회지
    • /
    • 제42권3호
    • /
    • pp.214-220
    • /
    • 2023
  • 본 논문에서는 합성곱 신경망과 트랜스포머의 장점을 결합한 Conformer 모델을 이용하여 물체 표면의 질감특성을 나타내는 햅틱 가속도 신호로부터 질감 인식 성능을 향상시키는 방식을 제안한다. 제안한 방식에서는 사람이 스타일러스와 같은 도구를 이용하여 물체 표면과 접촉하는 동안 충격음과 진동에 의해 발생한 3축 가속도 신호를 1차원 가속도 데이터로 결합하고, 오디오 신호와 유사성을 갖는 햅틱 가속도 신호로부터 로그 멜-스펙트로그램을 추출한다. 그리고 추출된 로그 멜-스펙트로그램에 Conformer 모델을 적용하여 다양한 물체의 질감을 인식하는 데 있어 주요한 지역적 및 전역적인 주파수 특징을 학습한다. 제안된 모델의 성능 평가를 위해 60개의 재질로 구성된 Lehrstuhl für Medientechnik(LMT) 햅틱 질감 데이터세트를 실험한 결과 제안된 방식이 기존 방식들보다 물체 표면 재료의 질감을 효과적으로 잘 인식할 수 있음을 보였다.