• 제목/요약/키워드: visual/audio system

검색결과 150건 처리시간 0.031초

Real-time 3D Audio Downmixing System based on Sound Rendering for the Immersive Sound of Mobile Virtual Reality Applications

  • Hong, Dukki;Kwon, Hyuck-Joo;Kim, Cheong Ghil;Park, Woo-Chan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.5936-5954
    • /
    • 2018
  • Eight out of the top ten the largest technology companies in the world are involved in some way with the coming mobile VR revolution since Facebook acquired Oculus. This trend has allowed the technology related with mobile VR to achieve remarkable growth in both academic and industry. Therefore, the importance of reproducing the acoustic expression for users to experience more realistic is increasing because auditory cues can enhance the perception of the complicated surrounding environment without the visual system in VR. This paper presents a audio downmixing system for auralization based on hardware, a stage of sound rendering pipelines that can reproduce realiy-like sound but requires high computation costs. The proposed system is verified through an FPGA platform with the special focus on hardware architectural designs for low power and real-time. The results show that the proposed system on an FPGA can downmix maximum 5 sources in real-time rate (52 FPS), with 382 mW low power consumptions. Furthermore, the generated 3D sound with the proposed system was verified with satisfactory results of sound quality via the user evaluation.

비디오 문서의 구조 정보를 이용한 메타데이터 모델링에 관한 연구 (A study on Metadata Modeling using Structure Information of Video Document)

  • 권재길
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.10-18
    • /
    • 1998
  • 비디오 정보는 전자도서관이나 WWW 및 주문형 비디오(VOD) 시스템과 같은 다양한 분야에서 중요한 요소로 부각되고 있으며, 시청각적(audio-visual), 시공간적(spatial-temporal), 의미적(semantics) 정보를 모두 포함하고 있어 사용자에게 다양한 형태의 정보를 제공할 수 있다. 또한 대부분의 경우 비디오 문서 전체를 검색하는 대신 비디오의 원하는 장면만을 검색할 수 있는 기능이 요구되고 있다. 따라서 본 논문에서는 이러한 검색의 다양성을 지원하기 위해 계층적으로 구성되어 있는 동영상 문서의 구조 정보를 이용하여 메타데이터를 모델링하고, 이를 통하여 동영상 문서를 통합적으로 다룰 수 있는 데이터베이스 스키마를 설계한다.

  • PDF

호흡동조 방사선치료 시 호흡유도시스템의 유용성 평가 (Evaluation of the Usefulness of the Respiratory Guidance System in the Respiratory Gating Radiation Therapy)

  • 이영철;김선명;도경민;박근용;김건오;김영범
    • 대한방사선치료학회지
    • /
    • 제24권2호
    • /
    • pp.167-174
    • /
    • 2012
  • 목 적: 호흡동조방사선치료(Respiratory Gating Radiation Therapy, RGRT)에서 호흡의 안정성은 매우 중요한 인자이다. 이러한 호흡의 안정을 위해 본인의 호흡주기를 직접 확인할 수 있도록 시청각시스템을 이용한 호흡유도시스템을 개발하였고 이의 유용성을 평가하고자 하였다. 대상 및 방법: 2011년 6월부터 2012년 4월까지 본원에서 호흡동조방사선치료를 받은 7명의 환자를 대상으로 시청각시스템을 이용하지 않는 자유호흡을 먼저 측정하고 자체개발한 호흡유도시스템을 이용한 호흡을 측정하였다. 시청각시스템을 이용한 호흡연습 후에는 치료실내에서의 자가호흡과 시청각시스템을 이용한 호흡을 각각 측정하였다. 측정된 데이터는 호흡주기, 호흡함수의 면적을 구하여 표준편차를 구하였으며, 이를 분석하여 치료전후의 호흡변화를 알아 보았다. 결 과: 자유호흡과 오디오 유도시스템, 시청각 유도시스템의 표준편차는 PTP (peak to peak)가 각각 0.343, 0.148, 0.078이다. 호흡주기는 각각 0.645, 0.345, 0.171이며, 호흡함수의 면적은 각각 2.591, 1.008, 0.877로 나타났다. 전체 환자의 CT실과 치료실에서의 차이를 평균한 값은 PTP가 0.425, 호흡주기가 1.566, 호흡면적이 3.671로 측정되었다. 호흡유도시스템 적용전후의 표준편자는 PTP가 0.265, 호흡주기가 0.474, 호흡면적이 1.714의 차이를 나타내었다. 자유호흡과 시청각유도시스템 적용전후의 값을 T-검정한 결과에서는 PTP, 주기, 호흡함수면적에서 각각 P-value 0.035, 0.009, 0.010의 값을 나타냈다. 결 론: 호흡동조방사선치료에서 호흡조절은 치료의 성패를 좌우할 만큼 중요한 인자이다. 자유호흡이나 청각에 의존한 호흡주기 획득에 비해 시청각 호흡유도 시스템을 이용한 경우에 보다 안정적인 호흡을 얻을 수 있었다. 특히, 치료실에서도 같은 시스템을 이용하여 호흡을 조절함으로써 호흡주기의 재현성이 뛰어났다. 이러한 시스템은 호흡불안정에 의한 치료시간의 지연을 줄이고 좀 더 정확하고 정밀한 치료가 가능하게 되었다.

  • PDF

시청각 유형 보존포맷 선정기준 및 권고포맷 연구 - 오디오 유형을 중심으로 - (Research on Audiovisual Type Preservation Format Selection Criteria and Recommended Formats: Focusing on Audio Types)

  • 전한역;양동민
    • 한국비블리아학회지
    • /
    • 제35권1호
    • /
    • pp.273-300
    • /
    • 2024
  • 전자기록 환경에서는 아날로그 기록물의 디지털화 방안에 대한 논의와 함께, 전자적으로 생산, 접수된 기록물에 대한 유형별 보존전략 마련이 중요하게 인식된다. 같은 맥락에서, 문서유형 외 데이터세트, 시청각 유형 전자기록물의 장기보존을 목표로 보존포맷 선정체계를 적용하기 위한 논의가 필요하다. 시청각 기록물은 이미지, 오디오, 비디오와 같이 매체별 특성에 적합한 보존전략을 적용해야 한다. 본 연구는 시청각 중 오디오 유형 전자기록물의 보존포맷 선정을 위한 고유기준을 문헌 조사에 바탕을 둔 필수보존속성 분석을 통해 수립하고, 오디오 유형 보존포맷 적합성 평가항목을 구성하고 이를 적용한 결과를 토대로 권고포맷을 제안했다.

Design of Music Learning Assistant Based on Audio Music and Music Score Recognition

  • Mulyadi, Ahmad Wisnu;Machbub, Carmadi;Prihatmanto, Ary S.;Sin, Bong-Kee
    • 한국멀티미디어학회논문지
    • /
    • 제19권5호
    • /
    • pp.826-836
    • /
    • 2016
  • Mastering a musical instrument for an unskilled beginning learner is not an easy task. It requires playing every note correctly and maintaining the tempo accurately. Any music comes in two forms, a music score and it rendition into an audio music. The proposed method of assisting beginning music players in both aspects employs two popular pattern recognition methods for audio-visual analysis; they are support vector machine (SVM) for music score recognition and hidden Markov model (HMM) for audio music performance tracking. With proper synchronization of the two results, the proposed music learning assistant system can give useful feedback to self-training beginners.

멀티모달러티를 이용한 실시간 음원추적 시스템 구현 (The Implementation of Real-Time Speaker Localization Using Multi-Modality)

  • 박정옥;나승유;김진영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.459-461
    • /
    • 2004
  • This paper presents an implementation of real-time speaker localization using audio-visual information. Four channels of microphone signals are processed to detect vertical as well as horizontal speaker positions. At first short-time average magnitude difference function(AMDF) signals are used to determine whether the microphone signals are human voices or not. And then the orientation and distance information of the sound sources can be obtained through interaural time difference and interaual level differences. Finally visual information by a camera helps get finer tuning of the speaker orientation. Experimental results of the real-time localization system show that the performance improves to 99.6% compared to the rate of 88.8% when only the audio information is used.

  • PDF

Audio-visual 멀티모달 정보 기반의 비정상 활성 돼지 탐지 시스템 (Abnormal Active Pig Detection System using Audio-visual Multimodal Information)

  • 채희찬;이준희;이종욱;정용화;박대희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.661-664
    • /
    • 2022
  • 양돈을 관리하는 데에 있어 비정상 개체를 식별하고 사전에 추적하거나 격리할 수 있는 양돈업 시스템을 구축하는 것은 효율적인 돈사관리를 위한 필수 요소이다. 그러나 돈사내의 이상 상황을 탐지하는 연구는 보고되었지만, 이상 상황이 발생한 돼지를 특정하여 식별하는 연구는 찾아보기 힘들다. 따라서, 본 연구에서는 소리를 활용하여 이상 상황이 발생함을 탐지한 후 영상을 활용하여 소리를 낸 특정 돼지를 식별할 수 있는 시스템을 제안한다. 해당 시스템의 주요 알고리즘은 활성 화자 탐지 문제에서 착안하여 이를 돈사에 맞게 적용하여, 비정상 소리를 내는 활성 돼지를 식별 가능하도록 구현하였다. 제안한 방법론은 모의 실험을 통해 돈사 내의 이상 상황이 발생한 돼지를 식별할 수 있음을 확인하였다.

Development of a Real-time Vehicle Driving Simulator

  • Kim, Hyun-Ju;Park, Min-Kyu;Lee, Min-Cheoul;You, Wan-Suk
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.51.2-51
    • /
    • 2001
  • A vehicle driving simulator is a virtual reality device which makes a human being feel as if the one drives a vehicle actually. The driving simulator is effectively used for studying interaction of a driver-vehicle and developing the vehicle system of new concepts. The driving simulator consists of a motion platform, a motion controller, a visual and audio system, a vehicle dynamic analysis system, a vehicle operation system and etc. The vehicle dynamic analysis system supervises overall operation of the simulator and also simulates dynamic motion of a multi-body vehicle model in real-time. In this paper, the main procedures to develop the driving simulator are classified by 4 parts. First, a vehicle motion platform and a motion controller, which generates realistic motion using a six degree of freedom Stewart platform driven hydraulically. Secondly, a visual system generates high fidelity visual scenes which are displayed on a screen ...

  • PDF

청각을 이용한 시각 재현장치의 분석프로그램 개발 (Development of Processing Program for Audio-vision System Based on Auditory Input)

  • 허세진;방성식;서지혜;최현우;김태호;이나희;이유진;박지원;이희중;원철호;이종민
    • 한국멀티미디어학회논문지
    • /
    • 제13권1호
    • /
    • pp.58-65
    • /
    • 2010
  • 본 연구의 궁극적 목적은 시각 장애인들의 안전보행을 위한 단순한 충돌 경보 장치가 아니라 전방의 3차원적 공간 정보를 청각 정보로 변환하여 시각을 재현할 수 있도록 하는 장치 (Audio-vision System)를 개발하기 위함이다. 이를 위하여 본 연구에서는 구동 소프트웨어를 개발하였고 그 유용성을 검증하였다. 30명의 정상지원자를 대상으로 하였으며 평균나이는 25.8세이었다. 다양한 가상의 공간을 분석프로그램에 입력하고 맹검상태에서 피험자가 공간 내 구조물을 그리게 하였다. 먼저 피험자에게 30분간 10개의 대상을 이용한 학습을 실시한 후 별도의 10개의 가상공간에 대한 시험을 채점하고 100점 만점으로 환산하였다. 실험결과 점수는 77점에서 97점이었으며 평균 88.7점이었다. 본 연구에서 자체 제작된 분석프로그램으로 청각정보를 시각정보로 변환하는 기반 기술을 확보하였으며 거리 센서를 확보한다면 제품화 가능성이 있음을 검증하였다.

USB 다중 신호 전송 시스템 (The USB Multi-signal Transmission System)

  • 채정식;김아용;정회경
    • 한국정보통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1330-1335
    • /
    • 2013
  • 최근 컴퓨터에서 DVI(Digital Visual Interface), 오디오, 비디오, USB(Universal Serial Bus), 랜(LAN) 등의 다양한 신호를 동시에 전송할 필요성이 요구됨에 따라 케이블이 복잡해지고 확장성 등의 문제점이 제기 되고 있다. 이에, 본 논문에서는 하나의 USB 케이블을 이용하여 컴퓨터의 영상, 음성, USB, 랜 등의 신호를 분배 할 수 있는 하나의 USB 다중 신호 전송 시스템을 설계 및 구현하였다. 따라서, USB 다중 신호 전송을 위해 단일 USB 신호를 DVI, 오디오, 다중 USB, 랜으로 변환하는 변환기 모듈들을 구현하였다. 이는 USB 방식으로 DVI 포트를 지원하며, 최대 1920 * 1080 해상도를 지원한다. USB 다중 신호 전송 시스템은 하나의 케이블로 다수의 신호를 전송하여 각종 케이블의 설치 비용이 절감되고, 화면 복제 기능을 이용하여 학교 및 학원 등에서 강의 편의 제공 및 컴퓨터 주변 포트의 확장성을 제공할 것이다.