통합 검색 | Korea Science

Realtime Video/Audio Streaming 기술과 컴퓨터통신 서비스 (Applying Realtime Video/Audio streaming technology to Online service)

이경한
- 한국데이타베이스학회:학술대회논문집
- /
- 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
- /
- pp.319-334
- /
- 1997
불과 2년 전만 하더라도 인터넷에서 오디오 또는 비디오 데이터를 감상하기까지 일련의 과정은 그 데이터의 물리적인 양과 전달방식에 있어서 이용자들에게 많은 인내력을 요구해 왔다. 이에 대한 해결책으로 관련업계에서는 real-time streaming 기술을 도입하여 각종 비디오와 오디오 데이터 전송에 관련기술을 적용시킴으로서 실시간 비디오/오디오 서비스 이용을 용이하게 하려는 움직임이 활발히 진행되어 왔었다.(중략)
PDF

AR 및 VR 을 위한 공간 오디오 렌더링 (Spatial Audio Rendering for AR and VR)

김상욱;강경옥;이태진
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 추계학술대회
- /
- pp.14-17
- /
- 2022
본 논문에서는 현실세계에서 사용되던 오디오 처리 기법을 가상현실과 증강현실로 확장하는 기술에 대해 제시한다. 메타버스 서비스 구축 등에 활용되는 가상현실 공간을 설계할 때에는 오디오 처리를 위해서 가상현실 공간내 사용자가 위치하는 장면에 따른 소리의 회절과 반사에 따른 잔향 효과를 고려해 줄 수 있어야 장면에 몰입된 사용자 경험이 가능하다. 증강현실 응용에서는 실제 정보와 증강된 효과를 제공하기 위해 가상과 실제 정보간의 위치 정합이 영상 또는 위치를 기반으로 하여 제공되어야 한다. 가상현실과 증강현실 지원을 위해 현실세계 오디오 재생 기술에 추가되어야 하는 기술들과 함께 진행중인 몰입형오디오 서비스를 제공하기 위한 국제표준 기술 개발의 현황을 살펴보고, 향후 추가로 기술이 개발되고 보완되어야 할 부분을 제시한다.
PDF

오디오 음량 자동 제어를 위한 콘텐츠 분류 기술 개발 (Audio Contents Classification based on Deep learning for Automatic Loudness Control)

이영한;조충상;김제우
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2018년도 하계학술대회
- /
- pp.320-321
- /
- 2018
오디오 음량을 자동으로 제어하는데 있어 음성이 있는 구간에 대해서 음량이 급격히 줄어드는 것을 막기 위해 콘텐츠에 대한 분석이 필요하다. 본 논문에서는 방송 음량을 조절을 위한 세부 기술로 딥러닝 기반의 콘텐츠 분류 기술을 제안한다. 이를 위해 오디오를 무음, 음성, 음성/오디오 혼합, 오디오의 4개로 정의하고 이를 처리하기 위한 mel-spectrogram을 이용하여 2D CNN 기반의 분류기를 정의하였다. 또한 학습을 위해 방송 오디오 데이터를 활용하여 학습/검증 데이터 셋을 구축하였다. 제안한 방식의 성능을 확인하기 위해 검증 데이터셋을 활용하여 정확도를 측정하였으며 약 81.1%의 정확도를 가지는 것을 확인하였다.
PDF

USAC이 적용된 디지털 라디오 수신 기술

권기원;백종호
- 방송과미디어
- /
- 제21권3호
- /
- pp.36-45
- /
- 2016
본 고에서는 디지털 라디오 방송 수신 기술 규격인 DAB(Digital Audio Broadcasting), DAB+ 기술과 DRM(Digital Radio Mondiale), DRM+ 그리고 최신 오디오 압축 기술인 USAC(Unified Speed and Audio Coding) 코덱 기술이 적용된 디지털라디오 수신 기술을 설명하고자 한다. 이를 위해 기존의 디지털라디오 규격과 오디오 코덱 기술을 살펴보고 오디오 서비스의 품질을 높이고 주파수 효율을 증대시킬 수 있는 USAC 기술을 살펴본다. 그리고 이를 적용할 수 있는 디지털라디오 수신 기술을 제시한다. 향후 DAB+기반의 디지털라디오 수신기에 USAC 적용 가능성을 제시하며 마무리 짓는다.
PDF KSCI

다시점 방송 서비스를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템 구현 (Implementation of a Person Tracking Based Multi-channel Audio Panning System for Multi-view Broadcasting Services)

김용국;양종열;이영한;김홍국
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2009년도 학술대회
- /
- pp.150-157
- /
- 2009
본 논문에서는 다시점 방송 서비스(multi-view broadcasting service)를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템을 제안한다. 다시점 방송이란 각기 다른 시점에 해당하는 카메라들을 이용하여 촬영한 영상을 렌더링 해주는 방송 서비스이며 다채널 오디오 패닝 기법은 이러한 다시점 방송의 실감효과를 증대시키기 위한 오디오 렌더링에 필요한 기술이다. 이런 실감 오디오 기술을 다시점 방송 서비스에 적용하기 위해서 사용자의 시점정보를 얻을 수 있는 사용자 추적 기술 역시 필요하다. 이를 위해서 본 논문에서 제안한 기술은 크게 두 가지로 나눌 수 있다. 첫째로, 초음파 위성 및 수신기를 이용하는 사용자 추적 기술을 제안한다. 제안한 사용자 추적 기술을 이용해 약 10 mm 근방의 높은 해상도와 약 0.15초의 빠른 간격으로 사용자의 위치정보를 얻을 수 있었다. 둘째로, 공간 파라메터 기반 다채널 오디오 패닝 기술을 제안한다. 제안한 오디오 패닝 기법은 MPEG Surround로 압축된 오디오에 대해 MPEG Surround의 공간 파라메터를 이용하여 복호화 시 패닝된 오디오를 얻는 방법이다. 제안된 방법의 성능을 평가하기위해 음질 측면과 음상 정위 측면에서 성능을 평가하였다. 음질 측정은 MUSHRA 방법으로 이루어졌으며, 제안된 방식은 약 90점에 해당하는 MUSHRA점수로 평가되었다. 또한, 음상 정위 성능은 더미헤드를 이용하여 각 패닝 오디오에 대한 각도별 주파수응답을 측정하여 방사패턴을 분석하였다. 그 결과 본 논문에서 제안된 방식은 기존 파라메터 기반 오디오 패닝 방식에 비해 향상된 음질을 보임과 동시에 음상이 올바른 위치에 정위됨을 보일 수 있었다. 마지막으로 제안된 사용자 추적 기법 및 오디오 패닝 기법을 다시점 영상 재생 시스템과 결합시킴으로써, 사용자 추적 기반 다시점 방송 시스템의 프로토타입을 구현하였다.
PDF

UHDTV를 위한 실감 오디오 재현 기술 (A Study on Realistic Sound Reproduction for UHDTV)

장대영;서정일;이용주;유재현;박태진;이태진
- 방송공학회논문지
- /
- 제20권1호
- /
- pp.68-81
- /
- 2015
최근 부품기술 및 미디어 처리기술의 발전과 함께 HDTV를 이을 UHDTV 서비스가 곧 도래할 것이라는 예상이 기정사실화되고 있다. 이에 따라 HDTV에서 5.1채널 서라운드 사운드를 제공했던 오디오 기술도 UHDTV 시대의 도래와 함께 어떠한 서비스를 제공하여야 할지 고민하여야 할 시점에 와 있다. 그러나 현실은 HDTV의 5.1채널 사운드 포맷조차도 가정에서의 설치 및 유지의 어려움으로 인해 시장에서의 고전을 면치 못하고 있다. 한편, 영화 사운드 시장에서는 오랫동안 사용되고 있던 5.1, 7.1 채널 사운드 포맷이 돌비 ATMOS, IOSONO, AURO3D 등 천정 사운드와 객체기반 오디오를 포함하는 하이브리드 오디오 기술이 잇달아 도입되면서 일대 격변기를 맞이하고 있다. 이러한 객체기반 오디오 기술은 홈씨어터 및 방송 오디오 시장에서도 도입이 확실시되고 있는 실정이며, 이러한 오디오 기술의 변화는 유연성이 결여된 채널기반 오디오의 기술 발전 및 시장 성장의 활로를 개척하는 호기가 될 것으로 전망된다. 따라서 본 논문에서는 UHDTV 방송에 적합한 실감 오디오 기술에 대한 고찰과 이와 관련된 하이브리드 오디오 기술의 콘텐츠 포맷 및 가정에서의 재현 방안에 대해서 기술하고 향후 전망을 고찰해 보고자 한다.
https://doi.org/10.5909/JBE.2015.20.1.68 인용 PDF KSCI KPUBS HTML

MPEE-2 AAC 오디오 인코더 및 디코도 구현 (Implementation of Audio Encoder and Decoder Using MPEG-2 AAC)

홍진우;장대영;김진웅
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
- /
- pp.217-222
- /
- 1999
본 논문에서는 멀티채널 오디오 부호화 방식인 MPEG-2 AAC(Advanced Audio Coding) 국제 표준을 수용한 AAC 인코더 및 디코더의 실시간 구현에 대해 기술한다. 범용 DSP 인 TMS320C6701 DSP를 이용한 하드웨어 플랫폼과 이 플랫폼에서 실시간으로 동작되는 인코더와 디코더 소프트웨어를 설계, 개발(MASIC 시스템)하였다. 구현한 MASIC 시스템은 오디오 입력 장치, 출력 장치, 인코더 보드, 그리고 디코더 보드로 구성되어 있으며, 개인용 컴퓨터의 PCI 슬롯을 이용하여 인코더의 경우 최대 6채널의 오디오를, 디코더의 경우 8채널의 오디오를 실시간 동작으로 처리할 수 있다. 인코더 및 디코더의 실시간 처리를 위한 소프트웨어 최적화 기술 및 인코더와 디코더의 연동시험에 대해서도 기술하며, 개인용 컴퓨터에서 실시간으로 수행되는 스테레오 AAC 디코더 소프트웨어의 개발 결과를 기술한다.
PDF

컨벌루션 신경망을 이용한 공간큐 기반 다채널 오디오 확장 기술

백승권;임우택;이태진
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 하계학술대회
- /
- pp.153-155
- /
- 2019
본 논문에서는 컨볼루션 신경망을 이용하여 예측 된 공간 오디오 큐를 이용한 오디오 채널 확장 기술을 소개한다. 오디오 채널 확장 기술은 일반적인 스테레오 신호에 적용되어 5.1 레이아웃과 같은 고차원 오디오 신호를 생성하는 기술이다. 스테레오 신호에서 채널을 확장하기 위해 스테레오 신호에서 공간 큐를 예측하고 예측 공간 큐의 방향에 따라 5.1 채널 신호의 스펙트럼 구성 요소를 할당하여 다중 채널 신호를 합성한다. 제안된 방식으로 생성된 5.1 채널 신호는 원 5.1 채널과 유사한 공간 정보 합성 능력과 스테레오 대비 주관적 선호도가 개선된 음질을 제공한다.
PDF

실시간 AV 전송을 위한 Audio/Video Bridging 기술

위정욱;박용석;박경원;송병철;전원기
- 정보와 통신
- /
- 제30권6호
- /
- pp.69-76
- /
- 2013
최근 홈 네트워크/정보가전 기술의 비약적인 발전과 고품질 멀티미디어 콘텐츠의 보급으로 인해 네트워크 기반의 멀티미디어 전송 시스템에 대한 요구가 증가하고 있다. 이러한 요구로 인해 고품질 오디오, 비디오 데이터를 이더넷 (Ethernet) 망을 이용하여 실시간 전송할 수 있는 Audio Video Bridging(AVB) 기술이 IEEE에서 표준화 되었다. AVB 기술은 네트워크를 통해 오디오 및 비디오 데이터뿐만 아니라, 각 장치들의 제어/관리를 위한 데이터도 동시에 전송할 수 있는 기술이다. 기술 개발 초기에는 네트워크 및 오디오 전문 업체를 중심으로 오디오 전송에 특화된 AoE(Audio over Ethernet) 기술 개발이 주를 이루고 있었으나, AVB 표준화가 완료된 2011년 이후부터 AVB가 적용된 제품이 개발되고 있다. 이에 본 고에서는 네트워크를 통해 멀티미디어 데이터를 전송할 때 필요한 핵심 요소기술과 개발 동향에 대해 살펴보고, IEEE 표준인 AVB 기술에 대해 알아본다.
PDF KSCI

음성기반 오디오 융합코덱 기술동향 (Trends of Speech-Based Audio Convergence Codec Technology)

김도영;성종모;이미숙;배현주;이병선
- 전자통신동향분석
- /
- 제24권5호
- /
- pp.10-19
- /
- 2009
본 논문에서는 통신과 방송서비스가 하나의 기기 또는 단말장치 안에서 결합되고 단말 내부에서는 디바이스의 통합에 따라 코덱의 개수를 최소화하기 위한 음성기반 오디오 융합코덱의 기술동향에 대해 기술한다. 하지만 기술적으로 완전히 태생이 다른 음성과 오디오 코덱을 진정한 의미에서 융합할 수 있는 기술적 모델과 기법은 아직 개발되지 않고 있다. 본 고에서는 이러한 시도의 일환으로 ITU-T SGl6을 중심으로 진행되고 있는 음성기반 코덱을 점진적 대역폭 확장 기술을 사용하여 광대역 음성, 슈퍼와이드 밴드 및 향후 오디오 대역까지 커버할 수 있는 임베디드 가변비트율 코덱기술을 중심으로 기술동향의 분석을 시도한다.
https://doi.org/10.22648/ETRI.2009.J.240502 인용 PDF

검색결과 655건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)