• 제목/요약/키워드: Digital Audio

검색결과 623건 처리시간 0.025초

ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기 (A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E)

  • 김경태;이민기;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제45권2호
    • /
    • pp.81-89
    • /
    • 2008
  • 광대역 신호는 16 kHz로 표본화되어 50-7000 Hz로 밴드 제한된 신호를 말하며, 전화대역 음성 신호에 비해서 높은 자연성(naturalness)과 명료성(intelligibility)을 가진다. 이런 특징으로 광대역 부호화기는 화상회의, 디지털 AM 방송 및 고음질 음성통신 등에 사용될 수 있다. 본 논문에서는 가변대역 특징을 갖는 광대역 음성 오디오 부호화기를 제안하였다. 제안된 부호화기는 대역분한 구조를 가진다. 저주파 대역은 전화대역 음성 부호화기로 많이 사용되고 있는 8 kbit/s ITU-T G.729나 보다 높은 전송률로 오디오 신호까지 처리할 수 있는 11.8 kbit/s ITU-T G.729 Annex E로 부호화한다. 고주파 대역은 청각 모델을 기반으로 한 파라미터 부호화 방법으로 부호화한다. 제안된 고주파 대역 부호화는 감마톤 필터뱅크(gammatone filterbank)를 이용하여 입력신호를 임계대역으로 분할한 후, 각각의 임계대역 신호를 양자화한다. 저주파 대역 부호화기와 고주파 대역 부호화기는 서로 독립되어 있으므로, 복호화기에서는 채널 조건에 따라 전화대역 합성신호와 광대역 합성신호를 선택할 수 있는 특징이 있다. 성능 평가 결과, 제안된 부호화기는 낮은 전송률과 짧은 지연 시간으로 음성과 오디오 신호 모두에 대해 ITU-T G.722.1 24 kbit/s와 동등한 음질을 제공한다는 것을 확인하였다.

시각장애인 미디어접근권 향상을 위한 해설오디오 수용도 조사 및 분석 (Survey and Analysis of the Audio Description Acceptance for Improving the Media Accessibility of the Visually Impaired)

  • 장인선;안충현;서정일;이은하;강완식
    • 방송공학회논문지
    • /
    • 제22권2호
    • /
    • pp.214-233
    • /
    • 2017
  • 신체적 감각적 제약이 있는 장애인들에게 방송 시청은 정보 습득 및 여가 생활의 주요 수단이다. 최근 방송통신의 융합, 방송의 디지털 모바일화, 이용자의 능동적인 미디어 이용행태 증가 등 미디어 환경의 변화는 장애인의 방송 접근성을 어렵게 하고 있으며 그 결과, 비장애인과의 정보격차가 커지고 있는 현실이다. 이에 2011년 7월 방송법의 개정으로 장애인방송 접근권 보장에 관한 고시가 제정되고 2013년 국가정보화기본법의 개정으로 웹 접근성 지침의 효력이 커지면서 시청각 장애인의 미디어접근권의 법적 근거가 마련되었다. 하지만 장애인을 위한 미디어 서비스는 여전히 양적 질적으로 부족한 현실이다. 본 연구에서는 시각장애인들의 미디어 접근에 필요한 해설오디오 서비스의 제공 현황을 알아보고 100명의 시각장애인들을 대상으로 실시한 해설오디오 서비스의 활용 실태, 만족도 및 개선 요구사항 등에 대한 설문조사 결과를 분석한다.

고품질 스테레오 음악을 위한 오디오 워터마크 정보 삽입/추출 기술 (An Embedding /Extracting Method of Audio Watermark Information for High Quality Stereo Music)

  • 배경율
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.21-35
    • /
    • 2018
  • 본 논문에서는 스테레오 음악에 오디오 워터마크를 삽입하기 위한 알고리즘을 제안하였다. 스테레오 음악은 2개의 채널을 갖고 있기 때문에 기존 워터마킹 기술은 일반적으로 각 채널을 독립적으로 생각하고 처리하는 경우가 많다. 그러나 스테레오를 모노로 변환하는 과정에서 워터마크의 손실이 발생하는 경우가 많이 발생할 수 있다. 제안한 알고리즘은 스테레오를 모노로 변환하더라도 워터마크의 손실이 발생하지 않도록 워터마크를 삽입할 때 스테레오와 모노변환의 특성을 이용하였다. 제안된 알고리즘에 사용된 오디오 워터마크는 "Copyright"와 "Copy_free"라는 두 가지 정보를 터보코드를 이용하여 생성하였다. 두 워터마크는 9바이트(72비트)로 이루어져 있으며, 오류정정을 위하여 터보코드를 적용하면 222비트로 삽입해야 하는 정보량이 늘어난다. 222비트의 워터마크는 추가적인 오류에 강인하도록 1024비트로 확장하여 최종적으로 스테레오 음악에 삽입할 워터마크로 사용하였다. 평균적으로 SNR은 40dB를 넘어서서 전통적인 양자화 방식보다 10dB 이상의 음질 개선을 가져왔다. 이는 상대적으로 10배의 음질 개선도를 의미하는 것으로 매우 유의미한 결과이다. 또한 워터마크의 추출에 필요한 샘플길이는 1초 이내의 길이면 충분히 추출이 가능하고, 128Kbps의 비트레이트를 갖는 MP3 압축에 대해서도 모두 1초 이내 길이의 음악 샘플로부터 워터마크의 완전한 추출이 가능하였다. 전통적인 양자화 방식이 10초 길이의 샘플을 이용해도 대부분 워터마크의 추출에 실패한 것에 비하면 1/10에 불과한 길이로 워터마크의 추출이 가능하다.

방송 서비스에서 MMT와 MPEG-2 TS의 오버헤드 비교 (An Overhead Comparison of MMT and MPEG-2 TS in Broadcast Services)

  • 박민규;김용한
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.436-449
    • /
    • 2016
  • 본 논문에서는 MMT(MPEG Media Transport)와 MPEG-2 TS(Transport Stream)의 전달 오버헤드(overhead)를 비교한다. MPEG-2 TS는 DTV(Digital Television), IPTV(Internet Protocol Television), DMB(Digital Multimedia Broadcasting) 등 디지털 방송 분야에서 압축된 오디오 및 비디오 데이터를 다중화하여 전송하기 위한 프로토콜로서 전 세계적으로 널리 사용되고 있다. MPEG-2 TS 표준은 1990년대 초에 제정되었으며, 그 후 20여 년이 지나면서 MPEG-2 TS의 많은 부분들이 오늘날의 방송과 통신 환경에 적합하지 않게 되었다. 이러한 상황에서, 2014년 MPEG(ISO/IEC JTC 1 SC 29/WG 11)에서는 MPEG-2 TS를 대체할 수 있는 차세대 멀티미디어 전달 표준으로서 MMT를 표준화하였다. 본 논문에서는 방송 서비스 시나리오를 가정하고, MMT와 MPEG-2 TS를 적용하여 그에 따른 전달 오버헤드를 계산하였다. 본 논문을 위해 연구실에서 제작한 전달 오버헤드 계산 소프트웨어를 사용하였으며, 계산 결과를 바탕으로 이 두 방식의 전달 오버헤드를 비교, 분석하였다.

실시간 운영체제에서 작업량 관찰에 기반한 저전력 기법의 설계 및 구현 (Design and Implementation of Low-Power Technique based on Monitoring Workload on Real-Time Operating Systems)

  • 조문행;정명조;김용희;이철훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.69-78
    • /
    • 2007
  • 오늘날의 내장형 이동 시스템은 MP3플레이어나 디지털 캠코더와 같이 하나의 기능만을 지원했던 단일 응용프로그램 시스템에서 PMP(Portable Multimedia Player), PDA(Personal Digital Assistants)와 같이 MPEG, W3플레이어, 전자사전, DMB(Digital Multimedia Broadcasting), 게임, 통신 기능 등을 모두 포함하는 하나의 디지털 컨버전스 기기로 변화해가고 있다. 이러한 변화는 CPU 성능 향상과 메모리, 저장장치의 증가, LCD의 크기 증가와 같은 하드웨어적인 요구사항의 증가로 이어졌고, 이로 인해 단말기에서 소모하는 전력이 그에 비례하여 증가하였다. 소모 전력의 증가에 따른 배터리 용량의 증가는 더딘 상황이며, 이를 해결하기 위해 소프트웨어적으로 소모 전력을 감축시키는 연구들이 많이 진행되고 있다. 본 논문에서는 소모 전력 감축 기법이 적용된 실시간 운영체제 UbiFOSTM을 ARM9계열의 MBA2440에 탑재하였다. 전력 감축 기법으로 시스템 작업량 관찰에 기반한 동적 전력 관리 기법과 장치 전력 관리기법을 적용하였다. 본 논문의 저전력 기법을 통해 작업량에 따라 24% 이상의 소모 전력 감축효과가 있음을 확인하였다.

HC-256 스트림 암호화를 이용한 범용성 및 확장성을 가진 DRM 기법 설계 (Design of A Generic and Scalable DRM Scheme using HC-256 Stream Cipher)

  • 박준철
    • 한국통신학회논문지
    • /
    • 제34권9B호
    • /
    • pp.923-930
    • /
    • 2009
  • DRM은 미디어 저작권자들을 보호하기 위해 디지털 콘텐츠의 사용을 제한하는 기술을 총칭하는 용어이다. 본 논문에서는 오디오, 비디오 등 미디어 유형에 상관없이 적용할 수 있는 범용의 복제 방지 기법을 제안한다. 제안방법을 써서 공격자가 불법 복제한 콘텐츠를 타 플랫폼에서 재생하거나, 암호화에 사용된 비밀 키 값을 알아내는 것을 매우 어렵게 만들 수 있다. 기존의 DRM 기법들과 달리 제안 기법은 미디어 콘텐츠 암호화를 위해 스트림 암호화인 HC-256만을 이용하기 때문에, 클라이언트에서는 콘텐츠 파일의 스트림 복호화를 거쳐 재생이 즉시 시작 될 수 있도록 한다. 이를 위해 저장하는 비밀키의 수는 미디어 콘텐츠의 수에는 무관하고, 클라이언트(플레이어 카피)의 수에만 비례해 증가하도록 하여 뛰어난 확장성을 보인다. 또한, 제안한 방법은 단순화를 위해 널리 통용되는 다운로드-무한재생의 미디어 라이센스 정책만을 지원하기 때문에 라이센싱을 위한 별도의 서버나 과정이 필요하지 않게 된다.

디지털 유산의 보존: UNESCO의 관점에서 (Preserving Our Digital Heritage: A UNESCO Perspective)

  • 압둘아지즈 아비드
    • 한국기록관리학회지
    • /
    • 제5권2호
    • /
    • pp.183-193
    • /
    • 2005
  • 세계에서 생산되는 막대한 정보 양의 상당 부분은 디지털로 생성되고, 매우 다양한 포맷으로 되어있다. 2001년 5월 유네스코의 이사회 회의 동안, 회원국들은 디지털 유산을 보호하기 위해 신속한 행동을 취할 필요성에 동의하였다. 이에 대한 유네스코의 관심은 전혀 놀랄만한 일이 아니다. 유네스코는 부분적으로는 세계 사람들의 문화, 과학 및 정보 유산의 보존과 향유를 장려하고 가능하게 하기 위하여 존재한다. 디지털 유산의 성장과 그것의 취약성은 결코 간과할 수 없는 것이었다. 우리 사회는 글로 쓴 아카이브의 패러다임, 수백 년 동안 발전해온 패러다임의 종식을 목격하였다. 20세기 동안 새로운 매체가 이와 같은 이름난 전통에 현명하고도 겸손하게 합류하였다. 이 패러다임은 이미 변형되었고, 자리를 차지한 장치들은 정보기술의 가차 없는 전진과 그것들이 야기한 양적 팽창을 다룰 수 없다. 이것은 기록의 유지 관리를 전문으로 하는 기관들의 능력 밖이다: 신속하고 완전하게 이전의 기록과 아카이빙 체제를 변모시키면서, 전적으로 새로운 정보의 제도가 구축되어야 할 것이다. 만약 이 전환이 일어나지 않으면, 우리 사회는 우리의 집단적 사회적 기록에서 돌이킬 수 없는 훼손을 겪게 될 것이다.

A Review of Assistive Listening Device and Digital Wireless Technology for Hearing Instruments

  • Kim, Jin Sook;Kim, Chun Hyeok
    • 대한청각학회지
    • /
    • 제18권3호
    • /
    • pp.105-111
    • /
    • 2014
  • Assistive listening devices (ALDs) refer to various types of amplification equipment designed to improve the communication of individuals with hard of hearing to enhance the accessibility to speech signal when individual hearing instruments are not sufficient. There are many types of ALDs to overcome a triangle of speech to noise ratio (SNR) problems, noise, distance, and reverberation. ALDs vary in their internal electronic mechanisms ranging from simple hard-wire microphone-amplifier units to more sophisticated broadcasting systems. They usually use microphones to capture an audio source and broadcast it wirelessly over a frequency modulation (FM), infra-red, induction loop, or other transmission techniques. The seven types of ALDs are introduced including hardwire devices, FM sound system, infra-red sound system, induction loop system, telephone listening devices, television, and alert/alarm system. Further development of digital wireless technology in hearing instruments will make possible direct communication with ALDs without any accessories in the near future. There are two technology solutions for digital wireless hearing instruments improving SNR and convenience. One is near-field magnetic induction combined with Bluetooth radio frequency (RF) transmission or proprietary RF transmission and the other is proprietary RF transmission alone. Recently launched digital wireless hearing aid applying this new technology can communicate from the hearing instrument to personal computer, phones, Wi-Fi, alert systems, and ALDs via iPhone, iPad, and iPod. However, it comes with its own iOS application offering a range of features but there is no option for Android users as of this moment.

WSOLA를 이용한 동영상 미세배속 재생 서비스에 대한 콘텐츠별 배속 선호도 분석 연구 (A Study about the Users's Preferred Playing Speeds on Categorized Video Content using WSOLA method)

  • 김이길
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.291-298
    • /
    • 2015
  • 빠르게 발전하는 IT환경 속에서 이제 동영상 콘텐츠는 TV를 통한 일방 시청이 아니라 언제 어디서든 다양한 단말에서 볼 수 있는 VOD (Video on Demand) 형태로 발전하고 있다. 이러한 동영상 시청형태의 변화는 디지털이란 특성 때문에 동영상의 재생 속도 또한 다양하게 조절할 수 있다는 부가적인 장점을 사용자에게 제공 한다. 지루하고 따분한 동영상 콘텐츠는 빠르게 돌려보고 흥미 있는 장면은 느리게 천천히 볼 수 있는 동영상 미세배속 재생 기능은 오늘날 다양한 동영상 플레이어에서 제공되고 있다. 동영상 미세배속 재생 시 동영상 콘텐츠 내용의 정확한 이해를 위해서는 시각정보 못지않게 음성정보 청취가 중요한데 정상속도 보다 빠르거나 느린 재생 시 발생하는 음성의 왜곡을 줄이기 위한 음성미세배속 기술들이 음성처리 분야에서 꾸준히 발전되어 왔다. 본 논문에서는 이중 WSOLA와 같은 우수한 음성미세배속 알고리즘에 대해 알아보고 동영상 시청 시 이러한 기능 제공이 실제 얼마나 사용자 니즈(needs)에 부합하는 지 분석해보고자 한다. 특히, 동영상 콘텐츠를 사용자의 콘텐츠 소비 목적에 따라 종류별로 구분하여 재생 배속의 선호도를 조사하고 그 결과를 분석해 봄으로써 동영상 미세배속 기능 제공시 콘텐츠별 소비 목적에 맞게 재생 배속을 제공하는 것이 필요하다는 것을 제안하고자 한다.

지역 방송국을 고려한 T-DMB기반 전국 SFN 구성 방안 (National SFN Composition Method based on T-DMB considering Local Broadcasting Station)

  • 주상임;정원호;김경석
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.21-27
    • /
    • 2014
  • 2012년 아날로그 TV가 종료되고 디지털 TV로의 전환이 이루어졌으며 최근 디지털 라디오의 도입 방안을 수립하기로 하는 등 아날로그 방송의 디지털화와 새로운 서비스의 등장으로 방송 주파수의 효율성을 높이기 위한 노력이 필요하게 되었다. 2005년 도입된 T-DMB는 기존 아날로그 TV 대역을 사용하며 상호 서비스 간 간섭을 피하기 위해 비효율적으로 채널 배치가 되어있다. 하지만 아날로그 TV가 종료되어 새롭게 정비할 수 있는 기반이 마련되었고, 이에 본 논문에서는 방송 주파수 사용의 효율성을 높이고 사용자에게 더 나은 서비스를 제공하기 위해 기존 지역 방송국을 고려하면서 전국 공통 방송을 제공할 수 있는 전국 SFN 구성 방안을 제안한다.