• 제목/요약/키워드: Digital Audio

검색결과 623건 처리시간 0.021초

Linbits 특성을 이용하여 MP3 비트스트림에 부가적인 정보를 삽입하는 방법에 관한 연구 (Additive Data Insertion into MP3 Bitstream Using linbits Characteristics)

  • 김도형;양승진;정재호
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.612-621
    • /
    • 2003
  • MP3의 사용이 늘어나면서 저작권 보호나 음악 콘텐츠 정보의 삽입을 위한 방법에 대한 요구가 증가하고 있으며 관련된 연구가 활발히 진행 중에 있다. 이때 부가적인 정보가 삽입되어도 MP3의 비트스트림 구조가 크게 변형되어 음질의 열화나 파일 크기의 변화가 발생하여서는 안 된다. 본 연구에서는 위의 조건을 만족할 수 있도록 MP3 부호화 과정 중에서 양자화 된 정수 형태의 계수가 허프만 부호화 될 때, 값이 큰 샘플들의 특징을 이용하여 linbits 중 몇 개의 비트를 변형하여 부가적인 정보를 삽입하고, 그 음질의 열화 정도를 테스트하였다. 일련의 실험 과정을 통하여 평균 60 bytes/sec의 정보 삽입률에서 MOS 4.6 정도의 음질을 얻을 수 있음을 확인하였다. 제안된 방법을 이용하면 저작권에 대한 정보 또는 미디어 자체에 대한 정보들을 효과적으로 삽입할 수 있어 음악 데이터베이스의 운용과 같은 다양한 분야에 적용될 수 있다.

MPEG 오디오 최신 표준: USAC 기술 (MPEG Audio New Standard: USAC Technology)

  • 이태진;강경옥;김환우
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.693-704
    • /
    • 2011
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2011년 7월 97차 회의에서 FDIS까지 승인하였다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용하며, 다양한 코어 코더 사이의 천이를 위한 윈도우 기술을 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북 등에서 응용이 가능하다.

강인한 오디오 핑거프린팅 시스템을 위한 에너지와 통계적 필터링 (Energy and Statistical Filtering for a Robust Audio Fingerprinting System)

  • 정병준;김대진
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-9
    • /
    • 2012
  • 디지털 음악과 스마트 폰이 대중화되면서 잡음에 강인한 실시간 음악 핑거프린트 시스템이 다양하게 개발되고 있다. 특히 핑거프린트 알고리즘 중 Multiple Hashing(MLH)은 잡음에 강인하고 정교한 구조로 되어 있다. 본 논문에서는 음악 데이터베이스로부터 질의 및 응답의 정확도를 개선하기 위해 에너지 집중필터를 사용하고 연속성과 중복성을 제거하는 통계적 필터를 제안한다. 에너지 집중 필터는 하위 비트에 에너지가 집중되는 Discrite Cosine Transform(DCT)의 특징을 이용하고, 통계적 필터는 검색된 핑거프린트 정보들 사이의 상관관계 특성을 이용한다. 실험 결과로 잡음 환경에서 에너지와 통계적 필터링으로 구성된 제안 알고리즘은 우수성을 보인다. 이는 제안된 필터 엔진으로 Philips Robust Hash(PRH)보다 잡음에 강인하고 Multiple Hashing(MLH)보다 간결한 핑거프린트 시스템을 구성할 수 있다.

사용자 접근권한 인증을 이용한 안전한 VoIP 시스템 설계 (Design of User Access Authentication and Authorization System for VoIP Service)

  • 양호경;김진묵;유황빈;박춘식
    • 융합보안논문지
    • /
    • 제8권4호
    • /
    • pp.41-49
    • /
    • 2008
  • VoIP 서비스는 아날로그인 음성 신호를 디지털 신호로 변환한 후 패킷으로 구성하여 사용자에게 음성정보를 전달해주는 서비스로 기존의 음성전화 서비스에 비해 요금이 저렴하고 확장성이 뛰어난 장점을 가지고 있다. 그러나 VoIP 서비스는 기존의 음성전화 서비스(PSTN)에 비해서 열악한 통화품질과 보안측면의 취약성을 포함한 시스템 구조를 갖는다. 이와 같은 문제점을 보완하기 위해 TLS 서비스를 도입함으로서 보안성을 높였지만, 실제적인 시스템에서는 QoS 문제점이 발생하므로 보안적인 측면과 QoS를 동시에 만족시킬 수 있는 VoIP 보안 시스템 개발이 필요하다. 본 논문에서는 기존 VoIP 세션 설정단계에 AA 서버를 추가하여 사용자의 접근에 따른 차등 서비스를 제공함으로서 보안과 사용자에 따른 서비스를 제공할 수 있는 사용자 권한 인증 VoIP 시스템을 제안한다. 본 논문에서 제안한 시스템은 TLS 기술을 추가한 시스템보다 빠른 QoS를 제공하면서 비슷한 보안성을 제공한다는 이점을 가지고 있다. 또한 사용자별 다양한 부가서비스를 제공할 수 있다.

  • PDF

1-비트 4차 델타-시그마 변조기법을 이용한 D급 디지털 오디오 증폭기 (Class-D Digital Audio Amplifier Using 1-bit 4th-order Delta-Sigma Modulation)

  • 강경식;최영길;노형동;남현석;노정진
    • 대한전자공학회논문지SD
    • /
    • 제45권3호
    • /
    • pp.44-53
    • /
    • 2008
  • 본 논문에서는 휴대용 오디고 제품의 헤드폰 구동을 위한 델타-시그마 변조기법 기반의 D급 증폭기를 제안한다. 제안된 D급 증폭기는 고성능 단일 비트 4차 델타-시그마 변조기를 이용하여 펄스폭 변조 신호를 발생시킨다. 높은 신호 대 잡음비를 얻는 것과 동시에 시스템의 안정성 확보를 위하여 시뮬레이션을 통해 변조기 루프필터의 폴과 제로를 최적화하였다. 테스트 칩은 $0.18{\mu}m$ CMOS 공정으로 제작되었다. 칩 면적은 $1.6mm^2$ 이며, 20Hz 부터 20kHz까지의 신호대역을 대상으로 동작한다. 3V 전원전압과 32옴의 로드를 사용하여 측정된 출력은 0.03% 이하의 전고조파 왜율을 갖는다.

촉각방송 (Haptic Media Broadcasting)

  • 차종은;김영미;서용원;류제하
    • 방송과미디어
    • /
    • 제11권4호
    • /
    • pp.118-131
    • /
    • 2006
  • 최근 초고속 인터넷과 디지털미디어의 획기적인 발전으로 전통적인 시청각미디어의 한계를 뛰어넘어 인간의 오감을 자극할 수 있는 실감방송이 차세대 방송기술로 등장하고 있다. 본 논문은 인간의 오감 중 촉각을 중심으로 하여 시청자들이 시청각미디어를 만지고 느낄 수 이는 촉각방송시스템은 전체적으로 촉가미디어의 획득 및 생성하는 단계 다양한 촉각미디어를 한 화면에 편집하고 저작하는 단계, 저작된 콘텐츠를 압축 및 전송하는 단계, 전송된 콘텐츠를 단말장치를 통해 재현하는 단계로 이루어진다. 촉각방송에서 촉각미디어는 시청자가 미디어를 능동적으로 만지고 조작하거나 미디어에서 제공하는 움직임을 따라하거나 촉감을 피부로 느낄 수 있도록 3차원 현상, 조작기능(버튼, 슬라이더, 조이스틱 등), 촉각 표면 특성(딱딱함, 정적 마찰계수, 동적 마찰계수, 거칠기 등), 움직임(위치, 속도, 가속도 등), 촉감 정보 등을 포함한 매체로 정의한다. 제안한 촉각방송 시스템에서는 3차원 객체 만지고 조작하기, 3차원 영상 만지기, 역감 재생, 촉감 재생 등의 네 가지 촉각 상호작용이 가능하며 적용례로써 홈쇼핑, 촉감효과가 가미된 영화, 지휘 교육 시나리오를 제시하였다.

멀티미디어 방송을 위한 SMIL 편집 시스템 구현 (Implementation of SMIL Editor for Multimedia Broadcasting)

  • 장대영;김창수;정회경
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.622-629
    • /
    • 2004
  • 최근 디지털 방송 및 인터넷이 확산되면서, 다양한 멀티미디어 정보를 보다 자유롭게, 시간과 공간의 제약을 받지 않으면서 이용할 수 있게 되었다. 이러한 최근의 동향에 따라 오디오, 비디오와 같은 멀티미디어 데이터 표현에 대한 관심이 급증하면서 많은 사용자들은 멀티미디어 데이터를 통합한 서비스를 요구하게 되었다. 이에 따라 1998년 W3C에서 멀티미디어 객체의 표현 및 동기화 문제를 해결하기 위해 XML에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)을 제안하였다. 이러한 멀티미디어 요소가 통합된 SMIL 문서는 플레이어를 통해 사용자와 상호 작용하는 멀티미디어 컨텐츠로서 단순히 오디오만 전달하는 인터넷 라디오 방송에 다양한 멀티미디어 요소를 접속하여 보다 않은 정보를 전달하며, 이를 통해 사용자 중심의 새로운 인터넷 라디오 방송 서비스를 창출할 수 있는 가능성이 마련되었다. 이에, 본 논문에서는 일반 사용자들이 손쉽게 멀티미디어 데이터들의 시간, 공간에 따른 배치 및 동기화를 표현하고 기술할 수 있도록 SMIL 문서 편집기를 설계 및 구현한 내용을 기술한다.

MPEG-D USAC: 통합 음성 오디오 부호화 기술 (MPEG-D USAC: Unified Speech and Audio Coding Technology)

  • 이태진;강경옥;김환우
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.589-598
    • /
    • 2009
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2009년 4월 88차 회의에서 WD3까지 완성되었다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 모두 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북등에서 응용이 가능하다.

MPEG-2 AAC 복호기를 위한 부동소수점유닛 설계에 관한 연구 (A Study On the Design of a Floating Point Unit for MPEG-2 AAC Decoder)

  • 구대성;김필중;김종빈
    • 대한전자공학회논문지TE
    • /
    • 제39권4호
    • /
    • pp.355-355
    • /
    • 2002
  • 본 논문에서는 디지털 오디오의 하드웨어 설계 시 가장 중요하고 고집적도를 요구하는 부동소수점 유닛을 설계하였다. 대부분의 모든 오디오 시스템이 다채널을 지원하고 고음질을 요구한다. 하드웨어로 구현한 부동소수점 연산기는 MPEG-2 AAC 복호기를 DSP로 구현 시 실시간 디코딩이 가능하도록 설계하였다. 그 이유는 오디오 분야에서 MPEG-2 AAC는 MPEG-4 이후 오디오와 상호 호환성을 갖기 때문이다. MPEG-2 AAC 디코더에서 가장 많은 연산부분을 차지하는 부동소수점유닛의 속도향상을 위하여 하드웨어로 설계하였다. FPU는 승산기와 가산기로 구성되어있다. 승산기는 Radix-4 Booth알고리즘을 사용하였고 가산기는 속도향상을 위하여 1의 보수 방식을 채택하였다. 부동소수점 형식은 지수부에 8bit 가수부에 24bit를 사용한다. IEEE 단정도 포맷과 호환되도록 설계하였으며, 연산기의 속도를 향상시키기 위하여 파이프라인 구조를 채택하였다. 모든 세부블록들은 ISO/IEC 13818-7 표준에 의거하여 구현하였다. 알고리즘 테스트는 C언어를 사용하였고, 설계는 VHDL(VHSIC Hardware Description Language)을 사용하였다. 최대동작속도는 23.2MHz이고, 안정상태의 동작속도는 약 19MHz이다.

SMIL을 기반으로 한 멀티미디어 네트워크 교육시스템 (Multimedia Network Teaching System based on SMIL)

  • 우뢰;조극양;방진숙;조태범;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.524-527
    • /
    • 2008
  • 최근 디지털 및 인터넷이 보편화되고, 멀티미디어 처리 기술과 정보통신 기술이 발달함에 따라 인터넷을 이용한 교육의 수요는 급격히 증가하고 있다. 또한 다양한 멀티미디어 정보를 보다 자유롭게, 시간과 공간의 제약을 받지 않으면서 이용할 수 있게 되었다. 그러나 여러 종류의 오디오, 미디어와 같은 멀티미디어 데이터를 통합하여 표현하기 위한 요구가 확산되었다. 이에 따라 1998년 W3C에서 XML(eXtensible Markup Language)에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)을 제안하였다. 이러한 멀티미디어 요소가 통합된 SMIL 문서는 플레이어를 통해 네트워크 교육 학습자와 상호 작용하는 멀티미디어 콘텐츠로서 단순히 오디오만 전달하는 인터넷 라디오 방송에 다양한 멀티미디어 요소를 추가하여 보다 많은 정보를 전달하며, 이를 통해 학습자 중심의 새로운 인터넷 라디오 방송 서비스를 창출할 수 있는 가능성이 마련되었다. 이에, 본 논문에서 제안한 시스템은 교사가 쉽게 멀티미디어 정보를 만들어 수업에 활용 할 수 있도록 한다. 학생들은 교사가 수업하는 오디오, 비디오 등 정보를 동시에 시청각할 수 있다. 그리고 채팅창을 통해서 문자로 실시간 교류할 수 있다. 또한, 수업 후에 학생들은 언제나 수업의 내용을 자율적으로 요청하고 볼 수 있다.

  • PDF