• 제목/요약/키워드: MP3 audio

검색결과 94건 처리시간 0.028초

간략화된 심리음향모델을 이용한 MPEG Audio Layer-III 부호화기 (MPEG Audio Layer-III Encoder Using Approximated Psy-choacoustic Model)

  • 송창준;오현오;박영철;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.469-472
    • /
    • 2001
  • MPEC Audio Layer-III(MP3)알고리듬은 복호화기에 비해 부호화기가 월등히 많은 연산량을 가지고 있는 비대칭 구조를 가지고 있다. MP3 부호화기의 대부분의 연산량은 복잡한 초월함수 연산이 포함되는 심리음향모델과 반복 루프 과정을 수행하는 비선형 양자화와 비트 할당과정 이 차지한다. 본 논문에서는 MP3 부호화기의 실시간 구현을 위한 알고리듬 레벨의 최적화를 수행하였다. MP3 부호화기의 연산량을 줄이기 위해 심리음향모델을 간략화하고 반복 루프의 회수를 최소화할 수 있는 방법을 제안하였다. 프레임당 한 그래뉼의 심리음향모델 정보를 계산하여 한 프레임 내에서의 심리음향모델 정보를 추정함으로써 연산량을 45% 이상 감소시켰다. 또한 외부 반복 루프의 반복 회수를 줄이기 위하여 외부 반복 루프의 반복에 따른 스케일 팩터(Scale Factor) 및 양자화 스탭의 증가 패턴을 관찰하고 최적화된 스캐일 팩터 증가 방법을 제안하였다. 제안된 고속화 방법은 주관적 음질 평가를 통해 성능을 검증하였다.

  • PDF

MP3 저작권 보호를 위한 AOD 시스템의 설계 (Design of AOD System for MP3 Copyright Protection)

  • 김영준;김태윤
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.323-328
    • /
    • 2002
  • 최근 초고속 통신망을 이용한 인터넷의 대중화와 더불어 인터넷을 기반으로 하는 전자상거래가 활발해지고 있다. 특히 인터넷을 통한 MP3 데이터 등의 멀티미디어 컨텐츠의 유통은 많은 연구의 대상이 되고 있다. 하지만 기존의 AOD(Audio On Demand) 시스템들은 실질적인 불법 복제방지와 저작권 보호에 미흡한 단점이 있다. 따라서 본 논문에서는 공개키 기반 구조(PKI: Public Key Infrastructure)에 기초하여 실질적인 불법복제방지와 저작권을 보호하는 AOD 시스템을 제안한다. 제안된 기법은 사용자의 공개키를 이용하여 MP3 데이터를 전송함으로써 전송 도중 제 3자로부터의 공격에 대응할 수 있고, 정당한 사용자 외에는 MP3 데이터를 사용하지 못하도록 함으로써 사용자와 판매자의 권리를 보장한다.

심리음향모델 기반의 디지털 오디오 워터마킹 (Digital Audio Watermarking Based on Psychoacoustic Model)

  • 송유수;김종환;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.772-775
    • /
    • 2005
  • 본 논문에서는 대역확산 기반 오디오 워터마킹 삽입에 대한 연구를 하였다. 최근 디지털 저작권을 확인하는데 디지털 워터마크가 사용되고, 영상, 문서뿐만 아니라 디지털 오디오 분야에서도 연구가 이루어지고 있다. MP3(MPEG Audio Layer-III)에 사용하는 심리음향모델을 이용함으로써 음질에 영향을 주지 않고 지각 할 수 없는 디지털 저작권을 삽입 할 수 있다. 본 논문에서는 대역확산 기반 오디오 워터마킹을 위한 심리음향모델을 분석하고 Matlab으로 모델링하여 시뮬레이션 하였으며, 이를 대역확산 기반 오디오 워터마크 삽입에 적용하였다.

  • PDF

악기별 분리처리를 통한 고음질 오디오 시스템 구현 (Implementation of the High-Quality Audio System with the Separately Processed Musical Instrument Channels)

  • 김태훈;이상학;김대경;이상찬
    • 한국음향학회지
    • /
    • 제32권4호
    • /
    • pp.346-353
    • /
    • 2013
  • 본 논문에서는 노래반주기를 위한 고음질 오디오 시스템 구현에 관한 내용을 담고 있다. 노래반주기의 중요한 기능인 키/템포 변환 음질의 개선을 위하여 악기별 채널 분리를 수행하였다. 악기별로 채널을 분리하여 처리함으로 고음질의 변환이 수행됨을 상관계수의 변화와 MOS 평가를 통하여 확인할 수 있었다. 구현된 오디오 시스템은 TI사의 32비트 부동 소수점과 고정 소수점 연산이 모두 가능한 DSP인 TMS320C6747를 이용하였으며 다채널의 WMA 복호화, MP3 부호화와 복호화, wav, EQ 및 템포/키 변환을 실시간으로 수행 가능하다. WMA 10채널로 구성되어 악기별 분리 처리가 가능도록 하였다. 또한 MP3 부호화/복호화는 녹음과 재생 기능으로 이용되고 wav 채널은 효과음 등으로 사용 가능하다.

스마트폰의 음질 향상을 위한 Equalizer 분석 (The Analysis of Equaizer for Improving Sound Quality of Samrtphones)

  • 이명환;류창수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.190-193
    • /
    • 2013
  • 스마트폰이 출시하기 전 과거 핸드폰의 음악 재생력은 아주 한정적이었기 때문에 MP3 플레이어를 필요로 했으나 스마트폰이 등장하면서 멀티미디어 재생은 필수적인 기능이 되었으며, MP3의 모든 기능이 작동하게 되었다. 그리고 하나의 기기에서 음악 및 멀티미디어 재생의 모든 것이 이루어지기 때문에 편리하지만 스마트폰의 음질 부분에 있어서의 논란은 끊이지 않았다. 본 논문은 스마트폰이 가진 음악 재생기능 중 EQ(Equalizer)를 Right Mark Audio Analyzer 프로그램을 통하여 EQ(Equalizer) 밸런스 조절을 통한 하이 피델리티(High Fidelity)에 가까운 사운드의 재생에 관하여 알아본다.

  • PDF

Audio Steganography Method Using Least Significant Bit (LSB) Encoding Technique

  • Alarood, Alaa Abdulsalm;Alghamdi, Ahmed Mohammed;Alzahrani, Ahmed Omar;Alzahrani, Abdulrahman;Alsolami, Eesa
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.427-442
    • /
    • 2022
  • MP3 is one of the most widely used file formats for encoding and representing audio data. One of the reasons for this popularity is their significant ability to reduce audio file sizes in comparison to other encoding techniques. Additionally, other reasons also include ease of implementation, its availability and good technical support. Steganography is the art of shielding the communication between two parties from the eyes of attackers. In steganography, a secret message in the form of a copyright mark, concealed communication, or serial number can be embedded in an innocuous file (e.g., computer code, video film, or audio recording), making it impossible for the wrong party to access the hidden message during the exchange of data. This paper describes a new steganography algorithm for encoding secret messages in MP3 audio files using an improved least significant bit (LSB) technique with high embedding capacity. Test results obtained shows that the efficiency of this technique is higher compared to other LSB techniques.

대역 확장을 통한 MP3 오디오의 음질 향상 (A Quality Improvement of MP3-Coded Audios Using Bandwidth Extension)

  • 허소영;김인철
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.744-751
    • /
    • 2008
  • 본 논문에서는 대역 확장 기법을 이용한 MP3 오디오 신호의 음질 향상 방법에 대해 살펴본다. Liu가 제안한 고주파 복원 기법을 근간으로 하여, 제안한 음질 향상 기법에서는 복원 시작 지점을 결정하는 방법과 개선된 선형 예측 방법을 제시하였다. 또한 고주파 대역 성분 생성에 저주파 성분을 복사해 이용하는 방법과 함께 AWGN을 이용하는 방법을 제시한다. 제안한 방법은 주관적 음질 평가를 통하여 MP3 오디오의 품질을 개선시킬 수 있음을 확인할 수 있었다.

MP3Player의 변화에서 나타나는 재매개적 특성 I : 계보적 변화와 재매개성 (Remediation Characteristics that Appear in the Change of MP3Player I : Re-mediation and Genealogical Change)

  • 이진혁;이영천;구윤희
    • 한국콘텐츠학회논문지
    • /
    • 제13권11호
    • /
    • pp.59-68
    • /
    • 2013
  • iPod Touch는 초기의 음악 재생기능을 무색하게 할 만큼 다양한 응용소프트웨어가 제공되고, UI를 UX의 차원으로 한층 높임으로써 혁신적이라는 평을 받기도 하였다. 또한 인터넷을 통한 다양한 영상의 제공이 이루어 졌음에도 불구하고 일부에서는 여전히 MP3Player의 상품분류가 음향기기로 인식되고 있다. 어떻게 음향기기가 하루아침에 영상 장치가 되었는지, 그러기까지 어떠한 요인들이 작용했는지는 매체의 본질적 변화 외에도 사회적, 문화적, 그리고 기술적 변화의 요일들이 존재할 것이다. 이 연구는 MP3Player의 매체적 특성에 관한 연구이다. 즉 MP3Player의 계보적 변화를 4개의 지점으로 분류할 수 있었다. 그리고 분류에 따른 각 지점별 특성을 분석하였다. 그 결과 MP3Player의 계보적 변화에는 기술적 변화와 사회적 맥락성이 함께 관계하고 있음을 알 수 있었다. 하나의 장치가 변화하는 데에는 다양한 요소들이 존재하지만, MP3Player의 계보적 변화의 요인에는 사회적 요구와 맥락, 그리고 기술적 변화의 총체성을 보이고 있다고 하겠다.

A Scalable Audio Coder for High-quality Speech and Audio Services

  • 이길호;이영한;김홍국;김도영;이미숙
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.75-86
    • /
    • 2007
  • In this paper, we propose a scalable audio coder, which has a variable bandwidth from the narrowband speech bandwidth to the audio bandwidth and also has a bit-rate from 8 to 320 kbits/s, in order to cope with the quality of service(QoS) according to the network load. First of all, the proposed scalable coder splits bandwidth of the input audio into narrowband up to around 4 kHz and above. Next, the narrowband signals are compressed by a speech coding method compatible to an existing standard speech coder such as G.729, and the other signals whose bandwidth is above the narrowband are compressed on the basis of a psychoacoustic model. It is shown from the objective quality tests using the signal-to-noise ratio(SNR) and the perceptual evaluation of audio quality(PEAQ) that the proposed scalable audio coder provides a comparable quality to the MPEG-1 Layer III (MP3) audio coder.

  • PDF

심리음향 분석을 이용한 MP3 저작권 보안을 위한 적응적 워터마킹 (Adaptive Watermarking for MP3 Copyright Protections Using Psychological Acoustics)

  • 이경환
    • 한국음향학회지
    • /
    • 제32권1호
    • /
    • pp.64-70
    • /
    • 2013
  • 본 논문에서는 오디오 컨텐츠 저작권 보안을 위하여 MP3 공격에 강인한 워터마킹 방법을 제안한다. 일반적인 주파수 도메인에서의 워터마킹 방법인 Cox의 스프레드 스펙트럼 방법에서는 DCT후 값이 큰 저주파수의 계수에 순차적으로 워터마크를 삽입하였다. 임의의 주파수 계수에 삽입하는 방법은 효과적이지 못하므로, 본 논문에서는 심리음향 모델을 분석하여 MP3 공격시 손실이 적은 주파수 계수에 적응적인 함수를 적용하여 가중치를 부여한 후 계수에 워터마크를 삽입하는 방법을 제안한다. 다양한 음원에 대하여 실험한 결과, 제안한 방법은 기존의 방법들에 비해 워터마크의 보존하고 원본 음원의 왜곡을 줄이는 두 가지 측면 모두 좋은 결과를 나타내었다.