• 제목/요약/키워드: Audio file

검색결과 95건 처리시간 0.022초

사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법 (An User Controllable Object Audio File Format and Audio Scene Description)

  • 조충상;김제우
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.25-33
    • /
    • 2010
  • 최근의 오디오 기술은 사용자 중심으로 변화하고 있으며, 사용자의 환경과 의도에 따라 능동적으로 서비스가 이루어지는 대화형 오디오 서비스 시대로 변화하고 있다. 이에 맞추어 시장에서는 고품질 오디오 서비스를 위한 무손실 오디오 기술을 탑재한 멀티미디어 기기와 사용자가 선택적으로 악기를 조절할 수 있는 객체 오디오 음원 서비스가 이루어지고 있다. 본 논문에서는 사용자가 컨트롤 할 수 있는 실감 객체 오디오 파일 포맷을 설계하고 실감 정보를 낮은 복잡도에서 저장 매체와 전송 매체에 적용 가능한 오디오 장면 묘사 방법을 제안한다. 설계된 실감 객체 오디오 파일 포맷은 MPEG-4 파일 포맷을 기반으로 설계되었다. MPEG-4 파일 포맷은 MPEG-4에 속하는 고성능 오디오 코덱을 오디오 코덱 객체 번호를 통해서 쉽게 적용가능하다. 또한 오디오 객체 개수의 변화에 따라 파일 포맷의 트랙을 변화 시켜 사용하면 되므로 객체 오디오를 포함하기에 적절하다. 본 연구에서 개발된 파일 포맷은 실감 객체오디오 생성시 MPEG-4 오디오 코덱으로 압축된 객체 오디오, 실감 객체 오디오를 위한 오디오 장면 묘사 데이터를 독립적인 트랙으로 포함하고 있다. 포함된 오디오 장면 묘사 기법은 저장 매체를 위해 전체 오디오 장면에 적용되는 오디오 묘사 기법과 각각의 오디오 객체에 적용되는 오디오 묘사 기법을 노드 구조로 설계 하였으며, 전송 매체를 위해서 기본적인 객체 오디오 동작을 하기위한 필수 정보와 오디오 세부장면 묘사를 위한 정보로 분할하여 설계하였다. 이를 바탕으로 본 연구에서는 실감 객체 오디오 시뮬레이터를 개발하였다. 개발된 시뮬레이터는 객체 음원과 오디오 장면 묘사 정보를 부호화하여 MPEG-4 파일 포맷에 저장하며, 생성된 실감 객체 오디오 파일은 재생 모듈에서 오디오 객체에 입력 받은 사용자 정보와 오디오 장면 묘사 정보가 적용되어 사용자에게 몰입감이 높은 실감 오디오 서비스를 제공한다.

법적 증거 능력을 위한 오디오 파일의 메타데이터 및 파일 구조 분석의 한계: 삼성 스마트폰을 중심으로 (Limitations of Analyzing Metadata and File Structure of Audio Files for Legal Evidence: Focusing on Samsung Smartphones)

  • 백성원;손호민;박재완
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.1103-1109
    • /
    • 2023
  • 오늘날, 스마트폰의 확산에 따라 오디오 파일이 법적 증거로 제출되는 수가 증가하면서 오디오 파일의 무결성은 중요한 이슈가 되고 있다. 이에 본 연구는 삼성 스마트폰에서 녹음된 오디오 파일의 메타데이터 및 파일 구조가 원본과 동일하게 조작될 수 있는지를 탐구하는 것을 목적으로 한다. 본 연구는 국내에서 가장 많이 사용되고 있는 삼성 스마트폰을 기반으로, 내장된 음성 녹음 앱과 녹음 앱으로 가장 인기가 높은 '이지 보이스 레코더' 앱을 대상으로 실험을 수행했다. 본 연구의 실험을 통해 오디오 파일의 메타데이터와 파일 구조는 조작이 가능하다는 것이 증명되었다. 따라서 본 연구는 오디오 파일이 법적 증거 채택을 위한 감정이 수행될 때, 메타데이터 및 파일 구조 분석은 무결성을 증명하는 데 한계를 지닌다는 점을 밝힌다. 또한 메타데이터 및 파일 구조 분석에 의존하지 않는 새로운 음성 파일 위변조 기술의 개발이 필요성을 주장한다.

Audio Data Hiding Based on Sample Value Modification Using Modulus Function

  • Al-Hooti, Mohammed Hatem Ali;Djanali, Supeno;Ahmad, Tohari
    • Journal of Information Processing Systems
    • /
    • 제12권3호
    • /
    • pp.525-537
    • /
    • 2016
  • Data hiding is a wide field that is helpful to secure network communications. It is common that many data hiding researchers consider improving and increasing many aspects such as capacity, stego file quality, or robustness. In this paper, we use an audio file as a cover and propose a reversible steganographic method that is modifying the sample values using modulus function in order to make the reminder of that particular value to be same as the secret bit that is needed to be embedded. In addition, we use a location map that locates these modified sample values. This is because in reversible data hiding it needs to exactly recover both the secret message and the original audio file from that stego file. The experimental results show that, this method (measured by correlation algorithm) is able to retrieve exactly the same secret message and audio file. Moreover, it has made a significant improvement in terms of the following: the capacity since each sample value is carrying a secret bit. The quality measured by peak signal-to-noise ratio (PSNR), signal-to-noise ratio (SNR), Pearson correlation coefficient (PCC), and Similarity Index Modulation (SIM). All of them have proven that the quality of the stego audio is relatively high.

대상 기기에 제한이 없는 스마트폰 기반의 적외선 리모컨 (Smart Phone Based Infrared Remote Controller without Restriction of Target Devices)

  • 황성진;이미현;홍정표;박태근;김용석
    • 산업기술연구
    • /
    • 제34권
    • /
    • pp.27-32
    • /
    • 2014
  • Infrared remote controllers are widely used in controlling electronic devices due to its simplicity and convenience. This paper presents a smart phone application unifying any infrared remote controllers. We can select a device from device list menu of the application. Any new device can be added easily by downloading the protocol file of the device from protocol file server. Remote controller protocol files are stored in audio file format, and the file related to a specific menu button is transmitted through the audio jack of smart phones. The protocol file server is a standard file server, and protocol files for various devices are collected by infrared receiver module. For smart phones without infrared facility, a small infrared module translating audio signal to infrared signal is applied.

  • PDF

오디오 특징계수를 이용한 시계열 패턴 인덱스 화일의 뮤지션 검색 기법 (Musician Search in Time-Series Pattern Index Files using Features of Audio)

  • 김영인
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.69-74
    • /
    • 2006
  • 최근 멀티미디어 내용기반 검색 기술의 발달로 음악 정보 검색 기술 중 하나인 오디오 특징을 이용한 뮤지션 검색에 대한 관심이 증대되고 있다. 그러나 이와 관련한 음악 데이타베이스의 인덱싱 기법에 대한 연구는 부족한 실정이다. 본 논문에서는 시계열 패턴 인덱스 화일의 공간 분할 방법을 이용하여 오디오 특징 데이터를 사용한 뮤지션 검색 기법을 제시한다. 뮤지션 탐색을 위하여 오디오의 특징을 사용하며, 유사한 후보 뮤지션의 곡을 탐색하기 위한 인덱싱 기법으로 시계열 패턴 인덱스 화일을 사용한다. 실험 결과, 윤번 공간 분할 방법을 사용한 시계열 패턴 인덱스 화일이 뮤지션 검색에 있어서 효율적임을 보였다.

  • PDF

Audio Steganography Method Using Least Significant Bit (LSB) Encoding Technique

  • Alarood, Alaa Abdulsalm;Alghamdi, Ahmed Mohammed;Alzahrani, Ahmed Omar;Alzahrani, Abdulrahman;Alsolami, Eesa
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.427-442
    • /
    • 2022
  • MP3 is one of the most widely used file formats for encoding and representing audio data. One of the reasons for this popularity is their significant ability to reduce audio file sizes in comparison to other encoding techniques. Additionally, other reasons also include ease of implementation, its availability and good technical support. Steganography is the art of shielding the communication between two parties from the eyes of attackers. In steganography, a secret message in the form of a copyright mark, concealed communication, or serial number can be embedded in an innocuous file (e.g., computer code, video film, or audio recording), making it impossible for the wrong party to access the hidden message during the exchange of data. This paper describes a new steganography algorithm for encoding secret messages in MP3 audio files using an improved least significant bit (LSB) technique with high embedding capacity. Test results obtained shows that the efficiency of this technique is higher compared to other LSB techniques.

Authoring Tool of Musical Slide Show MAF Contents

  • ;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.289-295
    • /
    • 2006
  • The Musical Slide Show MAF, which currently being standardized by MPEG, conveys the concept of combining several established standard technologies in a single file format. It defines the format of packing up MP3 audio data, along with MPEG-7 Simple Metadata Profile and MPEG-21 Digital Item Declaration metadata; with JPEC images and optional text, and synchronizes them all together to create a slideshow of JPEC image data associated to MP3 audio data during the audio playback. The implementation of Musical Slide Show MAF can be a music karaoke file where users can sing along while listening to the music, view the JPEG slideshow and reading the lyrics; or a story-telling file where users can listen to the narrated story by looking at the related illustration slideshow of the story In this paper we present the tool to producing the Musical Slide Show MAF contents. Regardless the knowledge of user on the MAF file format, the authoring tool simplify the manner of packaging several multimedia contents into single file.

  • PDF

스마트폰 음성녹음 파일 구조 및 메타데이터의 위변조 기법에 관한 연구 (A Study on Forgery Techniques of Smartphone Voice Recording File Structure and Metadata)

  • 박재완;곽원준;이상현
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.807-812
    • /
    • 2022
  • 최근 음성녹음 파일도 법정 증거로 제출되는 수가 늘어남에 따라 위변조를 주장하는 사례도 증가하고 있다. 객관적 근거인 음성녹음 파일 구조 및 메타데이터를 완벽하게 위변조 할 경우에는 정교한 음성녹음 파일의 위변조 검출은 사실상 불가능하다. 위변조된 음성녹음 파일을 가지고 수행된 파일 구조 및 메타데이터 분석이 법정에서 거부되는 것은 쉽지 않다. 본 연구는 음성녹음 파일 구조 및 메타데이터의 위변조가 손쉽게 가능하다는 것을 증명하는 것을 목적으로 한다. 이를 위해 본 연구에서는 음성녹음 파일의 편집 방법의 유형화를 기반으로 정교한 편집이 가능한 '혼합붙여넣기' 기능을 적용할 경우 위변조 검출의 불가능함을 소개했다. 더욱이 실험을 통해 파일 구조 및 메타데이터의 위변조가 가능하다는 것을 증명했다. 따라서 음성녹음 파일이 디지털 증거로 채택됨에 있어서 더 엄격한 증거능력 판단 기준이 필요하다. 본 연구는 법관이 디지털 증거를 채택함에 무결성의 기준에 공헌할 뿐만 아니라 향후 개발될 것으로 예상되는 녹음파일 위변조 검출 인공지능을 위한 데이터셋 구축 방법에 공헌할 것이다.

내용기반 오디오 장르 분류를 위한 신호 처리 연구 (A Study on the Signal Processing for Content-Based Audio Genre Classification)

  • 윤원중;이강규;박규식
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.271-278
    • /
    • 2004
  • 본 논문에서는 디지털 신호처리를 이용하여 Classic, Hiphop, Jazz, Rock, Speech 등 5개의 오디오 장르를 자동적으로 분류하는 내용기반 오디오 장르 분류기를 제안하였다. 20초 분량의 질의 오디오로부터 23ms 크기의 Hamming window를 이동시켜 가며 Spectral Centroid, Rolloff, Flux 등 STFT 기반의 특징 계수들과 MFCC, LPC 등의 계수들을 구하여 총 54차에 해당하는 특징 벡터 열을 추출하였으며 분류 알고리즘으로는 k-NN, Gaussian, GMM 분류기를 사용하였다. 최적의 특징 벡터를 선별하는 알고리즘으로 총 54차의 특징벡터 중 가장 성능이 좋은 특징 계수들을 찾아 순차적으로 재배치하는 SFS(Sequential Forward Selection)방법을 사용하였고, 이를 이용하여 최적화 된 10차의 특징 벡터만을 선정해서 오디오 장르 분류에 사용하였다. SFS를 적용한 실험 결과 약 90% 가까운 분류 성공률을 보이고 있어 기존 연구에 비하여 약 10%∼20% 정도의 성능 향상을 꾀 할 수 있었다. 한편 실제 사용자들이 오디오 자동 장르 분류 시스템을 사용할 때 일어날 수 있는 상황을 가정하여 임의 구간에서 질의 데이터를 추출하여 실험을 수행하였으며 실험 결과 오디오 파일의 맨 앞과 맨 뒤 등 worst-case 질의를 제외하고는 약 80%대의 분류 성공률을 얻을 수 있었다.

Analysis of Storage and Retrieval Results of Audio Sources and Signatures using Blockchain and Distributed Storage System

  • Lee, Kyoung-Sik;Kim, Sang-Kyun
    • 방송공학회논문지
    • /
    • 제24권7호
    • /
    • pp.1228-1236
    • /
    • 2019
  • Recently, media platforms such as YouTube and Twitch provide services that can generate personal revenue by utilizing media content produced by individuals. In this regard, interest in the copyright of media content is increasing. In particular, in the case of an audio source, competition for securing audio source copyright is fierce because it is an essential element for almost all media content production. In this paper, we propose a method to store the audio source and its signature using a blockchain and distributed storage system to verify the copyright of music content. To identify the possibility of extracting the audio signature of the audio source and to include it as blockchain transaction data, we implement the audio source and its signature file upload system based on the proposed scheme. In addition, we show the effectiveness of the proposed method through experiments on uploading and retrieving audio files and identify future improvements.