• Title/Summary/Keyword: 오디오파일

Search Result 124, Processing Time 0.024 seconds

Design and Implementation of MPEG-4 File Formatter included MPEG-4 System Information, with MOV Compatibility (시스템 정보가 포함된 MOV 호환 MPEG-4 파일 포맷터의 설계 및 구현)

  • 전형국;마평수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.520-522
    • /
    • 2001
  • 본 논문에서 제시하는 시스템은 MPEG-4로 부호화된 비디오/오디오에 대해서 MPEG-4 파일 포맷에 맞는 MPEG-4 파일 생성 포맷터이다. 본 논문에서 설계하고 구현된 파일 포맷터는 전처리 부분, 부호화기 파일 포맷터로 구성된 저작도구의 모듈로서 존재한다. 따라서 본 논문에서는 저작도구에서 사용될 MPEG-4 파일 포맷터의 구조 및 기능에 대해서 선명하고, 포맷터의 세부 설계 사항을 기술한다. 본 논문에서 MPEG-4 파일 포맷터의 기능은 비디오/오디오 인코더로부터 출력되는 비디오/오디오 데이터를 MPEG-4 파일 포맷의 형식에 맞는 MPEG-4 파일을 생성하는 것이다. 생성된 파일은 비디오/오디오 각각에 대한 정보와 생성된 비디오/오디오를 처리할 디코더에 대한 정보를 제공한다. 표준 상의 MPEG-4 시스템에서의 동기화 정보를 파일 포맷상의 비디오/오디오 데이터에 제공하여 , 스트리밍 서비스을 제공하는 서버쪽에서의 동기화 과정과 먹싱을 배제할 수 있게 한다. 비디오/오디오 인코더로부터 생성되는 다양만 종류의 비디오/오디오 데이터를 효율적으로 포맷팅하여 다양한 범위의 응용에서 사용될 수 있게 하며, 차기에 계위화 부호화를 효율적으로 적용시키기 위해 파일 포맷팅을 수행하게 된다.

  • PDF

An User Controllable Object Audio File Format and Audio Scene Description (사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법)

  • Cho, Choong-Sang;Kim, Je-Woo
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.47 no.5
    • /
    • pp.25-33
    • /
    • 2010
  • Multi-media service has been changed into user based audio services, which service supports actively user's preference and interaction with the users. In the market, multi-media products which can support the highest audio-quality by using lossless audio technology have been released and object audio music which user can select the objects has been serviced. In this paper, we design user's preference information based object audio file format and audio scene description for storage and transmission media. The designed file format is designed based on MPEG-4 file format because high-quality audio codecs in MPEG-4 audio can be easily used and the track of file format can be flexibly controlled depend on the number of the instrument in music. The encoded audio data of each objects and encoded audio scene description by binary encoding that has independent track are packed in a file. The scene description for storage media is consist of full and object scene description, the scene description for transmission media has an essential description for object audio operation and a specific description for real audio sound. The designed file format based simulator is developed and it generates an object audio file with several scene descriptions. Also, the real audio sound is serviced by the interaction with user and the unpacked scene description.

Cluster Sizing for Embedded Audio File Systems (임베디드 오디오 파일시스템의 클러스터 크기 연구)

  • Lim, Chang-Kyu;Lee, In-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.1523-1526
    • /
    • 2005
  • 본 논문에서는 현실 세계에서 사용되고 있는 디지털 오디오 파일들을 사용하여 전통적인 파일시스템에서의 클러스터 크기들이 파일시스템의 입출력 처리시간 및 공간 사용률 등의 성능 요소에 미치는 영향들을 분석하고 이를 디지털 오디오 파일의 특성에 맞게 개선함으로써, 임베디드 오디오 파일시스템의 클러스터 크기에 관한 개선된 디자인을 제시하고자 한다.

  • PDF

Limitations of Analyzing Metadata and File Structure of Audio Files for Legal Evidence: Focusing on Samsung Smartphones (법적 증거 능력을 위한 오디오 파일의 메타데이터 및 파일 구조 분석의 한계: 삼성 스마트폰을 중심으로)

  • Sungwon Baek;Homin Son;Jae Wan Park
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.6
    • /
    • pp.1103-1109
    • /
    • 2023
  • Today, as the number of audio files submitted as legal evidence increases with the proliferation of smartphones, the integrity of audio files has become an important issue. Accordingly, the purpose of this study is to explore whether the metadata and file structure of audio files recorded on Samsung smartphones can be manipulated to be identical to the original. This study was based on Samsung smartphones, the most widely used in Korea, and conducted experiments on the built-in voice recording app and the 'Easy Voice Recorder' app, which is the most popular recording app. Through the experiments of this study, it was proven that the metadata and file structure of audio files can be manipulated. Therefore, this study reveals that metadata and file structure analysis have limitations in proving the integrity when audio files are analyzed for adoption as legal evidence. They also argue for the need to develop new voice file forgery technology that does not rely on metadata and file structure analysis.

Tool of file Production from AVI to MPEG-4 (AVI to MPEG-4 파일 생성 도구)

  • 김선태;마평수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.403-405
    • /
    • 2001
  • MPEG-4 미디어 파일은 저비트율에서 고비트율까지 다양한 응용범위에서 이용 가능하므로, 요즘들어서 MPEG-4의 미디어 파일이 많은 분야에서 사용되고 있다. 하지만 미디어를 다루는 전문가 외에는 MPEG-4 알고리즘을 이용한 미디어 파일을 생성하여 서비스하기에는 많은 어려움이 있다. 따라서, 본 논문에서는 사용자가 사용하기 편리한 인터페이스를 갖춘 MPEG-4파일 생성 도구를 만들었다. 본 파일 생성도구는 일반 PC에 보편화된 미디어 포맷인 AVI과일을 입력으로 오디오와 비디오를 포함한 MPEG-4 파일을 생성하는 도구이다. 이 도구에는 비디오의 화면 크기 변환, 오디오의 채널변환 및 샘플링 주파수 변환 등의 전처기와 비디오/오디오 압축을 위한 각각의 MPEG-4 비디오/오디오 부호기 및 생성된 두개의 미디어 파일을 하나로 묶어 표준에 맞은 파일을 생성하는 포맷터를 포함한다. 본 파일 생성도구는 응용 비트율에 따른 파일 생성뿐 만 아니라 각각의 미디어 파일의 조건을 사용자 인터페이스의 간단한 입력으로 원하는 응용에 맞는 다양한 파일을 생성할 수 있다.

  • PDF

MPEG-4 Contents Authoring using AVI (AVI 데이터를 이용한 MPEG-4 컨텐츠 저작)

  • 이숙영;차경애;김상욱
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05d
    • /
    • pp.618-621
    • /
    • 2002
  • MPEG-4 컨텐츠는 비디오, 오디오 파일을 비롯하여 다양한 타입의 미디어로 구성되는 복합 멀티미디어 데이터이다. 본 논문에서는 MPEG-4 컨텐츠 생산을 위해서 저작 환경을 제공하고 이를 MPEG-4 파일로 생성하는 MPEG-4 컨텐츠 저작 도구를 제안한다. 특히 제안하는 MPEG-4 저작 도구는 AVI 형태의 동영상 자료를 입력 받아, MPEG-4 오디오, 비디오 데이터로 변환하고 이를 MPEG-4 장면 저작에 이용할 수 있다. MPEG-4 컨텐츠는 MPEG-4 파일로 구성되며, 장면 구성이 배제된 오디오, 비디오로만 구성된 MPEG-4 파일과 전체 미디어 데이터가 하나의 장면으로 생성된 MPEG-4 파일이 될 수 있다.

  • PDF

Overview of MPEG-A Interactive Music Application Format (MPEG-A Interactive Music Application Format 표준화 현황 및 기술 분석)

  • Jang, In-Seon;Seo, Jeong-Il;Kang, Kyeong-Ok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.8
    • /
    • pp.706-713
    • /
    • 2009
  • Standardization of technology for formatting multiple audio tracks and relevant information for interactive music service is in progress owing to the increasing need of consumers for participating in music production to their own taste. In this paper, we introduce the status of MPEG-A Interactive Music Application Format (IM AF) standardization and analyze techniques adopted in the current IM AF.

Deepfake Detection with Audio Fragile Watermarking (연성 워터마킹 기반 오디오 딥페이크 탐지)

  • Jun-Mo Kim;Changhee Hahn
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.269-270
    • /
    • 2024
  • 디지털 오디오 파일의 보안은 디지털 미디어의 확산과 함께 점차 중요해지고 있다. 특히, 딥페이크와 같은 기술을 이용한 조작이 증가함에 따라, 이를 효과적으로 방지하는 기술이 대두되고 있다. 본 연구에서는 연성 워터마킹 기술을 활용하여, 오디오 파일이 외부 조작에 의해 변경되었을 때 오디오 파일이 의도적으로 파괴하는 방식을 제안한다. 본 논문에서는 연성 워터마크 생성 및 삽입 방법에 관한 자세한 설명을 하고, 연성 워터마킹을 통해 오디오의 변조 여부를 즉각적으로 탐지하는데 어떻게 기여하는지를 보여준다. 제안 기법은 오디오 원본의 무결성을 효과적으로 보호하는 새로운 방법을 제시하며, 디지털 미디어 보안을 강화하는데 중요한 역할을 할 것으로 기대된다.

The Improved-Scheme of Audio Steganography using LSB Techniques (LSB 기법을 이용하는 개선된 오디오 스테가노그래피)

  • Ji, Seon-Su
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.17 no.5
    • /
    • pp.37-42
    • /
    • 2012
  • Audio steganography is quite similar to the procedure of modifying the least significant bit(LSB) of image media files. The most widely used technique today is hiding of secret messages into a digitized audio signal. In this paper, I propose a new method for hiding messages from attackers, high data inserting rate is achieved. In other words, based on the LSB hiding method and digitized to change the bit position of a secret message, an encrypted stego medium sent to the destination in safe way.

Diagnosis of Parkinson's disease based on audio voice using wav2vec (Wav2vec을 이용한 오디오 음성 기반의 파킨슨병 진단)

  • Yoon, Hee-Jin
    • Journal of Digital Convergence
    • /
    • v.19 no.12
    • /
    • pp.353-358
    • /
    • 2021
  • Parkinson's disease is the second most common degenerative brain disease after Alzheimer's in old age. Symptoms of Parkinson's disease are factors that reduce the quality of life in daily life, such as shaking hands, slowing behavior and cognitive function. Parkinson's disease that can slow the progression of the disease through early diagnosis. To diagnoze Parkinson's disease early, an algorithm was implemented to extract features using wav2vec and to diagnose the presence or absence of Parkinson's disease with deep learning(ANN). As a results of the experiment, the accuracy was 97.47%. It was better than the results of diagnosing Parkinson's disease using the existing neural network. The audio voice file could simply reduce the experiment process and obtain improved results.