• 제목/요약/키워드: 오디오파일

검색결과 124건 처리시간 0.024초

시스템 정보가 포함된 MOV 호환 MPEG-4 파일 포맷터의 설계 및 구현 (Design and Implementation of MPEG-4 File Formatter included MPEG-4 System Information, with MOV Compatibility)

  • 전형국;마평수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.520-522
    • /
    • 2001
  • 본 논문에서 제시하는 시스템은 MPEG-4로 부호화된 비디오/오디오에 대해서 MPEG-4 파일 포맷에 맞는 MPEG-4 파일 생성 포맷터이다. 본 논문에서 설계하고 구현된 파일 포맷터는 전처리 부분, 부호화기 파일 포맷터로 구성된 저작도구의 모듈로서 존재한다. 따라서 본 논문에서는 저작도구에서 사용될 MPEG-4 파일 포맷터의 구조 및 기능에 대해서 선명하고, 포맷터의 세부 설계 사항을 기술한다. 본 논문에서 MPEG-4 파일 포맷터의 기능은 비디오/오디오 인코더로부터 출력되는 비디오/오디오 데이터를 MPEG-4 파일 포맷의 형식에 맞는 MPEG-4 파일을 생성하는 것이다. 생성된 파일은 비디오/오디오 각각에 대한 정보와 생성된 비디오/오디오를 처리할 디코더에 대한 정보를 제공한다. 표준 상의 MPEG-4 시스템에서의 동기화 정보를 파일 포맷상의 비디오/오디오 데이터에 제공하여 , 스트리밍 서비스을 제공하는 서버쪽에서의 동기화 과정과 먹싱을 배제할 수 있게 한다. 비디오/오디오 인코더로부터 생성되는 다양만 종류의 비디오/오디오 데이터를 효율적으로 포맷팅하여 다양한 범위의 응용에서 사용될 수 있게 하며, 차기에 계위화 부호화를 효율적으로 적용시키기 위해 파일 포맷팅을 수행하게 된다.

  • PDF

사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법 (An User Controllable Object Audio File Format and Audio Scene Description)

  • 조충상;김제우
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.25-33
    • /
    • 2010
  • 최근의 오디오 기술은 사용자 중심으로 변화하고 있으며, 사용자의 환경과 의도에 따라 능동적으로 서비스가 이루어지는 대화형 오디오 서비스 시대로 변화하고 있다. 이에 맞추어 시장에서는 고품질 오디오 서비스를 위한 무손실 오디오 기술을 탑재한 멀티미디어 기기와 사용자가 선택적으로 악기를 조절할 수 있는 객체 오디오 음원 서비스가 이루어지고 있다. 본 논문에서는 사용자가 컨트롤 할 수 있는 실감 객체 오디오 파일 포맷을 설계하고 실감 정보를 낮은 복잡도에서 저장 매체와 전송 매체에 적용 가능한 오디오 장면 묘사 방법을 제안한다. 설계된 실감 객체 오디오 파일 포맷은 MPEG-4 파일 포맷을 기반으로 설계되었다. MPEG-4 파일 포맷은 MPEG-4에 속하는 고성능 오디오 코덱을 오디오 코덱 객체 번호를 통해서 쉽게 적용가능하다. 또한 오디오 객체 개수의 변화에 따라 파일 포맷의 트랙을 변화 시켜 사용하면 되므로 객체 오디오를 포함하기에 적절하다. 본 연구에서 개발된 파일 포맷은 실감 객체오디오 생성시 MPEG-4 오디오 코덱으로 압축된 객체 오디오, 실감 객체 오디오를 위한 오디오 장면 묘사 데이터를 독립적인 트랙으로 포함하고 있다. 포함된 오디오 장면 묘사 기법은 저장 매체를 위해 전체 오디오 장면에 적용되는 오디오 묘사 기법과 각각의 오디오 객체에 적용되는 오디오 묘사 기법을 노드 구조로 설계 하였으며, 전송 매체를 위해서 기본적인 객체 오디오 동작을 하기위한 필수 정보와 오디오 세부장면 묘사를 위한 정보로 분할하여 설계하였다. 이를 바탕으로 본 연구에서는 실감 객체 오디오 시뮬레이터를 개발하였다. 개발된 시뮬레이터는 객체 음원과 오디오 장면 묘사 정보를 부호화하여 MPEG-4 파일 포맷에 저장하며, 생성된 실감 객체 오디오 파일은 재생 모듈에서 오디오 객체에 입력 받은 사용자 정보와 오디오 장면 묘사 정보가 적용되어 사용자에게 몰입감이 높은 실감 오디오 서비스를 제공한다.

임베디드 오디오 파일시스템의 클러스터 크기 연구 (Cluster Sizing for Embedded Audio File Systems)

  • 임창규;이인환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.1523-1526
    • /
    • 2005
  • 본 논문에서는 현실 세계에서 사용되고 있는 디지털 오디오 파일들을 사용하여 전통적인 파일시스템에서의 클러스터 크기들이 파일시스템의 입출력 처리시간 및 공간 사용률 등의 성능 요소에 미치는 영향들을 분석하고 이를 디지털 오디오 파일의 특성에 맞게 개선함으로써, 임베디드 오디오 파일시스템의 클러스터 크기에 관한 개선된 디자인을 제시하고자 한다.

  • PDF

법적 증거 능력을 위한 오디오 파일의 메타데이터 및 파일 구조 분석의 한계: 삼성 스마트폰을 중심으로 (Limitations of Analyzing Metadata and File Structure of Audio Files for Legal Evidence: Focusing on Samsung Smartphones)

  • 백성원;손호민;박재완
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.1103-1109
    • /
    • 2023
  • 오늘날, 스마트폰의 확산에 따라 오디오 파일이 법적 증거로 제출되는 수가 증가하면서 오디오 파일의 무결성은 중요한 이슈가 되고 있다. 이에 본 연구는 삼성 스마트폰에서 녹음된 오디오 파일의 메타데이터 및 파일 구조가 원본과 동일하게 조작될 수 있는지를 탐구하는 것을 목적으로 한다. 본 연구는 국내에서 가장 많이 사용되고 있는 삼성 스마트폰을 기반으로, 내장된 음성 녹음 앱과 녹음 앱으로 가장 인기가 높은 '이지 보이스 레코더' 앱을 대상으로 실험을 수행했다. 본 연구의 실험을 통해 오디오 파일의 메타데이터와 파일 구조는 조작이 가능하다는 것이 증명되었다. 따라서 본 연구는 오디오 파일이 법적 증거 채택을 위한 감정이 수행될 때, 메타데이터 및 파일 구조 분석은 무결성을 증명하는 데 한계를 지닌다는 점을 밝힌다. 또한 메타데이터 및 파일 구조 분석에 의존하지 않는 새로운 음성 파일 위변조 기술의 개발이 필요성을 주장한다.

AVI to MPEG-4 파일 생성 도구 (Tool of file Production from AVI to MPEG-4)

  • 김선태;마평수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.403-405
    • /
    • 2001
  • MPEG-4 미디어 파일은 저비트율에서 고비트율까지 다양한 응용범위에서 이용 가능하므로, 요즘들어서 MPEG-4의 미디어 파일이 많은 분야에서 사용되고 있다. 하지만 미디어를 다루는 전문가 외에는 MPEG-4 알고리즘을 이용한 미디어 파일을 생성하여 서비스하기에는 많은 어려움이 있다. 따라서, 본 논문에서는 사용자가 사용하기 편리한 인터페이스를 갖춘 MPEG-4파일 생성 도구를 만들었다. 본 파일 생성도구는 일반 PC에 보편화된 미디어 포맷인 AVI과일을 입력으로 오디오와 비디오를 포함한 MPEG-4 파일을 생성하는 도구이다. 이 도구에는 비디오의 화면 크기 변환, 오디오의 채널변환 및 샘플링 주파수 변환 등의 전처기와 비디오/오디오 압축을 위한 각각의 MPEG-4 비디오/오디오 부호기 및 생성된 두개의 미디어 파일을 하나로 묶어 표준에 맞은 파일을 생성하는 포맷터를 포함한다. 본 파일 생성도구는 응용 비트율에 따른 파일 생성뿐 만 아니라 각각의 미디어 파일의 조건을 사용자 인터페이스의 간단한 입력으로 원하는 응용에 맞는 다양한 파일을 생성할 수 있다.

  • PDF

AVI 데이터를 이용한 MPEG-4 컨텐츠 저작 (MPEG-4 Contents Authoring using AVI)

  • 이숙영;차경애;김상욱
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.618-621
    • /
    • 2002
  • MPEG-4 컨텐츠는 비디오, 오디오 파일을 비롯하여 다양한 타입의 미디어로 구성되는 복합 멀티미디어 데이터이다. 본 논문에서는 MPEG-4 컨텐츠 생산을 위해서 저작 환경을 제공하고 이를 MPEG-4 파일로 생성하는 MPEG-4 컨텐츠 저작 도구를 제안한다. 특히 제안하는 MPEG-4 저작 도구는 AVI 형태의 동영상 자료를 입력 받아, MPEG-4 오디오, 비디오 데이터로 변환하고 이를 MPEG-4 장면 저작에 이용할 수 있다. MPEG-4 컨텐츠는 MPEG-4 파일로 구성되며, 장면 구성이 배제된 오디오, 비디오로만 구성된 MPEG-4 파일과 전체 미디어 데이터가 하나의 장면으로 생성된 MPEG-4 파일이 될 수 있다.

  • PDF

MPEG-A Interactive Music Application Format 표준화 현황 및 기술 분석 (Overview of MPEG-A Interactive Music Application Format)

  • 장인선;서정일;강경옥
    • 한국음향학회지
    • /
    • 제28권8호
    • /
    • pp.706-713
    • /
    • 2009
  • 기존의 수동적인 음악 서비스에서 벗어나 사용자가 음악 콘텐츠 제작에 직접 참여하고자 하는 욕구가 증가함에 따라 객체기반 오디오 서비스를 위한 기술로써 멀티 오디오 트랙과 관련 부가 정보들을 포맷화 하기 위한 객체기반 오디오 파일 포맷기술이 표준화 되고 있다. 본 논문에서는 MPEG에서 표준화 중인 객체기반 오디오 응용파일 포맷인 MPEG-A Interactive Music Application Format (IM AF)의 표준화 진행 현황을 소개하고 그 기술을 분석한다.

연성 워터마킹 기반 오디오 딥페이크 탐지 (Deepfake Detection with Audio Fragile Watermarking)

  • 김준모;한창희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.269-270
    • /
    • 2024
  • 디지털 오디오 파일의 보안은 디지털 미디어의 확산과 함께 점차 중요해지고 있다. 특히, 딥페이크와 같은 기술을 이용한 조작이 증가함에 따라, 이를 효과적으로 방지하는 기술이 대두되고 있다. 본 연구에서는 연성 워터마킹 기술을 활용하여, 오디오 파일이 외부 조작에 의해 변경되었을 때 오디오 파일이 의도적으로 파괴하는 방식을 제안한다. 본 논문에서는 연성 워터마크 생성 및 삽입 방법에 관한 자세한 설명을 하고, 연성 워터마킹을 통해 오디오의 변조 여부를 즉각적으로 탐지하는데 어떻게 기여하는지를 보여준다. 제안 기법은 오디오 원본의 무결성을 효과적으로 보호하는 새로운 방법을 제시하며, 디지털 미디어 보안을 강화하는데 중요한 역할을 할 것으로 기대된다.

LSB 기법을 이용하는 개선된 오디오 스테가노그래피 (The Improved-Scheme of Audio Steganography using LSB Techniques)

  • 지선수
    • 한국산업정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.37-42
    • /
    • 2012
  • 오디오 스테가노그래피는 오디오 매체(신호)에 암호화된 비밀 메시지를 은닉하여 전송하는 일반적이고, 폭넓게 이용되는 통신기법이다. 인간은 청각시스템의 지각능력의 한계 때문에 커버 오디오 파일과 스테고 오디오 파일의 지각품질(perceptual quality) 차이는 없다. 또한 공격자로부터의 안전성과 견고성 측면에서 LSB 기법은 디지털화된 오디오 신호에 메시지를 삽입하는 효율적이고, 경제적인 방법으로 널리 이용되고 있다. 이 논문에서는 LSB 기법을 기반으로 하고, 디지털화된 비밀 메시지의 비트별 위치를 변경하고, 암호화한 후 커버 오디오 매체에 은닉하는 개선된 방법을 제시한다.

Wav2vec을 이용한 오디오 음성 기반의 파킨슨병 진단 (Diagnosis of Parkinson's disease based on audio voice using wav2vec)

  • 윤희진
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.353-358
    • /
    • 2021
  • 노년기에 접어들면서 알츠하이머 다음으로 흔한 퇴행성 뇌 질환은 파킨슨병이다. 파킨슨병의 증상은 손 떨림, 행동의 느려짐, 인지기능의 저하 등 일상생활의 삶의 질을 저하시키는 요인이 된다. 파킨슨병은 조기진단을 통하여 병의 진행 속도를 늦출 수 있는 질환이다. 파킨슨병의 조기진단을 위해 오디오 음성 파일 입력으로 wav2vec을 이용하여 특징을 추출하고 딥러닝(ANN)으로 파킨슨병의 유무를 진단하는 알고리즘을 구현하였다. 오디오 음성 파일을 이용하여 파킨슨병을 진단하는 실험 결과 정확도는 97.47%로 나타났다. 기존의 뉴럴네트워크를 이용하여 파킨슨병을 진단하는 결과보다 좋은 결과를 나타냈다. 오디오 음성 파일을 wav2vec 이용으로 간단하게 실험을 과정을 줄일 수 있었으며, 실험 결과 향상된 결과를 얻을 수 있었다.