• 제목/요약/키워드: 오디오 콘텐츠

검색결과 200건 처리시간 0.026초

높은 비가청성을 갖는 믹스 음악의 크기 변조 오디오 워터마킹 기술에 관한 연구 (Study on the Amplitude Modification Audio Watermarking Technique for Mixed Music with High Inaudibility)

  • 강세구;이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권1호
    • /
    • pp.67-74
    • /
    • 2016
  • 본 논문에서는 믹스 음악을 위한 디지털 오디오 워터마킹 기술을 제안하였다. 믹스 음악은 기존에 저작권이 확보되어 있는 음악을 편집하여 한편의 오디오 클립에 다수의 음악이 포함되어 있는 재창조된 음악을 의미한다. 오디오 콘텐츠와 관련된 저작권료는 보통 완전체 오디오를 기준으로 부과된다. 그러나 믹스 음악의 경우에는 오디오 완전체를 모두 사용하는 것이 아니라 일부만을 이용하기 때문에 저작권료의 산정에서 저작권자와 사용자간의 분쟁의 소지를 갖고 있다. 본 연구에서는 이와 같은 오디오 저작권료와 관련된 문제의 기술적인 해결 방법으로서 믹스 음악을 구성하고 있는 각각의 오디오 콘텐츠에 대하여 서로 다른 워터마크를 삽입하여 음악을 구분할 수 있는 워터마킹 기술을 제안하였다. 제안된 기술은 기존의 워터마킹 방법과 달리 믹스음악을 구성하는 각각의 오디오에 대하여 서로 다른 워터마크를 삽입하기 때문에 오디오 전체에 대하여 워터마크를 삽입하는 기존의 방법과 달리 오디오의 품질을 떨어뜨리는 단점이 있다. 이에 대한 기술적 해결로서 비 가청성이 강조된 이진 랜덤 열을 이용하고 워터마크 삽입에 따른 신호의 왜곡 특성이 가장 적은 크기 변조 오디오 워터마킹 기술을 이용하였다. 제안된 방법은 워터마크의 추출 특성을 통하여 성능을 검증하였다.

멀티미디어 콘텐츠를 위한 다이얼로그 명료도 향상 알고리즘 (Dialog Enhancement Algorithm for Multimedia Contents)

  • 지유나;박영철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.86-89
    • /
    • 2016
  • 본 논문에서는 멀티미디어 콘텐츠의 명료도를 향상시켜 사용자가 주변 환경과 관계없이 안정적인 볼륨에서 오디오 청취를 할 수 있는 다이얼로그 명료도 향상 알고리즘을 제안한다. 최근 모바일 기기들의 발달로 다양한 환경에서 영화, TV 또는 동영상 등의 멀티미디어 콘텐츠를 즐기는 일이 늘어나고 있다. 이러한 경우 시청자는 주변 환경에 따라 영상의 오디오 볼륨을 조절하게 되는데 주변 소음에 비하여 과하게 증폭된 볼륨은 주변에 피해를 끼치거나 고막에 손상을 일으킬 수 있으며 반대로 주변에 비해 너무 작은 오디오 볼륨은 시청을 어렵게 한다는 단점이 있다. 본 논문에서는 수신단에서 멀티미디어 콘텐츠의 오디오 신호로부터 다이얼로그 성분을 검출하여 음성 명료도 향상 알고리즘을 적용시켜 동일한 볼륨에서도 음성의 명료도를 높이는 알고리즘을 제안한다. 본 알고리즘은 다이얼로그를 검출하여 단순히 증폭 시키는 기존 기술들과 달리 전체 에너지는 유지하면서 명료도에 중요한 영향을 미치는 주파수 대역에 에너지를 집중시키는 에너지 재분배 방식을 이용해 동일한 볼륨에서도 더 높은 음성 명료도를 기대할 수 있다. 컴퓨터 시뮬레이션을 통해 본 논문에서 제안한 알고리즘이 명료도에 중요한 영향을 미치는 주파수대역을 적절히 증폭시킴을 확인할 수 있었다.

  • PDF

모국어 오디오 콘텐츠 기반의 모바일 외국어 학습 플랫폼 개발 연구 (A Study on the Development of Mobile Foreign Language Learning Platform Based on Audio Contents of Mother Tongue)

  • 림빈;임영환;심근정;이요셉
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.487-495
    • /
    • 2021
  • 각자가 가진 모국어 능력을 활용한 외국어 오디오 콘텐츠 플랫폼 개발을 통해 보다 쉽고 재밌으며 또한 편리하게 외국어를 습득할 수 있도록 하는데 본 연구의 목적이 있다. 이를 위해 실생활에서 사용하는 모국어를 중심으로 오디오 콘텐츠를 거래할 수 있는 플랫폼을 제안한다. 일상생활에서 큰 노력을 들이지 않고 만들어낼 수 있는 콘텐츠들이 외국어 학습자들에게는 그 언어의 자연스러운 쓰임새를 배울 수 있는 소중한 콘텐츠로 사용되는 것이다. 현재 대다수의 외국어 학습 플랫폼은 콘텐츠 고갈과 낮은 콘텐츠의 실제성의 문제점을 안고 있다. 본 플랫폼을 통해 이러한 기존 단점들을 개선하여 학습자들에게는 외국어를 보다 현실적이고 효율적으로 배울 수 있는 기회를 부여함과 동시에 원어민들에게는 여유시간을 활용한 부가수익 창출 기회를 부여할 수 있을 것으로 기대한다.

실감 오디오 방송을 위한 초다채널 오디오 시스템 및 표준화 동향 (Introduction and Standard Status of High Order Multichannel Audio System for Realistic Audio Broadcasting)

  • 서정일;강경옥
    • 전자통신동향분석
    • /
    • 제27권6호
    • /
    • pp.49-56
    • /
    • 2012
  • 본고는 3DTV, UHDTV(Ultra High Definition Television)와 같은 실감방송 환경에서 실감 오디오 서비스를 제공하기 위한 초다채널 오디오 기술의 최근 연구 및 개발 동향을 소개한다. 스테레오와 5.1 채널로 대표되는 기존의 오디오 기술은 2차원 평면상에서만 음장을 형성할 수 있다는 표현의 한계를 가지고 있다. 3D 영화의 성공과 UHDTV로 대표되는 초고화질 비디오와 부합하기 위해서는 오디오도 3차원 공간상에서 표현되어야 하며 이를 위해서는 필연적으로 출력채널 수가 증가하여야 한다. 이러한 초다채널 오디오는 22.2 채널과 같은 대용량의 오디오 데이터를 압축하는 기술뿐만 아니라 다양한 오디오 출력 환경에 적응적으로 오디오 콘텐츠를 표현하는 기술에 대한 연구/개발이 필요하다.

  • PDF

깊은 신경망을 이용한 오디오 이벤트 검출 (Audio Event Detection Using Deep Neural Networks)

  • 임민규;이동현;박호성;김지환
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.183-190
    • /
    • 2017
  • 본 논문에서는 깊은 신경망을 이용한 오디오 이벤트 검출 방법을 제안한다. 오디오 입력의 매 프레임에 대한 오디오 이벤트 확률을 feed-forward 신경망을 적용하여 생성한다. 매 프레임에 대하여 멜 스케일 필터 뱅크 특징을 추출한 후, 해당 프레임의 전후 프레임으로부터의 특징벡터들을 하나의 특징벡터로 결합하고 이를 feed-forward 신경망의 입력으로 사용한다. 깊은 신경망의 출력층은 입력 프레임 특징값에 대한 오디오 이벤트 확률값을 나타낸다. 연속된 5개 이상의 프레임에서의 이벤트 확률값이 임계값을 넘을 경우 해당 구간이 오디오 이벤트로 검출된다. 검출된 오디오 이벤트는 1초 이내에 동일 이벤트로 검출되는 동안 하나의 오디오 이벤트로 유지된다. 제안된 방법으로 구현된 오디오 이벤트 검출기는 UrbanSound8K와 BBC Sound FX자료에서의 20개 오디오 이벤트에 대하여 71.8%의 검출 정확도를 보였다.

Music Information Retrieval(MIR)을 활용한 음악적 리듬의 시각화 연구 -Onset 검출(Onset Detection) 알고리즘에 의한 시각화 어플리케이션 (A Study on Visualization of Musical Rhythm Based on Music Information Retrieval)

  • 최수환
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1075-1080
    • /
    • 2009
  • 이 글은 Music Information Retrieval(MIR) 기법을 사용하여 오디오 콘텐츠의 리듬 정보를 자동으로 분석하고 이를 시각화하는 방법에 대해 다룬다. 특히 MIR을 활용한 간단한 시각화(sound visualization) 어플리케이션을 소개함으로써 음악 정보 분석이 디자인, 시각 예술에서 다양하게 활용될 수 있음을 보이고자 한다. 음악적 정보를 시각 예술로 담아내려는 시도는 20세기 초 아방가르드 화가들에 의해 본격적으로 시작되었다. 80년대 이후에는 컴퓨터 기술의 급속한 발전으로 사운드와 이미지를 디지털 영역에서 쉽게 하나로 다룰 수 있게 되었고, 이에 따라 다양한 오디오 비주얼 예술작품들이 등장하였다. MIR은 오디오 콘텐츠로부터 음악적 정보를 분석하는 DSP(Digital Signal Processing) 기술로 최근 디지털 콘텐츠 시장의 확장과 더불어 연구가 활발히 진행되고 있다. 특히 웹이나 모바일에서는 이미 다양한 상용 어플리케이션이 적용되고 있는데 query-by-humming과 같은 음악 인식 어플리케이션이 대표적인 경우이다. 이 글에서는 onset 검출(onset detection)을 중심으로 음악적 리듬을 분석하는 알고리즘을 살펴보고 기본적인 조형원리에 따라 이를 시각화하는 어플리케이션의 예를 소개한다.

  • PDF

적응형 혼합현실 체험공간을 위한 음향재현 기술에 관한 연구 (A Study on Sound Reproduction for Adaptive Mixed-Reality Space)

  • 박지웅;이호진;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.303-306
    • /
    • 2013
  • 실제공간체감을 극대화하기 위해 실제 물리적인 공간과 가상현실 공간을 융합하는 인터랙티브 아키텍쳐 기반 적응형 혼합현실 기술이 최근 연구되고 있다. 이러한 혼합현실 공간에서 동적인 사용자 위치에 따라 물리공간적 몰입감 증대를 위한 오디오 Sweet Spot 최적화 기술을 연구하였다. 이를 위해 주파수 대역 별 소리의 물리적 감쇠현상을 활용하여 주파수 별 오디오 신호 보상 전처리를 통해 동적인 사용자 위치에 원음과 동일한 음색의 오디오 Sweet Spot이 형성이 가능한지 실험한 결과 주파수 별 감쇠의 차이를 보정함으로써 원음 그대로의 음색이 재현될 수 있다는 것을 확인할 수 있었다.

차세대 TV 방송을 위한 UHD 오디오 기술 개발 (A Study of UHD Sound for Future TV Broadcasting)

  • 장대영;서정일;유재현;박태진;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.186-189
    • /
    • 2014
  • 그 동안 오디오 기술은 채널 개수, 해상도, 매체의 특징에 따라 구분되어 발전해 왔다. 그러나 채널 개수에 있어서는 5.1 채널을 정점으로 가정에서의 설치 및 유지의 어려움으로 인해 시장에서의 고전을 면치 못하고 있다. 최근 영화 사운드 시장에서 돌비 ATMOS, IOSONO, AURO3D 등 잇단 객체기반 오디오 기술이 도입되면서, 방송 오디오 시장에서도 도입이 검토되고 있는 실정이다. 이러한 오디오 기술의 변화는 유연성이 결여된 채널기반 오디오의 기술 발전 및 시장 성장의 활로를 개척하는 기회가 될 것으로 전망된다. 따라서, 본 논문에서는 UHDTV, 무안경 3DTV, 파노라마 영상, 홀로그램 영상 등 차세대 TV 방송 매체에 활용할 수 있는 UHD 오디오 기술의 콘텐츠 포맷 및 재현 기술에 대해서 논하고 향후 전망을 고찰해 보고자 한다.

  • PDF

청취환경 차이에 따른 3차원 오디오 기술 개발 동향 (Status of 3D Audio Technology Development for the difference of Listening Environments)

  • 서정일;이용주;장인선;유재현;강경옥
    • 방송과미디어
    • /
    • 제13권1호
    • /
    • pp.82-96
    • /
    • 2008
  • 3차원 오디오 기술은 3차원 오디오를 녹음하는 기술에서 부호화, 전송, 재현에 이르기까지 오디오 신호처리 과정을 포함한다. 하지만 오디오 신호를 재생하는 단말의 환경이 궁극적으로 3차원 오디오를 청취자에게 제공하는 마지막 단계가 되므로 재생환경에 따라서 적용되는 기술에 차이가 있다. 본 논문에서는 음악 콘텐츠를 소비하는 다양한 재생 단말에서 현실감을 증대시키기 위해 적용되는 3차원 오디오 기술의 연구동향을 살펴본다.

사용자의 관심 영역을 고려한 MPEG-21 디지털 아이템 적응변환 (MPEG-21 DIA considering user's Region of Interest)

  • 손유미;임정연;김문철;김종남;김경수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1459-1462
    • /
    • 2003
  • 멀티미디어 콘텐츠의 트랜스코딩은 디스플레이 사이즈, 컴퓨팅 자원, 네트워크 대역폭이나 QoS 같은 네트워크자원 등 사용자 터미널의 수용 능력의 관점에서 수행되어 왔다. 오디오비주얼 콘텐츠의 리사이징이나 프레임 드로핑과 같은 제약을 주어 비트 율을 줄여줌으로써 사용자의 터미널 환경에 맞도록 변환시키는 것이 일반적인 트랜스코딩 방법이었다. 이러한 사용자의 환경에 따른 전통적인 방법 외에, 사용자 선호도에 기반 하여 멀티미디어 콘텐츠에서 사용자의 관심 영역(Region Of Interest)을 중심으로 트랜스코딩 하는 의미적인 코딩(segment transcoding)방법을 제안하였다. MPEG-21 DIA 프레임워크 하에서 사용자의 관심 영역을 표현한 의미 정보가 XDI(context Digital Item)형식으로 콘텐츠 제공자에게 전달되고 리소스 적응엔진을 통해 적응 변환된 콘텐츠는 다시 사용자에게 전달된다. 본 논문에서는 사용자의 관심영역 기반 오디오 비주얼 콘텐츠의 의미론적 트랜스코딩 기술을 제안하고 적응 변환의 실험 결과를 설명한다.

  • PDF