• 제목/요약/키워드: 오디오신호

검색결과 435건 처리시간 0.025초

서포트 벡터 머신과 퍼지 클러스터링 기법을 이용한 오디오 분할 및 분류 (Audio Segmentation and Classification Using Support Vector Machine and Fuzzy C-Means Clustering Techniques)

  • ;강명수;김철홍;김종면
    • 정보처리학회논문지B
    • /
    • 제19B권1호
    • /
    • pp.19-26
    • /
    • 2012
  • 최근 멀티미디어 정보가 급증함에 따라 콘텐츠 관리에 대한 요구도 함께 증가되고 있다. 이에 오디오 분할 및 분류는 멀티미디어 콘텐츠를 효과적으로 관리할 수 있는 대안이 될 수 있다. 따라서 본 논문에서는 동영상에서 취득한 오디오 신호를 분할하고, 분할된 오디오 신호를 음악, 음성, 배경 음악이 포함된 음성, 잡음이 포함된 음성, 묵음(silence)으로 분류하는 정확도가 높은 오디오 분할 및 분류 알고리즘을 제안한다. 제안하는 알고리즘은 오디오 분할을 위해 서포트 벡터 머신(support vector machine, SVM)을 이용하였다. 오디오 신호의 분류를 위해서는 분할된 오디오 신호의 특징을 추출하고 이를 퍼지 클러스터링 알고리즘(fuzzy c-means, FCM)의 입력으로 사용하여 각 계층으로 오디오 신호를 분류하였다. 제안하는 알고리즘의 평가는 분할과 분류에 대해 각각 그 성능을 평가하였으며, 분할 성능 평가는 정확도율(precesion rate)과 오차율(recall rate)을 이용하였으며, 분류 성능 평가는 정확성(classification accuracy)을 사용하였다. 또한 오디오 분할의 경우는 이진 분류기와 퍼지 클러스터링을 이용한 기존의 알고리즘과 그 성능을 비교하였다. 모의 실험 결과, 제안한 알고리즘의 분류 성능이 기존 알고리즘 보다 정확도율과 오차율 면에서 모두 우수하였다.

MPEG 오디오 부호화 과정을 고려한 오디오 워터마킹

  • 김연정;오현오;윤대희;석종원;홍진우
    • 정보보호학회지
    • /
    • 제12권1호
    • /
    • pp.19-24
    • /
    • 2002
  • 시간 영역에서 수행하는 대역확산 워터마킹의 경우 들리지 않으면서도 강인한 워터마크를 생성하기 위해 심리음향 모델을 이용한다. 주파수 영역에서 심리음향모델에 의해 변형된 PN 시퀸스는 시간 영역으로 역변환되어 원신호에 삽입된다. 워터마크가 삽입된 오디오 신호가 WEG 오디오 부호화 과정을 통과할 경우, 다시 심리음향모델과 주파수 변환을 수행하는 중복 연산이 요구된다. 본 논문에서는 WEG오디오 부호화 과정과 오디오 워터마킹 과정을 결합시킴으로써 중복 연산을 피한 효율적인 오디오 워터마킹 알고리즘을 제안한다. 제안된 알고리즘은 MPEG 오디오 부호화 중에서, 특히, MP3 부호화 과정에 대해 수행하였으며, MDCT 영역에서 워터마크를 삽입한다. 삽입된 워터마크 신호는 일반적인 대역확산 워터마킹 복호화기를 이용하여 시간 영역에서 검출이 가능하며, 기존의 방법과 유사한 수준의 복호화 성능을 나타낸다.

음악 장르 분류를 이용한 자동차 오디오 시스템에서의 이퀄라이저 자동 조절 방식 (Automatic Equalizer Control Method Using Music Genre Classification in Automobile Audio System)

  • 김형국;남상순
    • 한국ITS학회 논문지
    • /
    • 제8권4호
    • /
    • pp.33-38
    • /
    • 2009
  • 본 논문은 자동차 오디오 시스템에 내장된 라디오에서 실시간으로 재생되는 연속적인 오디오 신호로부터 음악 신호를 선별하고, 해당 음악에 대한 실시간 음악장르 분류를 통해 자동으로 이퀄라이저를 조절하는 방식을 제안한다. 제안된 방식에서는 음악분류 정확도를 높이고 실시간 신호처리를 실행하기 위해 연속적인 오디오 신호로부터 추출한 음색 특징 벡터와 리듬 특징 벡터를 GMM (Gaussian mixture model) 분류 방식에 적용하여 음악 분류를 수행한다. 제안된 방식은 카오디오 시스템의 라디오로부터 출력된 오디오 신호로부터 분할된 다양한 오디오 구간을 5가지 음악장르로 분류하여 음악 장르 분류 성능을 측정하였다.

  • PDF

아날로그 음성, 비디오 및 오디오 신호의 비화방식

  • 이일우;조동호
    • 정보보호학회지
    • /
    • 제2권4호
    • /
    • pp.75-90
    • /
    • 1992
  • 본고는 아날로그 음성, 비디오 및 오디오 신호의 비화방식에 대한 연구로써 정보의 대부분을 구성하고 있는 음성, 그리고 앞으로 요구가 증가될 것으로 예견되는 위성 TV 및 CATV의 비디오와 오디오의 아날로그 비화방식의 종류 및 각각의 알고리즘에 대해 고찰하였다.

  • PDF

반향 오디오 워터마킹의 성능 향상 (Enhancement of Echo Audio Watermarking)

  • 오현오;윤대희;석종원;홍진우
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.227-230
    • /
    • 2001
  • 반향(Echo)을 이용한 워터마킹은 오디오 신호에 인위적인 반향을 첨가함으로써 정보를 삽입한다. 다른 오디오 워터마킹 방법과 마찬가지로 반향 오디오 워터마킹은 시간축 공격에 대해 강인하지 못한 단점을 가지고 있다. 특히, 오디오 신호의 피치를 보존하면서 재생 시간을 변형시키는 시간 스케일 변형 (Time Scale Modification)에 대해서는 별도의 방어를 위한 알고리듬이 없을 경우 전혀 복호화가 이뤄지지 않는다. 본 논문에서는 반향 오디오 워터마킹의 성능 향상을 위해 시간 스케일 변형 공격에 대응하여, 변형된 정도를 검출하고 보상하여 복호화가 가능하도록 하는 새로운 알고리듬을 제안한다.

  • PDF

디지털 오디오 방송 서비스를 위한 오디오 코덱의 구현 (Implementation of the Audio CODEC for Digital Audio Broadcasting Service)

  • 장대영;홍진우
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.66-71
    • /
    • 2001
  • 본 논문에서는 디지털 오디오 방송 시스템의 소스 부호화기로 사용하기 위한 AAC (MPEG-2 Advanced Audio Coding) 코덱 시스템의 개발에 관하여 기술한다. 인코더 및 디코더는 ETRI에서 제안한 디지털 오디오 방송 시스템에 접속하기 위해 MPEG-2 (moving Picture Exports Group Phase 2) 시스템의 TS(Transport Stream) 형식으로 입출력한다. 내부 오디오 신호처리를 위한 DSP (Digital Signal Processor)는 TI(Texas Instruments) 사의 TMS320C6701 (Floating point 166 MHz)을 사용하였으며, 인코더 에서는 DSP를 4개까지, 디코더에서는 3개까지 사용하여 구성할 수 있도록 설계하였다. DSP에서는 시스템 제어. 오디오 신호 입 력. 오디오 신호 처리, TS 신호 발생, 비트스트림 출력 등의 처리를 수행하며, 각 DSP는 직렬 및 병렬 접속에 의해 데이터를 전 달한다 현재 본 시스템을 사용하여 2채널의 AAC 코덱을 구현하였으며, 이후 본 시스템을 이용하여 멀티채널 AAC 코덱, MPEG-4 오디오 코덱을 구현할 예정이며. DAB 및 디지털 방송 분야에 활용될 것이다.

  • PDF

ARM 플랫폼 기반의 MP3 오디오 음질 향상 시스템 구현 (An Implementation of an ARM Platform based MP3 Sound Enhancement System)

  • 오상헌;박규식
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.70-75
    • /
    • 2007
  • 44.1kHz 샘플링 레이트의 표준 CD 음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서는 네트워크 대역폭과 저장 공간의 제한 점을 고려해야 한다. 이러한 제한은 MP3, AAC, OGG 등과 같은 오디오 신호 압축 코덱을 이용하여 해결할 수 있지만, 이러한 코덱들은 공통적으로 고 주파수(High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고주파수 손실은 결국 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생 할 수 있게 된다. 일반적으로 오디오 신호의 고 주파수 성분은 위치정보 와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 연구에서는 MP3 오디오 코덱으로 디코드(decode) 된 오디오 신호에서 손실된 고 주파수 대역의 정보를 효과적으로 추정 및 복원하는 ARM 플랫폼 기반의 MP3 오디오 음질향상 시스템을 구축하였다. 제안된 시스템과 기존의 대표적인 알고리즘인 Liu의 HFR 과의 비교실험을 통해 제안된 알고리즘이 신호 스펙트럼상에서 고주파 신호 추정 및 복원 능력이 우수함을 볼 수 있고, 알고리즘 연산량도 약 2배 정도 절약할 수 있었다.

인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템 (Soundtrack Search System for Interactive-Smart-Television)

  • 류상현;조재만;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.202-203
    • /
    • 2011
  • 본 논문에서는 인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템을 제안한다. 제안하는 시스템은 동영상을 오디오와 비디오특징을 구분한 후, 각 오디오와 비디오 신호를 분석한다. 비디오 신호의 분석은 MPEG-2 비디오 인코더로부터 영상의 장면전환과 시작과 끝 위치를 검출하고, 오디오 신호의 분석은 AC-3 오디오 인코더로부터 오디오 특징을 추출한 후, 오디오 정보의 비트 벡터를 추출하여 데이터베이스를 생성한다. 생성된 데이터베이스와 사용자가 북마크를 하여 요청한 쿼리와 비교를 통하여 오디오 특징정보가 유사한 부분의 장면을 검색하고, 검색된 장면을 사용자에게 제공한다. 제안된 시스템의 성능 측정을 위해서 뉴스, 패널토론, 음악방송, 광고, 드라마 등 50개 TV 방송 프로그램의 데이터베이스를 이용해서 정확성을 측정하였다.

  • PDF

DSP를 이용한 음성 및 오디오 시스템 설계

  • 김성수;조성호
    • 전기의세계
    • /
    • 제46권5호
    • /
    • pp.39-44
    • /
    • 1997
  • 현재 DSP는 음성 및 오디오 신호처리 시스템, 디지털 통신 시스템, 제어 시스템, 영상처리 시스템 등 많은 영역에 걸쳐 성공적으로 사용되고 있다. 몇가지 대표적인 활용분야를 살펴보면, 음성신호 압축 분야 [1-4], MPEG (moving picture expert group)과 같은 오디오신호 압축분야[5,6], 그리고 디지털 통신 시스템에서의 적응 반향제거기, 적응 동화기, 채널간섭 제거, 변복조기, 채널 코딩, 암호화기[7-14] 등에서도 DSP가 사용되고 있다. 그리고 수중 음향 신호처리[15], 디지털 필터 디자인, 전력 스펙트럼 추정, 수중 음향 신호처리 같은 디지털 신호처리 분야[16-23]와 적응 신호처리[24-26], 이외에도 능동 소음 제어기 및 적응 제어기와 같은 제어 시스템 [27]에도 유용하게 이용되고 있다. 또한 영상 압축, 디지털 방송, 의료기기 등과 같은 영상처리 분야[28-32] 및 그 밖의 많은 분야에서 DSP의 활용은 점점 커져가고 있는 추세이다.

  • PDF

동적 세그멘테이션을 이용한 폴리포닉 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Polyphonic Audio Signals Using Dynamic Segmentation Method)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.58-68
    • /
    • 2000
  • 본 논문에서는 폴리포닉 오디오 신호에 대한 정현파 모델링 방법을 제안한다. 정현화 모델링을 폴리포닉 오디오 신호에 적용하는데 있어서 가장 큰 문제점은 스펙트럼 분석을 위한 분석 윈도우의 크기를 결정할 수 없다는 것이다. 또한 고음질의 합성음을 위해서는 악기음의 특성을 결정짓는 어택이 잘 보존되어야 한다. 본 논문에서는 입력 신호를 6개의 옥타브 벤드 구조의 다중 해상도 필터 뱅크를 통과시키고, 각 서브벤드 신호에 대해 서로 다른 크기의 분석 윈도우를 적용시킴으로써 폴리포닉 오디오 신호에 대한 분석 윈도우 크기 결정 문제를 해결한다. 정현파 모델링에서 발생하는 어택과 같은 천이 구간에서의 퍼짐 현상을 개선하기 위해 각 서브밴드 신호에 동적 세그맨테이션 방법을 적용하여 천이 구간 근처에서는 분석과 합성 프레임 크기를 작게 하는 방법을 사용한다. 이 방법을 통해 서브밴드 신호의 구간별 시간-주파수 특성에 따라 적절한 크기의 윈도우를 선택할 수 있다. 동적 세그멘테이션 방법으로는 기존의 방법보다 계산량과 성능 면에서 더 나은 특성을 보이는 방법을 제안한다. 여러가지 폴리포닉 오디오 신호에 대한 시뮬레이션 결과 제안한 정현파 모델링 방법이 음질의 손상 없이 원래 신호를 잘 복원할 수 있음을 확인하였다.

  • PDF