• 제목/요약/키워드: 오디오 판별

검색결과 13건 처리시간 0.038초

다중 오디오 특징을 이용한 유해 동영상의 판별 (Classification of Phornographic Video with using the Features of Multiple Audio)

  • 김정수;정명범;성보경;권진만;구광효;고일주
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.522-525
    • /
    • 2009
  • 본 논문에서는 인터넷의 역기능으로 현대 사회에 큰 문제를 야기 시키는 음란성 유해 동영상을 내용기반으로 판별하기 위한 방법을 제안하였다. 유해 동영상에서 오디오 데이터를 이용하여 특징을 추출하였다. 사용된 오디오 특징은 주파수 스펙트럼, 자기상관, MFCC이다. 음란성의 내용이 될 수 있는 소리의 특징을 추출하였고 동영상 전체 오디오에서 해당 소리의 특징과 일치하는지를 측정하여 유해성을 판별하였다. 제안한 방법의 실험은 각 특징마다 유해 판별 측정 결과와 다중 특징을 이용한 측정 결과를 비교 수행하였다. 하나의 오디오 특징만을 추출하여 사용하였을 때 보다 다중 특징의 사용이 좋은 결과를 얻을 수 있었다.

  • PDF

음원을 이용한 멀티미디어 휴대용 단말장치 판별 (Hand-held Multimedia Device Identification Based on Audio Source)

  • 이명환;장태웅;문창배;김병만;오득환
    • 한국산업정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.73-83
    • /
    • 2014
  • 다양한 오디오 편집 기술이 개발됨으로써 오디오 데이터의 변경이 보다 쉬워지고 그 결과로 위변조 같은 다양한 사회 문제가 발생하고 있다. 현재 이런 문제를 해결하기 위해 디지털 포렌식 기술이 활발히 연구되어지고 있다. 본 논문에서는 이러한 디지털 포렌식 기술 중의 하나로 모바일 기기를 판별하는 방법을 제안하였다. 제안 방법에서는 사람에게는 들리지 않지만 기기의 디자인과 IC로부터 발생하는 노이즈 특징을 이용한다. 위너필터를 사용하여 기기의 노이즈 음을 추출하고 MIRtoolbox를 이용하여 특징들을 추출한 후 이를 다층 신경망에 학습시켜 기기를 판별한다. 총 6개의 모바일 기기를 사용하였으며 5-fold test를 통하여 99.9%의 판별 성능을 보였다. 또한 UCC 사이트에 업로드 된 데이터에서도 노이즈 음을 통한 판별이 가능한지 실험을 진행하였으며 99.8%의 판별 성능을 보였다.

오디오 딥러닝을 활용한 Al, Steel 소재의 절삭 깊이에 따른 오디오 판별 (A Study on Acoustic Signal Characterization for Al and Steel Machining by Audio Deep Learning)

  • 김태원;이영민;최해운
    • 한국기계가공학회지
    • /
    • 제20권7호
    • /
    • pp.72-79
    • /
    • 2021
  • This study reports on the experiment of using deep learning algorithms to determine the machining process of aluminium and steel. A face cutting milling tool was used for machining and the cutting speed was set between 3 and 4 mm/s. Both materials were machined with a depth to 0.5mm and 1.0mm. To demonstrate the developed deep learning algorithm, simulation experiments were performed using the VGGish algorithm in MATLAB toobox. Downcutting was used to cut aluminum and steel as a machining process for high quality and precise learning. As a result of learning algorithms using audio data, 61%-99% accuracy was obtained in four categories: Al 0.5mm, Al 1.0mm, Steel 0.5mm and Steel 1.0mm. Audio discrimination using deep learning is derived as a probabilistic result.

다자간 영상통화의 오디오 게인콘트롤을 위한 저연산 음성분류방식 (Multi-party video telephony of audio gain control for low computation voice classification method)

  • 류상현;김형국
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2012년도 춘계학술발표대회논문집
    • /
    • pp.349-350
    • /
    • 2012
  • 본 논문에서는 다자간 영상통화의 오디오 게인콘트롤을 위한 저연산 음성분류방식을 제안한다. 제안된 음성분류방식은 입력되는 음성신호를 음성신호의 특징에 따라서 묵음/무성음/유성음으로 분류한다. 입력된 음성신호의 에너지를 이용해서 음성구간과 비음성구간을 판별한다. 음성구간으로 판별된 구간에 대해서 ZCR(Zeor Crossing Rate)를 이용하여 유성음과 무성음으로 분류한다. 제안된 방식의 성능을 측정을 위해 음성분류 정확도와 연산시간을 측정하여 성능을 측정하였다.

  • PDF

FM 라디오 환경에서의 실시간 음악 판별 시스템 구현 (Implementation of Music Signals Discrimination System for FM Broadcasting)

  • 강현우
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.151-156
    • /
    • 2009
  • 본 연구에서는 GMM 기반의 음성/음악 판별 방법을 응용하여 FM 라디오 방송에서 순수한 음악 구간만을 판별하는 시스템을 구현하였다. 본 시스템에서는 음성, 음악, 광고 음악, 기타 여러 가지 사운드가 혼합되어 있는 오디오 방송 프로그램에서 순수한 음악만을 판별하여 자동으로 저장하고자 한다. 음악의 시작 부분과 끝 부분을 보다 정교하게 검출하고자 순수한 음악으로 판별된 구간의 시작 부분과 끝 부분에 대해 후처리 과정을 추가하였다. PC 환경에서 FM 라디오 방송을 이용하여 구현된 시스템을 실시간으로 테스트한 결과 우수한 성능을 보임을 확인하였다. 또한 SoC 구현을 고려하여 고정소수점 연산을 수행한 결과 3MIPS 이하의 적은 연산량으로 부동소수점 연산일 때와 동일한 결과를 얻을수 있었다.

FM 방송 중 블록 단위 음성 음악 판별 시스템의 설계 및 구현 (Design and Implementation of Speech Music Discrimination System per Block Unit on FM Radio Broadcast)

  • 장현종;엄정권;임준식
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.25-28
    • /
    • 2007
  • 본 논문은 FM 라디오 방송의 오디오 신호를 블록 단위로 음성 음악을 판별하는 시스템을 제안하는 논문이다. 본 논문에서는 음성 음악 판별 시스템을 구축하기 위해 다양한 특정 파라미터와 분류 알고리즘을 제안 한다. 특정 파라미터는 신호처리 분야(Centroid, Rolloff, Flux, ZCR, Low Energy), 음성 인식 분야(LPC, MFCC), 음악 분석 분야(MPitch, Beat)에서 각각 사용되는 파라미터를 사용하였으며 분류 알고리즘으로는 패턴인식 분야(GMM, KNN, BP)와 퍼지 신경망(ANFIS)을 사용하였고, 거리 구현은 Mahalanobis 거리를 사용하였다.

  • PDF

가변 전송율 MPEG 오디오 (Variable Bitrate MPEG Audio)

  • 남승현
    • 공학논문집
    • /
    • 제2권1호
    • /
    • pp.57-62
    • /
    • 1997
  • MPEG-1에서 사용하고 있는 두가지 심리음향모델은 서로 다른 매스킹 패턴과 매스킹 인덱스 그리고 매스킹 레벨의 산출 과정을 거친다. 결과적으로 모델 1은 우수한 순음/잡음 판별로 인하여 정확한 매스킹 레벨을 산출하지만 SMR 산출에 worst case를 가정하고 오디오 신호의 동적인 상태를 무시하기 때문에 모델 2보다 저하된 성능을 보여주는 것으로 밝혀졌다. 본 연구에서는 고정 전송율로 설계된 MPEG-1 오디오를 가변 전송율로 변환하였을 때 심리음향모델 1과 2의 성능이 어떻게 나타나는지에 대해 알아보았다. 모의 실험 결과 모델 2는 1에 비해 dual channel 모드에서 평균 30kbps, joint stereo 모드에서 평균 20 kbps 정도 이득을 제공하는 것으로 나타났다. 일반적으로 joint stereo 모드는 dual channel 모드에 비해 많은 이득을 제공하는 것으로 알려져 있는데, 이러한 현상은 attack이 많은 오디오 신호의 경우 모델 1에서 더 심하게 나타남을 알 수 있다. 이는 모델 1이 pre-echo를 줄이기위해 각 채널에서 과도하게 SMR을 산출하기 때문이다.

  • PDF

음성 확성을 위한 하울링 신호 자동 검출기법 연구 (A Study on the Automatic Howling Signal Detection Algorithm for Speech Sound Reinforcement)

  • 김경택;김동규;노용완;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.246-249
    • /
    • 2005
  • 음향 시스템에 있어서 하울링 현상은 음성 레벨을 제한함으로써 음성의 명료도를 저하시키는 주된 요인이다. 그리고 이를 해결하기 위한 방법으로 하울링 주파수 대역의 게인을 낮추어 음향신호의 피드백을 최소화 하는 것이 일반적이기 때문에 하울링 주파수를 찾아내는 것이 하울링 제어에 있어서 가장 핵심적인 요소가 된다. 그래서 본 논문에서는 하울링 주파수를 자동으로 검출할 수 있는 기법을 제시하였다. 이는 외부로부터 입력된 오디오신호가 하울링 신호 특성을 만족하는 정도를 ‘하울링 지수’라는 파라메터로 정의한 후 이를 기준으로 하울링 발생여부를 판단하고 하울링으로 판별된 신호의 최대 진폭을 갖는 주파수를 하울링 주파수로 출력하는 기법이다. 본 하울링 신호 자동 검출기법의 내용을 검증하기 위하여 하울링 자동 검출 프로그램을 제작하여 실험을 수행한 결과 전체 하울링 신호의 95% 이상을 검출할 수 있었다.

  • PDF

오디오 신호에 기반한 음란 동영상 판별 (Classification of Phornographic Videos Based on the Audio Information)

  • 김봉완;최대림;이용주
    • 대한음성학회지:말소리
    • /
    • 제63호
    • /
    • pp.139-151
    • /
    • 2007
  • As the Internet becomes prevalent in our lives, harmful contents, such as phornographic videos, have been increasing on the Internet, which has become a very serious problem. To prevent such an event, there are many filtering systems mainly based on the keyword-or image-based methods. The main purpose of this paper is to devise a system that classifies pornographic videos based on the audio information. We use the mel-cepstrum modulation energy (MCME) which is a modulation energy calculated on the time trajectory of the mel-frequency cepstral coefficients (MFCC) as well as the MFCC as the feature vector. For the classifier, we use the well-known Gaussian mixture model (GMM). The experimental results showed that the proposed system effectively classified 98.3% of pornographic data and 99.8% of non-pornographic data. We expect the proposed method can be applied to the more accurate classification system which uses both video and audio information.

  • PDF

방송 오디오 신호로부터 음악 신호 검출에 관한 연구 (A Study of Automatic Detection of Music Signal from Broadcasting Audio Signal)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.81-88
    • /
    • 2010
  • 본 논문에서는 실제 방송 환경에 적용 가능한 방송용 음원 모니터링 시스템을 구축하기 위한 사전연구로 방송 오디오 신호로부터 음악신호 구간을 자동으로 검출할 수 있는 시스템을 제안하였다. 음악구간과 비음악구간의 구분을 위한 특징으로는 사람의 음성 발화 특성을 반영하여 에너지 표준편차와 log 에너지 표준편차 그리고 log 에너지 평균 등 3개의 간단한 시간영역 특징들을 사용하였으며 최종 음악신호 구간 판별은 각 에너지 한계값(threshold)을 이용한 Rule-base 분류를 기반으로 하였다. 실제 FM 라디오 방송 신호를 24시간 녹음하여 진행한 모의실험에서 음악구간 인식률은 96%, 비-음악구간 인식률은 87%를 나타내어 방송용 음원 모니터링 시스템의 전처리기로 손색이 없음을 확인할 수 있었다.