• 제목/요약/키워드: Speech/music discrimination

검색결과 26건 처리시간 0.02초

방송 오디오 신호로부터 음악 신호 검출에 관한 연구 (A Study of Automatic Detection of Music Signal from Broadcasting Audio Signal)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.81-88
    • /
    • 2010
  • 본 논문에서는 실제 방송 환경에 적용 가능한 방송용 음원 모니터링 시스템을 구축하기 위한 사전연구로 방송 오디오 신호로부터 음악신호 구간을 자동으로 검출할 수 있는 시스템을 제안하였다. 음악구간과 비음악구간의 구분을 위한 특징으로는 사람의 음성 발화 특성을 반영하여 에너지 표준편차와 log 에너지 표준편차 그리고 log 에너지 평균 등 3개의 간단한 시간영역 특징들을 사용하였으며 최종 음악신호 구간 판별은 각 에너지 한계값(threshold)을 이용한 Rule-base 분류를 기반으로 하였다. 실제 FM 라디오 방송 신호를 24시간 녹음하여 진행한 모의실험에서 음악구간 인식률은 96%, 비-음악구간 인식률은 87%를 나타내어 방송용 음원 모니터링 시스템의 전처리기로 손색이 없음을 확인할 수 있었다.

사운드 분류기를 이용한 영상검색에 관한 연구 (A Study on Image Retrieval Using Sound Classifier)

  • 김승한;이명순;노승용
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년 학술대회 논문집 정보 및 제어부문
    • /
    • pp.419-421
    • /
    • 2006
  • The importance of automatic discrimination image data has evolved as a research topic over recent years. We have used forward neural network as a classifier using sound data features within image data, our initial tests have shown encouraging results that indicate the viability of our approach.

  • PDF

실시간 FM 방송중 음악/음성 검출에 관한 연구 (A Study on Real-time Discrimination of FM Radio Broadcast Speech/Music)

  • 황진만;강동욱;김기두
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2136-2139
    • /
    • 2003
  • 본 논문은 FM 라디오 방송중의 오디오 신호를 블록단위로 음악 및 음성을 검출하는 알고리즘에 대한 것으로, 이를 기반으로 방송중의 노래(가요, 팝, 클래식‥‥)만을 자동으로 인식하여 녹음하는 알고리즘을 개발한다. 본 논문에서는 기존에 제안되었던 것[1-4]과 같이 단지 음악과 음성을 구분함과 동시에 음악구간의 논리적 조합으로 이루어진 노래를 자동으로 인식하여 녹음하는 것을 알고리즘의 최종 목표로 한다. 알고리즘의 접근 역시 기존의 음소단위의 모델링을 거치는 GMM 기반의 접근이 아니기 때문에 모델링에 대한 훈련과정이 필요 없고, 시간영역에서의 오디오신호가 가지고 있는 직관적인 특징을 분석함으로써 비교적 적은 연산으로 실시간 구현이 가능하다.

  • PDF

인공와우이식 난청인의 말소리 운율변화에 따른 구어 이해와 음도 변별, 선율윤곽 확인 간 관련성 (The Relationship Between Perception of Prosody, Pitch Discrimination, and Melodic Contour Identification in Cochlear Implants Recipients)

  • 김은연;문일준;조양선;정원호;홍성화
    • 인간행동과 음악연구
    • /
    • 제14권2호
    • /
    • pp.1-18
    • /
    • 2017
  • 본 연구에서는 인공와우이식 난청인(N = 15)을 대상으로 말소리 운율변화에 따른 구어 이해와 음도 변별, 선율윤곽 확인(Melodic contour identification: MCI) 간 관련성을 살펴보았다. 말소리 운율 변화에 따른 구어이해를 살펴보기 위해 말소리 운율지각 검사를 시행하였고, 긍정적인 운율과 부정적인 운율 조건에 따른 의미 변화를 피검자에게 판단하게 하였다. 검사 시 긍정적인 의미(Positive meaning: PW)와 중립적인 의미(Neutral meaning: NW)를 갖는 낱말 및 낱말 조합 형태를 제시하고, 긍정적인 운율과 부정적인 운율 조건에 따른 의미 변화를 피검자에게 판단하게 하였다. 음도 변별 검사를 위해서는 단음도 변화 변별 과제와 3개 음으로 구성된 패턴에서의 음도 변별 과제가 실시되었다. MCI 검사는 기대 확률을 달리한 세부 검사 1, 2로 구성하여 시행하였다. 실시한 검사 간 관련성을 살펴본 결과, 말소리 운율지각 검사 결과는 보청기 착용으로도 청지각적 이득을 기대할 수 없었던 기간과 유의한 관련성을 보였다. PW와 NW 검사에서 운율 조건에 따라 유의한 수행 차를 보였지만, 단어조합 형태에 따른 통계적 유의성은 발견하지 못하였다. 말소리 운율지각 검사 결과는 MCI 1과 유의한 상관을 보인 반면(p < .01), 말지각 검사 수행력과는 유의한 관련성을 보이지 않았다. 이는 인공와우이식 후 시각적 단서 없이 말소리, 음소 지각이 가능해졌다 하더라도 미묘한 운율 변화에 따른 의미 지각의 제한은 계속될 수 있음을 시사한다. 또한 인공와우이식 후 선율윤곽 변화 확인은 음도 변별에 비해 제한을 보이며, 운율지각과 관련 있음을 확인할 수 있었다.

음성/음악 분류를 위한 특징 비교 (The Comparison of features for Speech/Music Discrimination)

  • 이경록;서봉수;김진영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.157-160
    • /
    • 2000
  • 본 논문에서는 멀티미디어 정보에서 원하는 정보를 추출하는 멀티미디어 인덱싱 중 오디오 인덱싱의 전처리 부격인 음성/음악 분류실험을 하였다. 오디오 인덱싱에 있어서 음성/음악 분류기는 원 오디오 신호에서 정보를 가진 음성 부분을 분리하는 역할을 한다. 실험에서는 음성/음악 분류에서 널리 쓰이는 멜캡스트럼(Mel Cepstrum), 정규화 로그 에너지(normalized log energy), 영교차(Zero-Crossings)를 특징 파라미터로 사용하였다[l, 2, 3]. 특징공간은 GMM(Gaussian Mixture Model)에 의해 모델링 되었고, 오디오 신호의 분류는 각각 3가지 분류항목(음성, 음악, 음성+음악)과 2가지 분류항목(음성, 음악)을 적용하였다. 실험결과 3가지 분류항목 적용시와 2가지 분류항목 적용시 모두 멜캡스트럼을 사용하였을 때 가장 좋은 결과를 보였다.

  • PDF