• Title/Summary/Keyword: Sound Detection

검색결과 451건 처리시간 0.035초

심층신경망을 이용한 시간 영역 음향 이벤트 검출 알고리즘 (Time-domain Sound Event Detection Algorithm Using Deep Neural Network)

  • 김범준;문현기;박성욱;정영호;박영철
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.472-484
    • /
    • 2019
  • 본 논문에서는 심층신경망을 이용한 시간 영역 음향 이벤트 검출 알고리즘을 제시한다. 본 시스템에서는 주파수 영역으로 변환되지 않은 시간 영역의 음향 데이터를 심층신경망의 입력으로 사용한다. 전반적인 구조는 CRNN 구조를 사용하였으며, GLU, ResNet, Squeeze-and-excitation 블럭을 적용하였다. 그리고 여러 계층에서 추출된 특징을 함께 고려하는 구조를 제안하였다. 또한 본 연구에서는 강한 라벨이 있는 훈련 데이터를 확보하는 것이 현실적으로 어렵다는 전제 아래에서 약한 라벨이 있는 훈련 데이터 약간 그리고 다수의 라벨이 없는 훈련 데이터를 활용하여 훈련을 수행하였다. 적은 수의 훈련 데이터를 효과적으로 사용하기 위해 타임 스트레칭, 피치 변화, 동적 영역 압축, 블럭 혼합 등의 데이터 증강 방법을 적용하였다. 라벨이 없는 데이터에는 의사 라벨을 붙여 부족한 훈련 데이터를 보완하였다. 본 논문에서 제안한 신경망과 데이터 증강 방법을 사용하는 경우, 종래의 방식으로 CRNN 구조의 신경망을 훈련하여 사용하는 경우보다, 음향 이벤트 검출 성능이 약 6 % (f-score 기준)가 개선되었다.

스마트 강의 시스템을 위한 시간차 검출 방식의 실시간 음원 추적 기법 구현 (Implementation of Real-time Sound-location Tracking Method using TDoA for Smart Lecture System)

  • 강민수;오우진
    • 한국정보통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.708-717
    • /
    • 2017
  • 음원 추적은 지능형 CCTV, 화상회의시스템, 음성 명령 인식 등에서 널리 활용되고 있다. 본 논문에서는 스마트강의시스템에 적합한 천정 부착형 직교배열 마이크로 음성 신호의 도착 시간차인 TDoA(Time Difference of Arrival)를 이용하는 실시간 음원추적 기법을 제안한다. TDoA를 위한 점 음원과 평행음원 모델을 분석하고, 3개의 선형배열마이크를 이용하여 상호 상관 방안을 제안하였다. 또한 직교축에 십자 배열된 5개의 마이크를 사용하여 전방위(omni-direction)에서 음원 추적이 가능함을 보였다. 무음구간을 제거하기 위하여 수신 에너지를 이용하였으며 상호상관을 부호로 연산하여 계산량을 줄이고 추정 결과에 미디언 필터(Median Filter)를 적용하여 안정도를 높였다. 제안된 시스템은 고속 MCU인 TMS320F379D와 MEMs마이크 모듈로 구현하여, 방향 검출 성능이 백색잡음이나 음악 등에 대해서는 0.5도, 음성에 대해서는 6.5도의 정밀도를 보였다.

Reliable Sound Source Localization for Human Robot Interaction

  • Kim, Hyun-Don;Choi, Jong-Suk;Lee, Chang-Hoon;Kim, Mun-Sang
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1820-1825
    • /
    • 2004
  • In this paper, we propose a humanoid active audition system which detects the direction of sound and performs speech recognition using just three microphones. Compared with previous researches, this system comprises simpler algorithm and better amplifier system having advantages to increase a detectible distance of sound signal in spite of simple circuit. In order to verify our system's performance, we install the proposed active audition system to the home service robot, called Hombot II, which has been developed at the KIST (Korea Institute of Science and Technology), thus we confirm excellent performance by experimental results

  • PDF

영상음향의 구조가 수용자 감응도에 미치는 영향 (Analysis of Cognitive Psychology Creates in Sound Design Structure)

  • 유회종;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2007년도 동계학술대회
    • /
    • pp.35-40
    • /
    • 2007
  • 본 논문에서는 사운드디자이너가 주어진 영상조건 속에서 음원(sound source)을 어떻게 구성하고, 디자인하고, 믹싱하는가 에 따라 수용자의 그 감응도(감정적변화:sympathy response)와 인지도(이해와 기억도:acknowl-edgment)가 달라질 수 있는가를 분석하고자 한 것이다. 그 방법으로 영상음향의 구조에서 음악, 음향, 대사의 상호크기, 연결, 편집, 강조, 등을 달리한 영상 내에서 사운드디자인과 믹싱을 달리하여 실험하였으며 주관적평가방법과 뇌파변화측정방법 2가지로 하여 비교, 평가 분석하고자 했다. 사운드의 디자인구조가 수용자에게 미치는 영향도를 알아보는 이러한 연구는 영화, 방송 등 미디어사운드에서 사운드디자인 구조를 어떻게 만들어야 하는가? 에 대한 방법론적 정리에 기여할 것으로 기대된다.

  • PDF

자동차 실내 BSR 소음의 정량적 평가 (Assessment of BSR Noise in a Vehicle Cabine)

  • 신수현;김덕환;이광세;최영우
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2014년도 춘계학술대회 논문집
    • /
    • pp.662-663
    • /
    • 2014
  • In most vehicle manufactures have traditionally relied on find-fix method of human auditor, mainly due to variation excitation source. To solve the BSR noise, the requirements for BSR test are presented in terms of detection of noise source, analysis of time-frequency and sound pressure, sound quality for noise. A number of new technology direction, particularly in the field of noise source identification application and psycho-acoustics from the Zwicker's sound quality parameter, the computed objective sound metrics and subjective jury test result.

  • PDF

자동차용 판재의 프레스 가공시 방출되는 음향을 이용한 결함 검출에 관한 연구 (Research for Defect Detection Using Pressing Sound of Vehicle Plate)

  • 하성윤;최환도;이대훈;전언찬;김중완
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2003년도 춘계학술대회 논문집
    • /
    • pp.1113-1116
    • /
    • 2003
  • In this paper, it is suggested that the technology sound measurement which is to search the inferiority of the plate during the pressing. We evaluate whether there is a inferiority by analysing and comparing the satisfactory and inferior plate with the method of a spectrum analysis by measuring the sound which is emitted during pressing. We designed the analysis algorithm to detect inferior plate throughout comparison of measured sound data using FFT, DFT and DASYLab S/W. In addition to these, we suggest the way to compare both inferior and satisfactory signal statistically.

  • PDF

마이크로폰 어레이를 이용하여 차량 하부에서 발생한 결함의 위치를 찾아내는 방법 (A method to find the position of fault in a moving vehicle using microphone arrays)

  • 김양한;전종훈
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2006년도 추계학술대회 논문집
    • /
    • pp.144-151
    • /
    • 2006
  • Sound generated from a moving vehicle often carries information on the condition of vehicle, for example, whether it has faults or not, where the fault exists. The latter is possible especially by MFAH(moving frame acoustic holography) and beamforming method. MFAH is applicable to the sound source of pure tone or narrow band noise. For the beamforming method, we have to know what kind of wave the sound source radiates, for example, plane wave or spherical wave. That is, whether the above methods are applicable depends on the characteristics of sound source. To apply these methods to the fault detection, we have to know the characteristics of wave from faults. In this research, a machine diagnosis technique based on the above holographic approaches is introduced to find the position of faults. The signal due to faults is modeled based on the fact that the faults radiate impulsive noise, and analyzed in time and frequency domain. The way how MFAH and beamforming method can be used is introduced to find the position of source.

  • PDF

정사면체 마이크로폰 어레이 기반 최적 음원추적 시스템 (Optimal Acoustic Sound Localization System Based on a Tetrahedron-Shaped Microphone Array)

  • 오상헌;박규식
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.13-26
    • /
    • 2016
  • 본 연구에서는 임의 공간에서 정사면체 형태의 마이크로폰 어레이(microphone array)를 이용하여 음원(sound source)추적 성능을 개선할 수 있는 알고리즘을 제안하였다. 음원추적 시스템은 마이크로폰 어레이의 각 마이크로폰에 도착하는 음원신호의 도착 지연시간(TDOA, Time Delay Of Arrival) 정보를 이용하여 음원의 방향성 정보를 추정한다. 임의 3차원 공간에서 음원추적을 위해서는 최소 3개 이상의 마이크로폰이 필요하다. 3개 마이크로폰으로 구성된 음원추적 시스템의 경우 만약 1개의 마이크로폰이라도 신호 오차가 발생한다면 정확한 음원 방향성 추정이 불가능하다. 본 연구에서는 이러한 문제점을 개선하기 위하여 1개의 마이크로폰을 추가한 정사면체 형태(tetrahedron shaper)의 마이크로폰 어레이를 구성하고 좌표변환 기법을 이용하여 주변 잡음이나 오류에 강인한 새로운 음원추적 알고리즘을 제안하였다. 제안 알고리즘의 성능을 입증하기 위하여 3개의 마이크로폰을 이용한 삼각형 기반 음원추적 시스템과 본 연구에서 제안한 정사면체 기반 음원추적 시스템에 대하여 실시간 비교 실험을 수행하였으며, 실험 결과 제안된 정사면체 기반의 시스템이 최대 약 16% 이상의 향상된 검출율을 보였다.

능동 소나 체계에서의 표적 탐지거리 예측 알고리즘과 최적 탐지깊이 결정에의 응용 (Detection Range Estimation Algorithm for Active SONAR System and Application to the Determination of Optimal Search Depth)

  • 박재은;김재수
    • 한국해양공학회지
    • /
    • 제8권1호
    • /
    • pp.62-70
    • /
    • 1994
  • In order to estimate the detection range of a active SONAR system, the SONAR equation is commonly used. In this paper, an algorithm to calculate detection range in active SONAR system as function of SONAR depth and target depth is presented. For given SONAR parameters and environment, the transmission loss and background level are found, signal excess is computed. Using log-normal distribution, signal excess is converted to detection probability at each range. Then, the detection range is obtained by integrating the detection probability as function of range for each depth. The proposed algorithm have been applied to the case of omni-directional source with center frequency 30Hz for summer and winter sound profiles. It is found that the optimal search depth is the source depth since the detection range increase at source depth where the signal excess is maximized.

  • PDF

전자청진 시스템을 위한 증폭기의 개발 및 심음 신호 분석 (Development of an Amplifier for Electronic Stethoscope System and Heart Sound Analysis)

  • 김동준;강동기
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제50권5호
    • /
    • pp.241-246
    • /
    • 2001
  • The conventional stethoscope can not store its stethoscopic sounds. Therefor a doctor diagnoses a patient with instantaneous stethoscopic sounds at that time, and he can not remember the state of the patient's stethoscopic sounds on the next. This prevent accurate and objective diagnosis. If the electronic stethoscope, which can store the stethoscopic sound, is developed, the auscultation will be greatly improved. This study describes an amplifier for electronic stethoscope system that can extract heart sounds of fetus as well as adult and alow us hear and record the sounds. Using the developed stethoscopic amplifier, clean heart sounds of fetus and adult can be heard in noisy environment, such as a consultation room of a university hospital, a laboratory of a university. Surprisingly, the heart sound of a 22-week fetus was heard through the developed electronic stethoscope. Pitch detection experiments using the detected heart sounds showed that the signal represents distinct periodicity. It can be expected that the developed electronic stethoscope can substitute for conventional stethoscopes and if proper analysis method for the stethoscopic signal is developed, a good electronic stethoscope system can be produced.

  • PDF