• 제목/요약/키워드: Sound Signal

검색결과 898건 처리시간 0.026초

토널 특성을 이용한 브라인드 오디오 워터마킹 (A Blind Audio Watermarking using the Tonal Characteristic)

  • 이희숙;이우선
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.816-823
    • /
    • 2003
  • 이 논문에서는 토널 특성을 이용한 브라인드 오디오 워터마킹을 제안한다. 먼저 기존의 심리음향연구를 통해 토널의 인지영향에 대해 살펴보고, 토널 성분이 여러 신호처리 후 변동측면에서 매우 안정적인 특성을 가짐을 다른 워터마크에 이용되는 특성들과 비교하여 보였다. 이를 기반으로 토널 마스커를 구성하는 주파수 신호들의 관계를 이용한 브라인드 오디 오 워터마킹(blind audio watermarking) 기법을 제안하였다. 이 기법이 적용된 오디오에 대한 SDG(Subjective Diff-Grades) 음질평가에서 평균 SDG 0.27의 결과를 얻었고 이는 비지각성 면에서 토널의 인지 영향을 이용한 워터마킹이 유용하다고 볼 수 있다. 또한 time shift를 제외한 여러 신호처리 후의 워터마크 추출 결과는 98%이상으로 제안한 워터마킹의 강인성을 보였다. Time shift처리에 대해서는 시간 축 상에서 최적의 위치를 찾아 추출하는 새로운 방법을 적용하여 추출율 90%의 결과를 얻었다.

  • PDF

차량 잡음 환경에서 엔트로피 기반의 음성 구간 검출 (Voice Activity Detection Based on Entropy in Noisy Car Environment)

  • 노용완;이규범;이우석;홍광석
    • 융합신호처리학회논문지
    • /
    • 제9권2호
    • /
    • pp.121-128
    • /
    • 2008
  • 정확한 음성 구간 검출은 음성 인식 및 음성 코딩 그리고 음성 통신 시스템 등과 같은 음성 어플리케이션의 성능에 큰 영향을 미친다. 본 논문에서는 실제 운전하고 있는 상태에서 다양한 차량 노이즈 환경의 음성 구간 검출 방법을 제안한다. 기존의 음성 구간 검출은 시간 에너지, 주파수 에너지, 영 교차율, spectral entropy 등 다양한 방법을 사용하였으며 잡음 환경에서 급격하게 성능이 저하되는 단점이 있었다. 본 논문에서는 기존의 spectral entropy를 기반으로 하여 MFB(Mel-frequency Filter Banks) spectral entropy, 기울기 FFT(Fast Fourier Transform) spectral entropy, 기울기 MFB spectral entropy를 이용한 음성 구간 검출 방법을 제안한다. MFB는 멜 스케일과 FFT를 곱한 것으로 멜 스케일은 인간이 소리를 인지할 때 주파수에 대해 비선형적인 스케일이며 음성의 특징을 잘 반영한다. 제안한 MFB spectral entropy 방법은 다양한 차량 잡음 환경에서 음성 및 비음성 분별 능력을 향상시킬 수 있으며 실험 결과 93.21%의 음성 구간 검출율을 나타내었다. 이는 기존의 spectral entropy 방법과 비교할 때 MFB를 이용한 음성 구간 검출 방법이 3.2%의 검출율이 향상되었다.

  • PDF

신경회로망 기반 고장 진단 시스템을 위한 고장 신호별 특징 벡터 결정 방법 (Feature Vector Decision Method of Various Fault Signals for Neural-network-based Fault Diagnosis System)

  • 한형섭;조상진;정의필
    • 한국소음진동공학회논문집
    • /
    • 제20권11호
    • /
    • pp.1009-1017
    • /
    • 2010
  • As rotating machines play an important role in industrial applications such as aeronautical, naval and automotive industries, many researchers have developed various condition monitoring system and fault diagnosis system by applying various techniques such as signal processing and pattern recognition. Recently, fault diagnosis systems using artificial neural network have been proposed. For effective fault diagnosis, this paper used MLP(multi-layer perceptron) network which is widely used in pattern classification. Since using obtained signals without preprocessing as inputs of neural network can decrease performance of fault classification, it is very important to extract significant features of captured signals and to apply suitable features into diagnosis system according to the kinds of obtained signals. Therefore, this paper proposes the decision method of the proper feature vectors about each fault signal for neural-network-based fault diagnosis system. We applied LPC coefficients, maximum magnitudes of each spectral section in FFT and RMS(root mean square) and variance of wavelet coefficients as feature vectors and selected appropriate feature vectors as comparing error ratios of fault diagnosis for sound, vibration and current fault signals. From experiment results, LPC coefficients and maximum magnitudes of each spectral section showed 100 % diagnosis ratios for each fault and the method using wavelet coefficients had noise-robust characteristic.

스펙트럼 변조를 이용한 청각정보의 촉감재현 가능성 연구 (Feasibility Study on Audio-Tactile Display via Spectral Modulation)

  • 곽현구;김희국;정주노;강대임;박연규;구민모
    • 한국정밀공학회지
    • /
    • 제28권5호
    • /
    • pp.638-647
    • /
    • 2011
  • Various approaches directly using vibrations of speakers have been suggested to effectively display the aural information such as the music to the hearing-impaired or the deaf. However, in these approaches, the human can't sense the frequency information over the maximum perceivable vibro-tactile frequency (around 1kHz). Therefore, in this study, an approach via spectral modulation of compressing the high frequency audio information into perceivable vibro-tactile frequency domain and outputting the modulated signals through the designated speakers is proposed. Then it is shown, through simulations of using Short-Time Fourier Transform (STFT) with Hanning windows and through preliminary experiments of using the vibro-tactile display testbed which is built and interfaced with a notebook PC, that the modulated signal of a natural sound composing sounds of a frog, a bird, and a water stream could produce the noise-free signal suitable enough for vibro-tactile speakers without causing Significant interfering disturbances, Lastly, for three different combinations of information provided to the subject, that is, i) with only video image, ii) with video image along with the modulated vibro-tactile stimuli as proposed in this study to the forearm of the subject, and iii) with video image along with full audio information, the effects to the human sense of reality and his emotion to given audio-video clips including various sounds and images are investigated and compared. It is shown from results of those experiments that the proposed method of providing modulated vibro-tactile stimuli along with the video images to the human has very high feasibility to transmit pseudo-aural sense to the human.

멀티 모달 감정인식 시스템 기반 상황인식 서비스 추론 기술 개발 (Development of Context Awareness and Service Reasoning Technique for Handicapped People)

  • 고광은;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제19권1호
    • /
    • pp.34-39
    • /
    • 2009
  • 사람의 감정은 주관적인 인식 작용으로서 충동적인 성향을 띄고 있으며 무의식중의 사람의 욕구와 의도를 표현하고 있다. 이는 유비쿼터스 컴퓨팅 환경이나 지능형 로봇의 사용자가 처한 환경의 상황정보 중에서 사용자의 의도를 가장 많이 포함하고 있는 정보라고 할 수 있다. 이러한 사용자의 감정을 파악할 수 있는 지표는 사람의 얼굴 영상에서의 표정과 음성신호에서의 Spectrum 통계치 및 생체신호(근전위, 뇌파, 등)등 이다. 본 논문에서는 감정인식 활용의 편의와 효율성 향상을 주목적으로 하여 사용자의 얼굴 영상과 음성을 이용한 감정인식에 대하여 개별 결과물만을 산출하고 그 인식률을 검토한다. 또한 임의의 상황에서의 인식률 향상을 위하여 영상과 음성의 특징을 기반으로 최적의 특징 정보들을 구별해 내고, 각각의 개별 감정 특징에 대한 융합을 시도하는 특징 융합 기반의 Multi-Modal 감정인식 기법을 구현한다. 최종적으로 감정인식 결과를 이용하여 유비쿼터스 컴퓨팅 환경에서 발생 가능한 상황 설정 시나리오와 베이지만 네트워크를 통해 유비쿼터스 컴퓨팅 서비스의 확률 추론 가능성을 제시하고자 한다.

신경망과 LPC 계수를 이용한 고래 소리의 분류 (Classification of Whale Sounds using LPC and Neural Networks)

  • 안우진;이응재;김남규;정의필
    • 융합신호처리학회논문지
    • /
    • 제18권2호
    • /
    • pp.43-48
    • /
    • 2017
  • 수중천이신호는 복잡하고 시변, 비선형 및 짧은 지속성의 특성을 지니고 있어서 기준패턴으로 모델링하기가 어렵다. 본 논문에서는 이러한 신호들을 프레임간의 중첩을 허용하는 일정한 짧은 신호로 잘라서 분석한다. 더빈 알고리듬을 이용하여 20차의 선형예측계수(LPC)를 프레임마다 추출하여 2층 은닉신경망회로의 입력신호로 사용한다. 추출된 선형예측계수들의 65%는 신경망구조의 학습에 이용되고 35%는 시험용 입력신호로 사용된다. 고래소리 분류에 사용된 고래 종류는 대왕고래, 들쇠고래, 귀신고래, 혹등고래, 밍크고래, 북방긴수염고래 등이다. 결과적으로 이러한 시험용의 신호들로부터 83%이상의 고래 소리 평균 분류율을 얻을 수 있었다.

  • PDF

피부에 의한 이득 감쇠를 줄이기 위한 FEA 시뮬레이션 기반의 이식형 마이크로폰 설계 및 구현 (Design and Fabrication of an Implantable Microphone for Reduction of Skin Damping Effect through FEA Simulation)

  • 한지훈;김민우;김동욱;성기웅;조성목;박일용;조진호
    • 대한의용생체공학회:의공학회지
    • /
    • 제29권1호
    • /
    • pp.59-65
    • /
    • 2008
  • Nowadays, implantable hearing aids have been developed to solve the problems of conventional hearing aids. In case of fully implantable hearing aids, an implantable microphone is necessary to receive sound signal beneath the skin. Normally, an implantable microphone has poor frequency response characteristics in high frequency bands of acoustic signal due to the high frequency attenuation effect of skin after implantation to human body. In this paper, the implantable microphone is designed to reduce the high frequency attenuation effect of a skin by putting its resonance frequency at the attenuated range through a finite element analysis (FEA) simulation. The designed implantable microphone through the simulated results has been fabricated by manufacturing process using bio-compatible materials. By the several in-vitro experiments with pig skin, it has been verified that the designed implantable microphone has a resonance frequency around the starting part of the attenuated range and reduces the attenuation effect.

키넥트를 이용한 가상 바이올린 구현 (Implementation of Virtual Violin with a Kinect)

  • 신영규;강동길;이정철
    • 융합신호처리학회논문지
    • /
    • 제15권3호
    • /
    • pp.85-90
    • /
    • 2014
  • 본 논문에서는 키넥트의 3차원 영상정보를 이용하여 종이 바이올린 지판과 손가락 끝점을 검출하고 활 움직임을 판정한 뒤, 이 정보를 이용하여 가상 바이올린을 구현하는 방법을 제안한다. 키넥트의 컬러영상과 깊이영상을 이용하여 먼저 바이올린 지판을 식별하고 손가락 끝점을 검출한 뒤 지판 정보와 사용자의 지판 누름 여부를 판정하기 위한 지판의 깊이 정보를 검출한다. 운지와 활 움직임 정보에서 음이름을 판정하여 PC MIDI 인터페이스를 통해 가상 바이올린 연주 시스템을 구현하였다. 본 논문에서 제안하는 방법을 이용하여 가상 바이올린 성능평가를 수행한 결과 높은 검출 정확도를 보였다. 구현된 가상 바이올린 기능을 활용하여 바이올린 연주 입력장치를 구현함으로써 PC기반 바이올린 연주시스템 구현의 편리성을 보였으며 악기 초보자가 PC 기반 바이올린 연주 학습에 사용자 인터페이스로 활용할 수 있는 가능성을 확인하였다.

PNCC와 robust Mel-log filter bank 특징을 결합한 조류 울음소리 분류 (Bird sounds classification by combining PNCC and robust Mel-log filter bank features)

  • 알자흐라 바디;고경득;고한석
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.39-46
    • /
    • 2019
  • 본 논문에서는 합성곱 신경망(Convolutional Neural Network, CNN) 구조를 이용하여 잡음 환경에서 음향신호를 분류할 때, 인식률을 높이는 결합 특징을 제안한다. 반면, Wiener filter를 이용한 강인한 log Mel-filter bank와 PNCCs(Power Normalized Cepstral Coefficients)는 CNN 구조의 입력으로 사용되는 2차원 특징을 형성하기 위해 추출됐다. 자연환경에서 43종의 조류 울음소리를 포함한 ebird 데이터베이스는 분류 실험을 위해 사용됐다. 잡음 환경에서 결합 특징의 성능을 평가하기 위해 ebird 데이터베이스를 3종류의 잡음을 이용하여 4개의 다른 SNR (Signal to Noise Ratio)(20 dB, 10 dB, 5 dB, 0 dB)로 합성했다. 결합 특징은 Wiener filter를 적용한 log-Mel filter bank, 적용하지 않은 log-Mel filter bank, 그리고 PNCC와 성능을 비교했다. 결합 특징은 잡음이 없는 환경에서 1.34 % 인식률 향상으로 다른 특징에 비해 높은 성능을 보였다. 추가적으로, 4단계 SNR의 잡음 환경에서 인식률은 shop 잡음 환경과 schoolyard 잡음 환경에서 각각 1.06 %, 0.65 % 향상했다.

초등학교 저학년 교실의 실내음향성능 실태조사 (Investigation of the Acoustic Performance of Lower Grade Elementary School Classrooms)

  • 조아현;박찬재;한찬훈
    • 교육시설 논문지
    • /
    • 제28권3호
    • /
    • pp.3-14
    • /
    • 2021
  • Speech information of teachers is transmitted to students in classrooms so that appropriate aural environment should be provided for academic purposes. Many researches have been undertaken for classroom acoustics, and acoustic standards of domestic classrooms were suggested based on the reverberation time and background noise level. However, these standards are suitable for middle and high schools and so not consider the auditory ability by ages. As a precedent research, the present study was begun to suggest an acoustic standard for lower grade elementary school classrooms with children under age 9 who have not normal auditory ability. In order to do this, acoustic performances of the lower grade classrooms were measured and compared with the general classrooms. Also, change of acoustic parameters depending on the desk layout was measured and analyzed. The measured acoustic parameters were background noise, signal to noise ratio, RT, STI, D50, and IACC. As a result, it was found that background noise is exceed the standard of 35dB(A) at the schools along the road sides. Also, it was shown that most of acoustic parameters are higher in the classrooms built recently rather than the old classrooms. Generally, there are not much difference of acoustic parameters among the various desk layouts but, better acoustic performances are acquired at the center line and the seats near sound source. Also, Higher IACC was measured at the seats on the center line facing the source squarely.