• 제목/요약/키워드: Noisy

검색결과 1,573건 처리시간 0.026초

비지도 학습 기반 영상 노이즈 제거 기술을 위한 정규화 기법의 최적화 (Optimized Normalization for Unsupervised Learning-based Image Denoising)

  • 이강근;정원기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권5호
    • /
    • pp.45-54
    • /
    • 2021
  • 최근 노이즈 제거를 위한 심층 학습 모델에 대한 연구가 활발하게 진행되고 있다. 특히 블라인드 노이즈 제거 (blind denoising) 기술이 발전하면서 깨끗한 영상을 얻기가 불가능한 영상의 영역에서 노이즈 영상만으로 심층 학습 기반 노이즈 제거 모델의 학습이 가능해졌다. 우리는 관찰된 노이즈 영상으로부터 깨끗한 영상을 얻기 위해 더는 깨끗한 영상과 노이즈 영상의 짝을 이루는 데이터를 필요하지 않는다. 하지만 노이즈 영상과 깨끗한 영상 간의 차이가 큰 데이터라면 노이즈 영상만으로 학습된 노이즈 제거 모델은 우리가 원하는 품질의 깨끗한 영상을 복원하기 어려울 것이다. 이 문제를 해결하기 위해서 짝지어지지 않는 깨끗한 영상과 노이즈 영상으로 학습한 모델 기반 노이즈 제거 기술은 최근 연구되고 있다. 가장 최신 기술인 ISCL은 깨끗한 영상과 노이즈 영상의 쌍을 기반으로 한 지도학습 기반 모델의 성능과 거의 근접한 성능을 보여 주었다. 우리는 제안된 방법이 ISCL을 포함한 다른 최신 짝을 이루지 않는 영상 기반 노이즈 제거 기술보다 성능이 우수함을 보여준다.

비정상 잡음환경에서 음질향상을 위한 적응 임계 치 알고리즘 (Adaptive Threshold for Speech Enhancement in Nonstationary Noisy Environments)

  • 이수정;김순협
    • 한국음향학회지
    • /
    • 제27권7호
    • /
    • pp.386-393
    • /
    • 2008
  • 본 논문에서는 비정상 잡음환경에서 음질향상을 위한 새로운 방법을 제안한다. 정상 잡음환경에서 음질향상을 위한 잡음제거 방법으로 주파수 차감법이 잘 알려져 있다. 그러나 실제 잡음환경은 대 부분 비정상적인 특성을 나타낸다. 제안한 방법은 다양한 잡음 과 비정상 환경에서 잘 동작 할 수 있도록 적응 임계 치를 위한 자동제어 파라미터를 사용한다. 특히, 자동제어 파라미터는 a posteriori SNR을 이용한 선형함수를 적용하여 잡음레벨의 증감에 따라 적응 임계 치를 제어한다. 제안한 알고리즘은 음질향상을 위해 Hangover (HO)을 이용한 주파수 차감법과 결합한다. 알고리즘의 성능은 다양한 잡음환경에서 ITU-T P.835 signal distortion (SIG)와 segment signal to-noise ratio (SNR)로 평가하여 (HO)을 이용한 음성검출과 minimum statistics (MS) 방법에 비해 우수한 결과를 나타냈다

결정적 잡음 모델을 이용한 효율적인 잡음음성 인식 접근 방법 (An Efficient Approach for Noise Robust Speech Recognition by Using the Deterministic Noise Model)

  • 정용주
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.559-565
    • /
    • 2002
  • 본 논문에서는 잡음음성 HMM (Hidden Markov Model)의 파라미터 값을 효율적으로 추정하는 새로운 방법에 대해서 제안하였다. 기존의 방법들에서 잡음음성의 HMM 파라미터 값을 추정하기 위해서는 먼저 잡음음성의 생성 모델을 가정한 후, 잡음과 원래 음성의 통계 모델을 이용하여 잡음음성 HMM 파라미터 값을 해석적으로 얻게 된다. 하지만 이러한 해석적 방법은 항상 단순화의 가정을 취하게 되므로 실제의 잡음음성 HMM 분포에 정확히 근접하는데 어려움을 겪게 된다. 본 연구에서는 이러한 가정을 하지 않고, 원래의 깨끗한 음성에서 얻을 수 있는 HMM의 파라미터 값을 사용하고 결정적 잡음 모델을 이용함으로서 기존의 방법보다 인식시에 계산량을 줄일 수 있었을 뿐만 아니라 인식 성능의 향상도 이룰 수 있었다.

스펙트럼사상기법을 기초로 한 잡음음성인식 (Noisy Speech Recognition Based on Spectral Mapping Techniques)

  • 이기영
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.39-45
    • /
    • 1995
  • 본 논문에서는 화자적응방법에서의 스펙트럼사상기법을 기초로한 잡음인식방법을 제시하였다. 제시한 방법에서는 스펙트럼사상에 의하여 잡음음성의 스펙트럼왜곡을 감소시키며, 스펙트럼을 더욱 정확히 사상하기 위하여 정합창의 기울기로 하여금 여러 단어의 길이에 적응하도록 하였다. 인식실험의 결과, 잡음처리를 하지 않는 VQ와 DTW를 이용한 기존의 방법보다 놓은 인식율을 얻었으며, 0 dB 의 SNR 레벨에서도 기존방법의 인식율을 10배 이상으로 향상시키므로써 스펙트럼사상을 이용한 화자적응기법이 잡음음성의 인식성능을 향상시킬 수 있음을 확인하였다.

  • PDF

가청화를 이용한 고소음 작업장의 흡음대책 평가 (Evaluation on Attenuation for Sound-absorbing Measures of Loud Noisy Work-site using Auralizational Technique)

  • 윤재현;김재수
    • 한국소음진동공학회논문집
    • /
    • 제20권8호
    • /
    • pp.742-752
    • /
    • 2010
  • In case of the working machine that using in the loud-noisy workplace, as it generates the loud-noise, it is influencing a physical, mental bad effect to those workers. Accordingly, though the noise countermeasure for the loud-noisy workplace is acutely requiring, until now, those methods that wearing the soundproof-protection tool, or restriction the working hours, and minimize the noise exposure volume, were mainly used. However, such noise countermeasures occur many problem points. On such point of view, using the acoustic simulation technique, let the workers to choose the workplace where suffering many damages due to the noise of working machine, and after grasp the physical property of working machine and indoor acoustic characteristic, this Study has attempted to grasp the reduction degree of noise level at before-improvement?after-improvement, through the sound-absorption measure. Passing through such preceding step, using auralizational technique based on the noise of working machine of before-improvement after-improvement, and by conduct psycho-acoustics evaluation, this study intended to investigate the change degree of subject reaction. As the result of evaluation, it is considering that the noise-reduction countermeasure method for the loud-noisy workplace could be much effective, through the sound-absorption measure.

잡음 환경 하에서의 전기-역학적 임피던스 기반 조류발전 구조물의 장기 건전성 모니터링 (Impedance-based Long-term Structural Health Monitoring for Tidal Current Power Plant Structure in Noisy Environments)

  • 민지영;심효진;윤정방;이진학
    • 한국해양공학회지
    • /
    • 제25권4호
    • /
    • pp.59-65
    • /
    • 2011
  • In structural health monitoring (SHM) using electro-mechanical impedance signatures, it is a critical issue for extremely large structures to extract the best damage diagnosis results, while minimizing unknown environmental effects, including temperature, humidity, and acoustic vibration. If the impedance signatures fluctuate because of these factors, these fluctuations should be eliminated because they might hide the characteristics of the host structural damages. This paper presents a long-term SHM technique under an unknown noisy environment for tidal current power plant structures. The obtained impedance signatures contained significant variations during the measurements, especially in the audio frequency range. To eliminate these variations, a continuous principal component analysis was applied, and the results were compared with the conventional approach using the RMSD (Root Mean Square Deviation) and CC (Cross-correlation Coefficient) damage indices. Finally, it was found that this approach could be effectively used for long-term SHM in noisy environments.

Noisy 한 CFD 결과에 대한 구속조건을 고려한 EGO 방법 연구 (A STUDY ON CONSTRAINED EGO METHOD FOR NOISY CFD DATA)

  • 배효길;권장혁
    • 한국전산유체공학회지
    • /
    • 제17권4호
    • /
    • pp.32-40
    • /
    • 2012
  • Efficient Global Optimization (EGO) method is a global optimization technique which can select the next sample point automatically by infill sampling criteria (ISC) and search for the global minimum with less samples than what the conventional global optimization method needs. ISC function consists of the predictor and mean square error (MSE) provided from the kriging model which is a stochastic metamodel. Also the constrained EGO method can minimize the objective function dealing with the constraints under EGO concept. In this study the constrained EGO method applied to the RAE2822 airfoil shape design formulated with the constraint. But the noisy CFD data caused the kriging model to fail to depict the true function. The distorted kriging model would make the EGO deviate from the correct search. This distortion of kriging model can be handled with the interpolation(p=free) kriging model. With the interpolation(p=free) kriging model, however, the search of EGO solution was stalled in the narrow feasible region without the chance to update the objective and constraint functions. Then the accuracy of EGO solution was not good enough. So the three-step search method was proposed to obtain the accurate global minimum as well as prevent from the distortion of kriging model for the noisy constrained CFD problem.

적응 지각 필터를 이용한 오디오 음질 개선 알고리즘 (Audio Enhancement Algorithm Using Adaptive Perceptual Filter)

  • 엄혜영;한헌수;홍민철;차형태
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.687-693
    • /
    • 2003
  • 본 논문에서는 적응적인 방식으로 필터의 성능을 향상시킴으로써 잡음에 의해 열화된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 주파수 영역으로 변환된 잡음에 의해 열화된 신호를 바크 대역으로 분할하여 청각 자극 에너지를 계산하고, 필터를 적응적으로 적용하여 잡음 에너지를 제거함으로써 본래의 신호를 획득하는 방식을 사용하였다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하며, 이때 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 급격하게 감소함을 알 수 있다. 그러나 제안하는 방식에서는 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 기존 방식과의 비교를 위하여 신호대 잡음비와 잡음대 마스킹비를 비교하였고 청각 테스트를 수행하여 그 결과로부터 향상된 음질 개선을 확인할 수 있었다.

Frequency analysis of GPS data for structural health monitoring observations

  • Pehlivan, Huseyin
    • Structural Engineering and Mechanics
    • /
    • 제66권2호
    • /
    • pp.185-193
    • /
    • 2018
  • In this study, low- and high-frequency structure behaviors were identified and a systematic analysis procedure was proposed using noisy GPS data from a 165-m-high tower in ${\dot{I}}stanbul$, Turkey. The raw GPS data contained long- and short-periodic position changes and noisy signals at different frequencies. To extract the significant results from this complex dataset, the general structure and components of the GPS signal were modeled and analyzed in the time and frequency domains. Uncontrolled jumps and deviations involving the signal in the time domain were pre-filtered. Then, the signal was converted to the frequency domain after applying low- and high-pass filters, and the frequency and periodic component values were calculated. The spectrum of the tower motion obtained from the filtered GPS data had dominant peaks at a low frequency of $1.15572{\times}10-4Hz$ and a high frequency of 0.16624 Hz, consistent with two equivalent GPS datasets. Then, the signal was reconstructed using inverse Fourier transform with the dominant low frequency values to obtain filtered and interpretable clean signals. With the proposed sequence, processing of noisy data collected from the GPS receivers mounted very close to the structure is effective in revealing the basic behaviors and features of buildings.

배경잡음을 고려한 가변임계값 Dual Rate ADPCM 음성 CODEC 구현 (Implementation of Variable Threshold Dual Rate ADPCM Speech CODEC Considering the Background Noise)

  • 양재석;한경호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 D
    • /
    • pp.3166-3168
    • /
    • 2000
  • This paper proposed variable threshold dual rate ADPCM coding method which is modified from the standard ADPCM of ITU G.726 for speech quality improvement. The speech quality of variable threshold dual rate ADPCM is better than single rate ADPCM at noisy environment without increasing the complexity by using ZCR(Zero Crossing Rate). In this case, ZCR is used to divide input signal samples into two categories(noisy & speech). The samples with higher ZCR is categorized as the noisy region and the samples with lower ZCR is categorized as the speech region. Noisy region uses higher threshold value to be compressed by 16Kbps for reduced bit rates and the speech region uses lower threshold value to be compressed by 40Kbps for improved speech quality. Comparing with the conventional ADPCM, which adapts the fixed coding rate. the proposed variable threshold dual rate ADPCM coding method improves noise character without increasing the bit rate. For real time applications, ZCR calculation was considered as a simple method to obtain the background noise information for preprocess of speech analysis such as FFT and the experiment showed that the simple calculation of ZCR can be used without complexity increase. Dual rate ADPCM can decrease the amount of transferred data efficiently without increasing complexity nor reducing speech quality. Therefore result of this paper can be applied for real-time speech application such as the internet phone or VoIP.

  • PDF