• Title/Summary/Keyword: 잡음 은닉

Search Result 61, Processing Time 0.023 seconds

Application of Excitation Moment for Enhancing Fault Diagnosis Probability of Rotating Blade (회전 블레이드의 결함진단 확률제고를 위한 가진 모멘트 적용)

  • Kim, Jong Su;Choi, Chan Kyu;Yoo, Hong Hee
    • Transactions of the Korean Society of Mechanical Engineers A
    • /
    • v.38 no.2
    • /
    • pp.205-210
    • /
    • 2014
  • Recently, pattern recognition methods have been widely used by researchers for fault diagnoses of mechanical systems. A pattern recognition method determines the soundness of a mechanical system by detecting variations in the system's vibration characteristics. Hidden Markov models (HMMs) and artificial neural networks (ANNs) have recently been used as pattern recognition methods in various fields. In this study, a HMM-ANN hybrid method for the fault diagnosis of a mechanical system is introduced, and a rotating wind turbine blade with a crack is selected for fault diagnosis. The existence, location, and depth of said crack are identified in this research. For improving the diagnostic accuracy of the method in spite of the presence of noise, a moment with a few specific frequencies is applied to the structure.

A Study on the Characteristics of a series of Autoencoder for Recognizing Numbers used in CAPTCHA (CAPTCHA에 사용되는 숫자데이터를 자동으로 판독하기 위한 Autoencoder 모델들의 특성 연구)

  • Jeon, Jae-seung;Moon, Jong-sub
    • Journal of Internet Computing and Services
    • /
    • v.18 no.6
    • /
    • pp.25-34
    • /
    • 2017
  • Autoencoder is a type of deep learning method where input layer and output layer are the same, and effectively extracts and restores characteristics of input vector using constraints of hidden layer. In this paper, we propose methods of Autoencoders to remove a natural background image which is a noise to the CAPTCHA and recover only a numerical images by applying various autoencoder models to a region where one number of CAPTCHA images and a natural background are mixed. The suitability of the reconstructed image is verified by using the softmax function with the output of the autoencoder as an input. And also, we compared the proposed methods with the other method and showed that our methods are superior than others.

Robust Speech Recognition Using Missing Data Theory (손실 데이터 이론을 이용한 강인한 음성 인식)

  • 김락용;조훈영;오영환
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.3
    • /
    • pp.56-62
    • /
    • 2001
  • In this paper, we adopt a missing data theory to speech recognition. It can be used in order to maintain high performance of speech recognizer when the missing data occurs. In general, hidden Markov model (HMM) is used as a stochastic classifier for speech recognition task. Acoustic events are represented by continuous probability density function in continuous density HMM(CDHMM). The missing data theory has an advantage that can be easily applicable to this CDHMM. A marginalization method is used for processing missing data because it has small complexity and is easy to apply to automatic speech recognition (ASR). Also, a spectral subtraction is used for detecting missing data. If the difference between the energy of speech and that of background noise is below given threshold value, we determine that missing has occurred. We propose a new method that examines the reliability of detected missing data using voicing probability. The voicing probability is used to find voiced frames. It is used to process the missing data in voiced region that has more redundant information than consonants. The experimental results showed that our method improves performance than baseline system that uses spectral subtraction method only. In 452 words isolated word recognition experiment, the proposed method using the voicing probability reduced the average word error rate by 12% in a typical noise situation.

  • PDF

Game Interface using Robust Skin Color Detection (조명 변화에 강건한 피부색 검출을 사용한 게 임 인터페이스)

  • 장상수;박혜선;김항준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.736-738
    • /
    • 2004
  • 최근 사용자의 제스처를 이용한 게임 시스템에 대한 연구가 많은 관심을 받고 있다. 사용자의 얼굴 및 손의 움직임을 이용하여 게임을 제어하기 위해서는 복잡한 배경 및 조명에 강건한 얼굴 및 손 영역의 추출이 필수적이다. 본 논문에서는 조명 변화에 강건한 피부색 검출을 이용한 게임 인터페이스를 제안한다. 이를 위해 제안된 시스템은 다음의 두 단계로부터 얼굴 및 손 영역을 추출한다. 먼저, 피부색과 유사한 물건들을 제거하기 위해 배경 영상과 현재 영상의 차영상으로부터 전경물체를 추출한다. 그 다음, 조명에 의한 깜박임이나 잡음을 줄이기 위해서 SCT 알고리즘을 이용하여 전경물체 영역 안에서 피부색 영역만을 정확하게 검출한다. 추출된 얼굴 및 손의 움직임으로부터 얻어지는 제스처는 은닉마르코프 모델을 사용하여 인식된다. 복잡한 환경에서 실험한 결과, 제안된 시스템은 정확한 피부색 영역 검출을 제공하고 이를 통한 보다 정확한 인식률을 제공할 수 있다는 것이 증명되었다.

  • PDF

Robust Speaker Recognition using Independent Component Analysis (독립성분분석을 이용한 강인한 화자인식)

  • 장길진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.327-330
    • /
    • 1998
  • 독립성분분석(ICA: Independent Component Analysis)이란 특징이 상이한 둘 이상의 신호들이 선형적으로 결합되어 있을 때 이를 효과적으로 분리하는 방법들을 통칭하며 잡음제거, 음질개선 및 신호처리 분야에서 많이 활용되고 있다. 본 논문에서는 전화음성 화자인식 시스템의 성능향상을 위해 독립성분분석을 이용하는 방법을 제안한다. 먼저 화자가 발성한 음성신호의 켑스트럼 계수를 여러 채널 함수들의 선형적인 합으로 가정하고, 독립성분분석을 이용하여 얻은 새로운 켑스트럼 벡터를 학습과 인식에 사용하였다. 실험자료는 잔화음성 화자식별기의 성능평가에 널리 쓰이고 있는 SPIDRE를 사용하였고 regodic 은닉 마코프 모델을 이용하여 문장 독립 화자식별 시스템을 구성하였다. 학습음성의 특징과 실험음성의 특징이 다른 조건에서 기존의 채널 정규화 방법들에 비해 10~15%이상 인식률이 향상되었다.

  • PDF

HMM-based missing feature reconstruction for robust speech recognition in additive noise environments (가산잡음환경에서 강인음성인식을 위한 은닉 마르코프 모델 기반 손실 특징 복원)

  • Cho, Ji-Won;Park, Hyung-Min
    • Phonetics and Speech Sciences
    • /
    • v.6 no.4
    • /
    • pp.127-132
    • /
    • 2014
  • This paper describes a robust speech recognition technique by reconstructing spectral components mismatched with a training environment. Although the cluster-based reconstruction method can compensate the unreliable components from reliable components in the same spectral vector by assuming an independent, identically distributed Gaussian-mixture process of training spectral vectors, the presented method exploits the temporal dependency of speech to reconstruct the components by introducing a hidden-Markov-model prior which incorporates an internal state transition plausible for an observed spectral vector sequence. The experimental results indicate that the described method can provide temporally consistent reconstruction and further improve recognition performance on average compared to the conventional method.

A Multiresolution Digital Watermarking Based on Image Statistics (영상의 통계적 특성에 기반한 다해상도 디지털 워터마킹)

  • 한성현
    • Journal of the Institute of Electronics Engineers of Korea TE
    • /
    • v.37 no.2
    • /
    • pp.25-32
    • /
    • 2000
  • Digital watermarking has been recently proposed as the means of intellectual property right protection of multimedia data. We present a novel watermarking scheme to hide a copyright information in a digital image. The method Is based on the 2D DWT(Discrete Wavelet Transform) and image statistics. Gaussian and Laplacian noises as the watermarks are added to the large wavelet coefficients at the high and middle frequency bands in the wavelet domain. Experimental results show that the proposed Laplacian watermark is stronger to several common image distortions, such as noises, JPEG coding as different qualities, Gaussian blurring, and edge enhancement.

  • PDF

The Detection of Epileptic Spikes in EEG using Neural Network (신경망과 웨이브렛 변환을 이용한 뇌전도의 간질 극파 검출)

  • 최혜원;이성수;윤영로
    • Journal of Biomedical Engineering Research
    • /
    • v.20 no.6
    • /
    • pp.555-560
    • /
    • 1999
  • 간질은 신경세포의 일부가 짧은 시간동안 과도한 전기를 발생시킴으로써 일어나는 신경계의 발작적 증상으로 배경 활동파와는 구별되는 극파, 예파, 예파와 서파를 동반한 극서파 복합(sharp and slow complexes)의 뇌파 특징파를 갖는다. 장시간의 뇌파기록에서 시간의 절약과, 정량화를 위해 컴퓨터를 이용한 간질 파형의 자동 검출은 객관성을 높이고 정량적인 해석을 위해 필수적이다. 본 연구에서는 간질 뇌파를 검출하기 위해 웨이브렛 변환과 신경망을 사용하였다. 웨이브렛 변환은 잡음을 제거하고 간질 뇌파의 특징을 강조하며 신경망의 입력노드수를 줄였다. 전문가에 의해서 분류된 간질특성과 정상뇌파를 신경망에 입력시켜 최적의 신경망구조를 선택하였고, 검출 문턱치를 설정하였다. 신경망은 200ms(26개의 데이터포인트)신호의 웨이브렛 결과와 웨이브렛 변환후 데이터 상의 최대, 최소 기울기가 입력되어 전체 28개의 입력 노드로 구성하였다. 은닉층은 18노드, 문턱치값은 민감도와 선택도가 일치하는 0.65가 사용되었다. 결과로 임상 환자 데이터에 입력되어 78.54% 의 검출률을 보였다.

  • PDF

On-line Handwritten Numeral Recognition based on Table Top Display (테이블 탑 디스플레이 기반의 온라인 필기 숫자 인식)

  • Kim, Eui-Chul;Kim, Ji-Woong;Kim, Soo-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.9-12
    • /
    • 2007
  • 테이블 탑 디스플레이는 사람에게 친숙한 상호작용의 매개체인 손을 입력장치로 이용하는 일종의 탁자형 멀티 터치스크린이라고 할 수 있다. 본 논문에서는 이러한 환경에서 손가락 제스쳐를 활용하여 필기 숫자를 인식하는 연구를 수행함으로써 테이블 탑 디스플레이에 적합한 필기 숫자 인식 기술을 개발하였고, 이로 인해 추후 진행될 연속 숫자 혹은 특수기호의 성공적인 인식 가능성을 확인하였다. 실험 과정은 테이블 탑 디스플레이의 표면을 통해 입력된 손가락 궤적을 잡음제거, 대표점 추출등의 전처리 과정을 거쳐 16-방향 체인코드로 변환하고, 변환된 체인코드의 학습 및 필기 숫자 인식에 확률 통계적 모델인 은닉 마르코프 모델을 이용하였다. 학습에는 총 300개 필기 숫자 데이터를 이용하였고, 인식 실험에 사용한 별도의 100개의 필기 숫자 데이터에 대해 97%의 정인식율을 보였다.

Reversible Image Watermarking with Differential Histogram Shifting and Error Prediction Compensation (차이값 히스토그램 쉬프팅과 오류 예측 보정을 이용한 가역 영상 워터마킹)

  • Yeo, Dong-Gyu;Lee, Hae-Yeoun;Kim, Byeong-Man;Kim, Kyung-Su
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.6
    • /
    • pp.417-429
    • /
    • 2010
  • Reversible watermarking inserts watermark into digital media in such a way that visual transparency is preserved and then enables to restore the original media from the marked one without any loss of media quality. This watermarking can be applied to quality-sensitive imaging such as medical imaging, military imaging, remote-sensing imaging, and precious artwork, where the original media should be preserved during image processing and analysis. In this paper, a reversible image watermarking technique that embeds message bits by modifying the differential histogram of adjacent pixels is presented. In order to satisfy both high embedding capacity and visual quality, the proposed technique exploits the fact that adjacent pixels in the image have highly spatial correlation. Also, we prevent overflow/underflow problem and salt-and-pepper artifacts by employing a predicted error compensation scheme. Through experiments using various test images, we prove that the presented technique provides perfect reversibility and high embedding capacity, while maintaining the induced-distortion low.