• Title/Summary/Keyword: 잡음 은닉

검색결과 61건 처리시간 0.021초

SVM을 이용하여 HMM과 심잡음 점수를 결합한 심음 기반 심장질환 분류기 (Heart Sound-Based Cardiac Disorder Classifiers Using an SVM to Combine HMM and Murmur Scores)

  • 곽철;권오욱
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.149-157
    • /
    • 2011
  • 본 논문은 support vector machine (SVM)을 사용하여 은닉 마코프 모델 (HMM)과 심잡음 존재 정보를 결합한 새로운 심장질환 분류 방법을 제안한다. 켑스트럼 특징과 HMM 비터비 (Viterbi) 알고리듬을 이용하여 입력 신호를 모든 심장질환 모델에 대하여 상태 단위로 분할하여 상태별로 로그우도 (점수)를 계산한다. 심잡음 신호의 시간적 위치 특성을 이용하기 위하여 입력신호를 두 개의 부대역으로 나누고 부대역별로 프레임 단위의 심잡음 점수를 계산한 다음, 비터비 알고리듬으로부터 구한 상태 분할 정보를 이용하여 상태단위의 심잡음 점수를 구한다. SVM은 모든 심장질환 종류에 대한 상태 단위의 HMM과 심잡음 점수를 입력으로 하여 최종적으로 심장질환을 판정한다. 심장질환 분류 실험결과, 제안한 방법은 기존의 켑스트럼 특징과 HMM 분류기를 이용한 방법에 비하여 20.4 %의 상대적 개선율을 보여준다.

비음수 텐서 분해와 은닉 마코프 모델을 이용한 터널 환경에서의 음향 사고 검지 방법 (An Acoustic Event Detection Method in Tunnels Using Non-negative Tensor Factorization and Hidden Markov Model)

  • 김남균;전광명;김홍국
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권9호
    • /
    • pp.265-273
    • /
    • 2018
  • 본 논문에서는 터널 환경에서 비음수 텐서분해와 가우시안 혼합을 갖는 은닉 마코프 모델을 사용한 사고 검지 시스템을 제안한다. 대부분의 터널 내 환경은 내재된 환경으로 인한 작은 사고들이 발생한다. 특히 터널 내에서 사고가 발생할 시, 2차, 3차 사고가 발생되어 큰 재해로 발전할 가능성이 높다. 주로 시각기반의 사고 검지 기법들이 많이 제안되어왔으나, 시야각 등의 문제로 오검지가 발생하는 단점이 존재한다. 이러한 시각기반의 검지 기법을 보완하기 위해 본 논문에 제안된 기법은 터널환경에서의 음향사고 검출의 정확도 개선을 위해 비음수 텐서분해와 가우시안 혼합모델(Gaussian mixture model, GMM) 기반의 은닉 마코프 모델(hidden Markov model, HMM)을 이용한다. 제안된 방법은 비음수 텐서 분해 기법에 활용되는 사고음향 모델과 잡음모델을 사용하여 사고음을 분리하고, 분리된 사고음을 기반으로 기 훈련된 GMM-HMM 기반의 음향모델을 기반으로 우도비 검증을 수행하여 사고 검지를 수행한다. 제안된 방법의 검지 정확도를 평가하기 위해 터널 내 환경잡음과 사고음을 합성하여 생성한 데이터를 생성하였고, 높은 정확도를 얻을 수 있었다.

DCT영역에서 스크램블된 이진 위상 컴퓨터형성홀로그램을 이용한 디지털 영상 워터마킹 기술 (Digital Image Watermarking Technique using Scrambled Binary Phase Computer Generated Hologram in Discrete Cosine Transform Domain)

  • 김철수
    • 한국멀티미디어학회논문지
    • /
    • 제14권3호
    • /
    • pp.403-413
    • /
    • 2011
  • 본 논문에서는 DCT 영역에서 스크램블된 이진 위상 컴퓨터형성홀로그램을 이용한 디지털 영상 워터마킹 기술을 제안하였다. 워터마크 삽입과정은 워터마크로 사용되는 은닉영상 대신 은닉영상을 손실 없이 재생할 수 있는 이진 위상 컴퓨터홀로그램을 생성하고 이를 스크램블기법으로 암호화 하여 워터마크로 사용한다. 그리고 암호화된 워터마크에 가중치 함수를 곱하고 호스트영상의 DCT 영역에서 DC성분에 삽입한 후 IDCT를 수행한다. 워터마크의 추출은 워터마킹된 영상과 원래의 호스트영상의 DCT계수 차이를 구하고, 삽입시 적용한 가중치 함수를 나눈 후 디스크램블링 하여 복호화 한다 그리고 복호화된 워터마크를 역푸리에 변환하여 은닉영상을 재생한다 마지막으로 원래의 은닉영상과 복호화된 은닉영상과의 상관을 통해 워터마크의 존재여부를 결정한다. 제안된 워터마킹 기술은 이진 값으로 구성된 은닉영상의 홀로그램정보를 이용하고 스크램블링 암호화 기법을 활용하였음으로 기존의 어떠한 워터마킹 기술보다 압축, 잡음 및 절단과 같은 다양한 외부공격에 안전하고 견실한 특징을 가지고 있음을 컴퓨터시뮬레이션을 통해 그 장점들을 확인하였다.

SNR 매핑을 이용한 환경적응 기반 음성인식 (Speech Recognition based on Environment Adaptation using SNR Mapping)

  • 정용주
    • 한국전자통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.543-548
    • /
    • 2014
  • 다 모델 기반의 음성인식기는 음성인식에서 매우 성공적임이 알려져 있다. 그것은 다양한 신호-대-잡음비(SNR)와 잡음종류에 해당하는 다수의 HMM을 사용함으로서 선택된 음향모델이 인식잡음음성에 매우 근접한 일치성을 가질 수 있기 때문이다. 그러나 실제 사용시에 HMM의 개수가 제한됨에 따라서 음향모델의 불일치는 여전히 문제로 남아 있다. 본 논문에서는 인식잡음음성과 HMM 간의 SNR 불일치를 줄이고자 이들 간의 최적의 SNR 매핑 (mapping)을 실험적으로 결정하였다. 인식잡음음성으로 부터 추정된 SNR 값을 사용하는 대신 제안된 SNR 매핑을 사용함으로서 향상된 인식결과를 얻을 수 있었다. 다 모델 기반인식기에 제안된 방법을 적용하여 Aurora 2 데이터베이스에 대해서 인식 실험한 결과 기존의 MTR 이나 다 모델 기반 음성인식기에 비해서 6.3%와 9.4%의 상대적 단어 오인식율 감소를 이룰 수 있었다.

웨이브릿 변환 영역에서의 디지털 워터마킹에 관한 연구 (A Study on Digital Watermarking on the Wavelet Transform Domain)

  • 한상엽;선영범;김진태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.146-149
    • /
    • 2001
  • 디지털 워터마킹은 멀티미디어 데이터의 저작권 보호 목적으로 최근에 제안되었다. 본 논문에서는 디지털 영상에 저작권 정보를 은닉하는 디지털 워터마킹 방법을 제안한다. 제안한 방법은 2차원 이산 웨이블릿 변환과 영상의 대역 특성에 기반한다. 워터마크로 PN 코드와 이진 영상들 웨이블릿 영역에서 중간 대역의 큰 계수에 삽입한다. 실험 결과 삽입된 워터마크는 잡음, JPEG 압축과 같은 일반적인 영상 왜곡에 대해 매우 강함이 입증되었다.

  • PDF

배경잡음 및 패킷손실에 강인한 voice-over-IP 수신단 기반 음질향상 기법 (Robust speech quality enhancement method against background noise and packet loss at voice-over-IP receiver)

  • 김지연;김형국
    • 한국음향학회지
    • /
    • 제37권6호
    • /
    • pp.512-517
    • /
    • 2018
  • 음성 품질의 향상은 통신 분야의 주요 관심사이다. 본 논문에서는 VoIP(Voice-over-IP) 수신부에서의 배경잡음 및 패킷손실에 강인한 음질향상 방식을 제안한다. 제안된 방식에서는 하이브리드 마르코프 체인 기반 네트워크 지터추정, 추정된 지터를 이용한 적응적 플레이아웃 스케줄링, 그리고 진폭 및 위상 복원 기반의 음성 향상 방식 등을 결합하여 IP 네트워크를 통해 VoIP 수신부에 도착하는 음성신호의 품질을 향상시킨다. 실험결과는 제안된 방식이 송신부의 인코딩 전에 음성신호에 추가된 잡음을 제거하고 불안정한 네트워크 환경에서 양질의 음성을 제공하는 것을 확인할 수 있다.

적응형 복합 분류 알고리즘을 이용한 초소형 전자소자 탐지 향상 기법 (Improved Detecting Schemes for Micro-Electronic Devices Based on Adaptive Hybrid Classification Algorithms)

  • 김광열;임정환;김송강;조준경;신요안
    • 한국통신학회논문지
    • /
    • 제38A권6호
    • /
    • pp.504-511
    • /
    • 2013
  • 본 논문은 지적재산권 보호를 위한 방안으로 적응형 알고리즘 기반의 초소형 전자소자 탐지 기법을 제안한다. 전자소자를 탐지하는 기본 원리는 분류기의 송신기에서 특정 기본 주파수의 전파가 은닉된 물체로 전파되면, 물체로부터 반사되어 수신기로 들어오는 2차 및 3차 고조파의 크기를 분류기가 비교함으로써 판별하게 된다. 하지만, 측정 과정에서 발생하는 잡음 및 전자파의 간섭으로 인해 분류의 성능이 저하되므로, 이러한 환경에서도 은닉된 전자소자를 적응적으로 판별하기 위해 Fuzzy c-Means 클러스터링 알고리즘과 ${\kappa}$-Nearest Neighbor 분류 알고리즘을 복합적으로 이용하는 방안을 제시한다. 모의실험 결과, 제안 기법이 잡음 및 전자파 간섭 환경에서도 적응적으로 전자소자 잘 탐지할 수 있었으며, 이에 따라 지적재산권을 효율적으로 보호할 수 있을 것으로 기대된다.

다수 표적 탐지를 위한 Track-Before-Detect 알고리듬 연구 (Track-Before-Detect Algorithm for Multiple Target Detection)

  • 원대연;심상욱;김금성;탁민제;성기정;김응태
    • 한국항공우주학회지
    • /
    • 제39권9호
    • /
    • pp.848-857
    • /
    • 2011
  • 영상센서 기반의 충돌회피 시스템을 구성하기 위해서는 수 픽셀 이내의 낮은 신호대잡음비 환경에서 다수의 표적을 탐지할 수 있는 알고리듬이 필요하다. 이처럼 영상 내에서 희미하게 나타나는 잠재적인 표적과 잡음을 구분하기 위한 방법으로서 연속적인 영상 정보를 효율적으로 처리하는 Track-Before-Detect (TBD) 알고리듬이 연구되고 있다. 본 논문에서는 기존의 TBD 알고리듬을 확장하여 다수 표적 탐지 요구조건을 만족시키기 위한 두 가지 방식의 기법을 제시하였다. 첫 번째 방식은 동적 계획법과 K-평균 클러스터링 기법에 기반을 두고 있으며 두 번째 방식은 은닉 마르코프 모델에 Sub-Window 기법을 적용하였다. 제안한 방식의 성능 및 차이점은 수치해석 결과를 통해 분석하였다.

H.264 비디오 표준에서의 칼만 필터 기반의 움직임벡터 복원 (Kalman filter based Motion Vector Recovery for H.264)

  • 고기홍;김성환
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.801-808
    • /
    • 2007
  • MPEG-2, MPEG-4, H.263, H.264 와 같은 부호화 표준은 비디오 영상을 압축하여 대역폭이 제한된 유/무선 통신 시스템을 통하여 전송한다. 통신 시스템에서 고압축률의 비트스트림은 채널 잡음 (channel noise)에 민감하여, 채널 잡음으로 인한 오류가 발생하기 쉽다. 이러한 오류는 수신부에서 디코딩할 때 비디오 영상을 심각하게 왜곡시키게 된다. 본 논문에서는 수신부 단에서 오류를 복원하는 기법 (decoder error concealment) 중 손상된 움직임벡터를 복원하는 기법을 제안한다. 본 논문에서는 손실된 움직임벡터를 예측하기 위하여 인접 블록들의 움직임 벡터를, 예측필터의 일종인 칼만 필터의 입력 치로 사용하여, 손실된 움직임벡터의 최적 예상치를 만들어 손상된 움직임벡터를 복구하게 된다. H.264 비디오 코딩을 적용한 표준 테스트 영상에 대하여, 손실된 MVD (motion vector difference) 값을 0 으로 대체한 뒤, H.264 비디오 코딩에서 사용하고 있는 기본 움직임벡터 예측만을 사용한 경우와 본 논문에서 제안한 칼만 필터를 사용한 복원기법을 비교하였으며, 복원된 움직 임벡터와 원래 움직임벡터 값과의 차이를 나타내는 오차율을 비교한 결과 제안된 기법의 오차율이 평균 0.91 - 1.12 정도의 정확도가 향상된 것을 확인할 수 있다.

다중대역 음성인식을 위한 부대역 신뢰도의 추정 및 가중 (Estimation and Weighting of Sub-band Reliability for Multi-band Speech Recognition)

  • 조훈영;지상문;오영환
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.552-558
    • /
    • 2002
  • 최근에 Fletcher의 HSR (human speech recognition) 이론을 기초로 한 다중대역 (multi-band) 음성인식이 활발히 연구되고 있다. 다중대역 음성인식은 주파수 영역을 다수의 부대역으로 나누고 별도로 인식한 뒤 부대역들의 인식결과를 부대역 신뢰도로 가중 및 통합하여 최종 판단을 내리는 새로운 음성인식 방식으로서 잡음환경에 특히 강인하다고 알려졌다. 잡음이 정상적인 경우 무음구간의 잡음정보를 이용하여 부대역 신호대 잡음비(SNR)를 추정하고 이를 가중치로 사용하기도 하였으나, 비정상잡음은 시간에 따라 특성이 변하여 부대역 신호대 잡음비를 추정하기가 쉽지 않다. 본 논문에서는 깨끗한 음성으로 학습한 은닉 마코프 모델과 잡음음성의 통계적 정합에 의해 각 부대역에서 모델과 잡음음성 사이의 거리를 추정하고, 이 거리의 역을 부대역 가중치로 사용하는 ISD (inverse sub-band distance) 가중을 제안한다. 1500∼1800㎐로 대역이 제한된 백색잡음 및 클래식 기타음에 대한 인식 실험 결과, 제안한 방법은 정상 및 비정상대역제한잡음에 대하여 부대역의 신뢰도를 효과적으로 표현하며 인식 성능을 향상시켰다.