• 제목/요약/키워드: 잡음에 대한 강인함

검색결과 230건 처리시간 0.021초

중증 장애우용 음성구동 휠체어를 위한 강인한 음성인식 알고리즘 (Robust Speech Recognition Algorithm of Voice Activated Powered Wheelchair for Severely Disabled Person)

  • 석수영;정현열
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.250-258
    • /
    • 2007
  • 현재의 음성인식 기술은 하드웨어 기술의 발전과 더불어 여러 분야에 응용되고 있지만 음성구동 휠체어와 같은 고신뢰성이 요구되는 응용분야에서는 아직도 그 성능이 불충분하다. 실 환경에서 음성을 통해 안전하게 휠체어를 제어하기 위해서는 도로의 소음 등과 같은 주변잡음의 영향에 의한 음성인식 성능의 저하, 사용자의 기침소리나 숨소리 등과 같은 비음성 입력시의 오동작, 명령어의 불명확한 발성과 일반인과는 다른 발성 속도 및 발성 주파수 등을 고려한 인식시스템이 필요하다. 이를 위하여 본 논문에서는 비음성 입력시의 오동작을 방지하기 위해 인식기의 전처리 단에서 YIN 기본주파수 추출방법을 적용한 후 프레임 별 신뢰도에 기반한 고정도로 음성/비음성을 판별할 수 있는 방법을 제안하고, 불명확한발성에 대한 인식 성능 향상을 위해 화자 적응화 방법 및 개인적인 발성 변이를 표현할 수 있는 다중 후보 단어사전을 구성하여 인식성능 제고를 도모하였다. 잡음이 포함된 실 환경하에서 수집한 데이터를 대상으로 인식실험을 수행한 결과 기존의 켑스트럼 방법에서는 오류 없이 비음성을 찾아내는 재현율은 62%로 나타났으나 본 논문에서 제안한 YIN방법에 기반을 둔 신뢰도 측정방법에서는 95.1%를 나타나 우수한 성능을 나타내었다. 실 환경에서 수집된 2211개의 불명확한 발성을 대상으로 인식실험을 수행한 결과 2000상태 16 혼합수 HMnet 모델을 이용한 경우 인식률이 78.6%로 나타났으나 MAP적응화 방법 및 다중 후보 인식사전을 적용한 결과 99.5%의 인식 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

이미지 평가를 위한 픽셀 변화량과 포화 인지의 구조적 유사도 기법 (Structural Similarity Index for Image Assessment Using Pixel Difference and Saturation Awareness)

  • 정지수;김영진
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.847-858
    • /
    • 2014
  • 지금까지 최적의 인간 시각 만족을 위한 이미지 평가 기법 또는 도구 연구가 많이 이루어져 오고 있는데 SSIM(Structural SIMilarity) 및 이의 개선 기법들이 그 대표적인 예이다. 하지만 이들 기법은 여전히 다양한 이미지 종류 및 이미지 왜곡 종류에 대해 견실하게 대응하지 못하는 한계를 보이며 인간 시각 만족과의 괴리가 크게 존재하고 있다. 이 논문에서는 SSIM 및 개선된 SSIM 기법을 대상으로 집중적인 이미지 평가를 수행하였으며 각각의 함수에서의 관측된 이상 동작 내용에 대해서 원인을 분석하고 이를 보완 및 개선하는 새로운 이미지 평가 기법을 제시한다. 또, 기법에 대한 다양한 이미지 평가 실험을 통해서 제안 기법이 SSIM과 이의 기존 개선 기법보다 여러 이미지 종류와 왜곡 종류에 대해서 인간 시각 만족을 견실하고 일관성 있게 효과적으로 표현하고 있음을 보인다.

컨텐츠의 저작권 보호를 위한 DWT영역에서의 디지털 워터마킹 기법 (Digital Watermarking Technique in Wavelet Domain for Protecting Copyright of Contents)

  • 서영호;최현준;김동욱
    • 한국정보통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1409-1415
    • /
    • 2010
  • 본 논문에서는 웨이블릿 변환 영역에서 구성한 부대역간의 트리구조와 공간 영역에서의 영상 형태 정보를 이용하여 워터마크의 삽입 위치를 결정한 후에 워터마크를 삽입하는 기법을 제안하였다. 웨이블릿 영역에서 높은 주파수를 가지는 부대역을 다수의 영역으로 나누고 각 블록에 대한 에너지와 전체 에너지의 평균값 등을 이용하여 워터마킹을 위한 후보영역을 얻는다. 또한 공간 영역에서 얻어진 영상의 경계 정보를 이용하여 워터마크가 삽입될 후보 영역을 구한다. 무작위 난수와 웨이블릿 영역에서 이웃 웨이블릿 계수간의 관계를 이용하여 워터마킹 후보영역 내에 워터마크를 삽입한다. 마지막으로 역 웨이블릿 변환을 수행하여 워터마크가 삽입된 영상을 생성한다. 제안된 워터마킹 알고리즘은 JPEG과 같은 압축과 블러링, 선명화, 그리고 가우시안 잡음 등의 공격에 대해서 우수한 특성을 보였다.

DCT영역에서 3차원 다각형 메쉬 모델의 디지헐 워터마킹 방법 (Digital Watermarking for Three-Dimensional Polygonal Mesh Models in the DCT Framework)

  • 전정희;호요성
    • 전자공학회논문지CI
    • /
    • 제40권3호
    • /
    • pp.156-163
    • /
    • 2003
  • 워터마킹 기술 중에 공간 영역을 주파수 영역으로 변환하여 워터마크 신호를 삽입하는 이유는 워터마크를 삭제하려는 악의적인 공격에 대해 살아 남을 수 있고 인간이 삽입되는 워터마크 신호를 쉽게 인지할 수 없는 주파수 대역을 고려할 수 있기 때문이다. 그러나 3차원 데이터의 비정규성(irregularity)으로 인하여 공간영역의 3차원 데이터를 주파수 영역으로 자연스럽게 변환한다는 것은 쉽지 않다. 본 논문에서는 3차원 메쉬(mesh) 데이터를 주파수 영역으로 변환하여 수행하는 새로운 워터마킹 방법을 제안한다. 이를 위해 우선 3차원 모델을 운행(traversing)하여 삼각형 스트립을 생성하고, 각 스트립에 속한 꼭지점 좌표들을 각 좌표축에 따라 독립적으로 1차원 DCT 변환한다. 그리고 쉽게 인지되지 않으면서도 불법적인 공격으로부터 워터마크 신호가 살아남기 위해 AC 계수의 중간 주파수 대역에 워터마크 신호를 삽입한다. 마지막으로, 컴퓨터 실험을 통해 제안한 3차원 데이터 워터마킹 방법은 무작위 잡음 첨가 공격이나 Affine 변환, 그리고 MPEG-4 SNHC의 표준 기하 압축에 강인하다는 것을 보였다.

강인한 음성인식을 위한 극점 필터링 및 스케일 정규화를 이용한 켑스트럼 특징 정규화 방식 (Cepstral Feature Normalization Methods Using Pole Filtering and Scale Normalization for Robust Speech Recognition)

  • 최보경;반성민;김형순
    • 한국음향학회지
    • /
    • 제34권4호
    • /
    • pp.316-320
    • /
    • 2015
  • 본 논문에서는 Cepstral Mean Normalization(CMN)과 Cepstral Mean and Variance Normalization(CMVN) 프레임워크에서 극점 필터링(pole filtering) 개념을 Mel-Frequency Cepstral Coefficient(MFCC) 특징 벡터에 적용한다. 또한 분산 정규화를 대신하여 스케일 정규화를 사용하는 Cepstral Mean and Scale Normalization(CMSN)의 성능을 잡음 환경 음성인식 실험을 통해 평가한다. CMN과 CMVN은 보통 발화 단위로 수행되기 때문에 짧은 발화의 경우 특징에 대한 평균과 분산의 추정 신뢰도가 보장되지 않는 문제점을 가지는데, 극점 필터링과 스케일 정규화 방식을 적용함으로 이러한 문제점을 보완할 수 있다. Aurora 2 데이터베이스를 이용한 실험 결과, 극점 필터링과 스케일 정규화를 결합한 특징 정규화 방식의 성능이 가장 높은 성능 향상을 보인다.

다중 경로 채널 환경에서 DM-MPSK의 성능 분석 (Performance Analysis of the DM-MPSK in Multipath Fading Channels)

  • 이명수;송정한;김준환;윤석호
    • 한국통신학회논문지
    • /
    • 제35권3C호
    • /
    • pp.314-319
    • /
    • 2010
  • 처프 확산 대역 (chirp spread spectrum: CSS) 기술은 넓은 주파수 대역에 걸쳐 데이터를 확산하는 기술로, 다중 경로 페이딩에 강인한 특성을 보인다. 이로 인해 무선 통신 분야에서 크게 주목받고 있다. 하지만 다중 경로 페이딩 환경에 따른 CSS 시스템의 성능에 대한 연구는 아직 부족한 실정이다. 본 논문에서는 다중 경로 페이딩 채널이 직접 변조 (direct modulation: DM) M진 위상 편이 방식 (M-ary phase shift keying: MPSK) 시스템에 미치는 영향에 대해 알아본다. 채널 환경은 레일레이 페이딩을 가정하고, 덧셈 꼴 백색 가우시안 잡음의 (additive white Gaussian noise: AWGN) 영향을 받은 chirp 신호의 이론적인 심볼 에러율을 (symbol error rate: SER) 구한다. 그리고 실험적인 결과를 통해 이론적인 SER이 실험적인 SER과 일치함을 확인한다.

레이다 신호처리 보드의 EMC 대책 설계 (Design of EMC countermeasures for radar signal processing board)

  • 김홍락;이만희;김윤진;박성호
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.41-46
    • /
    • 2023
  • 레이다 시스템에서 최대 탐지거리를 충족하는 것은 매우 중요하다. 최대 탐지거리를 충족하기 위해서는 레이다 시스템의 수신신호에 대한 민감도가 높아야 한다. 또한 레이다 신호처리기에서 동적 영역이 넓어야 한다. 이러한 요구사항을 충족하기 위해서는 신호처리기 보드가 외부 및 내부 노이즈에 강인하게 설계되어야 한다. 특히 보드 내부에서 여러 스위칭 회로로 인하여 발생되는 잡음이 수신되는 레이다 신호에 영향을 최소화 하기 위한 설계가 필요하다. 본 논문에서는 레이다 시스템 성능을 충족하기 위하여 신호처리기 보드의 요구사항을 도출하고 도출된 요구사항을 충족하기 위한 설계에 대하여 기술한다. 또한 외부에서 입력되어 들어오거나 내부에서 생성되는 노이즈의 영향을 최소화 하기 위한 EMC 설계에 대하여 기술한다. 제작된 보드의 시험을 통하여 확보된 성능을 확인한다.

주파수 영역에서의 Gaussian Mixture Model 기반의 동시통화 검출 연구 (Frequency Domain Double-Talk Detector Based on Gaussian Mixture Model)

  • 이규호;장준혁
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.401-407
    • /
    • 2009
  • 본 논문에서는 주파수 영역에서의 가우시안 혼합 모델 (Gaussian Mixture Model, GMM) 기반의 새로운 동시통화 검출 (Double-talk Detection, DTD) 알고리즘을 제안한다. 구체적으로 주파수 영역에서의 음향학적 반향억제 (Acoustic Echo Suppression, AES)를 위한 동시 통화 검출 알고리즘을 구성하기 위해 기존의 시간 영역에서의 동시통화 검출에 사용되는 상호 상관계수를 이산 푸리에 변환을 통해 16개 채널의 주파수 영역으로 변환하였다. 이러한 주파수 영역에서의 상호 상관계수를 GMM의 보다 효과적인 구성을 위해 통계적 분류 특성에 근거하여 우수한 7개를 선별하였다. 본 논문은 이러한 특징 벡터로 패턴인식에서 우수한 성능을 보이는 GMM을 구성하였으며 원단화자만 있는 구간, 동시통화 구간, 근단 화자만 있는 구간을 우도 (Likelihood) 비교에 따라 분류함으로써 별도의 원단 화자 신호에 대한 음성 검출기 (Voice Activity Detector, VAD)의 사용 없이 잡음환경과 반향 경로 변화에서 강인한 동시통화 검출 알고리즘을 제안한다. 다양한 실험 결과 제안된 방법은 기존의 상호 상관계수를 고정된 문턱 값과 가부 비교하여 동시 통화 구간을 검출하는 hard decision 방법에 비해 검출 오류 확률 (Detection Error Probability)을 비교한 결과 우수한 성능을 보였다.

해상교통공학적 고려 요소를 이용한 광양항의 장래교통량 예측에 대한 연구 (A Study on the Future Traffic Volume Estimation for Kwangyang Port Using The Consideration Factors of Marine Traffic Engineering)

  • 박영수;김종수;박진수
    • 한국항해항만학회지
    • /
    • 제31권6호
    • /
    • pp.447-454
    • /
    • 2007
  • 항만개발의 적정성 및 해상교통 환경평가를 위하여 대상항만의 현재의 입출항 교통량을 이용하여 장래의 교통량을 추정하고 있다. 이는 장래 교통량의 추정을 기초로 하여 항로의 혼잡도, 항로 폭의 결정, 각종 운영규정을 설정하기 때문에 상당히 중요한 요소로 반드시 고려되어야 할 요소이다. 장래 해상교통량 추정방법은 프레터 법칙, 경향 추세식을 이용한 방법 등이 있는데 이전 연구의 대부분은 교통량 추정요소는 그 항만의 입출항 척수를 기초로 장래교통량을 추정하고 있다. 그러나 항만 특성상 입출항 선박의 종류 및 크기가 상이하여 지금과 같이 입출항 척수라는 하나의 요소로 변화 추이를 이용한 장래 교통량 예측은 상당히 어렵다. 이 논문에서는 각 항만의 해상교통 구성 특성요소인 연안 외항선박 척수, 선박 크기별 입출항 척수, 각 선박 당 수송 물동량 등의 변화 추이를 이용하여 장래 교통량 추이를 조사하여 예측하고자 한다. 그리고 수학적으로 모델을 구하기 어려운 비선형 시스템이라 할지라도 입 출력 특성을 묘사할 수 있으며, 입력정보의 왜곡, 잡음 등에 강인한 특성을 가지고 있어서 최근에 비선형 동특성 시스템의 동정(Identification)에 응용되고 있는 신경회로망을 이용하여 장래교통량을 예측한 결과와 상호 비교하고자 한다.

단일 벡터센서의 수중음향 통신 시스템 성능 향상을 위한 채널 파라미터 기반 가중 방법 (A channel parameter-based weighting method for performance improvement of underwater acoustic communication system using single vector sensor)

  • 최강훈;최지웅
    • 한국음향학회지
    • /
    • 제41권6호
    • /
    • pp.610-620
    • /
    • 2022
  • 음향 벡터센서는 한 위치에서 음향압력 뿐만 아니라 입자속도 및 가속도와 같은 벡터량을 동시에 수신할 수 있기 때문에 수중음향 통신 시스템의 단일입력다중출력 수신기로써 사용가능하다. 한편, 단일 벡터센서로 수신되는 벡터 신호는 송·수신기 간 방위각과 다중경로 각 요소의 전파각도에 따라 서로 다른 채널 특성을 갖기 때문에 다른 통신성능을 야기한다. 본 논문에서는 단일 벡터센서를 이용한 수중음향 통신 시스템의 성능 향상을 위한 채널 파라미터 기반 가중 방법을 제안한다. 제안 방법의 검증을 위해 Korea Reverberation Experiment(KOREX-17) 중에 수행된 통신실험 데이터를 사용하였다. 음향 송신기는 수신기로부터 멀어지면서 통신신호를 전송했으며 단일 벡터 수신기는 음향압력 신호와 x, y, 및 z 가속도 신호를 측정했다. 수신된 가속도 신호는 압력등가 입자속도 신호로 변환되어 음향압력 신호와 함께 다중채널 통신 시스템의 입력값으로 사용되었다. 통신 복조를 위해 시변 채널에 강인한 블록기반 시역전 기법이 활용되었으며, 통신 결과로부터 단일 벡터센서를 이용한 수중음향 통신 시스템에 대한 채널 파라미터 기반 가중 방법의 유효성이 입증되었다.