통합 검색 | Korea Science

드론 소음 환경에서 심층 신경망 기반 음성 향상 기법 적용에 관한 연구 (A study on deep neural speech enhancement in drone noise environment)

김지민;정재희;여찬은;김우일
- 한국음향학회지
- /
- 제41권3호
- /
- pp.342-350
- /
- 2022
본 논문에서는 재난 환경과 같은 환경에서의 음성 처리를 위해 실제 드론 소음 데이터를 수집하여 오염 음성 데이터베이스를 구축하고 음성 향상 기법인 스펙트럼 차감법과 심층 신경망을 이용한 마스크 기반 음성 향상 기법을 적용하여 성능을 평가한다. 기존의 심층 신경망 기반의 음성 향상 모델인 VoiceFilter(VF)의 성능 향상을 위해 Self-Attention 연산을 적용하고 추정한 잡음 정보를 Attention 모델의 입력으로 이용한다. 기존 VF 모델 기법과 비교하여 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)에 대해 각각 3.77 %, 1.66 %, 0.32 % 향상된 결과를 나타낸다. 인터넷에서 수집한 오염 음성 데이터를 75 % 혼합하여 훈련한 경우, 실제 드론 소음만을 사용한 경우에 비해 상대적인 성능 하락률 평균이 SDR, PESQ, STOI에 대해 각각 3.18 %, 2.79 %, 0.96 %를 나타낸다. 이는 실제 데이터를 취득하기 어려운 환경에서 실제 데이터와 유사한 데이터를 수집하여 음성 향상을 위한 모델 훈련에 효과적으로 활용할 수 있음을 확인해준다.
https://doi.org/10.7776/ASK.2022.41.3.342 인용 PDF KSCI

검출기 필터를 이용한 화질의 향상 (Enhancement of Image Quality Using Detector Filter)

임종남;김형태;김민혜;천권수
- 한국방사선학회논문지
- /
- 제10권6호
- /
- pp.451-456
- /
- 2016
방사선 검사로 환자의 병을 진단하기 위해서는 방사선 피폭이 따르게 된다. 최소한의 피폭으로 병변을 진단하는 일반촬영에 이중 엑스선 에너지 기법의 임상적용 가능성을 SNR 및 화질 점수화의 지표로 조사하였다. 이중 엑스선 에너지 기법은 검출기로 사용되는 두 개의 Image Plate 사이에 0.5 mm 두께의 Cu와 Al 필터를 추가함으로써 구현하였다. 한 번의 엑스선 조사로 획득된 두 IP 영상을 Subtraction 및 Enhance Contrast 기법을 적용하여 획득하였다. Enhance 영상은 첫 번째 IP에서 획득한 First 영상보다 SNR이 우수한 것으로 측정되었다. 이 일반촬영의 이중 엑스선 에너지 기법은 피폭선량을 줄이면서 영상의 품질을 높일 수 있는 방법으로 임상에서 매우 유용하게 적용될 수 있을 것이다.
https://doi.org/10.7742/jksr.2016.10.6.451 인용 PDF KSCI

SAD 알고리즘을 이용한 소형표적 검출속도 개선 (Improvement of detecting speed of small target using SAD algorithm)

손정민;안상호;김종호;김상균
- 한국산업정보학회논문지
- /
- 제18권4호
- /
- pp.53-60
- /
- 2013
본 논문에서는 소형표적의 검출속도를 개선하기 위하여, SAD 알고리즘을 이용한 소형표적 검출 방법을 제안한다. 먼저 미디언 필터를 사용해서 클러터를 제거한다. 다음으로 다양한 크기의 구조 요소를 이용해 닫힘 연산과 열림 연산을 수행하고, 닫힘 연산 결과와 열림 연산 결과를 차 연산 하여 표적 후보 화소를 추출한다. 정확한 소형 표적을 검출하기 위해 표적 후보 영역에서 가우시안 거리 함수를 이용하여 표적을 검출한다. 검출 속도를 개선하기 위하여 다음 7프레임에서는 표적의 방향성을 예측한 후, SAD알고리즘을 이용해서 표적을 검출한다. 제안한 방법은 예측된 영역에서만 표적을 추출함으로써 97%의 검출율을 나타내며, 실시간 처리가 가능한 장점을 가지고 있다.
https://doi.org/10.9723/jksiis.2013.18.4.053 인용 PDF KSCI

확률적 표본화와 배경 차분을 이용한 비디오 객체 추적 (Visual Tracking Using Monte Carlo Sampling and Background Subtraction)

김현철;백준기
- 대한전자공학회논문지SP
- /
- 제48권5호
- /
- pp.16-22
- /
- 2011
본 논문에서는 배경 차분에 의해 객체를 검출하고 확률적으로 표본화된 입자 필터링(particle filtering)기법을 사용한 다중객체 추적 기법을 제안한다. 확률적으로 표본화된 입자들을 사용하여 다중 객체에 독립적으로 적용할 때 발생하는 계산 복잡도(computational complexity)를 감소시키는 동시에 안정적인 추적을 가능하게 하였다. 객체의 색상정보를 사용한 히스토그램 분포에 의한 관측 모델(observation model)을 구성하고 객체의 움직임 정보를 위해 동적 모델을 공식화하여 영상을 해석하였다. 전체적인 추적 시스템은 베이시언 최대 우도 기법(Bayesian maximum likelihood method)을 근간으로 하되, 입자 필터링을 객체 추적에 적용하여 실용적인 현실 객체 추적 상황에도 강건하게 대처할 수 있음을 실험을 통해서 증명하였다.
PDF KSCI

Multi-channel Speech Enhancement Using Blind Source Separation and Cross-channel Wiener Filtering

Jang, Gil-Jin;Choi, Chang-Kyu;Lee, Yong-Beom;Kim, Jeong-Su;Kim, Sang-Ryong
- The Journal of the Acoustical Society of Korea
- /
- 제23권2E호
- /
- pp.56-67
- /
- 2004
Despite abundant research outcomes of blind source separation (BSS) in many types of simulated environments, their performances are still not satisfactory to be applied to the real environments. The major obstacle may seem the finite filter length of the assumed mixing model and the nonlinear sensor noises. This paper presents a two-step speech enhancement method with multiple microphone inputs. The first step performs a frequency-domain BSS algorithm to produce multiple outputs without any prior knowledge of the mixed source signals. The second step further removes the remaining cross-channel interference by a spectral cancellation approach using a probabilistic source absence/presence detection technique. The desired primary source is detected every frame of the signal, and the secondary source is estimated in the power spectral domain using the other BSS output as a reference interfering source. Then the estimated secondary source is subtracted to reduce the cross-channel interference. Our experimental results show good separation enhancement performances on the real recordings of speech and music signals compared to the conventional BSS methods.
PDF KSCI

2차원 이진 마스크를 이용한 적응형 음성향상 잡음 제거기 (Adaptive Noise Canceller for Speech Enhancement Using 2-D Binary Mask)

이기현;이정현;조진호;김명남
- 한국멀티미디어학회논문지
- /
- 제19권7호
- /
- pp.1127-1136
- /
- 2016
Speech enhancement algorithm plays an important role in numerous speech signal processing applications. Over the last few decades, many algorithms have been studied for speech enhancement. The algorithms are based on spectral subtraction, Wiener filter, and subspace method etc. They have good performance of speech enhancement, but the performance can be deteriorated in specific noises or low SNR environment. In this paper, a new speech enhancement algorithms are proposed based on adaptive noise canceller. And the proposed algorithm improved performance of adaptive noise cancelling using 2-D binary mask. From objective experimental index, it is confirmed that the proposed algorithm is useful and has better performance than recently proposed speech enhancement algorithms.
https://doi.org/10.9717/kmms.2016.19.7.1127 인용 PDF KSCI KPUBS HTML

음성 향상 전처리와 문턱값 갱신을 적용한 향상된 음성검출 방법 (An Improved VAD Algorithm Employing Speech Enhancement Preprocessing and Threshold Updating)

이윤창;안상식
- 한국통신학회논문지
- /
- 제28권11C호
- /
- pp.1161-1168
- /
- 2003
본 논문에서는 음성검출의 성능을 향상시킬 목적으로 정합 필터를 이용한 음성향상 전처리 과정을 통하여 SNR을 개선한 후, 이를 LLR(Log Likelihood Ratio) 검사에 의한 최적 결정방법을 적용하여 확률적인 모델을 기준으로 하는 향상된 음성검출 방법을 제안한다. 또한 기존의 음성검출 방법들에서는 제시되지 않았던 문턱값 갱신 알고리즘을 제안하며, 이 방법을 통해서 기존의 방법들에서 성능이 좋지 않았던 낮은 SNR 환경에서도 음성검출을 할 수 있게 되었다. 마지막으로 컴퓨터 시뮬레이션을 통하여 이미 상용화되어 널리 이용중인 G.729B(ITU-TG.729 Annex B)의 음성검출 결과와 비교를 통해서 제안한 음성검출 방법의 성능의 우수성을 검증하며, 실제적인 환경에도 적용이 가능함을 보인다.
PDF KSCI

전화선 채널이 화자확인 시스템의 성능에 미치는 영향 (The Effect of the Telephone Channel to the Performance of the Speaker Verification System)

조태현;김유진;이재영;정재호
- 한국음향학회지
- /
- 제18권5호
- /
- pp.12-20
- /
- 1999
본 논문에서는 깨끗한 환경에서 녹음된 음성데이터와 채널환경에서 수집된 음성데이터의 화자확인 성능을 비교하였다. 채널데이터의 화자확인 성능을 향상시키기 위하여 채널환경에 강인한 특징 파라메타 및 전처리에 대해 연구하였다. 실험을 위한 음성 DB는 어구지시(text-prompted) 시스템을 고려하여 두 자리의 한국어 숫자음으로 구성하였다. 적용한 음성 특징은 LPCC(Linear Predictive Cepstral Coefficient), MFCC(Mel Frequency Cepstral Coefficient), PLP(Perceptually Linear Prediction), LSP(Line Spectrum Pair)이며, 채널 잡음을 제거하기 위한 전처리 과정으로는 음성신호에 대한 필터링을 적용하였다. 추출된 특징으로부터 채널의 영향을 제거 또는 보상하기 위해 cepstral weighting, CMS(Cepstral Mean Subtraction), RASTA(RelAtive SpecTrAl)를 적용하였다. 또한 각각의 특징 및 처리 방법에 대한 음성인식 성능을 제시함으로써 화자확인에서의 성능과 음성인식에서의 성능을 비교하였다. 적용한 음성 특징 및 처리 방법들에 대한 성능 평가를 위해 HTK(HMM Tool Kit) 2.0을 이용하였다. 남자, 여자 화자별로 임계값을 다르게 주는 방법으로 깨끗한 음성데이터와 채널 데이터에 대한 EER(Equal Error Rate)을 구하여 비교하였다. 실험결과 전처리 과정에서 대역통과 필터(150～3800Hz)를 적용하여 저대역 및 고대역의 채널 잡음을 제거하고, 이 신호로부터 MFCC를 추출하였을 때 EER 측면에서의 화자확인 성능이 가장 좋게 나타났다.
PDF

광학 필터를 이용한 광섬유 방사선 센서의 체렌코프 빛 제거 (Removal of Cerenkov Light in Fiber-optic Radiation Sensor Using Optical Filters)

장경원;이봉수;조동현;김형식;이정한;이정환;김신;조효성
- 한국광학회지
- /
- 제17권4호
- /
- pp.312-316
- /
- 2006
본 연구에서는 유기 섬광체와 플라스틱 광섬유를 이용하여 치료용 전자선의 계측을 위한 광섬유 방사선 센서를 제작하였다. 또한, 선형가속기에서 발생되는 고 에너지 전자선에 의해 광섬유 방사선 센서를 이용한 전자선 계측에 있어 방해요소로 존재하는 체렌코프 빛을 감법 및 광학 필터링을 이용하여 제거하였고 두 가지방법들을 비교, 분석하였다.
https://doi.org/10.3807/KJOP.2006.17.4.312 인용 PDF KSCI

적외선 영상에서 모폴로지와 가우시안 거리함수를 이용한 소형표적 검출 (Small Target Detection using Morphology and Gaussian Distance Function in Infrared Images)

박준재;안상호;김종호;김상균
- 한국산업정보학회논문지
- /
- 제17권4호
- /
- pp.61-70
- /
- 2012
본 논문에서는 모폴로지 연산을 기반으로 소형 표적 후보를 찾고, 변형된 가우시안 거리 함수를 이용해서 소형 표적을 검출하는 방법을 제안한다. 기존의 소형 표적 검출 방법은 예측 필터를 이용하는 방법과 모폴로지를 이용하는 방법이 있다. 예측필터를 이용하는 방법의 경우 최소 오차 수렴 시간이 오래 걸리고, 모폴로지를 이용하는 방법의 경우 클러터에 취약하고, 소형 표적의 크기를 고려하여 구조요소의 크기를 선정해야 하는 단점이 있다. 본 논문에서는 기존 연구 방법의 단점을 보완한 강인한 소형 표적 검출 방법을 제안한다. 제안하는 방법은 먼저 미디언 필터를 사용해서 클러터를 제거한다. 다음으로 다양한 크기의 구조 요소를 이용해 닫힘 연산과 열림 연산을 수행하고, 닫힘 연산 결과와 열림 연산 결과를 차 연산 하여 표적 후보 화소를 구한다. 정확한 소형 표적을 검출하기 위해 표적 후보 영역에서 가우시안 거리 함수를 이용하여 표적을 검출한다. 제안한 방법은 클러터에 민감하지 않고, 98%의 검출율을 보였다.
https://doi.org/10.9723/jksiis.2012.17.4.061 인용 PDF KSCI

검색결과 78건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)