통합 검색 | Korea Science

주파수대역별 TDNN을 이용한 음성신호의 잡음억제 (Noise Suppression of Speech Signal using TDNN for each Frequency Band)

최재승
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2009년도 춘계학술대회
- /
- pp.341-344
- /
- 2009
본 논문에서는 신경회로망(Neural network)에 시간구조를 도입한 시간지연 신경회로망(Time-delay Neural Network: TDNN)을 사용하여 잡음을 포함한 음성신호로부터 잡음을 제거함으로써 음성을 강조하는 것을 목적으로 한다. 본 논문에서는 먼저 각 프레임의 FFT 진폭성분들을 유성음 구간과 무성음 구간으로 검출한 후, 무성음 구간에 대해서는 각 프레임에서 이동평균을 취하여 음성을 강조한다. 유성음 구간에 대해서는 각 프레임의 FFT 진폭성분들을 저역, 중역 및 고역으로 각각 분리한 후에 각 대역의 FFT 진폭성분들을 저역용 TDNN, 중역용 TDNN, 그리고 고역용 TDNN의 입력으로 하여 각 TDNN에 학습시킴으로써 최종 FFT 진폭성분들을 구한다. 본 실험에서는 Aurora2 데이터베이스를 사용하여 FFT의 진폭성분을 복원하는 잡음제거의 알고리즘을 사용하여 여러 잡음에 대해서 본 알고리즘의 유효성을 실험적으로 확인한다.
PDF

수중 음향센서의 원거리 데이터 전송에 관한 연구 (A study on the long distance data transmission of underwater acoustic sensor)

한정희;이병화;김동욱;이정민
- 한국음향학회지
- /
- 제38권2호
- /
- pp.240-245
- /
- 2019
본 논문은 수중 음향센서 데이터의 원거리 케이블 전송에 관한 연구 결과이다. LVDS(Low Voltage Differential Signaling) 전송 방식으로 설계된 데이터 송수신기의 케이블에 대한 원거리 전송 신호를 측정하고 지터 특성을 분석하였다. 지터 특성을 저감하기 위하여, 원거리 전송에 따라 감쇠될 송신 신호를 역 보상하는 고역 강조(pre-emphasis) 기법을 적용하였으며, 전송 거리에 따라 송신 특성을 검증하였다.
https://doi.org/10.7776/ASK.2019.38.2.240 인용 PDF KSCI HTML

고역통과필터를 이용한 혈관조영상의 화질 개선 (Improvement of Angiogram Quality Using by High Pass Filter)

박민주;이상복
- 한국방사선학회논문지
- /
- 제8권6호
- /
- pp.301-307
- /
- 2014
본 연구에서는 DSA 장치에 의하여 획득된 영상을 고역 통과 필터링 알고리즘을 구성하여 구성된 알고리즘으로 실험을 하여 혈관조영상의 화질을 개선하는 방안을 제안하였다. 고역 통과 필터(High Pass Filter)는 고주파 성분은 통과시키고 저주파 성분은 차단하는 필터이다. 의료영상에서 고주파 성분은 장기(organ)의 윤곽이나 경계선 부분이 고주파 성분에 해당된다. 따라서 고역 통과 필터는 경계선 검출에도 쓰이지만 고역 강조를 위해서도 이용된다. 제시한 알고리즘으로 분석을 하여 혈관조영상의 화질을 개선할 수 있었다. 목적부위의 표현이 확연하게 두드러짐을 알 수 있었다. 제안된 방안을 이용한다면 DSA 시스템의 화질을 개선하는 소프트웨어에 적용하여 오진을 줄여주고 시술의 정확도를 더욱 높여 줄 수 있을 것이라 사료된다.
https://doi.org/10.7742/jksr.2014.8.6.301 인용 PDF KSCI

형태학적 처리를 이용한 윤곽선의 선명도 향상 알고리듬 (An Edge Enhancement Algorithm using Morphological Processing)

남진우
- 융합신호처리학회 학술대회논문집
- /
- 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
- /
- pp.109-112
- /
- 2000
고역의 주파수 성분이 감쇠되어 선명도가 저하된 이미지나 선형 보간법에 의해 확대된 이미지의 계단모양 왜곡을 감소시킴으로써 경계선의 선명도가 저하된 이미지들을 위해 형태학적 처리(morphological processing)에 의한 이미지 윤곽선의 선명도를 향상시키는 방법을 제안하였다. 본 논문에서는 블러링(blurring)된 이미지를 화소의 명암에 따라 다수개의 평판 이미지(slice image)로 나누고 각 평판 이미지에 대해 반복적인 최대/최소값 필터(min/max filter)의 적용으로 얻어진 윤곽선의 중심을 기준으로 하여 팽창(dilation)과 침식(erosion)을 수행함으로 이미지의 윤곽선에서의 명암 변화에 대한 경사도를 크게 만들고 이로써 이미지 윤곽선의 선명도를 향상시키는 방법을 사용하였으며 모의 시험결과를 통하여 고역 주파수 강조에 의한 방법에 비하여 인위적인 잡음(artifact)없이 효과적으로 선명도를 향상시킬 수 있음을 보였다.
PDF

잡음환경에서 음성-영상 정보의 통합 처리를 사용한 숫자음 인식에 관한 연구 (A Study on Numeral Speech Recognition Using Integration of Speech and Visual Parameters under Noisy Environments)

이상원;박인정
- 전자공학회논문지CI
- /
- 제38권3호
- /
- pp.61-67
- /
- 2001
본 논문에서는 한국어 숫자음 인식을 위해 음성과 영상 정보를 사용하고, 음성에 사용하는 선형예측계수 알고리즘을 영상에 적용하는 방법을 제안한다. 입력으로 얻어지는 음성신호는 0.95의 매개변수를 통해 고역 신호가 강조되고, 해밍창과 자기상관 분석, Levinson-Durbin 알고리즘에 의해 13차 선형예측계수를 구한다. 마찬가지로, 그레이 영상신호도, 음성의 자기상관 분석, Levinson-Durbin 알고리즘을 사용하여 13차의 2차원 선형예측계수를 구한다, 이러한 음성/영상 신호에 대한 선형예측계수들은 다층 신경회로망에 적용하여 학습이 이루어졌고, 각 레벨의 잡음이 섞인 음성신호를 적용한 결과, 숫자음 '3', '5', '9' 에서 음성만으로 인식한 결과보다 훨씬 좋은 인식결과를 얻을 수 있었다. 결과적으로, 본 연구에서는 영상 신호의 2차원 선형 예측 계수들이 음성인식에 사용될 경우, 특징 추출에 따른 부가적인 알고리즘이 새로 고안될 필요가 없이, 음성특징 계수를 추출하는 방법을 그대로 사용할 수 있으며, 또한 데이터량과 인식율이 잡음 환경에서 보다 향상되는 효율적인 방법을 제시하고 있음을 알 수 있었다.
PDF

잡음환경 하에서의 음성의 SNR 개선 (Improvement of Signal-to-Noise Ratio for Speech under Noisy Environment)

최재승
- 한국정보통신학회논문지
- /
- 제17권7호
- /
- pp.1571-1576
- /
- 2013
본 논문에서는 잡음 환경 하에서 음성신호에 대한 신호대잡음비(SNR)를 개선하기 위한 알고리즘을 제안한다. 본 논문에서 제안하는 알고리즘은 백색잡음 및 자동차잡음 등과 같은 배경잡음으로부터 음성신호의 SNR을 개선할 목적으로 먼저 저역, 중역, 고역 SNR 대역에서 SNR을 추정한다. 다음으로 본 알고리즘은 각 대역에서 스펙트럼을 강조함으로써 잡음으로 오염된 음성신호 속에서 잡음신호를 차감한다. 백색잡음, 자동차잡음에 의하여 오염된 음성에 대하여 본 논문에서 제안한 알고리즘이 스펙트럼 차감 방법과 비교하여 양호한 신호대잡음비 값을 구하였다. 실험결과로부터 스펙트럼 차감 방법과 비교하여 백색잡음에 대하여 최대 4.2 dB, 자동차잡음에 대하여 최대 3.7 dB의 출력 신호대잡음비가 개선된 것을 확인할 수 있었다.
https://doi.org/10.6109/jkiice.2013.17.7.1571 인용 PDF KSCI

실시간 임베디드 음성 인식 시스템 (A Real-Time Embedded Speech Recognition System)

남상엽;전은희;박인정
- 전자공학회논문지CI
- /
- 제40권1호
- /
- pp.74-81
- /
- 2003
본 연구에서는 음성인식 엔진과 데이터베이스에 필요한 메모리 규모를 최소화시킨 실시간 임베디드 음성인식 시스템을 구현하였다. 실험을 위해 PCS 전화기에서 사용하는 40가지의 명령어와 10개의 숫자음으로 구성된 단어 목록을 만들고, 이들 단어들을 남,여 화자가 발성하여 음성 시료를 구했다. 채록된 음성을 대상으로 창크기 256표본외 단기 분석을 통해 선형 예측 계수를 구한다. 이때 고역강조를 통해 직류 성분을 제거하고 성문 등의 저역 필터효과를 제거하였다. 선형 예측 계수는 Levinson-Durbin 알고리즘을 사용해 구했고 이를 다시 켑스트럼 계수로 변환하여 인식을 위한 특징 벡터열로 구축하였다. 각 단어의 특징 벡터 열에 대해 Baum-Welch 추정법을 이용하여 HMM을 훈련시킨 다음, 기능성 계산을 통해 각 단어에 대한 인식을 수행하도록 하였다. 단어 인식을 위해 ARM CPU코어가 장착된 보드에 음성인식 엔진과 데이터 베이스를 포팅하여 실험용 임베디드 시스템을 구축하였다 5가지 인식 계수집단에 대한 인식 실험을 실시하여 인식률이 좋은 계수 집단을 선정하였다. 전체적인 음성인식 엔진의 인식률은 95%이었고 명령어에 대한 인식률은 96%, 숫자음에 대한 인식률은 94%로 나타났다.
PDF KSCI

검색결과 7건 처리시간 0.025초

주파수대역별 TDNN을 이용한 음성신호의 잡음억제 (Noise Suppression of Speech Signal using TDNN for each Frequency Band)

수중 음향센서의 원거리 데이터 전송에 관한 연구 (A study on the long distance data transmission of underwater acoustic sensor)

고역통과필터를 이용한 혈관조영상의 화질 개선 (Improvement of Angiogram Quality Using by High Pass Filter)

형태학적 처리를 이용한 윤곽선의 선명도 향상 알고리듬 (An Edge Enhancement Algorithm using Morphological Processing)

잡음환경에서 음성-영상 정보의 통합 처리를 사용한 숫자음 인식에 관한 연구 (A Study on Numeral Speech Recognition Using Integration of Speech and Visual Parameters under Noisy Environments)

잡음환경 하에서의 음성의 SNR 개선 (Improvement of Signal-to-Noise Ratio for Speech under Noisy Environment)

실시간 임베디드 음성 인식 시스템 (A Real-Time Embedded Speech Recognition System)

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)