통합 검색 | Korea Science

적응 웨이블릿 패킷 기반 스펙트럼 차감법을 이용한 음성신호 개선에 관한 연구 (A study on Speech Enhancement Using Adaptive Wavelet Packet Based Spectral Subtraction)

김진호;박정재;장성욱;권영헌;양성일
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
- /
- pp.43-46
- /
- 2004
본 논문에서는 최근에 제안된 음성신호 개선을 위한 적응 웨이블릿 패킷 기반의 스펙트럼 차감법을 이용하여 다양한 측면에서의 성능평가 결과를 제시한다. 사용된 음성신호 개선 방식은 적응 웨이블릿 패킷의 불균등 주파수 해상도와 높은 에너지 집중도로 인해 발생하는 극대, 극소값의 영향을 피하기 위해 기하평균을 이용하는 스펙트럼 추정법을 사용하였다. 다양한 측면의 성능평가를 위해 주관적 평가 척도인 MOS 와 높은 상관도를 갖는 것으로 알려진 log likelihood ratio, log area ratio, segmental SNR, weighted spectral slope 등을 평가 척도로 사용하였다. Fourier 기저를 사용한 방식과의 비교에서 적응 웨이블릿 패킷 방식은 SegSNR 과 음성의 명료도를 비교적 잘 반영하는 weighted spectral slope 측면에서 우수한 성능을 보였다.
PDF

음성신호의 단일입력 적응잡음제거 (A Single Channel Adaptive Noise Cancellation for Speech Signals)

강해동;배건성
- 한국음향학회지
- /
- 제13권3호
- /
- pp.16-24
- /
- 1994
음성신호에 내재한 배경잡음을 제거하는 단일입력 적응잡음제거 시스템을 구성하였다. 기존 방법에서는 프레임 단위로 분석된 음성신호의 피치 정보를 이용하여 적응여파기의 기준신호를 얻는데 비해 제안된 방법에서는 매 샘플마다 지연 정보를 추정하여 기준신호를 만든다. 입력되는 음성신호로부터 매 샘플시간마다 지연 정보를 구하기 위하여 일반적인 자기상관 함수와 평균절대차 함수로부터 재귀적 자기상관함수와 재귀적 평균절대차함수를 유도하였다. 정규화된 최소평균자승(NLMS) 적응알고리듬을 사용하는 단일입력 잡음제거 시스템에 제안된 지연추정 방법을 적용하여 백색 가우시안 잡음에 왜곡된 음성에 대해 음성개선 실험을 하였으며, 기존 방법과의 성능비교 실험을 하였다. 제안된 방법에 의한 음성개선이 기존 방법보다 음질 및 SNR면에서 더 좋은 결과를 보였다.
PDF

개선된 선형예측 잔여를 이용한 음성의 잔향음 제거 (Speech Dereverberation using Improved Linear Prediction Residual)

박찬섭;김기만;강석엽
- 한국정보통신학회논문지
- /
- 제11권10호
- /
- pp.1845-1851
- /
- 2007
배경 잡음과 실내 잔향음은 음성 인식 시스템 성능 저하의 주요 이유이다. 많은 알고리즘이 음성의 잔향음 제거를 위해 개발되었다. 이 논문에서는 실내 환경에서 수정된 선형 예측 잔여(Linear Prediction Residual)를 이용하여 음질 개선을 위한 잔향음 제거 방법을 제안한다. 제안된 잔향음 제거 방법은 음성에서 성문 경계의 순간에 발생한 성도(聲道)시스템의 중요한 여기에 기반한다. 본 논문에서 제안한 방법은 3개의 센서로부터 수집한 반향신호로 각 센서에서의 시간지연 정보를 사용한다. 새로운 선형 예측 잔여신호는 선형 예측 잔여의 가중치와 힐버트 변환으로 얻은, 개선된 선형 예측 잔여 조합을 사용한다. 코히런트하게 더해진 힐버트 포락선의 특징은 잡음과 반사로 인한 큰 진폭 피크를 가지는 것이다. 깨끗한 음성의 잔여는 개선된 음성을 얻는 시변전극 필터를 일으키는데 사용된다. 본 논문에서는 반향 환경에서 성능 분석을 위해 제안된 알고리즘의 시뮬레이션을 수행하였다. 제안된 알고리즘은 실내 잔향환경에서 기존의 알고리즘에 비해 반사된 음성의 품질 향상의 결과를 보였다.
https://doi.org/10.6109/jkiice.2007.11.10.1845 인용 PDF KSCI

원헝 ad hoc 방식의 음성 컨퍼런스 시스템 (Voice Conference System Based On Circular ad hoc)

김철한
- 한국정보통신설비학회:학술대회논문집
- /
- 한국정보통신설비학회 2003년도 하계학술대회
- /
- pp.123-126
- /
- 2003
최근 컴퓨터 및 통신 기술의 발전으로 인터넷 전화 서비스가 증가하고 있다. 지금까지의 인터넷 전화 서비스는 1:1 방식의 서비스가 주류를 이루었으나, 점차 다자간 음성 채팅, 원격 강의 등과 같은 N:N 방식의 음성 컨퍼런스 서비스에 대한 수요가 급증하고 있다. 그러나 기존의 음성 컨퍼런스 시스템은 별도의 컨퍼런스 서버 구축, 부하 집중 사용자 수의 증가에 따른 음성 트래픽 증가 등의 문제로 일정한 통화 품질을 유지하기 어렵다는 단점이 있다. 따라서, 본 논문에서는 이와 같은 문제를 개선하기 위한 ad hoc 방식의 음성 컨퍼런스 시스템을 제안하였다. 그리고 이 시스템의 성능 분석을 통하여 최소 4명의 참여자까지 일정한 음성 품질이 보장됨을 확인함으로써 본 논문에서 제안하는 시스템의 타당성을 검증하였다.
PDF

링 방식의 음성 멀티캐스팅 시스템

김철한;이정태
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
- /
- pp.268-270
- /
- 2001
최근 컴퓨터 및 통신 기술의 발전으로 인터넷 전화 서비스가 증가하고 있다. 지금까지의 인터넷 전화 서비스는 1:1 방식의 서비스가 주류를 이루었으나, 점차 다자간 음성 채팅, 원격 강의 등과 같은 N:N 방식의 음성 멀티캐스팅 서비스에 대한 수요가 급증하고 있다. 그러나 기존의 음성 멀티캐스팅 시스템은 별도의 멀티캐스팅 서버 구축, 부하 집중, 사용자 수의 증가에 따른 음성 트래픽 증가 등의 문제로 일정한 통화품질을 유지하기 어렵다는 단점이 있다. 따라서, 본 논문에서는 이와 같은 문제를 개선하기 위한 링 방식의 음성 멀티캐스팅 시스템을 제안하고, 이 시스템의 성능 분석을 통하여 최소 4명의 참여자까지 일정한 음성품질이 보장됨을 확인함으로써 타당성을 검증하였다.

MFCC 특징 파라미터를 이용한 인식 알고리즘 (Recognition Algorithm using MFCC Feature Parameter)

최재승
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2016년도 추계학술대회
- /
- pp.773-774
- /
- 2016
배경잡음은 음성신호의 특징을 왜곡하기 때문에 음성인식 시스템의 인식율 향상의 방해요소가 된다. 따라서 본 논문에서는 배경잡음이 존재하는 환경에서의 음성인식을 실시하기 위해서, 신경회로망과 Mel 주파수 켑스트럼 계수를 사용하여 연속음성 식별 알고리즘을 제안한다. 본 논문의 실험에서는 본 알고리즘을 사용하여 배경잡음이 섞인 음성신호에 대하여 음성인식의 식별율 개선을 실현할 수 있도록 연구를 진행하며, 본 알고리즘이 유효하다는 것을 실험을 통하여 명백히 한다.
PDF

음성인식 개발 프로젝트 위험 요인에 관한 연구 (A Study on Risk Factors of Speech Recognition Development Project)

김선교;박준호
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2020년도 추계학술발표대회
- /
- pp.733-734
- /
- 2020
음성인식은 음향모델, 언어모델, 디코더 등의 기술을 이용한다. 음성인식은 하드웨어와 소프트웨어 구성이 정확하게 설계가 되어야 한다. 음성인식 프로젝트는 인프라 구성과 도입되는 음성인식 엔진도입, 인식률 그리고 시스템과의 연계가 중요하다. 하지만 음성인식 프로젝트는 솔루션 도입으로 인지하고 수행할 경우에는 많은 위험이 발생한다. 이 중 가장 문제가 되는 것이 인식률이다. 본 논문에서 음성인식 개발 프로젝트 수행에 도출되는 인식률을 개선하는 방안을 제시하겠다.
https://doi.org/10.3745/PKIPS.y2020m11a.733 인용 PDF

반회신경 문합과 후윤상피열근 절제가 발성기능에 미치는 영향에 대한 실험적 연구 (EXPERIMENTAL STUDIES ON THE EFFECT OF RLN ANASTOMOSIS REMOVAL ON PHONATION)

김영모;이영구;이정식;이준열;김광문;김기령;홍원표;최홍식
- 대한기관식도과학회:학술대회논문집
- /
- 대한기관식도과학회 1991년도 제25차 학술대회 연제순서 및 초록
- /
- pp.11-12
- /
- 1991
편측 성대마비의 음성개선을 위하여 현재까지 알려진 치료방법은 teflon 또는 silicone 주입술, 외과적 성대 내전술, 갑상연골 성형술, 신경재식술, 등이 있으며, 근래까지는 Teflon 또는 Gelform 주입술이 제일 효과적인 방법이라 알려져 있으나, 이는 음의 높낮이 조절능력의 한계가 있고, 신경재식술의 결과 역시 만족스럽지 못한 경우가 많다. 따라서 저자는 발성기능의 생리학적인 측면에서, 보다 효과적인 음성개선의 방법을 찾기 위하여, 사람의 후두와 비교적 유사한 특성을 가진 개를 사용하여 실험을 하였다. 반회신경을 절단하여 편측 성대 마비를 유발한 뒤, 동측의 유일한 외전근인 후윤상피열근을 절제후 절단된 신경을 문합하여, 성대의 외전근 작용의 소실과, 발성시에 주로 작용하는 내전근만의 작용을 유도하여, 공동운동의 차단과, 내전운동의 향상을 기대하였다. 본 실험에 앞서, 임의적으로 신경을 자극시킬 수 있는 신경자극기와, 주위조직으로부터 신경만을 분리하여 자극할 수 있는 전극을 개발하여 사용하였으며, 또한 성대의 발성음을 임의대로 유발시킬 수 있는 생체 내 후두발성 모형(in vivo laryngeal phonation model)을 Moore(1987, 1988)등이 발표한 모형을 토대로 자체 개발하여 사용하였다. 실험은 13마리의 개를, 반회신경 절단군(3 마리), 반회신경 절단 및 후윤상피 열근 절제군(3 마리), 후윤상피열근 절제군(3 마리), 반회신경 문합 및 후윤상피 열근 절제군(4 마리)등으로 나누어 실험하였으며, 3 개월 후, 현수후두경, 후두 내시경, videolaryngoscopy, 신경자극 검사 등으로 성대의 내전운동 및 위치 변화의 관찰, 발성음의 음향분석 및 갑상피열근의 형태학적 변화를 관찰하여 다음과 같은 결과를 얻었다. 1. 반회신경 절단군과 반회 신경 절단 및 후윤상피열근 절제군은, 수술후 3 개월에 성대의 움직임이나 각도의 변화가 없었으며, 음향분석 결과 발성음이 아닌 잡음만이 포착되었다. 즉, 절단된 신경의 문합 없이 후윤상피열근 절제 만으로는 음성개선은 기대할 수 없었다. 2. 후윤상피열근 절제군에서는 수술 후 3 개월에 정상적인 성대의 내전운동이 관찰되었으며, 음향분석상 기본주파수 동요율 및 발성음의 강도는 약간의 증가를 보였다. 즉, 반회신경이 절단되지 않은 상태에서 후윤상피 열근 만을 절제하면, 발성음의 변화는 거의 없었다. 3. 반회신경을 절단후 문합하고 후윤상피열근을 절제한군 에서는 수술후 3 개월에, 성대의 정상적인 내전운동을 보였고, 음향분석상 수술직후에는 잡음만이 포착되었으나, 3 개월 후에는 잡음이 아닌 발성음을 들을 수 있었으며, 이 발성음의 기본주파수 및 강도는 수술전보다 감소되어 있었으나, 기본주파수 동요율은 증가되어 있었다. 즉 이 술식으로 인한 뚜렷한 발성음의 향상이 있었다. 이상의 결과로 미루어, 편측 신경 절단으로 인한 성대마비시, 절단된 신경을 봉합하고 성대의 유일한 외전근인 후윤상피열근을 절제하면, 공동운동의 차단과, 내향운동의 향상으로, 음성개선에 효과적이라고 사료되었으며, 이 방법이 편측 성대마비 환자의 효과적인 음성개선의 치료방법의 하나로 응용될 수 있으리라 생각된다.
PDF

심한 소음환경에서 언어장애인 음성 인식률 향상을 위한 단어선정 방법 및 장치 개선에 관한 연구 (A Study on Word Selection Method and Device Improvement for Improving Speech Recognition Rate of Speech-Language-impaired in Severe Noise Environment)

양기웅;이형근
- 한국정보통신학회논문지
- /
- 제23권5호
- /
- pp.555-567
- /
- 2019
언어장애인, 언어 사용이 불편한 분들의 경우 조금의 잡음 환경에도 음성인식률이 저하되어 사회 생활시 어려움을 겪게 된다. 언어 사용 시 불편함을 장치로 개선시킴과 동시에, 언어 장애인의 발음 특성을 고려하여 단어 선정 시 자체 개선한 단어 선정 방법을 사용하여 280개 단어를 선정하였다. 실험에 사용된 MEMS 개발 장치는 재질, 유도선 종류, 길이, 방향을 고려하여 제작되었으며 잘못된 발음으로 인한 음성과 심한 소음에서 음성 인식률 향상을 위하여 개발된 MEMS 장치와 개발된 단어 선정 방법을 사용하여 개선시켰다. 개선 방법으론 새로운 단어 선정 방법과 mems 장치를 개선하여 진행하였으며 결과를 포함하였다.
https://doi.org/10.6109/jkiice.2019.23.5.555 인용 PDF KSCI HTML

잡음 신호의 지각 패턴 제어를 통한 음질 개선 알고리즘 개발에 관한 연구 (The Study for Noisy Speech Improvement with Noise Perception Pattern Suppression)

김헌중;차형태
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.199-202
- /
- 2002
본 논문에서는 사람의 청각 모델을 기반으로 잡음에 의해 손상된 음성 신호로부터 잡음 신호의 마스킹 특성과 신호에너지의 지각(知覺)을 나타내는 임계대역(critical band)에서의 잡음 에너지에 대한 지각 패턴인 noise excitation pattern을 이용한 잡음 에너지 차감과 잡음 추정 오차에 의한 변형된 음성신호 내의 순음(tonal) 성분과 비순음(non-tonal)성분의 보정을 통해 효과적인 음성 품질의 개선을 위한 연구를 하였다.
PDF

검색결과 1,031건 처리시간 0.032초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)