• 제목/요약/키워드: 음성신호의 품질개선

검색결과 16건 처리시간 0.029초

음향학적 모델에 의한 스펙트럼 필터 알고리즘 (Spectrum Filter Algorithm based on Acoustic Model)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.770-772
    • /
    • 2016
  • 본 논문에서는 음성신호처리 시스템에 유용하게 사용되는 음성신호의 특징 파라미터를 출력하는 스펙트럼 필터모델을 사용하여, 배경잡음 환경 하에서 음성신호 중의 잡음을 제거하는 알고리즘을 제안한다. 따라서 본 논문에서는 배경잡음을 제거할 때 고려해야 할 인간의 청각특성이 포함된 음성의 진폭 스펙트럼에 의한 청각필터의 특성을 도입한다. 본 논문의 실험에서 사용한 성능평가의 방법으로는 음절 명료도의 테스트에 적합한 주관적인 평가인 주파수 영역에서의 스펙트럼 왜곡률(Spectral Distortion, SD)을 사용하여 실험결과를 비교하고 고찰한다.

  • PDF

잡음 신호의 지각 패턴 제어를 통한 음질 개선 알고리즘 개발에 관한 연구 (The Study for Noisy Speech Improvement with Noise Perception Pattern Suppression)

  • 김헌중;차형태
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.199-202
    • /
    • 2002
  • 본 논문에서는 사람의 청각 모델을 기반으로 잡음에 의해 손상된 음성 신호로부터 잡음 신호의 마스킹 특성과 신호에너지의 지각(知覺)을 나타내는 임계대역(critical band)에서의 잡음 에너지에 대한 지각 패턴인 noise excitation pattern을 이용한 잡음 에너지 차감과 잡음 추정 오차에 의한 변형된 음성신호 내의 순음(tonal) 성분과 비순음(non-tonal)성분의 보정을 통해 효과적인 음성 품질의 개선을 위한 연구를 하였다.

  • PDF

무전기 음성통신에서 최적음성채널 선택을 위한 개선방안에 관한 연구 (Study on Improvement for selecting the optimum voice channels in the radio voice communication)

  • 류창국;이배호
    • 한국전자통신학회논문지
    • /
    • 제11권2호
    • /
    • pp.171-178
    • /
    • 2016
  • 지상 관제소에 근무하는 항공관제사와 비행중인 항공기는 무전기를 이용하여 음성통신을 한다. 항공기에서 송신하는 음성신호는 전국에 있는 다수의 지상사이트에 동시에 수신된다. 이때 항공관제사는 항공기와의 거리, 속도, 기상상태, 안테나와 무전기 조정상태 등에 따라 다양한 품질의 음성신호를 수신하게 된다. 항공관제사는 매 순간 최적의 음성신호를 찾아 항공기와 최적의 상황에서 음성통신을 수행한다. 그러나, 현재는 입력된 음성의 음량(Gain)을 기준으로 CD(: Carrier Dectect)값이 우수하다고 판단되는 신호를 최적채널로 선택하지만, 이는 잡음이 통화품질에 미치는 영향을 고려하지 않기에 최적채널을 선택한다고 볼 수 없다. 본 논문을 통해 수신된 음성신호에서 잡음을 제거한 후 사용자가 최적채널을 선택할 수 있도록 수치화된 정보 및 개선된 음질의 음성신호를 제공할 수 있었다. 이를 이용하여 항공기 관제 또는 훈련감청시스템 운용 시 향상된 품질의 채널을 선택하여 안전사고 예방, 훈련 능력향상 등을 기대할 수 있다.

G.729.1 광대역 멀티코덱 표준 기술 동향 (The Trend of G.729.1 Wideband Multi-codec Technology)

  • 김현우;성종모;이미숙;김도영;정해원
    • 전자통신동향분석
    • /
    • 제21권6호통권102호
    • /
    • pp.77-85
    • /
    • 2006
  • 2006년 5월 고품질 인터넷 전화(VoIP) 서비스에 사용할 수 있는 가변대역 광대역 음성 코덱 기술이 ITU-T SG16 회의에서 국제 표준으로 확정되었다. ITU-T에서 표준화된 G.729.1 코덱은 국내 IPR이 포함된 최초 음성 코덱 분야의 표준이다. 이 코덱은 인터넷 전화 서비스에서 가장 널리 사용되는 G.729를 기반으로 8-32kbps 범위 내에서 임베디드 형태로 비트열 계층을 쌓아가는 구조로 협대역 신호(300-3400Hz)부터 광대역 신호(50-7000Hz)를 압축, 복원한다. 이 기술은 기존의 인터넷 전화에서 사용하고 있는 코덱의 낮은 품질, 대역폭 확장, 품질 제어가 곤란한 단점을 개선하여 인터넷전화 서비스 시장을 활성화 할 것으로 기대된다.

주파수가중 스펙트럼성형필터와 위너필터를 결합한 음성 스펙트럼 강조 (Speech Spectrum Enhancement Combined with Frequency-weighted Spectrum Shaping Filter and Wiener Filter)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제20권10호
    • /
    • pp.1867-1872
    • /
    • 2016
  • 디지털신호처리 분야에서 다양한 환경에서 존재하는 배경잡음을 제거하여 음성신호의 품질을 개선시키는 것은 반드시 필요한 문제이다. 음향학적으로 배경잡음을 제거할 때 고려해야 할 중요한 점은 인간의 청각기전이 주로 음성의 진폭 스펙트럼의 정보에 의존하여 문제 해결을 하고 있다는 사실이다. 본 논문에서는 음성의 진폭 스펙트럼의 추출을 주요 목적으로 하는 주파수가중 스펙트럼성형필터의 특성을 도입한다. 따라서 본 논문에서는 배경잡음으로 중첩된 음성신호 성분 중에 이 진폭 스펙트럼 정보를 추출하여, 위너 필터법과 음향학적인 모델에 의한 주파수가중 스펙트럼성형필터를 사용한 알고리즘을 제안한다. 본 실험에서는 스펙트럼 왜곡률(SD)에 의하여 제안한 알고리즘의 출력 SD가 기존의 다른 방법과 비교하여 약 5.28 dB 이상 개선되었다.

VoIP망을 이용한 음질의 주관적 품질평가에 관한 연구 (A Study of Subjective Quality-evaluation for Speech using VoIP Network)

  • 강영도;강진석;최연성;김장형
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 춘계종합학술대회
    • /
    • pp.285-290
    • /
    • 2001
  • 본 논문에서는 멀티미디어 서비스 요소 중의 하나인 VoIP(Voice Over Internet Protocol)망에서의 음성 품질에 대한 평가를 위해 VoIP망에서 송화자 내용- 발생과정에 있어서 어느 정도 완전히 표현되었는가를 나타내는 송화품질과 음성의 전송계를 통해 수화자에게 전달되는 과정에서 왜곡이나 잡음 등의 방해요인에 의해 열화되는 정도를 나타내는 전송품질, 그리고 수화자가 청각에서 신호처리 과정을 거친 송화자의 내용을 어느 징도 이해할 수 있는지를 나타내는 수화품질에 대한 주관적 방법을 평가한 후 통화품질을 측정한 내용을 분석하여 그 원인과 개선책에 대한 방법을 제시하고자 한다.

  • PDF

4채널 환경에서 독립벡터분석 및 주파수대역 빔형성 알고리즘에 의한 혼합잡음제거 (Mixed Noise Cancellation by Independent Vector Analysis and Frequency Band Beamforming Algorithm in 4-channel Environments)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.811-816
    • /
    • 2019
  • 본 논문에서는 잡음이 포함된 4채널의 음원신호를 주파수 대역의 독립벡터분석 알고리즘에 의하여 깨끗한 음성신호와 혼합잡음신호를 분리하는 기법을 먼저 제안한다. 제안한 독립벡터분석 알고리즘에 의하여 분리된 음원신호를 주파수대역 지연합 빔형성기로부터 출력되는 신호와 독립벡터분석으로부터 분리된 출력신호 간의 상호 상관성을 이용하여 향상된 출력음성신호를 구한다. 본 실험에서는 백색잡음이 포함된 0dB, -5dB의 SNR의 입력 혼합잡음음성에 대하여, 본 논문에서 제안하고 있는 알고리즘이 주파수대역 지연합 빔형성기 알고리즘만을 사용하였을 때 보다 최대 10.90dB의 SNR 및 10.02dB의 Segmental SNR이 개선되었음을 확인하였다. 따라서 본 논문의 알고리즘 기법이 주파수대역 지연합 빔형성기와 비교하여 음성품질이 향상된 것을 실험 및 고찰을 통하여 확인할 수 있었다.

개선된 선형예측 잔여를 이용한 음성의 잔향음 제거 (Speech Dereverberation using Improved Linear Prediction Residual)

  • 박찬섭;김기만;강석엽
    • 한국정보통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.1845-1851
    • /
    • 2007
  • 배경 잡음과 실내 잔향음은 음성 인식 시스템 성능 저하의 주요 이유이다. 많은 알고리즘이 음성의 잔향음 제거를 위해 개발되었다. 이 논문에서는 실내 환경에서 수정된 선형 예측 잔여(Linear Prediction Residual)를 이용하여 음질 개선을 위한 잔향음 제거 방법을 제안한다. 제안된 잔향음 제거 방법은 음성에서 성문 경계의 순간에 발생한 성도(聲道)시스템의 중요한 여기에 기반한다. 본 논문에서 제안한 방법은 3개의 센서로부터 수집한 반향신호로 각 센서에서의 시간지연 정보를 사용한다. 새로운 선형 예측 잔여신호는 선형 예측 잔여의 가중치와 힐버트 변환으로 얻은, 개선된 선형 예측 잔여 조합을 사용한다. 코히런트하게 더해진 힐버트 포락선의 특징은 잡음과 반사로 인한 큰 진폭 피크를 가지는 것이다. 깨끗한 음성의 잔여는 개선된 음성을 얻는 시변전극 필터를 일으키는데 사용된다. 본 논문에서는 반향 환경에서 성능 분석을 위해 제안된 알고리즘의 시뮬레이션을 수행하였다. 제안된 알고리즘은 실내 잔향환경에서 기존의 알고리즘에 비해 반사된 음성의 품질 향상의 결과를 보였다.

VoIP 스팸 콜 탐지를 위한 음성신호의 DEVS 모델링 및 시뮬레이션 (DEVS Simulation of Spam Voice Signal Detection in VoIP Service)

  • 김지연;김형종;조영덕;김환국;원유재;김명주
    • 한국시뮬레이션학회논문지
    • /
    • 제16권3호
    • /
    • pp.75-87
    • /
    • 2007
  • VoIP 서비스 품질이 개선되고 많은 문제점들이 극복되면서 이에 대한 사용자들의 관심이 높아지고 있다. VoIP는 인스턴트 메시징 서비스 등 사용자들의 편익을 위한 서비스를 제공하고 있지만 비용 및 보안 문제는 사용자들의 이러한 서비스 사용을 주저하게 만들고 있다. 본 논문은 이와 같은 문제 중 하나인 VoIP 스팸 문제를 다루고자 한다. 스팸 콜에서의 음성 메시지 신호 패턴을 고려하여 정상 콜과 Noise가 포함된 정상 콜, 스팸 콜 이 세 가지 음성 모델을 설계하고, 논문에서 제시하는 음성 신호 정보량 기반의 스팸 탐지 알고리즘에 적용해 보았다. 각 모델의 모델링 및 시뮬레이션은 DEVS-$Java^{TM}$를 이용하였다. 본 연구는 스팸 콜 음성 신호를 탐지하기 위한 방법을 제시하고 이를 모델링 및 시뮬레이션 방법론을 통해 검증하는 것에 기여점을 둘 수 있다.

  • PDF

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.