• 제목/요약/키워드: Voice quality estimate

검색결과 18건 처리시간 0.022초

이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델 (Complex nested U-Net-based speech enhancement model using a dual-branch decoder)

  • 황서림;박성욱;박영철
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.253-259
    • /
    • 2024
  • 본 논문에서는 이중 분기 디코더를 갖는 복소 중첩 U-Net 기반의 새로운 음성 향상 모델을 제안하였다. 제안된 모델은 음성 신호의 크기와 위상 성분을 동시에 추정할 수 있도록 복소 중첩 U-Net으로 구성되며, 디코더는 스펙트럼 사상과 시간 주파수 마스킹을 각각의 분기에서 수행하는 이중 분기 디코더 구조를 갖는다. 이때, 이중 분기 디코더 구조는 단일 디코더 구조에 비하여, 음성 정보의 손실을 최소화하면서 잡음을 효과적으로 제거할 수 있도록 한다. 실험은 음성 향상 모델 학습을 위해 보편적으로 사용되는 VoiceBank + DEMAND 데이터베이스 상에서 이루어졌으며, 다양한 객관적 평가 지표를 통해 평가되었다. 실험 결과, 이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델은 기존의 베이스라인과 비교하여 Perceptual Evaluation of Speech Quality(PESQ) 점수가 0.13가량 증가하였으며, 최근 제안된 음성 향상 모델들보다도 높은 객관적 평가 점수를 보였다.

연속음성신호의 SNR 추정기법에 관한 연구 (A Study on SNR Estimation of Continuous Speech Signal)

  • 송영환;박형우;배명진
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.383-391
    • /
    • 2009
  • 음성 신호처리 환경에서 잡음이 섞인 신호를 개선할 목적으로 음성향상 기법이 많이 이용되고 있다. 잡음추정 알고리즘은 변화하는 환경에 빠르게 적응할 수 있어야 하며 음성신호의 영향을 줄이기 위해 음성신호가 존재하지 않는 구간에서만 잡음의 파워를 갱신한다. 이러한 방법은 음성구간검출이 선행되어야 한다. 그러나 잡음에 열화된 음성신호에 묵음구간이 존재하지 않을 경우, 위와 같이 음성검출을 통한 묵음구간에서의 잡음 추정 방법 및 SNR 추정 방법이 적용될 수 없다. 본 논문에서는 묵음구간이 존재하지 않는 연속음성신호에서 SNR을 추정하는 기법을 제안한다. 유성음의 안정구간에서는 단구간 내 피치의 변화가 매우 작아 피치주기에 따른 음성신호의 파형이 유사하게 나타난다. 따라서 잡음이 음성에 부가되었을 때 피치주기에 따른 인접파형의 유사도를 통해 SNR을 추정한다. 무성음에서는 잡음의 영향이 수신신호의 성도성분 추정에 영향을 미치기 때문에 잡음환경에서 추정된 성도성분과 수신신호 스펙트럼 간의 거리를 이용하여 SNR을 추정한다. 마지막으로, 음성신호의 에너지가 유성음에 대부분 분포하기 때문에, 부가성 잡음 환경에서 유성음의 에너지를 음성신호의 에너지로 근사화하여 SNR을 추정할 수 있다.

VoIP 손실 환경에 강인한 저지연 LSF FEC 기법 (Low-Delay LSF FEC Technique Robust in Lossy VoIP Environment)

  • 양해용;이경훈;황인호
    • 대한전자공학회논문지SP
    • /
    • 제39권6호
    • /
    • pp.687-695
    • /
    • 2002
  • VoIP 음성 패킷 손실에 대한 대응 방안으로 제시되고 있는 매체 종속 FEC 기법은 통화 품질을 개선시키는 효과를 갖는데 반하여 한 프레임에 해당하는 추가지연이 발생하는 단점을 갖는다. 본 논문에서는 패킷 손실 복원에 사용되는 잉여 정보로 미래 프레임의 LSF 성분을 사용함으로써, 전송 지연을 줄이고 통화 품질을 개선할 수 있는 LSF FEC 기법을 제안하고 그 성능을 평가한다. 성능 평가를 위해서 VoIP에서 사용하는 ITU-T G.723.1, G.729 코덱을 Gilbert 손실 모델에 적용하고, PESQ 음질 측정 알고리즘을 사용하여 각 손실률 별로 MOS를 추정하는 방법을 사용한다. 본 논문에서 제안한 기법은 기존의 매체 종속 FEC 기법에 비해서 6.5ms∼27ms 이상의 지연 감소 효과를 가지고 있는 것으로 나타났으며, FEC를 적용하지 않은 경우와의 복원 음성 품질 비교 시뮬레이션 결과, 5% 정도의 현실적인 손실 환경에서 MOS 0.1 이상의 음질 개선 효과를 보였다.

Kano-QFD 통합모형에서의 고객 요구속성 중요도 산정 (Derivation of Weights for Customer Requirements Attribute in Kano-QFD Integration Model)

  • 문경원;김낙훈;정병호
    • 산업경영시스템학회지
    • /
    • 제37권1호
    • /
    • pp.68-78
    • /
    • 2014
  • Recently, companies are trying to gain a competitive advantage in the market to meet the voice of customer. For this purpose, QFD has been used as product development technology in many areas to include the customer' requirements. Also, Kano model has been used to understand the customer' requirements for an effective way. Therefore integration of Kano model and QFD can more efficiently reflect the customer' requirements when designing a new service. This paper proposes PI index by taking into account the current satisfaction position of our company and competitors while IR (Improvement Ratio) value was set uniformity. This study suggests a more accurate index to predict potential improvements and calculates the final importance or priority. Through case studies targeted at elevator maintenance companies, we can have a general idea how much to improve in the near future and estimate the final importance of customer requirements.

신용카드서비스에 대한 공적불평행동과 불평처리 만족에 관한 연구 (Consumer Public Complaint Behaviors and Satisfaction of Complaint Handling By Credit Card Services)

  • 이영애
    • 한국생활과학회지
    • /
    • 제21권5호
    • /
    • pp.957-973
    • /
    • 2012
  • This study analyzed consumer public complaint behaviors and the satisfaction of complaint handling among credit card users who availed of credit card services. Relatively little research has been done in this area, despite the obvious importance of understanding and improving credit card market conditions. The purpose of this study was to examine consumer compliant behaviors with a focus on public actions, such as voice responses and the third party actions among credit card users. With the goal of providing consumers with more positive expectations of credit card companies' complaint handling process, this study investigated the status of public actions and the negative effect of complaints on the overall satisfaction of post-complaint behavior toward credit card services. The responses from 1,000 credit card users were analyzed using descriptive analysis, factor analysis, multi-logit analysis, and Heckman selection estimate. The analysis provided three major results: (1) perceived service quality among credit card users was conceptualized into groups such as responsiveness, innovation, company, additional service, and fee, (2) perceived service qualities, age, residential area, employment status, and subjective economic status had significant effect on public compliant action behaviors, and (3) unidimensional factors resulting from post-complaint behaviors were analyzed and several variables, such as period of credit card use, average amount used, and perceived service quality had significant effects on the degree of satisfaction associated with complaint handling in terms of credit card services. Several implications and directions for further research are discussed.

무선 네트워크 환경에서 멀티미디어 서비스를 위한 AP 선정 기법 (An AP Selection Scheme for Enhancement of Multimedia Streaming in Wireless Network Environments)

  • 류동우;왕위빈;강경진
    • 한국산학기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.997-1005
    • /
    • 2010
  • 최근 무선 랜(WLAN : Wireless Local Area Network) 기술이 사용자에게 편리성과 유연성을 제공함에 따라 무선 분야에 대한 관심이 증가하고 있다. 무선 랜 어플리케이션의 웹 접근과 같은 표준화된 인터넷 서비스에서부터 멀티미디어 비디오 및 음성 서비스와 같은 분야에서 매우 엄격한 지연시간/처리율이 요구된다. 따라서, 무선 랜의 효율을 높이기 위해 AP(Access Point)들 간 트래픽의 공정하고 효율적인 부하의 분산이 중요한 문제가 된다. 본 논문에서는 보다 나은 로드 밸런스를 달성하고, 네트워크 리소스 사용률을 증가시키기 위한 AP 선정 기법을 제안한다. 제안된 기법은 부하 측정과 AP 선정의 주요 파라미터로서 활성화 검사 패턴과 네트워크 지연을 사용한다. 또한, 상향 링크/하향링크 지연을 관찰함으로써 AP 트래픽 부하를 예측하고, 로드 밸런스를 통해 링크 자원의 효율성을 극대화하기 위해 예측 결과를 사용한다. 제안하는 기법은 NS-2(Network Simulation-2)를 이용하여 SNR(Signal to Noise Ratio) 기법과 비교하였다. 제안한 기법은 전체 네트워크의 처리율이 12.5% 향상된 것으로 나타났고, 상향링크/하향링크 지연 시간은 36.84%, 60.42%씩 감소되었다. 또한 제안한 기법은 전체 네트워크 처리율을 증가시켰으며, 비디오와 음성서비스를 우수한 품질로 제공하면서 상향링크/하향링크의 지연 시간을 감소시킴을 확인하였다

공간평가를 위한 피스톨음원의 적정성에 관한 연구 (A Study of Enemy Aptitude of Pistol Sound Source for Space Estimation)

  • 송장렬;김정중
    • 한국소음진동공학회논문집
    • /
    • 제15권3호
    • /
    • pp.320-328
    • /
    • 2005
  • Last target of architectural acoustics is that people wish to convey voice effectively from the space adaptively in use purpose in building. But, how exactly through space sound (sound source) that wish to deliver from indoor can be passed method to do quantification and evaluate quantity of sound by method to serve indoor architectural acoustics estimation summer period and methods to estimate definition propose. This Study searches special quality of sound source about MLS signal that is occurred short-answer sound source (pistol sound source) and nondirectional speaker among indoor sound estimation method, and measure and analyzed reverberation time (RT60), definition (C80, D50) by regulation of each ISO 3382 in age place (classroom, hall, gymnasium). Analysis result and sound factor among could know that d of two sound sources converges in measurement error extent about reverberation time (RT60) of analysis incidental and sound factors and value shows change irregularly about sound factor of D50, C80, pistol sound source judged there is problem. Also, could know that problem is happened in deflection except reverberation time is in deflection analysis with wave that measure each in fixed distance in branch. Finally, when differ size of sound source and measure about change of sound pressure level in case measure sound pressure level giving difference about 10 dB, sound factor could know that there is no different effect.

서브밴드 가중치를 적용한 스펙트럼 최소값 추적을 이용하는 수정된 IMCRA 기반의 음성 향상 기법 (Speech Enhancement Based on Modified IMCRA Using Spectral Minima Tracking with Weighted Subband Selection)

  • 박윤식;박규석;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권3호
    • /
    • pp.89-97
    • /
    • 2012
  • 본 논문에서는 잡음환경에서 음성 향상 (speech enhancement)을 위한 새로운 잡음전력 추정 방법을 제안한다. 음성 향상 알고리즘에 널리 적용되고 있는 IMCRA (improved minima controlled recursive averaging) 기법은 오염된 음성신호로부터 추정된 최소 전력 스펙트럼에 기반하여 잡음전력을 추정하는 기존의 방법을 개선하기 위해 간단한 음성 검출 알고리즘을 이용하여 대략적으로 음성 성분이 제거된 전력 스펙트럼에서 최소값을 추정함으로써 음성구간에서 발생할 수 있는 음성왜곡 문제점을 개선하였다. 하지만 비정상 잡음이나 신호 대 잡음 비 (SNR signal-to-noise ratio)가 낮은 환경에서는 음성 검출 성능이 저하되어 음성구간에서 음성왜곡이 발생되는 기존의 문제점이 여전히 발생된다. 따라서 제안된 방법에서는 향상된 잡음전력 추정을 위하여 기존의 IMCRA에서 추정된 최소 전력 스펙트럼에 대하여 스펙트럼 최소값 추적 (SMT, spectral minima tracking) 기법을 적용하고 IMCRA에 의한 최소값과 SMT에 의해 추정된 최소값을 서브밴드 (subband)에 따라 가중치를 적용하여 결합한다. 제안된 알고리즘은 기존의 방법과 주관적 및 객관적 음질평가 테스트를 통해 비교 평가한 결과 다양한 배경잡음 환경에서 향상된 성능을 보였다.