• 제목/요약/키워드: Perceptual quality

검색결과 344건 처리시간 0.023초

잡음 추정 알고리즘을 이용한 신뢰성 있는 코드벡터 조합의 선정 방법 (A Selection Method of Reliable Codevectors using Noise Estimation Algorithm)

  • 정승모;김무영
    • 전자공학회논문지
    • /
    • 제52권7호
    • /
    • pp.119-124
    • /
    • 2015
  • 배경잡음에 강인한 음성인식을 위한 전처리기로써 음성향상 기법이 요구되고 있다. 코드북 기반의 음성향상 기법은 기존 잡음 추정 알고리즘들과 비교하여 nonstationary 배경잡음 환경에 강인하다는 장점이 있다. 하지만 코드북 정보에 의존적이기 때문에 입력신호와 상관성이 떨어지는 코드벡터의 조합을 사용할 경우 성능이 급격히 떨어진다는 단점이 있다. 본 논문에서는 학습된 음성과 잡음 코드벡터를 조합하는 과정에서 입력신호와 상관성이 떨어지는 코드벡터의 조합을 제거함으로써, Log-Spectral Distortion (LSD)과 Perceptual Evaluation of Speech Quality (PESQ) 관점에서 기존 코드북 기반 알고리즘의 성능을 향상시켰다.

Pyramid VQ를 이용한 AMR-WB+ 코덱 내 TCX 모듈의 성능 개선 (Improvement of the TCX Module in AMR-WB+ Codec Using Pyramid VQ)

  • 박상국;박정은;백승권;서정일;강상원
    • 한국음향학회지
    • /
    • 제26권3호
    • /
    • pp.109-114
    • /
    • 2007
  • 본 논문은 AMR-WB+ 코덱의 오디오 품질을 개선하기 위하여 TCX모듈 변환계수 양자화기에 8차 및 16차 Pyramid VQ방식을 제안하였다. 제안된 Pyramid VQ 방식은 AMR-WB+ 코덱에 적용된 $RE_8$ Lattice VQ 방식과 비교 평가되었으며, 8차 및 16차 Pyramid VQ 방식의 사용시 Mean Squared Error (MSE)는 각각 4% 및 5.7% 개선되었고, Perceptual Evaluation of Audio Quality(PEAQ) 값은 각각 3.3% 및 4.7% 개선되었다.

인지적 색 차이 기반의 이미지 품질 평가 기법 및 왜곡 종류에 따른 평가 시스템 제안 (Perceptual Color Difference based Image Quality Assessment Method and Evaluation System according to the Types of Distortion)

  • 이지용;김영진
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1294-1302
    • /
    • 2015
  • 현재까지 인간 시각 체계를 정확하게 반영하기 위한 이미지 평가 기법에 대한 연구가 많이 이루어져 오고 있다. SSIM은 인간의 시각 체계가 이미지의 구조적 정보에 예민하다는 점을 이용하여 구조적 정보를 이용하여 이미지를 평가하는 대표적인 인간 시각 체계를 만족시키는 평가 기법이다. 하지만 SSIM은 이미지의 색 차이를 반영하지 못하는 문제가 있다. 이러한 문제를 해결하기 위해, HSI 색 공간을 활용한 SHSIM 기법이 제안되었으나 두 컬러 이미지 간 인지적 색 차이를 충분히 반영하지는 못하고 있다. 본 논문에서는 CIE Lab 색 공간을 도입하여 대응 되는 픽셀들의 인지적 색 차이를 계산하여 이미지 평가에 활용하는 방법을 제안한다. 그리고 연구를 더 확장하여, SVM 분류기를 활용하여 왜곡 종류에 따라 최적의 평가 수식을 적용하는 최적화 시스템을 제안한다. 제안하는 기법을 평가하기 위해, 이미지 평가분야에서 가장 많이 알려진 LIVE 데이터베이스를 사용하였으며 네 종류의 평가 기준들을 이용하였다. 실험 결과에서는 제안하는 기법이 다른 기법들보다 인간 시각 체계와 더 상관성이 높다는 것을 보여준다.

부산·경남지역 의료소비자들의 전문병원에 대한 지각 만족도와 기대요소 간의 인과관계 (The Cause-and-Effect Relationship between Perceptual Satisfaction and Expectation Factors for Special Hospitals by Busan and Gyungnam Medical Consumers)

  • 박기혁;신진호
    • 융합정보논문지
    • /
    • 제11권7호
    • /
    • pp.181-188
    • /
    • 2021
  • 본 연구는 중소병원들이 지속적으로 안정성과 효과성을 유지할 수 있는 전략방안의 검토를 위하여 전문병원에 대한 기대수준 대비 이용 후 지각 만족도와 기대요소 간의 관계를 살펴보았다. 연구방법은 20세 이상의 부산 및 경남 거주자를 대상으로 구조화된 설문지를 이용하여, 카이제곱 검정, 로지스틱 회귀분석을 실시하였다. 연구결과, 첫째, 응답자의 68.0%가 특성화를 표방하는 병원을 전문병원으로 인식하였고, 보건복지부 지정병원이라 인식한 응답자는 21.3%로 확인되었다. 둘째, 주관적으로 인식하는 전문병원 이용 경험이 있는 경우에는 대부분의 이용자들이 기대수준 대비 지각하는 만족도가 충족되었으며, 이용했던 병원을 계속 이용 할 의사가 있는 것으로 확인되었다. 셋째, 기대수준 대비 이용 후 지각 만족도에는 치료에 대한 안전성과 치료의 질적 수준이 유의하게 영향을 미치는 인과관계가 있음을 확인하였다. 이 결과는 의료소비자들의 지각 만족도 향상과 감정적 애착 관리를 통한 장기적이고 지속적인 효과를 위한 전략 수립에 유용한 정보로 활용될 수 있을 것으로 사료된다.

노인성 후두의 조직병리학적, 생리학적 특성 (Histopathologic and Physiologic Features of the Aging Larynx)

  • 박일석
    • 대한후두음성언어의학회지
    • /
    • 제25권1호
    • /
    • pp.20-23
    • /
    • 2014
  • Age-related changes in larynx can have a direct impact on voice quality and general comfort level. Observations of vocal aging have spanned perceptual, acoustic, aerodynamic, physical, electromyographic (EMG) and histological levels. Evidence of differential vocal aging in relation to gender and physical condition has been reported. Perceptual, acoustic, aerodynamic, kinematic, EMG and histological data document age-related changes in laryngeal structure and function with advancing age. These changes contribute to a functional age-related impact of vocal hypofunction or compensatory hyperfunction. This review will focus on the current understanding of the clinical and cellular changes in the larynx that lead to presbyphonia.

  • PDF

A Reversible Audio Watermarking Scheme

  • Kim, Hyoung-Joong;Sachnev, Vasiliy;Kim, Ki-Seob
    • 정보통신설비학회논문지
    • /
    • 제5권1호
    • /
    • pp.37-42
    • /
    • 2006
  • A reversible audio watermarking algorithm is presented in this paper. This algorithm transforms the audio signal with the integer wavelet transform first in order to enhance the correlation between neighbor audio samples. Audio signal has low correlation between neighbor samples, which makes it difficult to apply difference expansion scheme. Second, a novel difference expansion scheme is used to embed more data by reducing the size of location map. Therefore, the difference expansion scheme used in this paper theoretically secures high embedding capacity under low perceptual distortion. Experiments show that this scheme can hide large number of information bits and keeps high perceptual quality.

  • PDF

Improved Single Channel Speech Enhancement Algorithm Using Adaptive Postfiltering

  • 송은우;강홍구
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.122-125
    • /
    • 2011
  • In real environment, background noise exists everywhere and degrades the performance of system. To reduce this distortion, a speech enhancement algorithm can be very useful and variety methods have been proposed. In this paper, we propose a postfilter to improve the performance of optimally modified log-spectral amplitude (OM-LSA) estimator. Proposed algorithm uses the formant postfilter to minimize perceptual distortion caused by background noise. We adjust an emphasizing parameter which is varied by spectral flatness and first reflection coefficient. The performance of the proposed algorithm is evaluated by measuring the log-spectral distance (LSD) and the perceptual evaluation of speech quality (PESQ) score. The test results show the improvement of proposed algorithm compared to conventional OM-LSA.

  • PDF

심리 음향 겝스트럼 평균 차감법을 이용한 이동 전화망에서의 음질 평가 (Speech Quality Measure in a Mobile Communication System using PLP Cepstral Distance with CMS)

  • 윤종진;박상욱;박영철;안동순;윤대희
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2046-2051
    • /
    • 2000
  • 본 논문에서는 기존의 음질 평가 방법들보다 우수할 뿐 아니라 다양한 채널 경로의 음성 신호에 대해서도 일관된 성능을 갖는 새로운 음질 평가 방법 PLP-CMS(Perceptual Linear Predictive-Cepstral Mean Subtraction)를 제안한다. CDMA PCS 이동 전화 환경에서 음성 신호의 주관적 음질을 효과적으로 예측할 수 있는 PLP-CMS는 심리 음향 선형 예측 분석(PLP Analysis: Perceptual Linear Predictive Analysis)을 이용하여 주관적 음질과의 상관 관계를 높였으며, 겝스트럼 평균 차감(CMS: Cepstral Mean Subtraction) 과정을 통하여 PSTN 경로에 무관하게 일관된 성능을 갖음을 확인하였다.

  • PDF

Perceptual Experiment on Number Production for Speaker Identification

  • Yang, Byung-Gon
    • 음성과학
    • /
    • 제8권1호
    • /
    • pp.7-19
    • /
    • 2001
  • The acoustic parameters of nine Korean numbers were analyzed by Praat, a speech analysis software, and synthesized by SenSynPPC, a Klatt formant synthesizer. The overall intensity, pitch and formant values of the numbers were modified dynamically by a step of 1 dB, 1 Hz and 2.5% respectively. The study explored the sensitivity of listeners to changes in the three acoustic parameters. Twelve subjects (male and female) listened to 390 pairs of synthesized numbers and judged whether the given pair sounded the same or different. Results showed that subjects perceived the same sound quality within the range of 6.6 dB of intensity variation, 10.5 Hz of pitch variation and 5.9% of the first three formant variations. The male and female groups showed almost the same perceptual ranges. Also, an asymmetrical structure of high and low boundary was observed. The ranges may be applicable to the development of a speaker identification system while the method of synthesis modification may apply to its evaluation data.

  • PDF

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.