• 제목/요약/키워드: Mean Opinion Score (MOS)

검색결과 94건 처리시간 0.018초

EVALUATION OF THE SYNTHETIC SPEECH QUALITY BY THE TD-PCULI METHOD

  • Kang, Chan-Hee;Shin, Yong-Jo;Kim, Yun-Seok;Kwon, Ki-Hyung;Chin, Yong-Ohk
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.977-983
    • /
    • 1994
  • In this paper we have evaluated the synthetic speech quality by the proposed TD-PCULI speech synthesis method. For the synthesis we have extracted parameters from the Korean monosyllables through the analysis of speech waveforms in the time domain. We have constructed the Korean data format dictionary for the synthesis-by-rule depending upon the frequencies of the Korean pronunciation large vocabulary dictionary, in which V type syllables are 19, CV type's are 80, VC type's are 30 and CVC type's are 100. And using them we have synthesized various Korean monosyllables, words and sentences. We have tested each 10 syllables selected according to the 4 Korean syllable types with the objective MOS(Mean Opinion Score) evluation method about the 4 items i.e., intelligibility, clearness, loudness, and naturality after selecting random group without the knowledge of them. And also we have tested the possibility to modify a duration and F0 into another forms with changing a duration (i.e., 150msec, 300msec, 500msec, 700msec and 1sec) and a central fundamental frequency(i.e., 80Hz, 118Hz, 140Hz, 170Hz, and 200Hz). As the results of experiments the noises occurred in the course of synthesizing the speech by the rules are removed to be a very clear level and we can find that the prosodic elements can be controled as a good condition.

  • PDF

S-JND 모델을 사용한 주관적인 율 제어 알고리즘 기반의 HEVC 부호화 방법 (A Perceptual Rate Control Algorithm with S-JND Model for HEVC Encoder)

  • 김재련;안용조;임웅;심동규
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.929-943
    • /
    • 2016
  • 본 논문에서는 인지 화질을 고려하기 위해 S-JND 모델 기반의 율 제어 알고리즘을 제안한다. 제안하는 율 제어 알고리즘은 인간이 가지는 시각 시스템의 특징을 반영하기 위하여 시각적 민감도와 시각적 관심도를 동시에 반영할 수 있도록 제작된 S-JND (Saliency-Just Noticeable Difference) 모델을 사용한다. 율 제어 알고리즘을 통해 비트를 분배하는 과정에서 픽쳐 내에 존재하는 각 CTU (Coding Tree Unit)가 가지는 S-JND threshold를 구한다. 각 CTU의 threshold는 적응적으로 적절한 비트를 분배하는데 사용되고, 따라서 제안하는 비트 분배 모델은 인지 화질을 향상 시킬 수 있다. 제안하는 방법의 성능 검증을 위해서 제안하는 방법을 HM 16.9에 구현하였으며, CTC (Common Test Condition) RA (Random Access), Low-delay B와 Low-delay P의 경우에 Class B와 Class C 영상들에 대해 실험 하였다. 실험 결과, 제안하는 방법은 기존 율 제어 알고리즘 대비 평균 2.3%의 비트율이 감소했고 BD-PSNR은 약 0.07dB 향상이 있었으며 비트 정확도 또한 0.06% 정도 증가하였다. DSCQS (Double Stimulus Continuous Quality Scale) 방법으로 측정한 결과, 제안하는 방법은 기존 방법 대비 0.03 MOS (Mean Opinion Score) 향상을 보였다.

IPTV 서비스에서 패킷손실에 의한 비디오품질 열화 모니터링 방법 (A Nobel Video Quality Degradation Monitoring Schemes Over an IPTV Service with Packet Loss)

  • 권재철;오승준;서창렬;진영민
    • 방송공학회논문지
    • /
    • 제14권5호
    • /
    • pp.573-588
    • /
    • 2009
  • 본 논문에서는 네트워크 전송 중에 패킷손실에 의해 열화되는 IPTV 셋탑박스(STB: Set-Top Box) 재생영상의 화질을 모니터링하는 방법인 VR-VQMS(Visual Rhythm based Video Quality Monitoring Scheme)를 제안한다. 제안된 방법은 인코딩된 영상의 비쥬얼리듬(VR) 정보와 STB 재생영상의 비쥬얼리듬 정보를 특징정보로 사용하는 감소기준법 기반의 영상품질 측정 방법이며, 특히 영상품질관리 측면에서 패킷손실에 의한 화질열화를 정량화한 것이다. 화면열화 정도를 측정하기 위해 기존의 PSNR(peak-to-peak signal-to-noise ratio)을 수정한 NPSNR(Networked PSNR)이라는 새로운 품질척도를 정의하고 이를 기반으로 객관적 및 주관적 열화 척도를 정의하였으며, 온라인 VR-VQMS와 오프라인 VR-VQMS 두 가지의 화질열화 모니터링 방식을 제안하였다. 제안된 방법을 사용하면 화질열화가 발생된 시간과 지속시간, 발생횟수, 평균열화량 등에 대한 통계정보를 얻을 수 있을 뿐만 아니라 시청자의 주관적 체감화질까지 측정할 수 있으며, VR 정보를 사용하기 때문에 눈으로도 직접 이들을 확인할 수 있다는 장점이 있다. 모의실험 결과를 통하여 VR 정보로 추정한 NPSNR 을 이용하여 계산한 화질열화 척도값이 2D 재생영상에 대해 계산한 화질열화 척도값을 매우 근사적으로 추정하고, 시청자의 주관적 화질까지도 상당히 정확하게 추정함을 확인할 수 있었다. 제안된 방법은 IPTV 사업에서 개별 고객들의 시청품질을 평가하는 품질관리 솔루션의 일부로 적용가능하며, 복잡한 연산은 품질관리서버가 수행하고, STB는 작고 가벼운 에이전트 프로그램만 탑재하면 되기 때문에 실용성이 뛰어난 장점이 있다.

3차원 시각 주의 모델과 이를 이용한 무참조 스테레오스코픽 비디오 화질 측정 방법 (3D Visual Attention Model and its Application to No-reference Stereoscopic Video Quality Assessment)

  • 김동현;손광훈
    • 전자공학회논문지
    • /
    • 제51권4호
    • /
    • pp.110-122
    • /
    • 2014
  • 최근 사용자에게 직접 입체감을 제공하는 3차원 영상기술에 대한 관심이 증대함에 따라 스테레오스코픽 비디오 화질 측정기술개발은 중요한 주제로 많은 연구자에게 관심을 받고 있다. 특히, 스테레오스코픽 비디오 화질 측정에 중요한 역할을 하는 인간시각특성을 고려한 연구가 활발히 진행되지 않고 있어 본 논문에서 스테레오스코픽 비디오를 시청할 때 자극되는 다수의 인간시각특성 요소인 깊이, 움직임, 컬러, 휘도, 대조 등을 고려하여 3차원 시각 주의 모델을 제안한다. 또한, 본 논문에서는 실제 3차원 영상 특정 영역의 화질 열화 정도를 측정하는데 제안된 3차원 시각 주의 모델을 사용하여 무참조 스테레오스코픽 비디오 화질 측정 방법을 제안하였다. 제안 방법을 검증하기 위해 주관평가를 실시하여 기존의 스테레오스코픽 비디오 화질 측정 방법보다 평균 평가점에서 더 높은 연관성을 보였다. 게다가, 3차원 시각 주의 모델을 이용하여 스테레오스코픽 비디오의 관심영역 추출 결과는 공간적, 시간적 요소를 고려하여 추출된 관심영역에 비해 실제 관심영역과 더욱 유사함을 주관적으로 보여 제안 방법의 효율성을 보였다.