• 제목/요약/키워드: Mean Opinion Score (MOS)

검색결과 94건 처리시간 0.052초

디지털 이동통신망 환경 하에서 마스킹 효과를 이용한 객관적 음질 평가 척도 (An Objective Speech Quality Measure using Masking Effect under Digital Mobile Telephone Network Environment)

  • 김광수;김민정;석수영;정호열;정현일
    • 한국멀티미디어학회논문지
    • /
    • 제5권4호
    • /
    • pp.405-414
    • /
    • 2002
  • 본 논문에서는 이동전화망 환경 하에서의 음성의 통화품질 평가를 위해 마스킹 문턱치를 이용하는 객관적 음질평가법을 제안하고 실험을 통하여 그 유효성을 확인하였다. 현재까지 잘 알려진 BSD(Bark Spectral Distortion), PSQM(Perceptual Speech Quality Measure)등의 성능을 먼저 분석하였다. 그 결과, MOS(Mean Opinion Score)와의 상관성이 이동통신 환경하에서 문헌상에 보고된 결과보다 성능이 저하됨을 확인하였다. 이동통신 환경하에서 보다 효율적인 객관적 음질평가척도 개발을 위하여 제안된 방법에서는 인간의 심리음향학적 마스킹 현상을 이용하였고, 성능 평가시 비교대상인 주관적 음질척도로는 DMOS(Degradation MOS)를 사용하였다. 디지털 이동통신망에서 수집된 음성 데이터에 대한 성능평가실험을 수행한 결과, BSD와PSQM 같은 기존의 척도들에 비하여 평균 4%의 상관성능이 향상됨을 확인하였다.

  • PDF

VVC에서 360 비디오를 위한 랩-어라운드 움직임 벡터 예측 방법 (Wrap-around Motion Vector Prediction for 360 Video Streams in Versatile Video Coding)

  • 이민훈;이종석;박준택;임웅;방건;심동규;오승준
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.313-324
    • /
    • 2020
  • 본 논문에서는 360 비디오의 특성을 이용하여 픽쳐 경계에서 코딩 효율을 증가시키는 움직임 벡터 예측 방법을 제안한다. VVC의 화면간 예측에서 움직임 벡터 후보군을 구성할 때 주변 블록의 위치가 픽쳐의 경계 바깥이면 후보군 구성 과정에서 제외되어 픽쳐 경계에서 코딩 효율이 감소하게 된다. 이를 해결하기 위해 360 비디오의 부/복호화를 위한 투영 방법의 특성을 이용하여 이미 복호화된 정보로부터 픽쳐의 경계에서 추가로 후보군을 구성하는 방법을 제안한다. 제안하는 방법의 성능 평가를 위하여 JVET-360 CTC의 임의 접근 환경에서 VTM6.0 및 360Lib9.1와 비교한다. 그 결과로써 제안하는 방법은 추가 계산 복잡도 없이 휘도 성분에서 평균 0.02%, 색차 성분에서 각각 평균 0.05%, 0.06%의 비트율 감소를 보이고, 픽쳐의 경계에서는 비트율이 휘도 성분에서 평균 0.29%, 색차 성분에서 각각 평균 0.45%, 0.43% 감소하였다. 그리고 DSCQS (Double Stimulus Continuous Quality-Scale) 방법을 통해 제안하는 방법의 주관적 화질 평가를 수행하여 MOS (Mean Opinion Score)값을 얻는다. MOS값은 평균 0.03 향상되었고, MOS값과 비트량을 이용하여 BD-MOS를 구한다. 그 결과, 제안하는 방법의 성능이 최대 8.78%, 평균 5.18% 향상하였다.

정적 통계적 특성 잡음의 추정을 통한 지각 필터 성능 개선 (Perceptual Filter Performance Improvement through Estimation of Stationary Static Characteristic Noise)

  • 서정국;류일현;차형태
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.291-294
    • /
    • 2004
  • 본 논문에서는 잡음의 변화(variance)가 없는 정적인 통계적 특성(Stationary Static Characteristic)을 갖는 환경에서 잡음 추정을 통해 지각 필터의 성능을 개선하는 알고리즘을 제안한다. 제안된 잡음 추정 알고리즘은 입력되는 잡음에 열화 된 신호의 묵음 구간에서 추정된 잡음을 이용하여 입력되는 잡음의 SNR을 추정 후, 대역 별로 smoothing 상수 값으로 잡음 에너지를 제어하여 첨가된 잡음을 추정함으로써 초기 추정 잡음 보다 가까운 추정 잡음을 얻을 수 있게 된다. 이는 신호를 열화 시킨 잡음을 보다 정확한 추정을 제공함으로써, 지각 필터의 응답을 개선할 수 있고 더불어 잡음에 의해 열화 된 신호의 음질을 개선할 수 있다. 또한 저 대역에 영향을 미치는 잡음인 경우 다른 방법들과는 달리 음질의 개선이 뚜렷하다. 기존의 방식과 비교를 위해 다양한 신호 대 잡음 비(signal-to-noise ratio, SNR)에서 열화 된 오디오 신호를 입력으로 사용하였다. 입력 SNR이 5dB, 10dB, 15dB와 20dB의 각각의 경우에 대하여 SSNR(Segmental SNR)과 잡음 대 마스킹 비(Noise-to-mask ratio, NMR), 음질 테스트를 수행한 결과, 청감 테스트(Mean Opinion Score, MOS Test) 결과의 향상과 음질개선의 개선을 확인할 수 있었다.

  • PDF

효율적인 Call Flow 를 위한 VOIP 기반 Converged Virtual Call Center Architecture (Converged Virtual Call Center Architecture based on VOIP for efficient call flow)

  • 강정식;백두권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.1189-1192
    • /
    • 2003
  • 초기 콜 센터는 단순히 고객에게 걸려오는 전화를 응대하는 서비스 수준으로 시작되었지만, 현재는 고객과 마주하는 최 접점으로 서비스 뿐만 아니라 마켓팅, 세일즈를 행하는 기업의 경쟁력을 유지하는데 있어 필수적인 요소로 자리잡아 가고 있다. 특히 개인고객을 많이 접하는 금융기관에서는 콜 센터를 대형화, 지방 분산화 및 백업체제 구축을 위한 Multi 센터를 구축하여 콜만 처리하는 센터로서가 아니라 다양한 채널[전화,email,fax,chating]를 통해 접속되는 고객요구 사항들을 통합된 인프라에서 One Stop 으로 처리하고자 한다. 하지만 회선 교환망을 이용하는 PBX기반 Voice 회선과 IP 환경의 DATA 를 처리하는 이원화된 구조로 Multi 콜 센터를 구축 할 경우, 타 센터의 상담원에게로 콜을 설정시 시간이 많이 소요되어 센터간 Call Load Balancing 및 상담원 Skill Based Routing 을 수행함이 어렵다는 단점이 있다. 본 논문에서는 이러한 단점을 개선할 수 있는 방안으로 Voice 와 Data 를 IP 기반 단일 망으로 구성하고 WAN상에서 음성을 전달할 때 적정한 MOS(Mean opinion score)를 측정 후 객관적으로 필요한 Bandwidth 를 검증하고 Muti 콜 센터에서 효과적인 콜 load Balancing 및 Routing을 할 수 있는 VOIP기반 Convereed Virtual Call Center Architecture 설계 한다.

  • PDF

Resource Allocation for Relay-Aided Cooperative Systems Based on Multi-Objective Optimization

  • Wu, Runze;Zhu, Jiajia;Hu, Hailin;He, Yanhua;Tang, Liangrui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2177-2193
    • /
    • 2018
  • This paper studies resource allocation schemes for the relay-aided cooperative system consisting of multiple source-destination pairs and decode-forward (DF) relays. Specially, relaying selection, multisubcarrier pairing and assignment, and power allocation are investigated jointly. We consider a combinatorial optimization problem on quality of experience (QoE) and energy consumption based on relay-aided cooperative system. For providing better QoE and lower energy consumption we formulate a multi-objective optimization problem to maximize the total mean opinion score (MOS) value and minimize the total power consumption. To this end, we employ the nondominated sorting genetic algorithm version II (NSGA-II) and obtain sets of Pareto optimal solutions. Specially, two formulas are devised for the optimal solutions of the multi-objective optimization problems with and without a service priority constraint. Moreover, simulation results show that the proposed schemes are superior to the existing ones.

FEC기능을 추가한 AMR-WB 음성 부호화기를 이용한 음성 패킷 전송 (Speech Packet Transmission Using the AMR-WB Coder with FEC)

  • 황정준;이인성
    • 대한전자공학회논문지TC
    • /
    • 제40권11호
    • /
    • pp.63-71
    • /
    • 2003
  • 본 논문에서는 인터넷 환경에서 실시간 음성 통신을 가능하게 하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송 방법을 제시한다. 3GPP에서 기본적으로 이동 통신 환경에서의 사용을 위해 표준화되었고, 인터넷 환경에서의 사용을 위해 최근에 ITU-T에서 개선된 AMR-WB 음성 부호화기를 사용하였다. 인터넷과 같은 패킷 교환망 서비스에서의 패킷손실은 음질 저하를 유발하고 실시간 통신이 불가능하도록 한다. 따라서 본 논문에서는 단일 손실 발생시에 FEC(Foward Error Correction) 방법을 적용하였고 연속 손실의 경우에는 오류 은닉을 하였다. 또한 손실율에 따라 AMR-WR(Adaptive Multi-Rate Wideband) 부호화기의 특성을 이용하여 여러 모드로 동작하는 방법을 제시한다. 인터넷 환경의 실험을 위해 길버트 모델을 이용하였다. 손실율을 변화시키며 AMR-WB 23.05 kbit/s 모드로 전송하는 방법과 SNR(Signal to Noise Rate)과 MOS(Mean Opinion Score) 측정을 통해 비교하였다. 실험한 결과 손실율이 30% 에서도 SNR은 9.8㏈ MOS 값은 3.0정도의 통신 가능한 높은 음질을 보였다.

IPTV 서비스 영상에 대한 객관적 품질측정 방안 연구 (Research for measuring degradation of IPTV-serviced videos)

  • 김원준;김창익;김진술;이현우;류원
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.440-451
    • /
    • 2008
  • 최근 IP 기반의 멀티미디어 서비스가 증가하면서 IPTV에 대한 수요가 급증할 것으로 예상되고 있다. IPTV는 케이블을 이용하는 기존의 TV와 달리 IP 네트워크 기반의 다양한 서비스 제공이 가능하다. 그러나 IPTV 서비스 품질은 패킷 손실, 지터와 같은 네트워크 열화에 크게 영향을 받기 때문에 언제나 안정된 서비스를 보장하기가 힘들다. 본 논문에서는 다양한 영상 열화에 대하여 주관적 평가를 반영한 IPTV 서비스 품질측정 방안을 도출한다. 이를 위하여 시청자에게 인지적으로 영향을 줄 수 있는 열화 항목을 선정하였으며 선정된 각 열화 항목에 대하여 측정 메트릭을 제안하였다. 각 열화 항목에 대하여 MOS(Mean Opinion Score) 기반의 주관적 평가를 수행하였으며 제안한 메트릭의 측정 결과를 주관적 평가에 사상시켜 주관적 인지 상태를 고려하는 항목별 객관적 품질측정 기준을 도출한다. 다양한 영상에 대한 실험을 통해 개발된 품질측정 메트릭이 주관적 측면을 잘 반영하고 있음을 확인할 수 있다.

패킷취합전송이 있는 MANET에서 IDS 성능 (IDS Performance on MANET with Packet Aggregation Transmissions)

  • 김영동
    • 한국전자통신학회논문지
    • /
    • 제9권6호
    • /
    • pp.695-701
    • /
    • 2014
  • 블랙홀 공격은 라우팅 정보를 무단으로 변경하여 전송성능에 치명적인 영향을 초래할 수 있다. 블랙홀 공격에 대응하는 수단으로서 IDS(Intrusion Detection System) 또는 IPS(Intrusion Prevention System) 등을 사용할 경우 일정 정도의 전송성능을 개선할 수 있다. 본문에서는 블랙홀 공격이 발생되는 MANET(Mobile Ad-hoc Network)에서 IDS가 종단간 성능에 미치는 영향을 패킷취합전송 관점에서 분석한다. 성능분석은 NS-2를 기반으로 구축한 MANET 시뮬레이터를 사용하였으며, 음성 서비스인 VoIP(Voice over Internet Protocol) 트래픽을 대상으로 음성서비스 표준 성능 파라미터인 MOS(Mean Opinion Score), 연결율, 지연 및 패킷손실율을 분석하였고, 본 논문에서 제시한 성능팩터를 활용한 분석을 제시하였다. 성능분석 결과의 하나로 패킷취합전송을 사용하는 MANET에서 블랙홀 공격에 대비한 IDS 조건을 제시하였다.

CA Joint Resource Allocation Algorithm Based on QoE Weight

  • LIU, Jun-Xia;JIA, Zhen-Hong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2233-2252
    • /
    • 2018
  • For the problem of cross-layer joint resource allocation (JRA) in the Long-Term Evolution (LTE)-Advanced standard using carrier aggregation (CA) technology, it is difficult to obtain the optimal resource allocation scheme. This paper proposes a joint resource allocation algorithm based on the weights of user's average quality of experience (JRA-WQOE). In contrast to prevalent algorithms, the proposed method can satisfy the carrier aggregation abilities of different users and consider user fairness. An optimization model is established by considering the user quality of experience (QoE) with the aim of maximizing the total user rate. In this model, user QoE is quantified by the mean opinion score (MOS) model, where the average MOS value of users is defined as the weight factor of the optimization model. The JRA-WQOE algorithm consists of the iteration of two algorithms, a component carrier (CC) and resource block (RB) allocation algorithm called DABC-CCRBA and a subgradient power allocation algorithm called SPA. The former is used to dynamically allocate CC and RB for users with different carrier aggregation capacities, and the latter, which is based on the Lagrangian dual method, is used to optimize the power allocation process. Simulation results showed that the proposed JRA-WQOE algorithm has low computational complexity and fast convergence. Compared with existing algorithms, it affords obvious advantages such as improving the average throughput and fairness to users. With varying numbers of users and signal-to-noise ratios (SNRs), the proposed algorithm achieved higher average QoE values than prevalent algorithms.

End-to-end 비자기회귀식 가속 음성합성기 (End-to-end non-autoregressive fast text-to-speech)

  • 김위백;남호성
    • 말소리와 음성과학
    • /
    • 제13권4호
    • /
    • pp.47-53
    • /
    • 2021
  • Autoregressive한 TTS 모델은 불안정성과 속도 저하라는 본질적인 문제를 안고 있다. 모델이 time step t의 데이터를 잘못 예측했을 때, 그 뒤의 데이터도 모두 잘못 예측하는 것이 불안정성 문제이다. 음성 출력 속도 저하 문제는 모델이 time step t의 데이터를 예측하려면 time step 1부터 t-1까지의 예측이 선행해야 한다는 조건에서 발생한다. 본 연구는 autoregression이 야기하는 문제의 대안으로 end-to-end non-autoregressive 가속 TTS 모델을 제안한다. 본 연구의 모델은 Tacotron 2 - WaveNet 모델과 근사한 MOS, 더 높은 안정성 및 출력 속도를 보였다. 본 연구는 제안한 모델을 토대로 non-autoregressive한 TTS 모델 개선에 시사점을 제공하고자 한다.