• 제목/요약/키워드: Mean Opinion Score (MOS)

검색결과 94건 처리시간 0.023초

Spline 코드북 기반의 spectral folding을 이용한 대역폭 확장 방법 (Bandwidth Expansion Method Using Spline Codebook Based Spectral Folding)

  • 박지훈;한승호;양희식;정상배;한민수
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.131-134
    • /
    • 2006
  • Quality of narrowband speech $(0{\sim}4kHz)$ can be enhanced by the bandwidth expansion technique, by which the high- band components are estimated. This paper proposes the bandwidth expansion method using the spline codebook based spectral folding. For the performance evaluation, the PESQ(Perceptual Evaluation of Speech Quality) scores are measured as the objective measurement In addition, the MOS (Mean Opinion Score) and the preference tests are performed as the subjective measurement. The results show our proposed method outperforms the existing spline based one.

  • PDF

PROSODY CONTROL BASED ON SYNTACTIC INFORMATION IN KOREAN TEXT-TO-SPEECH CONVERSION SYSTEM

  • Kim, Yeon-Jun;Oh, Yung-Hwan
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.937-942
    • /
    • 1994
  • Text-to-Speech(TTS) conversion system can convert any words or sentences into speech. To synthesize the speech like human beings do, careful prosody control including intonation, duration, accent, and pause is required. It helps listeners to understand the speech clearly and makes the speech sound more natural. In this paper, a prosody control scheme which makes use of the information of the function word is proposed. Among many factors of prosody, intonation, duration, and pause are closely related to syntactic structure, and their relations have been formalized and embodied in TTS. To evaluate the synthesized speech with the proposed prosody control, one of the subjective evaluation methods-MOS(Mean Opinion Score) method has been used. Synthesized speech has been tested on 10 listeners and each listener scored the speech between 1 and 5. Through the evaluation experiments, it is observed that the proposed prosody control helps TTS system synthesize the more natural speech.

  • PDF

접합 왜곡의 최소화 과정이 포함된 음성합성기 (Text-to-Speech Synthesizer with the Process of Minimizing Concatenation Distortion)

  • 박훈재;김상훈;정재호
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.38-44
    • /
    • 1998
  • 대용량의 음성합성용 데이터베이스를 용이하게 구축하기 위해 음성인식 시스템을 이용한 음소 경계 분할이 이루어지고 있다. 그러나 자동 분할 결과를 직접 이용하여 합성음 을 생성할 경우 음소 경계 에러로 인하여 접합 왜곡이 많이 발생하게 된다. 이러한 문제를 해결하기 위해서, 본 연구에서는 단위 접합시 경계 에러를 고려하여 적합한 접합 위치를 찾 고자 하였다. 여기서 적합한 접합 위치는 스펙트럼의 불연속이 최소화된 접합점을 의미한다. 합성음에 대한 MOS(Mean Opinion Score) 테스트와 스펙트로그램(spectrogram)의 모양을 비교하므로써 제안된 방법의 성능을 평가하였다. 제안된 방법은 두 단계로 이루어져 있다. 첫째, 레퍼런스 패턴(reference pattern)과 두 개의 테스트 패턴(test pattern)을 선택하는 단 계와, 둘째, 앞과 뒤 테스트 패턴 사이의 적합한 접합위치를 찾는 단계이다. 본 연구에서는 패턴 사이의 스펙트로그램 비교를 위해 켑스트럼(cepstrum) 피라미터와 패턴 분류기 (pattern classifier)인 DTW(Dynamic Time Warping) 알고리즘을 사용하였다. 제안된 알고 리즘을 평가한 청취 테스트의 결과에서 제안된 알고리즘을 적용하여 합성된 합성음의 음질 이 자동 분절로 생성된 단위를 그대로 이용한 경우의 음질보다 우수함을 보였다.

  • PDF

팩시밀리 화상품질 측정에 관한 연구 (A Study on Testing Image Quality on Facsimile)

  • 권세혁;황건
    • 전자통신동향분석
    • /
    • 제8권4호
    • /
    • pp.157-162
    • /
    • 1993
  • 본 연구는 아날로그 신호를 사용하는 공중교환 전화망과 접속되는 그룹 3(G3) 팩시밀리의 화상 품질을 측정하는 방법을 제시하였다. CCITT(현 ITU-TS) 표준시험 도표 No.2를 이용하여 전송된 화상에 대한 평가는 설문조사를 통해 평가되었고, 그것들은 MOS(Mean Opinion Score) 방법에 의해 계량화되었다. 설문지의 결과에 대한 상관 분석을 통해 문항을 하나의 종합 평가 문항으로 줄일 수 있음을 살펴보았다. 그리고 그 점수들의 평균들에 대한 차이를 분석함으로써 팩시밀리 화상 품질에 영향을 미치는 요인들의 유의성을 검정하였다. 유의성을 검정하는 방법들로 t 검정법과 Vander Waerden Scores 방법을 제시하였다. 그리고 검정 결과 점수 평균이 유의하지 않은 그룹들을 하나의 그룹으로 하여 그 그룹에 있어서 점수 히스토그램을 구하였다. 이 히스토그램을 하나의 정규 분포 곡선으로 근사시켜 팩시밀리 화상 품질 평가치를 살펴보았다.

소음 환경에서 강인한 어학용 헤드폰 구현 (The implementation of the Language-Study-Headphone storng to Noise Environment)

  • 손재혁;신재호
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2005년도 하계학술대회
    • /
    • pp.397-405
    • /
    • 2005
  • This paper presents a headphone system which has adopted two algorithm to increase sound clearness and to separate signal from noisy environment. In the field of adaptive signal processing, LMS algorithm which is a kind of steepest decent method, can be implemented with more simple calculation, so that we use it to eliminate unwanted noise elements for the proposed system. Futhermore we generate early echo using some delays, then mix it in signal. This process can increase the clearness of signal. In this paper, we prove that the proposed system can be implemented in real time. The proposed system is satisfied to subject assessment test base on MOS(Mean Opinion Score) of ITU-T.

  • PDF

PACS 환경에서 JPEG2000 압축 영상의 화질 평가 (Quality Evaluation of JPEG2000 Compressed Images in PACS Environments)

  • 이용재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.682-684
    • /
    • 2005
  • 현재 설러 병원에서 PACS 시스템을 도입해 유용하게 사용하고 있다. 병원 진료에서 방사선 영상 정보는 중요한 위치를 차지한다. 방사선 영상은 관전압(KVP)과 관전류(mAs)로 방사선량을 조절한 후 인체에 조사하여 얻게 되는데, KVP와 mAs, 인체의 두께에 따라 영상의 질이 변하게 된다. 이와 같이 장비에서 촬영된 영상은 판독을 거처 진료에 이용되고 일정한 시간이 지나면 압축하여 보관하게 되는데, 압축율을 높게 적용할수록 저장장치에 대한 경제적인 효과는 크다. 이에 저자는 1) CR, DR 촬영 조건별 흉부 영상을 얻어 JPEG 2000 압축방식을 적용해 촬영조건이 압축영상에 미치는 영향을 평가하였고, 2) MOS(Mean opinion score) 평가를 통해 영상판독에 영향을 주지 않는 유효 압축율을 제시하였다.

  • PDF

가변 윈도우를 이용한 CELP 부호화기의 음질 향상에 관한 연구 (A Study on a Improvement of the Speech Quality with Variable Window in CELP Vocoder)

  • 주상규
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.265-268
    • /
    • 2010
  • There have been proposed two types of low bit rate vocoder upto now : One is MBE type using the spectrum modeling and another is CELP type using the hybrid coding method. CELP type vocoder has mainly studied between them. Specially, much of intensity is concentrated in CELP vocoder due to the emergence of Internet Phone and PCS in a domestic. In order to improve the speech quality in CELP vocoder, in this paper, we proposed a new spectrum analysis algorithm with variable window. In CELP vocoder, the spectrum of the synthesised speech signal is distorted because the fixed size windows is used for spectrum analysis. So we have measured the spectral leakage and in order to minimize the spectral leakage have adjusted the window size. Applying this method G.723.1 ACELP, we can get SD(Spectral Distortion) reduction 0.084(dB), residual energy reduction 6.3% and MOS(Mean Opinion Score) improvement 0.1.

  • PDF

음성 향상에서 강인한 새로운 선행 SNR 추정 기법에 관한 연구 (A Novel Approach to a Robust A Priori SNR Estimator in Speech Enhancement)

  • 박윤식;장준혁
    • 한국음향학회지
    • /
    • 제25권8호
    • /
    • pp.383-388
    • /
    • 2006
  • 본 논문에서는 잡음 환경에서 단일 마이크로폰의 음성 향상에 대한 새로운 기법을 제시했다. 일반적으로 널리 알려진 스펙트럼 차감법에 근거한 음성 향상 기술은 신호 대 잡음비에 따른 스펙트럼 이득으로 표현된다. 대표적인 Ephraim과 Malah의 decision-directed (DD) 추정치는 잡음 구간에서 효율적으로 뮤지컬 잡음을 제거하지만 음성 구간에서는 이전 프레임의 음성 스펙트럼 성분에 더 큰 비중을 두기 때문에 a priori SNR의 프레임 지연이 발생한다. 따라서 DD에 의해 추정된 a priori SNR이 적용된 잡음 제거 이득은 현재 프레임보다 이전 프레임에 영향을 받으므로 음성 전이 구간에서 잡음 제거 성능을 저하시킨다. 본 논문은 DD의 가중치 파라미터에 Sigmoid Type의 함수를 적용하여 계산적으로는 간단하지만 효과적인 음성 향상 알고리즘을 제안한다. 제안된 접근 방식은 DD의 주요 파라미터인 a priori SNR 지연의 문제점을 해결하면서 뮤지컬 잡음 제거에 우수한 DD의 이점은 유지한다. 제안된 알고리즘의 성능은 다양한 잡음 환경에서 ITU-T P.862 Perceptual Evaluation of Speech Quality (PESQ) 와 Mean Opinion Score (MOS). 그리고 음성 스펙트로그램 (Spectrogram)에 의해 평가했고 기존의 DD의 고정된 가중치 파라미터를 사용했을 때 보다 향상된 결과를 나타내었다.

휘도, 색차의 분포도 분석을 이용한 인지적 무기준법 영상 화질 평가방법 (A Novel Perceptual No-Reference Video-Quality Measurement With the Histogram Analysis of Luminance and Chrominance)

  • 김요한;성덕구;한정현;신지태
    • 방송공학회논문지
    • /
    • 제14권2호
    • /
    • pp.127-133
    • /
    • 2009
  • 영상통신기술의 발달로, 영상화질평가는 많은 연구자들에 의해 새로운 알고리즘이 연구되었고, 성능은 점차 개선되었다. 하지만, 사람의 주관적인 시각시스템은 너무나 다양하고, 복잡하기 때문에 이를 수식화하고, 객관화하는데 많은 어려움이 있다. 영상의 화질을 평가하는 방법은 전체 기준법 (Full-Reference), 감소기준법 (Reduced-Reference) 그리고 무기준법 (No-Reference)으로 나눌 수 있다. 이중 무기준법은 수신 영상외의 다른 정보가 필요 없기 때문에, 다양한 영상 스트리밍서비스에 사용될 수 있다. 본 연구에서는, 영상의 양자화로 인한 범위 왜곡을 고려한 새로운 무기준법 영상 화질 평가 방법을 제안한다. 그리고, 성능을 비교하기 위해서, ITU-T P910 문서에 따른 주관적 화질 평가를 수행하고, 이를 363개의 영상을 통해 새로운 방법과 기존의 방법을 비교하였다. 실험 결과 제안된 방법의 실제 주관적 화질과의 상관도는 다른 기존방법보다 높은 것으로 나타났다.

웨이블릿 변환을 이용한 잡음제거기 설계 (Design of the Noise Suppressor Using Wavelet Transform)

  • 원호진;김종학;이인성
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.37-46
    • /
    • 2001
  • 본 논문에서는 웨이블릿 변환을 이용한 주변 잡음제거기를 제안하였다. 기존의 고정된 시간-주파수 해상도를 가지는 단구간 푸리에 분석법 대신 다양한 시간-주파수 해상도를 제공하는 웨이블릿 분석법을 사용함으로써 시간 특성이 변하는 베이블 (Babble) 잡음에 좀더 효율적인 잡음제거 방법을 설계하였다. 본 논문에 제안된 웨이블릿 변환 잡음제거기는 스펙트럴 차감법에 기반하여 구성하였으며, 고주파 영역에서 높은 시간 해상도를 갖는 웨이블릿 마스크 패턴을 사용함으로써 시간 특성이 빠르게 변화하는 고주파 잡음에 더욱 효율적인 동작을 하도록 설계하였다. 성능평가를 위해 차량 잡음, 길거리 잡음, 베이블 잡음과 같은 이동통신에서 많이 사용하는 주변잡음에서 시험하였으며, 그 주관적 음질 평가 결과 베이블 잡음의 경우 기존의 EVRC(Enhanced Variable Rate Coder) 잡음 제거기보다 Mos (Mean Opinion Score) 0.2의 성능 개선을 이룰 수 있었다. 출력 음성의 스펙트로그램에서도 성능 개선을 확인할 수 있었다.

  • PDF