• 제목/요약/키워드: WSOLA

검색결과 3건 처리시간 0.019초

WSOLA 기반의 음성 시간축 변환을 위한 고속의 정규상호상관도 계산 (A Fast Normalized Cross-Correlation Computation for WSOLA-based Speech Time-Scale Modification)

  • 임상준;김형순
    • 한국음향학회지
    • /
    • 제31권7호
    • /
    • pp.427-434
    • /
    • 2012
  • WSOLA 방식은 음성 신호의 시간축 변환을 위한 고음질의 효율적인 알고리즘으로 알려져 있다. WSOLA의 계산량은 두 신호 파형 사이의 유사도를 평가하는 반복적인 정규상호상관도 계산에 집중되어 있다. 본 논문은 WSOLA 계산량 감축을 위해 고속의 정규상호상관도 계산 방법을 제안하며, 제안된 방법에서는 미리 계산된 합 테이블을 통해 인접한 구간에서의 반복적인 정규상호상관도 계산의 중복성을 제거한다. 정규상호상관도의 분모 부분은 시간축 변환 비율에 관계없이 높은 중복성을 가지는데 반해, 분자 부분은 보다 낮은 중복성을 가지며 중복 정도가 시간축 변환 비율과 최적 이동값에 의해 영향을 받기 때문에 고속 계산을 위해 보다 복잡한 알고리즘이 요구된다. 시뮬레이션 결과, 제안된 방법이 기존의 WSOLA와 완전히 동일한 음질을 유지하면서도 시간축 압축의 경우 약 40%, 그리고 1/2배속 및 1/3배속으로의 시간축 신장의 경우 각각 약 47% 및 52%의 실행시간을 감소시킴을 보인다.

WSOLA를 이용한 동영상 미세배속 재생 서비스에 대한 콘텐츠별 배속 선호도 분석 연구 (A Study about the Users's Preferred Playing Speeds on Categorized Video Content using WSOLA method)

  • 김이길
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.291-298
    • /
    • 2015
  • 빠르게 발전하는 IT환경 속에서 이제 동영상 콘텐츠는 TV를 통한 일방 시청이 아니라 언제 어디서든 다양한 단말에서 볼 수 있는 VOD (Video on Demand) 형태로 발전하고 있다. 이러한 동영상 시청형태의 변화는 디지털이란 특성 때문에 동영상의 재생 속도 또한 다양하게 조절할 수 있다는 부가적인 장점을 사용자에게 제공 한다. 지루하고 따분한 동영상 콘텐츠는 빠르게 돌려보고 흥미 있는 장면은 느리게 천천히 볼 수 있는 동영상 미세배속 재생 기능은 오늘날 다양한 동영상 플레이어에서 제공되고 있다. 동영상 미세배속 재생 시 동영상 콘텐츠 내용의 정확한 이해를 위해서는 시각정보 못지않게 음성정보 청취가 중요한데 정상속도 보다 빠르거나 느린 재생 시 발생하는 음성의 왜곡을 줄이기 위한 음성미세배속 기술들이 음성처리 분야에서 꾸준히 발전되어 왔다. 본 논문에서는 이중 WSOLA와 같은 우수한 음성미세배속 알고리즘에 대해 알아보고 동영상 시청 시 이러한 기능 제공이 실제 얼마나 사용자 니즈(needs)에 부합하는 지 분석해보고자 한다. 특히, 동영상 콘텐츠를 사용자의 콘텐츠 소비 목적에 따라 종류별로 구분하여 재생 배속의 선호도를 조사하고 그 결과를 분석해 봄으로써 동영상 미세배속 기능 제공시 콘텐츠별 소비 목적에 맞게 재생 배속을 제공하는 것이 필요하다는 것을 제안하고자 한다.

CELP 부호화기를 위한 양방향 패킷 손실 은닉 알고리즘 (BS-PLC(Both Side-Packet Loss Concealment) for CELP Coder)

  • 이인성;황정준;정규혁
    • 대한전자공학회논문지TC
    • /
    • 제42권12호
    • /
    • pp.127-134
    • /
    • 2005
  • VoIP에서 패킷의 손실은 음성의 품질에 영향을 주는 가장 중요한 요인이다. 따라서 수신된 정보로부터 손실된 패킷을 복구하는 것은 중요하다. 따라서 본 논문은 VoIP에서 가장 많이 사용되는 CELP 부호화기를 위한 수신측 기반의 손실 패킷 복구방법을 제안한다. 제안하는 WSOLA(Waveform Shift OverLab Add)기반의 BS-PLC (Both Side Packet Loss Concealment) 방법은 패킷 손실이 발생하였을 경우 미래 패킷을 이용할 수 있는 경우와 그렇지 않을 경우로 나누고, LP(Linear prediction) 파라미터와 여기 신호를 복구한다. 미래 패킷을 이용할 수 없는 경우에는 과거에 전송된 정상 패킷만을 가지고 복원을 하며, 미래 패킷을 이용할 수 있을 경우에는 과거의 정상 패킷과 미래의 정상 패킷을 동시에 이용하여 손실된 패킷을 복구한다. 연속 패킷 손실 환경은 Gilbert 모델로 설정하였고, 제안한 알고리즘을 VoIP에서 가장 많이 사용되는 CELP 음성부호화기인 G.729에 적용하여 성능을 비교한다. 성능 비교를 위해 손실율을 변화시키면서 SNR(Signal to Noise)와 MOS(Mean Opinion Score)측정하였고, 제안한 방법을 G.729의 패킷 손실 은닉 방법과 비교하였다. 실험 결과, 평균 손실률이 $20\%$에서도 SNR은 2dB, MOS값은 0.3정도로의 음질 개선을 보였다.