• 제목/요약/키워드: 음질 개선

검색결과 235건 처리시간 0.018초

CELP 부호화기를 위한 양방향 패킷 손실 은닉 알고리즘 (BS-PLC(Both Side-Packet Loss Concealment) for CELP Coder)

  • 이인성;황정준;정규혁
    • 대한전자공학회논문지TC
    • /
    • 제42권12호
    • /
    • pp.127-134
    • /
    • 2005
  • VoIP에서 패킷의 손실은 음성의 품질에 영향을 주는 가장 중요한 요인이다. 따라서 수신된 정보로부터 손실된 패킷을 복구하는 것은 중요하다. 따라서 본 논문은 VoIP에서 가장 많이 사용되는 CELP 부호화기를 위한 수신측 기반의 손실 패킷 복구방법을 제안한다. 제안하는 WSOLA(Waveform Shift OverLab Add)기반의 BS-PLC (Both Side Packet Loss Concealment) 방법은 패킷 손실이 발생하였을 경우 미래 패킷을 이용할 수 있는 경우와 그렇지 않을 경우로 나누고, LP(Linear prediction) 파라미터와 여기 신호를 복구한다. 미래 패킷을 이용할 수 없는 경우에는 과거에 전송된 정상 패킷만을 가지고 복원을 하며, 미래 패킷을 이용할 수 있을 경우에는 과거의 정상 패킷과 미래의 정상 패킷을 동시에 이용하여 손실된 패킷을 복구한다. 연속 패킷 손실 환경은 Gilbert 모델로 설정하였고, 제안한 알고리즘을 VoIP에서 가장 많이 사용되는 CELP 음성부호화기인 G.729에 적용하여 성능을 비교한다. 성능 비교를 위해 손실율을 변화시키면서 SNR(Signal to Noise)와 MOS(Mean Opinion Score)측정하였고, 제안한 방법을 G.729의 패킷 손실 은닉 방법과 비교하였다. 실험 결과, 평균 손실률이 $20\%$에서도 SNR은 2dB, MOS값은 0.3정도로의 음질 개선을 보였다.

8kbps 비트율을 갖는 ACFBD-MPC와 LMS-MPC를 통합한 ACLMS-MPC 부호화 방식 (An ACLMS-MPC Coding Method Integrated with ACFBD-MPC and LMS-MPC at 8kbps bit rate.)

  • 이시우
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.1-7
    • /
    • 2018
  • 본 논문에서는 합성 음성파형의 일그러짐을 제어하기 위하여 V/UV/S(Voiced / Unvoiced / Silence)의 스위칭을 사용하고, 피치구간마다 멀티펄스를 보정하며, 무성자음(Unvoiced)의 근사합성에 특정주파수를 이용하는 ACFBD-MPC(Amplitude Compensation Frequency Band Division - Multi Pulse Coding)와 LMS-MPC(Least Mean Square - Multi Pulse Coding)를 통합한 8kbps ACLMS-MPC(Amplitude Compensation and Least Mean Square - Multi Pulse Coding) 부호화 방식을 제안하고자 한다. 여러 방식을 통합하는데 있어서, 음성파형의 일그러짐을 줄이면서 유성음과 무성음의 비트율을 8kbps로 조정하는 것이 중요하다. 유성음과 무성음의 비트율을 8kbps로 조정함에 있어서, 개별피치를 이용하여 대표구간의 멀티펄스를 피치구간마다 복원함으로서 음성파형을 효율적으로 합성할 수 있다. 8kbps의 부호화 조건에서 ACLMS-MPC 방식을 구현하고 SNR를 평가한 결과, ACLMS-MPC의 SNR는 남자음성에서 15.0dB, 여자음성에서 14.3dB 임을 확인할 수 있었다. 따라서 ACLMS-MPC가 기존의 MPC, ACFBD-MPC, LMS-MPC에 비하여 남자음성에서 0.3dB~1.8dB, 여자음성에서 0.3dB~1.6dB 정도 개선된 것을 알 수 있었다. 이러한 방법들은 셀룰러폰이나 인터넷폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다. 향후 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 6.9kbps 음성부호화 방식의 음질평가를 수행하고자 한다.

인공지능과 인간 전문가의 오디오 마스터링 비교 연구 (A Study on the Audio Mastering Results of Artificial Intelligence and Human Experts)

  • 허동혁;박재록
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권3호
    • /
    • pp.41-50
    • /
    • 2021
  • 인공지능에 의한 직업의 대체가 빠르게 진행되고 있지만, 창의성이 중요한 예술 분야에서는 예외로 여겨졌다. 예술과 기술의 경계에 있는 직업인 음악의 마스터링에서는 현재 여러 인공지능 마스터링 서비스가 운영 중이다. 일반적으로 인공지능의 마스터링은 전문 마스터링 엔지니어의 작업에 비해 품질이 낮다고 여겨진다. 본 논문에서는 인공지능 마스터링과 인간 마스터링을 음향 분석, 청취 실험, 전문가 인터뷰 과정을 통해 비교해 보았다. 음향 분석에서는 전문 마스터링 엔지니어의 결과물과 인공지능의 결과물에서 큰 차이는 관찰되지 않았다. 청취 실험의 경우 비음악인 그룹은 전문 마스터링 엔지니어의 결과물과 인공지능의 결과물의 음질 차이를 거의 구분하지 못했다. 음악인 그룹은 특정 음원에 대한 선호를 드러냈지만, 어느 특정 마스터링에 대한 일반적인 선호가 유의미하게 나타나지는 않았다. 전문가 심층인터뷰에서도 전문 마스터링 엔지니어와 인공지능 마스터링간의 음향적인 차이는 거의 없으며, 가장 큰 차이는 마스터링 서비스 제공자와 사용자 간의 소통 방식에 있다고 응답하였다. 또 향후 더 많은 데이터를 통한 훈련으로 인공지능 마스터링이 빠르게 품질 향상을 이룰 것이고 사용자와 인공지능 간의 소통 방식에서도 더 개선이 있을 것이라고 예상하였다.

HMM기반 자동음소분할기의 음소분할 오류 유형 분석 (The Error Pattern Analysis of the HMM-Based Automatic Phoneme Segmentation)

  • 김민제;이정철;김종진
    • 한국음향학회지
    • /
    • 제25권5호
    • /
    • pp.213-221
    • /
    • 2006
  • 합성음의 음질을 향상시키기 위하여 분할된 corpora로부터 합성유닛을 선택하여 사용하는 연속음성합성에서 정확한 음소분할은 매우 중요하다. 일반적으로 음소분할은 사람에 의해 수행되지만 많은 작업량으로 인한 시간적 지연, 일관 성 유지 어려움 등 많은 문제가 발생한다. 이에 따라 음성인식에서 도입된 HMM 기반의 자동음소분할이 음성인식, 음성 합성에서 널리 사용되어지고 있지만 음성전문가의 수작업 결과와 비교할 때 HMM 기반 자동음소분할은 오류가 있고, 이는 합성음 품질의 열화의 주요 원인이 되고 있다. 본 논문에서는 HMM 기반의 자동음소분할기를 사용하여 나타난 자동음소분할 결과와 수작업에 의한 음소분할 결과를 비교하고 유형별로 분석함으로써 음성합성의 성능향상을 위해 개선해야 할 문제점들을 제시한다. 실험에서는 ETRI의 표준형 한국어 공통 음성 DB을 사용하였고, 오차의 범위가 20ms를 벗어난 경우를 분절 오류로 간주하였다. 실험 결과 여성화자의 경우 파열음 + 모음, 파찰음 + 모음, 모음 + 유음 음소쌍에서는 각각 약 99%, 99.5%, 99%의 높은 정확률을 보인 반면, 폐쇄음 + 비음, 폐쇄음 + 유음, 비음 + 유음 음소쌍에서는 44.89%, 50%, 55% 의 낮은 정확률을 보였으며, 남성화자에 대한 실험결과에서도 유사한 경향을 보였다.

홍도의 소리경관 자원의 발굴, 보존 및 육성을 위한 사운드스케이프 조사연구 (Research on the Soundscape for Excavation, Preservation and Promotion of Soundscape Resources in Hongdo Island)

  • 한명호;오양기;노태학
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.343-355
    • /
    • 2009
  • 이 연구는 지역의 소리환경의 정체성을 회복하고 소리문화로 계승/발전시키기 위하여, 그 지역의 소리경관 자원을 발굴하여 보존하고 육성하기 위한 방안을 마련하기 위한 조사연구이다. 이러한 목표를 위해, 이 연구는 한국의 서남해안의 섬인 홍도를 대상으로 주민의 면담조사와 소리들으며 걷기를 이용한 관찰조사를 수행하였다. 조사결과, 홍도에서 들을 수 있는 소리는 새소리, 파도소리, 바람소리, 갈매기소리, 몽돌구르는 소리 등의 자연의 소리, 그리고 뱃고동소리, 선박의 안내방송, 관광객들의 말소리, 교회의 종소리, 등대의 에어사이렌 등의 인공의 소리에 이르는 많은 소리가 있는 것으로 확인되었다. 또한 연구의 결과, 홍도의 고유한 사운드스케이프를 회복하기 위해서는 몇가지 방안을 배려할 필요가 있는 것으로 조사되었다. 즉, 선박 안내방송의 효율적 운영개선, 몽돌해수욕장의 선착장 이전, 당산제 행사의 운영 및 관리, 홍도 등대 및 무종의 보존 및 관리, 마을 복개하천의 복원 및 정비, 마을 공동어시장의 운영 및 관리, 풍어제 및 홍어축제의 복원, 홍도운동회의 운영관리, 뱃고동소리의 음질 변경, 상여소리 등의 민속문화자원의 복원, 생태자연환경 및 도서해양환경의 보존활동, 지역의 활력과 매력을 위한 어메니티 증대를 꾀하는 방안이 필요한 것으로 파악되었다. 또한 많은 관광객들이 이러한 홍도의 사운드스케이프의 정체성과 소리환경의 중요성을 깨닫고 홍도의 사운드스케이프를 직접 체험하고 느낄 수 있도록 하기 위한 소리지도 (Sound Map)를 작성하였다.