통합 검색 | Korea Science

통합 음성 오디오 부호화 기술 (Unified Speech and Audio Coding Technology)

이태진;백승권;강경옥;김환우
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2011년도 하계학술대회
- /
- pp.264-267
- /
- 2011
다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. MPEG 에서는 2008 년 10 월부터 MPEG-D USAC 기술에 대해 CfP 를 시작으로 본격적으로 표준화를 진행하고 있으며, 2011 년 3 월 96 차 미팅에서 Study on DIS 까지 승인하였다. 본 논문에서는 LPD 모드의 TCX 윈도우의 변경을 통한 USAC 성능향상 방법은 제안한다. TCX 프레임의 연결에 고정된 크기의 중첩만을 이용하는 현재의 방식과는 달리, 이전 TCX 모드와 다음 TCX 모드, transient 의 존재 유무에 따라 적절하게 TCX 윈도우 중첩크기를 조절하여 음악 특성 신호에 대해 LPD 모드의 음질을 개선할 수 있다.
PDF

CNN을 이용한 TCX 모드 기반의 주파수 정보 복원 기술 (Spectral recovery method based on TCX mode using CNN)

김재원;신성현;한석현;최현국;김상민;박호종
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 하계학술대회
- /
- pp.340-342
- /
- 2020
본 논문에서는 CNN을 이용한 TCX 모드 기반의 주파수 정보 복원 기술을 제안한다. TCX 모드는 USAC에서 지원하는 음성을 위한 양자화 기술로 부호화 과정에서 포락선을 평탄화한 후 양자화한다. 이러한 평탄화 동작은 주파수 정보 간의 상관도를 높여 네트워크의 학습을 쉽게 만들고 예측 성능을 높인다. 제안하는 방법은 청각 심리 모델 기반으로 구현된 주파수 정보 복원 방법에 TCX 모드 기반의 양자화 방법을 적용하여 일부 주파수 정보만을 사용해 손실된 주파수 정보를 복원한다. 제안하는 방법을 사용해 기존 방법보다 낮은 학습 오차를 얻었고 최적화 되지 않은 조건에서 동등한 음질을 얻었다.
PDF

Pyramid VQ를 이용한 AMR-WB+ 코덱 내 TCX 모듈의 성능 개선 (Improvement of the TCX Module in AMR-WB+ Codec Using Pyramid VQ)

박상국;박정은;백승권;서정일;강상원
- 한국음향학회지
- /
- 제26권3호
- /
- pp.109-114
- /
- 2007
본 논문은 AMR-WB+ 코덱의 오디오 품질을 개선하기 위하여 TCX모듈 변환계수 양자화기에 8차 및 16차 Pyramid VQ방식을 제안하였다. 제안된 Pyramid VQ 방식은 AMR-WB+ 코덱에 적용된 $RE_8$ Lattice VQ 방식과 비교 평가되었으며, 8차 및 16차 Pyramid VQ 방식의 사용시 Mean Squared Error (MSE)는 각각 4% 및 5.7% 개선되었고, Perceptual Evaluation of Audio Quality(PEAQ) 값은 각각 3.3% 및 4.7% 개선되었다.
https://doi.org/10.7776/ASK.2007.26.3.109 인용 PDF KSCI

PVQ 방식을 이용한 AMR-WB+ 코덱의 TCX 모듈 변환계수 양자화기 설계 (Design of the TCX module transform coefficients quantizer in AMR-WB+ codec using PVQ)

박상국;박정은;강상원
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2007년도 하계종합학술대회 논문집
- /
- pp.345-346
- /
- 2007
In this paper, we propose a Pyramid VQ(PVQ) to quantize the transform coefficients of TCX module for the music improvement of AMR-WB+ codec. The proposed PVQ is compared to the $RE_8$ Lattice VQ used in the AHR-WB+ standard codec, demonstrating improvement 4% and 5.7%, respectively, in Mean Squared Error(MSE) and 3.3% and 4.7%, respectively, in Perceptual Evaluation of Audio Quality(PEAQ) by 8-dimensional and 16-dimensional Pyramid VQ.
PDF

분석/합성 구조의 저 전송률 변환여기 광대역 음성/오디오 부호화기 설계 (Design of Low Bits Rate Transform Excitation Wide Band Speech and Audio Coder of Analysis-by-Synthesis Structure)

장성훈;홍기봉;이인성
- 한국음향학회지
- /
- 제31권7호
- /
- pp.472-479
- /
- 2012
본 논문은 음성과 오디오의 혼합 콘텐츠를 대상으로 하는 9.2 kbps 저 전송률 변환여기 부호화기 설계를 목표로 한다. 저 전송률 환경을 위하여 주파수 영역 신호의 중요도에 따른 Band-Selection 방법과 Gain-Shape 양자화를 이용한 Analysis by Synthesis(AbS) 구조를 이용한다. AbS 구조를 이용하는 과정에서 발생하게 되는 연산량을 감소시키기 위하여 밴드별 IDFT를 취하고 합성하는 방법을 이용한다. 전송 되지 않는 구간에 대하여 Comfort Noise를 삽입함으로써 음질 저하 없이 설계한다. 기존의 TCX모드와 비교하여 저 전송률에서 성능의 저하 없는 부호화기를 제안한다.
https://doi.org/10.7776/ASK.2012.31.7.472 인용 PDF KSCI

Adaptive TCX Windowing Technology for Unified Structure MPEG-D USAC

Lee, Tae-Jin;Beack, Seung-Kwon;Kang, Kyeong-Ok;Kim, Whan-Woo
- ETRI Journal
- /
- 제34권3호
- /
- pp.474-477
- /
- 2012
The MPEG-D unified speech and audio coding (USAC) standardization process was initiated by MPEG to develop an audio codec that is able to provide consistent quality for mixed speech and music contents. The current USAC reference model structure consists of frequency domain (FD) and linear prediction domain (LPD) core modules and is controlled using a signal classifier tool. In this letter, we propose an LPD single-mode USAC structure using an adaptive widowing-based transform-coded excitation module. We tested our system using official test items for all mono-evaluation modes. The results of the experiment show that the objective and subjective performances of the proposed single-mode USAC system are better than those of the FD/LPD dual-mode USAC system.
https://doi.org/10.4218/etrij.12.0211.0404 인용 PDF KSCI

경련성 전기충격에 의하여 나타나는 측뇌-피질과 피질을 제외한 대뇌의 Acetylcholine및 Polyamine 함량-변동에 관한 연구 (Effects of Single and Repeated Electroconvulsive Shock on the Acetylcholine and Polyamine Contents in Temporal Cortex and Decorticated Cerebrum of Mice)

최상현;이학회;박청산;전보권;천연숙
- 대한약리학회지
- /
- 제27권1호
- /
- pp.13-20
- /
- 1991
뇌에 대한 경련성 전기충격(electroconvulsive shock: ECS)을 이용한 치료가 시작된 후, 50여년에 걸처 이의 생물학적 작용에 대한 연구가 있었으나, 이렇다할 결과가 아직 없으며, 특히 뇌의 신경전달물질중 가장 중요한 것으로 인정되는 acetylcholine의 함량이 ECS로 증가되는지 감소되는지 확실치 않다. 더욱이, 대체로 조직의 재생능에 비례하는 함량의 증감을 보이는 polyamine함량이 가장 재생능이 미약한 뇌에 고농도로 있으며 뇌의 국소에 따라서도 그 함량에 큰 차가 있고, 뇌의 polyamine-합성 또한 ECS에 의하여 촉진된다고 하는데, 최근에 Zawia와 Bondy는 polyamine-대사가 뇌-신경의 장기적 적응현상에 관련됨을 제시하였다. 따라서 본 연구에서는 웅성 ICR계 생쥐에 ECS(13mA, 100cps, 1sec)를 단회(1 ECS)-부하하여 나타나는 변동을 검색하고 그 결과를 5회(매일 1회씩 이틀마다 5회: 5 ECS)-부하하여 얻은 것과 비교-검토하였다. 측뇌-피질(temporal cortex: $TC{\acute{x}}$)과 피질을 제거한 대뇌(decorticated cerebrum: dc-CB)의 acetylcholine(ACh)함량이 1 ECS 부하후 각각 10분 및 30분에 79.9 및 49.4% 증가되었으며, 이 증가가 5 ECS 부하시에는 유의하게 감약되었던 바, 특히 TCx에서 더욱 현저하였다. Polyamine의 경우, putrescine함량은 TCx 및 dc-CB에서 1 ECS 및 5 ECS 어느 부하에 의하여도 별 변동을 보이지 않았으나 spermidine(Sd) 및 spermine(Sm)은 1 ECS 후에 다소 감소되었을 뿐 아니라 그 감소의 크기가 5 ECS 후에는 현저히 증폭되었고, 특히 dc-CB에서 더욱 현저하였다. 또한 ECS를 4회-부하하고 24시간 후의 Sd및 Sm 함량은 ACh 함량과 달리 정상치에 비하여 유의하게 낮았으며, 따라서 ECS에 의한 ACh함량-변동에 미치는 Sm(30mg/kg, 복강내주사)의 영향을 관찰하였던 바 별 변화를 볼 수 없었다. 이상의 성적은 반복되는 ECS에 대하여 대뇌의 ACh 및 polyamine대사가 각각 특이적인 적응성 변동을 보임을 시사하는 것으로 사료된다.
PDF

MPEG 오디오 최신 표준: USAC 기술 (MPEG Audio New Standard: USAC Technology)

이태진;강경옥;김환우
- 방송공학회논문지
- /
- 제16권5호
- /
- pp.693-704
- /
- 2011
다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2011년 7월 97차 회의에서 FDIS까지 승인하였다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용하며, 다양한 코어 코더 사이의 천이를 위한 윈도우 기술을 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북 등에서 응용이 가능하다.
https://doi.org/10.5909/JEB.2011.16.5.693 인용 PDF KSCI

MPEG-D USAC: 통합 음성 오디오 부호화 기술 (MPEG-D USAC: Unified Speech and Audio Coding Technology)

이태진;강경옥;김환우
- 한국음향학회지
- /
- 제28권7호
- /
- pp.589-598
- /
- 2009
다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2009년 4월 88차 회의에서 WD3까지 완성되었다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 모두 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북등에서 응용이 가능하다.
https://doi.org/10.7776/ASK.2009.28.7.589 인용 PDF KSCI

SBR을 이용한 주파수 밴드선택 여기 선형예측 광대역 음성/오디오 부호화 (Frequency Band Selection Exited Linear Prediction Wideband Speech/Audio Coding Using SBR)

장성훈;이인성
- 한국음향학회지
- /
- 제32권6호
- /
- pp.556-562
- /
- 2013
본 논문은 컴포트 노이즈(comfort noise)를 이용하는 주파수 밴드선택 음성/오디오 코덱에서 컴포트 노이즈 대신 SBR(Spectral Band Replication) 기술을 이용하여 여기 신호를 대체 함으로서 밴드 선택 광대역 음성/오디오 부호화기의 성능 향상을 목표로 한다. 비 전송 밴드에 SBR 기술로 합성된 신호를 삽입하기 위하여 부밴드 별로 전송된 신호를 활용하며, 각각의 부밴드 별로 에너지 가중치를 설정한다. 백색잡음 성분의 컴포트 노이즈 대신 전송신호에 의존하는 신호를 합성 함으로서 보다 높은 음질의 밴드 선택 부호화기를 제안하였다.
https://doi.org/10.7776/ASK.2013.32.6.556 인용 PDF KSCI

검색결과 11건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)