통합 검색 | Korea Science

비디오 압축을 위한 딥러닝 기반 화면 간 예측 부호화 기법 (Deep Learning based Inter Prediction Technique for Video Coding)

이정경;김나영;강제원
- 방송공학회논문지
- /
- 제23권5호
- /
- pp.718-721
- /
- 2018
최근 차세대 국제 비디오 압축 표준 제정에 딥러닝을 이용하여 비디오 부호화 효율을 향상시키기 위한 다양한 시도가 이루어지고 있다. 본 논문에서는 참조프레임 리스트에 포함된 복원 프레임을 이용하여 현재 프레임의 가상 참조프레임을 딥러닝으로 생성하여 화면 간 예측 부호화에 이용하는 알고리즘을 제안한다. 실험에 따르면 제안 알고리즘은 HEVC 참조 소프트웨어 대비 Random Access 실험 환경에서 평균 1.9%의 BD-rate 감소 효율을 제공한다.
https://doi.org/10.5909/JBE.2018.23.5.718 인용 PDF KSCI KPUBS

효과적인 초음파검사를 위한 동화상 검색시스탬 설계 및 구현 (Design and Implementation of Video Retrievaling System for Effective Ultrasonograph)

오태석;오무송
- 한국음향학회지
- /
- 제17권6호
- /
- pp.79-84
- /
- 1998
초음파 진단장치는 X선 촬영과 달리 인체에 해를 주지 않고 계속적으로 장시간 관 찰할 수 있고 실시간으로 영상을 볼 수 있으며, 또 타장비에 비해 가격이 저렴하고 소형이 라는 장점이 있다. 현재는 이 영상들을 대용량 저장매체에 저장되어 컴퓨터를 통해 재생하 여 볼 수 있게 되었다. 본 논문에서는 이러한 막대한 양의 영상데이터를 검색하기 위한 새 로운 검색방법을 제시한다. 제안하는 검색방법은 검색을 원하는 정지화상의 컬러이미지를 제시하면 시스템이 이를 자동으로 분석하여 이미지 데이터베이스에 저장된 유사한 이미지데 이터들과 관련된 정보들을 질의결과로 나타내어 쉽게 검색하고자 한다. 이를 위하여 사용자 가 제시한 정지화상을 Bitmap으로 구성하고, Bitmap전체의 비디오 메모리에서 검색할 부분 영역을 검색대상으로 설정한다. 이 값을 key값으로 우선적으로 여기에 원하는 유사비를 설 정한 후 전체 동화상의 각 프레임에서 추출한 비디오 메모리 데이터와 검색 화면의 비디오 메모리를 Pixel별로 비교하여, 사용자가 원하는 영상데이터의 위치point 값과 유사비율값을 보관한다. point값으로 보관된 것을 유사비율에 따라 우선 순위를 정하여 데이터베이스에 보 관하고 이 보관된 후보 이미지들을 순위별로 화면에 나타내어 사용자가 원하는 이미지데이 터를 쉽고 빠르게 검색할 수 있었다.
PDF

VVC 행렬가중 화면내 예측(MIP) 학습기법 분석 (Analysis of Training Method for Matrix Weighted Intra Prediction (MIP) in VVC)

박도현;권형진;정세윤;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.148-150
- /
- 2020
최근 VVC(Versatile Video Coding) 표준 완료 이후 JVET(Joint Video Experts Team)은 인공신경망 기반의 비디오 부호화를 위한 AhG(Ad-hoc Group) 구성하고 인공지능을 이용한 비디오 압축 기술들을 검증하고 있으며, MPEG(Moving Picture Experts Group)에서는 DNNVC(Deep Neural Network based Video Coding) 활동을 통해 딥러닝 기반의 차세대 비디오 부호화 표준 기술을 탐색하고 있다. 본 논문은 VVC 에 채택된 신경망 기반의 기술인 MIP(Matrix Weighted Intra Prediction)를 참조하여, MIP 모델의 학습에서 손실함수가 예측 성능에 미치는 영향을 분석한다. 즉, 예측의 왜곡(MSE)만을 고려한 경우와 예측오차의 부호화 비용도 함께 반영한 손실함수를 비교한다. 실험을 위해 HEVC(High Efficiency Video Coding) 화면내 예측 대비 평균적인 PSNR 향상 정도를 나타내는 성능 지표(��PSNR)를 정의한다. 실험결과 예측오차의 부호화 특성을 반영하는 손실함수를 이용한 학습이 MSE 만 고려한 학습 대비 ��PSNR 기준 평균 0.4dB 향상됨을 보였다.
PDF

VVC 화면 내 예측에서의 딥러닝 기반 예측 블록 개선을 통한 부호화 효율 향상 기법 (Accurate Prediction of VVC Intra-coded Block using Convolutional Neural Network)

정혜선;강제원
- 방송공학회논문지
- /
- 제27권4호
- /
- pp.477-486
- /
- 2022
본 논문에서는 컨볼루션 신경망 네트워크를 이용하여 VVC 화면 내 예측으로 얻은 예측 블록을 개선하여 잔차 신호를 보다 줄이는 화면 내 예측 방법을 제안한다. 기존의 화면 내 예측 방법은 일부 고정 규칙을 기반으로 주변의 재구성된 참조 샘플로부터 예측 블록을 생성하므로 복잡한 콘텐츠의 예측 블록을 생성하기 어렵다는 한계가 있다. 또한, 참조 샘플로 이용할 수 있는 정보의 양이 시간적 주변 정보에 비해 적기 때문에 화면 간 예측보다 낮은 부호화 성능을 가진다. 본 연구에서는 앞서 언급한 문제를 해결하기 위해 기존의 비디오 부호화 과정의 화면 내 예측을 통해 생성되는 예측 블록에 CNN을 적용하여 원본 블록과 예측 블록의 차분 신호를 줄이는 화면 내 예측 방법을 제안한다. 부호기에서는 제안 알고리즘의 활성 여부를 나타내는 플래그가 함께 부호화된다. 제안하는 화면 내 예측 방법은 최신 비디오 압축 표준인 Versatile Video Coding의 참조 모델인 VTM version 10.0 대비 휘도 성분에 대하여 향상된 압축 성능을 제공한다.
https://doi.org/10.5909/JBE.2022.27.4.477 인용 PDF KSCI KPUBS

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

이용주;손종목;강경옥;배건성
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 1999년도 학술대회
- /
- pp.187-191
- /
- 1999
비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.
PDF

주관적 관심영역 중요도를 고려한 화면내 예측 간소화 방법 (A Simplification Method of Intra Prediction Considering Importance of Subjective Interest Region)

이호영;권순각
- 한국멀티미디어학회논문지
- /
- 제12권7호
- /
- pp.922-928
- /
- 2009
최신 비디오 부호화 표준인 H.264에서는 화면내 예측으로 화소블록의 신호값을 예측하기 위하여 9개의 모드를 사용한다. 이러한 과정을 거쳐 화면내 부호화신호에서 우수한 압축율을 가져을 수 있으나 9가지 예측 모드 전체 사용은 인접화소 비교로 인해 발생되는 연산량 또는 탐색건수로 복잡도가 증가되는 비효율성을 내재하고 있다. 본 논문에서는 주관적 관심영역을 고려한 화면내 예측모드의 간소화 방법을 제안한다. 비디오 신호의 각 화면에는 관심이 주어지는 특정영역이 존재한다. 이러한 영역은 다른 영역에 비하여 더 좋은 주관적화질 제공이 필요하다. 제안된 방법은 주관적 관심이 높은 영역에 비하여 주관적 관심이 낮은 영역에는 9개의 모드중에 필수모드만을 제공하여 예측모드 간소화를 높여준다. 예측특성만을 고려하여 화면 전체에 간소화를 주는 기존 방법에 비하여 제안된 방법은 추가적으로 11%$\sim$15%의 예측모드 간소화가 가능하다.
PDF

문맥적응적 화면내 예측 모델 학습 및 부호화 성능분석 (Context-Adaptive Intra Prediction Model Training and Its Coding Performance Analysis)

문기화;박도현;김재곤
- 방송공학회논문지
- /
- 제27권3호
- /
- pp.332-340
- /
- 2022
최근 딥러닝을 적용하는 비디오 압축에 대한 연구가 활발히 진행되고 있다. 특히, 화면내 예측 부호화의 성능 한계를 극복할 수 있는 방안으로 딥러닝 기반의 화면내 예측 부호화 기술이 연구되고 있다. 본 논문은 신경망 기반 문맥적응적 화면내 예측 모델의 학습기법과 그 부호화 성능분석을 제시한다. 즉, 본 논문에서는 주변 참조샘플의 문맥정보를 입력하여 현재블록을 예측하는 기존의 합성곱 신경망(CNN: Convolutional Neural network) 기반의 화면내 예측 모델을 학습한다. 학습된 화면내 예측 모델을 HEVC(High Efficiency Video Coding)의 참조 소프트웨어인 HM16.19에 추가적인 화면내 예측모드로 구현하고 그 부호화 성능을 분석하였다. 실험결과 학습한 예측 모델은 HEVC 대비 AI(All Intra) 모드에서 0.28% BD-rate 부호화 성능 향상을 보였다. 또한 비디오 부호화 블록분할 구조를 고려하여 학습한 경우의 성능도 확인하였다.
https://doi.org/10.5909/JBE.2022.27.3.332 인용 PDF KSCI KPUBS

합성곱 신경망 기반의 화면 내 예측 모드 결정 (Decision of the Intra Prediction mode using Convolutional Neural Network)

정지연;이영렬
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 추계학술대회
- /
- pp.24-26
- /
- 2019
본 논문에서는 최신 비디오 압축 표준인 HEVC 를 기반으로, 영상의 화면 내 예측 모드를 결정하기 위하여 기존의 RDO 프로세스 대신 합성곱 신경망을 접목시켜 예측 모드를 결정하는 연구를 진행하였다. 네트워크 학습에는 실제 화면 내 예측 모드를 결정하는 데 사용되는 데이터들이 사용되었다. 실험 결과 본 제안 기법은 HM 16.20 대비 0.05%의 부호화 성능 향상을 보였다.
PDF

디지털 방송 전환에 따른 영상 변화에 관한 연구 (A Study on Moving Picture Variety according of Digital Broadcasting for Transition)

주헌식
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
- /
- pp.335-336
- /
- 2013
아날로그 방송이 2012년 12월 31일 종료되고 디지털 방송 시대를 맞이했다. 디지털 방송은기존의 아날로그 방송에 비해 디지털은 HD화질로 주사선이 2배가 넘는 1050~1250으로 영화스크린처럼 선명한 화면으로 아날로그 TV보다 4~5배 정도의 화질의 차이가 있으며, 음질에서도 CD 수준의 고음질로 전환되었다. 따라서 디지털 TV로 전환되었고, 화면크기와 전환 효과 비디오효과, 화면 분할, 3D 기법 적용 등 다양한 영상 변화를 나타낸다.
PDF

실시간 다채널 비디오 처리에 대한 효율적인 대역폭 제어 방법 연구 (A Study of efficient Bandwidth Control for Real-Time Multi-Channels Video Processing)

김찬규;홍인화;이상원;박정범
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
- /
- pp.1503-1506
- /
- 2005
비디오 코딩 기술과 더불어 디지털 비디오 장치의 급속적인 발전으로 최근에 디지털 비디오 시스템에 대한 관심은 극도로 향상되어 있다. 특히, 비디오 압축 기술을 바탕으로 하고 있는 디지털 비디오 레코딩 시스템, DVR은 실제로 채널 확장에 따른 영상의 압축과 복원이 실시간으로 변화되지 않는 비(非) 대층형 압축 기술에 대한 문제점과 화면정지 시의 화질 문제, 초당 녹화 프레임 수를 높이기 위한 압축 기술의 향상과 이에 따른 화질 저하 문제를 모두 해결할 수 있는 기술이 절실히 요구되어지고 있는 가운데, 본 논문에서는 비디오 채널의 확장에 따른 기술적인 부담을 안고 실시간으로 디지털로 기록하는 동안에 캡쳐된 비디오 프레임들의 다채널의 실시간 비디오 데이터 처리에 대한 효과적인 메모리 대역폭 제어와 PCI 대역폭을 제어하는 방법을 통해 시스템 내부의 계산상의 비용을 감소시키고 시스템의 성능을 향상 시킬 수 있는 방법을 제시하고자 한다.
PDF

검색결과 307건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)