• 제목/요약/키워드: random media

검색결과 364건 처리시간 0.022초

A Context-based Fast Encoding Quad Tree Plus Binary Tree (QTBT) Block Structure Partition

  • Marzuki, Ismail;Choi, Hansol;Sim, Donggyu
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.175-177
    • /
    • 2018
  • This paper proposes an algorithm to speed up block structure partition of quad tree plus binary tree (QTBT) in Joint Exploration Test Model (JEM) encoder. The proposed fast encoding of QTBT block partition employs three spatially neighbor coded blocks, such as left, top-left, and top of current block, to early terminate QTBT block structure pruning. The propose algorithm is organized based on statistical similarity of those spatially neighboring blocks, such as block depths and coded block types, which are coded with overlapped block motion compensation (OBMC) and adaptive multi transform (AMT). The experimental results demonstrate about 30% encoding time reduction with 1.3% BD-rate loss on average compared to the anchor JEM-7.1 software under random access configuration.

  • PDF

양방향 예측에서 LIC 복잡도를 줄이기 위한 방법 (Modified LIC for Bi Prediction to Reduce Complexity)

  • 최한솔;박준택;이종석;심동규;방건;김휘용
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.163-164
    • /
    • 2018
  • 본 논문에서는 양방향 예측 모드에서 LIC(Local Illuminance Compensation)의 복잡도 감소를 위한 방법을 제안한다. 제안하는 방법은 현재 CU 가 양방향 예측 모드일 경우 움직임 보상 단계에서 예측 블록 두 개를 가중 평균을 낸 뒤 LIC 를 수행함으로써 양방향 예측모드에서 LIC 를 한번만 수행하여 기존 LIC 대비 낮은 복잡도를 보인다. 제안하는 방법의 성능 평가를 위하여 RA(Random Access) 조건에서 MPEG 표준 실험 영상의 B, C, D 클래스를 이용하여 BD-rate 를 VTM-2.0.1 과 비교한다. 실험결과로서 본 논문에서 제안하는 방법이 VTM2.0.1 대비 BD-rate 성능 관점에서 Y, U, V 각각에 대하여 평균 0.17, 0.17, 0.23 의 성능 향상을 보인다.

  • PDF

Neural Network based Video Coding in JVET

  • Choi, Kiho
    • 방송공학회논문지
    • /
    • 제27권7호
    • /
    • pp.1021-1033
    • /
    • 2022
  • After the Versatile Video Coding (VVC)/H.266 standard was completed, the Joint Video Exploration Team (JVET) began to investigate new technologies that could significantly increase coding gain for the next generation video coding standard. One direction is to investigate signal processing based tools, while the other is to investigate Neural Network based technology. Neural Network based Video Coding (NNVC) has not been studied previously, and this is the first trial of such an approach in the standard group. After two years of research, JVET produced the first common software called Neural Compression Software (NCS) with two NN-based in-loop filtering tools at the 27th meeting and began to maintain NN-based technologies for the common experiment. The coding performances of the two filters in NCS-1.0 are shown to be 8.71% and 9.44% on average in a random access scenario, respectively. All the material related to NCS can be found in the repository of the JVET. In this paper, we provide a brief overview and review of the NNVC activity studied in JVET in order to provide trend and insight for the new direction of video coding standard.

GAN 을 이용한 압축된 동영상 품질 향상 (GAN-based Quality Enhancement of Compressed Video)

  • 김용성;이유진;김범윤;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.191-192
    • /
    • 2022
  • 본 논문에서는 딥러닝의 주요 기법 중 하나인 GAN 을 활용하여 압축된 영상의 품질을 개선하는 방법을 제안한다. 제안하는 GAN 의 생성자는 U-Net 과 ResNet 을 기반으로 구성되었으며, 판별자는 합성곱층과 전연결층으로 구성하였다. 네트워크의 학습은 HEVC (High Efficiency Video Coding)의 테스트 모델인 HM16.25 를 사용하여 RA (Random Access) 구성하에 양자화 계수 37 로 압축된 영상을 입력으로 하여 수행되었다. 제안하는 네트워크의 성능 확인을 위해 학습 시와 동일한 조건으로 압축된 다른 영상을 입력으로 하여 실험하였다. 실험 결과 영상의 평균 PSNR 은 34.20dB 에서 34.24dB 로 0.04dB 의 품질 향상이 이루어진 것을 확인할 수 있었다.

  • PDF

깊이영상을 이용한 지면 검출 및 고도 측정 방법 (Depth Image-based Ground Detection and Altitude Measurement Method)

  • 천무호;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.180-182
    • /
    • 2021
  • 본 논문에서는 드론의 비행 장소와 온도 및 습도에 영향을 받지 않는 적외선 기반 깊이 카메라로부터 얻어진 깊이영상을 분석하여 지면 영역을 찾고 AGL(Above Ground Level) 단위의 고도를 측정하는 방법을 제안한다. Decimation filter 와 Median filter 를 적용하여 잡음 및 빈 데이터들을 제거한 깊이영상으로부터 RANSAC (RANdom Sample Consensus) 기반 평면 모델 추정 방법을 이용하여 지면 영역과 이에 대한 평면의 방정식을 유추하고 현재 위치와의 거리를 계산한다. 성능 평가를 위해 Lidar 센서와 비교한 결과, 제안 방법이 지면에 위치한 장애물에 영향을 더 적게 받으며, 자세 정보와 독립적으로 고도를 측정할 수 있었다.

  • PDF

A multi-label Classification of Attributes on Face Images

  • Le, Giang H.;Lee, Yeejin
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.105-108
    • /
    • 2021
  • Generative adversarial networks (GANs) have reached a great result at creating the synthesis image, especially in the face generation task. Unlike other deep learning tasks, the input of GANs is usually the random vector sampled by a probability distribution, which leads to unstable training and unpredictable output. One way to solve those problems is to employ the label condition in both the generator and discriminator. CelebA and FFHQ are the two most famous datasets for face image generation. While CelebA contains attribute annotations for more than 200,000 images, FFHQ does not have attribute annotations. Thus, in this work, we introduce a method to learn the attributes from CelebA then predict both soft and hard labels for FFHQ. The evaluated result from our model achieves 0.7611 points of the metric is the area under the receiver operating characteristic curve.

  • PDF

3D 체적형 모델 기반의 랜덤 위상을 갖는 홀로그램 생성 (Hologram Generation with Random Phase based on 3D Volumetric Model)

  • 이솔;김경진;김진겸;박병서;김동욱;서영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.323-324
    • /
    • 2020
  • 논문에서는 3D 체적형 모델을 이용하여 홀로그램에 랜덤 위상 효과를 주는 방법을 제안한다. CGH(Computer Generated Hologram)에서 랜덤 위상의 추가는 실제 촬영하여 획득한 홀로그램에서 물체 표면의 난반사에 대한 영향을 고려한 것이다. 이 랜덤 위상은 생성한 홀로그램의 광 시야각 확장 효과가 있다. 하지만 이것은 랜덤으로 발생하기 때문에 홀로그램 시퀀스를 생성할 때 같은 객체 표면에 대해서 고정된 효과를 줄 수 없다. 본 논문에서는 CGH를 진행할 때 물체의 고유한 랜덤 위상 추가를 위해 3D 체적형 모델을 사용하는 방법을 제안한다.

  • PDF

패킷망에서 전송율 제어와 패킷 폐기에 의한 연속 미디어 전송방안 (Transmission of Continuous Media by Send-rate Control and Packet Drop over a Packer Network)

  • 배시규
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1999년도 추계공동학술대회 논문집:21세기지식경영과 정보기술
    • /
    • pp.121-129
    • /
    • 1999
  • 통신망을 통하여 시간 연속(continuous) 미디어를 전송하면 통신망의 부하 변동에 따라 운송지연(transit delay)이 일정하지 않으므로 수신측에 도착하는 패킷간에 원래의 시간 관계가 유지되지 않는 비동기 현상이 나타난다. 현재 제안된 여러 동기화 방안들은 운송 지연 특성을 보장하는 자원 보장형 통신망과 운송 지연 특성이 보장되지 않아 변화의 폭이 큰 자원 비보장형 통신망 환경을 고려한 2가지 형태가 존재한다. 자원 보장형 통신망은 최소 및 최대 운송 지연 시간을 예약이나 협상을 통해 전송 기간동안 계속 유지하는 반면, 자원 비보장형 통신망에서는 가능한 최대의 대역폭을 사용하는 최대 노력 (best-effort) 서비스를 사용한다. 이 논문은 패킷망이나 인터넷과 같은 자원 비보장형 통신망 환경에서 통신망의 부하 변화에 동적으로 적응하여 동기화된 전달(playout)을 제공하는 미디어내 동기화 방안(Inter-media Synchronization)에 관한 것이다. 본 논문에서 제안하는 방안은 데이터 전송 경로의 운송 지연 통계치를 사용하여 다음 전송할 패킷의 운송 지연을 추정하여 송신 시간을 조절함으로써, 통신망의 부하로 인한 운송 지연의 변화가 크더라도 수신 패킷의 도착 시간을 일정한 범위 내로 유지한다. 또한, 통신망의 부하가 지속적으로 증가하여 연속되는 패킷의 운송 지연이 점차 늘어나면 전송률을 높이는 것만으로 문제를 해결할 수 없을 뿐만 아니라 오히려 혼잡을 발생시킬 가능성이 있다. 따라서, 통신망의 대역폭에 맞추어 일부 전송 패킷을 폐기함으로써 실제적인 전송률을 조정하였다. 이 방안은 수신측의 버퍼가 충분하지 않거나, 버퍼 지연 시간이 제한적인 대화형 응용에서 연속 미디어를 전송하는데 적합하다.았으며 tall fescue는 T, V, V + T(1 : 1로 피복한 종자)에서 가장 높게 나타났다(P<0.01). 종자피복에 있어서 red clover와 tall fescue 공히 접착제는 CF나 PVA로 하고 고형물질은 V나 V+T(1:1)로 피복함으로서 가장 좋은 피복효과를 얻을 수 있었다.. 쟁점 및 과제들이 제시되었다. cells of these species contained considerable to large amount of neutral mucin, and small to considerable amount of acid mucin, Most of the medium sized and small mucous cells contained neutral mucin and sialomucin, but a few mucous cells contained neutral mucin and strongly sulfomucin or neutral combined with strongly sulfomucin and sialomucin. Most of the esophageal mucous cells pf Bryzoichthys lysimus contained small amount of neutral mucin, while on the other hand a feww mucous cells contained small amount of neutral mucin and minimal amount of sialomucin. But the esophageal mucous cells of Takifugu pardalis contained considerable amount of neutral mucin only.분해가 더욱 촉진

  • PDF

이웃한 블록 내 화소 정보를 이용한 투표 결정 기반의 인트라 예측 모드 부호화 생략 방법 (Voting-based Intra Mode Bit Skip Using Pixel Information in Neighbor Blocks)

  • 김지언;조혜정;정세윤;이진호;오승준
    • 방송공학회논문지
    • /
    • 제15권4호
    • /
    • pp.498-512
    • /
    • 2010
  • 인트라 프레임 부호화 기술은 임의 접근성과 에러 확산 방지에 용이하기 때문에 비디오 부호화 기술의 필수적인 기술로 자리 잡고 있다. 그러나 인터 부호화 기술에 비해 낮은 부호화 효율이 문제점으로 지적되고 있다. H.264/AVC 인트라 부호화 방식은 기존 표준 방법들보다 부호화 효율을 크게 향상시켰지만 부호화 과정이 복잡하여 저 비트율 기반의 양방향 서비스에는 부적합하다. 따라서 본 논문에서는 복호화기 측의 예측을 이용해 인트라 부호화 효율을 보다 향상시키며 부호화 시간을 단축시키는 V-IMBS (Voting-based Intra Mode Bit Skip)를 제안한다. 제안하는 방법은 복호화기가 부호화기에서와 동일하게 최적의 인트라 예측 모드를 결정할 수 있으면 인트라 예측 모드를 전송하지 않는다. 그러나 최적의 인트라 예측 모드를 결정할 수 없을 경우에는 기존의 H.264/AVC 표준과 동일한 방식으로 인트라 예측 모드를 부호화하여 복호화기로 전송한다. V-IMBS는 H.264/AVC보다 시험 시퀀스에 대해 PSNR 값이 평균 약 0.24 dB 정도 향상되었고, 비트율도 평균 약 4.44% 정도 감소되었다. 또한 전체 부호화 시간도 평균 약 42.8% 정도 감소되었다.

차세대 비디오 코덱(JEM)의 고속 QTBT 분할 깊이 결정 기법 (A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM)

  • 윤용욱;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.541-547
    • /
    • 2017
  • 차세대 비디오 부호화 표준 기술 탐색을 진행하고 있는 JVET(Joint Video Exploration Team)의 참조 SW 코덱인 JEM(Joint Exploration Model)은 재귀적 QTBT(Quadtree plus Binary Tree) 분할 구조의 부호화단위(CU)를 제공한다. QTBT를 통하여 새로운 블록 형태를 추가하여 부호화 효율 이득을 얻을 수 있는 반면, 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 JEM 부호화기의 복잡도 감소를 위해 상위 분할 깊이(depth)와 현재 분할 깊이의 율-왜곡(Rate-Distortion: RD) 비용을 사용하는 고속 블록 분할 깊이 결정 기법을 제안한다. 실험결과 JEM 5.0 대비 AI(All Intra) 부호화 구조에서 0.7%의 BD-rate 증가에 21.6%의 부호화 시간 감소를 보였고, RA(Random Access)에서는 1.2%의 BD-rate 증가에 11.0%의 시간 감소 효과를 얻을 수 있었다.