• 제목/요약/키워드: 화면분할

검색결과 144건 처리시간 0.035초

문맥적응적 신경망 기반 화면내 예측의 트리 구조 반영 학습기법 분석 (Analysis of Training Method Using Tree Structure for Context Adaptive Neural Network-Based Intra Prediction)

  • 문기화;허승정;박도현;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.55-56
    • /
    • 2021
  • 최근, 딥러닝 및 인공신경망 기술의 발전으로 비디오 부호화 분야에서도 인공지능을 이용한 요소 기술에 대한 연구가 활발이 진행되고 있다. 본 논문에서는 주변 참조샘플로부터 문맥정보를 이용하여 현재블록을 예측하는 CNN 기반의 화면내 예측 모델을 구현하고, 비디오 부호화의 블록 분할 구조를 반영한 학습 기법에 따른 부호화 성능을 분석한다. 실험결과 HM(HEVC Test Model)에 구현한 문맥적응적 신경망 기반 예측 모델에서 트리 분할 구조를 반영한 학습이 HM16.19 대비 0.35% BD-rate 부호화 성능 향상을 보였다.

  • PDF

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

서브 블록 분할을 이용한 효율적인 근접 무손실 화면내 부호화 (Efficient Near Lossless Intra Coding using Sub-block Partitioning)

  • 최정아;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.337-340
    • /
    • 2010
  • 본 논문은 H.264/AVC를 이용한 근접 무손실 화면내 부호화에서 기존의 라인 기반 예측 방법에서 발생할 수 있는 오류 전파 문제를 해결하기 위한 방법을 제안한다. H.264/AVC의 화면내 예측 부호화는 주변 블록의 복원 화소들을 현재 부호화하려는 블록의 예측값으로 사용하여 공간적 상관성을 제거하고 부호화 효율을 향상시킨다. 기존의 라인 기반 예측 방법에서는 일반적으로 화소 간 거리가 멀어질수록 화소 간 상관성이 떨어지므로 라인 단위로 예측을 수행하여 예측의 정확도를 높였다. 하지만, 이 경우 오류 전파 문제에 취약하다는 단점이 있다. 본 논문에서는 화면내 $16{\times}16$ 수직 및 수평 예측 모드에 대해 매크로블록을 라인 단위로 예측하면서 정해진 서브 블록마다 참조 화소를 업데이트하는 방법을 제안한다. 따라서, 라인 기반 예측 방법의 예측 정확도는 유지하면서 오류 전파 문제를 예방할 수 있다. 실험을 통해, 제안하는 방법이 High 프로파일에서 H.264/AVC 표준 소프트웨어 JM 12.2에 비해 평균 약 5.8%의 비트율을 감소시킬 수 있음을 보였다.

  • PDF

방송 영상 패턴을 이용한 축구 경기 장면 분석 (An Scene Analysis is for Soccer Game Video using TV Broadcasting Pattern)

  • 최영수;유채곤;이성환;황치정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.490-492
    • /
    • 2000
  • 본 논문에서는 방송영상 특성을 이용한 축구 경기 장면 분석을 제안한다. 동영상의 프레임들을 분할하기 위해서는 급격한 장면 변화나 화면의 색상과 같은 화면의 형식적인 변화가 주요 결정사항이다. 그러나 축구경기와 같은 동영상에서의 하이라이트는 화면의 형식적인 변화와는 조금 다른 의미를 가진다. 그러므로, 축구 경기 동영상에서 하이라이트 부분을 검출하기 위해서는 장면의 변화와 더불어 화면의 의미를 해석할 필요가 있다. 본 논문에서는 축구 경기 동영상의 모든 프레임을 순차적으로 검사한다. 임의의 프레임에 대하여 RGB 정보의 분석을 통하여 영상의 구성내용을 파악한 후, 구성 내용의 위치와 분포를 참조하여 하이라이트 여부를 판단한다. 제안된 방법에서는 RGB 값의 변화 문제를 해결하기 위하여, 주 RGB 범위 군집화(Dominant RGB Grouping) 방법을 통하여 임의의 영상에서 RGB 값의 변화에 최대한 덜 민감한 방법으로 대상의 RGB 정보를 취득할 수 있는 방법을 사용하였다.

  • PDF

포토 센서를 이용한 시분할 입체 시스템의 구현 (Field-Sequential Stereoscopic System Using a Photo Sensor)

  • 이상훈;김영모
    • 전자공학회논문지CI
    • /
    • 제37권3호
    • /
    • pp.39-44
    • /
    • 2000
  • 본 논문에서는 포토 센서를 통해 화면 안에서 동기 신호를 얻는 시분할입체방식을 제안하였다. 동기 신호가 되는 화면의 일부분을 좌측 영상이냐 우측 영상이냐에 따라 밝기의 차이를 두어 대부분의 시분할 입체방식에서는 불가능한 좌우 영상의 구별이 가능하도록 하였다. 제안된 방식은 컴퓨터, VTR 및 TV 등 다양한 하드웨어 환경을 지원하고 다양한 OS와 웹에서도 동작할 수 있으며, 별도의 소프트웨어 드라이버를 필요로 하지 않으며 가격이 저렴하다는 장점을 지닌다.

  • PDF

HEVC 화면 내 예측을 위한 FAST 에지 검출 기반의 CU 분할 방법 (CU Depth Decision Based on FAST Corner Detection for HEVC Intra Prediction)

  • 전승수;김남욱;전병우
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.484-492
    • /
    • 2016
  • High efficiency video coding (HEVC)은 H.264/AVC와 같은 이전 비디오 압축 표준 보다 더 높은 압축 효율을 갖는 최신 비디오 압축 표준이다. 화면 내 예측에서 최대 압축 단위 (LCU)들은 quadtree 구조를 통해 64x64부터 8x8까지의 크기를 갖는 더 작은 압축 단위 (CU)들로 나누어지고, 이들은 다시 예측 단위 (PU)들로 나누어진다. 가능한 크기까지 CU를 분할하면서 RDO (Rate Distortion Optimization) 과정을 통해 최적의 CU 분할 형태가 선택된다. 이 과정에서 HEVC는 많은 계산량을 필요로 한다. 본 논문에서는 HEVC의 계산량을 줄이기 위해, FAST (Features from Accelerated Segment Test) 코너 검출을 이용하여 화면 내 예측을 위한 고속 CU depth 결정 방법 (FCDD)을 제안한다. 제안하는 방법은 기존의 HEVC와 비교하여 약 0.7%의 BDBR 만큼의 적은 압축 성능 감소와 함께 부호화기에서 약 53.73%의 계산 시간을 감소시켰다.

VVC의 기울기 기반 화면내 예측모드 결정 및 블록분할 고속화 기법 (Gradient-Based Methods of Fast Intra Mode Decision and Block Partitioning in VVC)

  • 윤용욱;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.338-345
    • /
    • 2020
  • 차세대 비디오 부호화 표준으로 진행중인 VVC(Versatile Video Coding)는 HEVC(High Efficiency Video Coding)보다 두 배 이상의 압축 성능을 달성하기 위해 다양한 기술들을 채택하고 있다. 최근 배포된 VVC 참조 SW 코덱인 VTM(VVC Test Model)은 HEVC 대비 38% 이상의 BD-rate 부호화 성능 향상을 보이는 반면 부호화와 복호화 복잡도가 각각 9배, 2배 정도 증가를 보인다. 특히, 재귀적 MTT(Multi-Type Tree) 분할 구조와 HEVC 대비 2배로 증가한 화면내 예측모드 수로 인해 상당한 부호화기의 복잡도가 증가하였으며, 이를 감소시키기 위한 다양한 기법들이 연구되고 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위하여 블록내 화소의 기울기를 이용한 고속 화면내 예측모드 결정 및 블록분할 기법을 제시한다. 실험결과 VTM6.0 대비 AI(All Intra) 부호화 구조에서 3.54%의 부호화 성능 감소와 65%의 부호화 시간 절감 효과를 얻었다.

유전적 알고리즘을 이용한 동화상의 영역분할 부호화 방법 (A Moving Picture Coding Method Based on Region Segmentation Using Genetic Algorithm)

  • 정남채
    • 융합신호처리학회논문지
    • /
    • 제10권1호
    • /
    • pp.32-39
    • /
    • 2009
  • 동화상의 부호화 효율향상을 위하여 유전적 알고리즘(Genetic Algorithm: GA)을 이용하여 영역 분할하는 방법을 제안한다. 유전적 알고리즘은 함수치만을 이용하여 큰 탐색공간으로부터 최적의 조합을 축차적으로 찾아내는 방법이다. 이동추정과 영역분할을 동시에 진행함으로써, 이동 벡터를 화면내의 작은 블록이나 화소의 각각에 할당하고, 그것을 부호화 정보량과 신호 대 잡음비의 관계로부터 최적화 문제로 변환할 수 있다. 즉, 이동보상예측 부호화에는 영역분할과 이동 추정은 서로 밀접하게 관계되어 있다. 이것은 부호량과 S/N비를 최적화하는 것으로서 화면 속의 각 블록에서 이동 벡타를 최적의 상태로 배치하는 것이다. 그러므로, 본 논문에서는 최적인 영역분할 결과를 얻기 위하여 GA의 데이터형과 그 데이터의 처리 방법에 대해서 검토하였다. 또한, 테스트 화상을 이용한 컴퓨터시뮬레이션을 통하여 제안 방법의 유효성을 확인하였다.

  • PDF

HEVC 화면내 부호화 복잡도 감소 방법 (Encoder Complexity Reduction Method of HEVC Intra Coding)

  • 권대혁;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.335-337
    • /
    • 2013
  • 본 논문은 HEVC(high efficiency video coding)의 다양한 화면내 부호화 모드에 대한 성능을 분석하고, 그 분석에 바탕하여 RMD(rough mode decision)가 고려하는 화면내 예측 모드의 개수를 PU 의 크기별로 감소시키는 것과 함께, MPM(most probable mode)의 추가를 최소화해 RDO 가 고려하는 후보의 개수를 줄이고, 상위 CU 와의 Cost 차이값을 이용하여 CU 의 분할을 줄이는 것으로 부호화 복잡도를 감소시키기 위한 방법을 제안한다. 실험 결과에서는 2.02% BD-rate 증가만으로 부호화 시간을 10.87% 감소시킬 수 있음을 보인다.

  • PDF

웹사이트의 효율적 설계를 위한 사용자의 시각궤적에 관한 연구 (A Study on the User's Visual Trajectories for an Efficient Design of a Web site)

  • 하종수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.356-359
    • /
    • 2015
  • 본 연구는 웹사이트의 효율적이고 경험 디자인(User Experience Design : UX 디자인)적 설계가 가능하도록 사용자의 시각궤적을 통해 주시빈도를 확인한다. 사용자 경험치에 따라 웹 포털 사이트를 세 가지로 분류하고 와이어프레임을 제시하여 각 사이트의 화면분할과 정보영역을 분석한다. 시선추적 장치를 통해 세 가지 와이어프레임의 시각궤적 및 주시빈도를 확인하여 시선이 머무는 히트맵을 제시한다. 이를 통해 웹사이트의 디자인 설계시 페이지나 화면에 보이는 요소들의 효율적 배치를 위한 주시영역을 살펴본다.

  • PDF