• 제목/요약/키워드: Screen Image Coding

검색결과 13건 처리시간 0.027초

Efficient Screen Splitting Methods - A Case Study in Block-wise Motion Detection

  • Layek, Md. Abu;Chung, TaeChoong;Huh, Eui-Nam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권10호
    • /
    • pp.5074-5094
    • /
    • 2016
  • Screen splitting is one of the fundamental tasks in different methods including video and image compression, screen classification, screen content coding and the like. These methods in turn support various applications in data communications, remote screen sharing, remote desktop delivery to assist teaching-learning, telemedicine, Desktop as a Service etc. In the literature we find systems requiring splitting assumes a fixed size split that do not change dynamically, also there is no analysis why that split is chosen in terms of performance. By doing mathematical analysis this paper first finds the efficient splitting schemes that can be easily automated to make a system adaptive. Thereafter, taking the screen motion detection as a case study, it demonstrates the effects of various splitting methods on motion detection performance. The simulation results clearly shows how classification performances varies with different splitting which will facilitate to choose the best splitting for a specific application scenario as well as making the system adaptive by providing dynamic splitting.

스크린 이미지 부호화를 위한 에지 정보 기반의 효과적인 형태학적 레이어 분할 (Effective Morphological Layer Segmentation Based on Edge Information for Screen Image Coding)

  • 박상효;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.38-47
    • /
    • 2013
  • 다중 레이어 영상 모델인 Mixed Raster Content 모델 (MRC) 기반의 영상 부호화는 스크린 이미지와 같은 혼합 영상을 전경 레이어, 이진 마스크 레이어, 배경 레이어로 재구성한 뒤, 각 레이어마다 그 레이어의 신호 특성에 적합한 부호화기를 이용하여 영상을 압축하는 기법이다. 문자와 같은 계단 형태의 강한 에지를 갖는 영역의 위치 정보를 마스크 레이어에 저장하고, 그 위치의 색상 신호는 전경 레이어에 저장한다. 그리고 나머지 영역인 배경 영역의 색상 신호는 배경 레이어에 저장한다. 따라서 마스크 레이어가 전경과 배경의 분할 정보를 담게 되며, 이 분할 정보의 정확도에 따라 전체 부호화기의 압축 효율이 직접적인 영향을 받는다. 본 논문은 MRC 기반의 영상 부호화를 위한 새로운 레이어 분할 알고리즘을 제안한다. 제안 방법은 형태학적 필터인 top hat 변환을 이용하여 문자를 배경신호로부터 분할한다. 이때 문자의 경계를 에지 맵으로부터 추정하여 문자 색상과 배경과의 상대적 밝기를 결정하고 이를 통해 형태학적 필터링에 필요한 top hat 변환의 종류를 정확히 선택하도록 하였다. 실험을 통해 제안 방법이 비교 대상 알고리즘에 비해 우수한 분할 성능을 가짐을 보인다.

몰입형 비디오 압축을 위한 스크린 콘텐츠 코딩 성능 분석 (Screen Content Coding Analysis to Improve Coding Efficiency for Immersive Video)

  • 이순빈;정종범;김인애;이상순;류은석
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.911-921
    • /
    • 2020
  • 최근 MPEG-I (Immersive) 그룹에서는 몰입형 비디오(Immersive Video)에 대한 표준화 프로젝트를 통해 압축 성능 탐색을 진행하고 있다. MIV(MPEG Immersive Video) 표준 기술은 다수의 시점 영상과 깊이 맵을 통한 깊이 맵 기반 이미지 렌더링(DIBR)을 바탕으로 제한적인 6DoF을 제공하고자 하는 기술이다. 현재 MIV에서는 바탕 시점(Basic View)과 각 시점의 고유한 영상 정보를 패치 단위로 모아둔 추가 시점(Additional View)으로 처리하는 모델을 채택하고 있다. MIV에서 생성된 아틀라스는 포함되는 시점의 성격에 따라 다른 영상의 특성을 나타내어 비디오 코덱의 압축 효율에 대한 고찰이 필요하다. 따라서 본 논문에서는 다양한 시점과 패치들이 반복되는 패턴에 착안하여 화면 내 블록 카피(IBC: intra block copy) 등의 압축 기법이 포함된 스크린 콘텐츠 코딩 툴에 대한 성능 비교 분석을 진행하여 복원 영상에서 최대 -15.74% Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다.

웨이브릿 변환에서 인지적 가중치를 이용한 SPIHT 비디오 부호기 (SPIHT Video Coder Using Perceptual Weight in Wavelet transform)

  • 정용재;강경원;문광석
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.15-20
    • /
    • 2002
  • 동영상 부호기에서 화면내 프레임 부호화는 전체 프레임의 화질에 중요한 영향을 미친다. 표준화된 동영상의 부호기는 DCT를 쓰지만, 저 비트율에서의 블록화 현상으로 화질의 열화를 가져올 수 있다. 본 논문에서는 화질의 열화를 감소시키고 인간 시각적인 측면에서의 화질 개선을 위한 비디오 코딩을 제안한다. 제한안 방법에서는 웨이브릿 변환에서 인지적 가중치를 화면내 프레임에 적용하여 SPIHT와 VLC를 이용하여 부호화하였고, 인간 시각 특성을 고려하여 시각적인 노이즈를 제거하여 주관적인 화질을 향상 시켰다.

  • PDF

MRC 기반의 영상 부호화를 위한 분수령 알고리즘을 이용한 효과적인 신호 채움 기법 (Efficient Signal Filling Method Using Watershed Algorithm for MRC-based Image Compression)

  • 박상효;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제15권2호
    • /
    • pp.21-30
    • /
    • 2015
  • Mixed raster content 모델 기반의 영상 부호화는 전경과 배경 레이어에 빈 영역인 don't care region (DCR)이 발생하게 되며, 이 영역에 대한 신호 채움 방식에 따라 전체적인 부호화 성능이 큰 영향을 받게 된다. DCR을 채우기 위한 대부분의 기존 기법들은 홀 주변 기존 영역의 특성을 효율적으로 이용하지 않아 신호 채움 후에도 기존 신호 영역에 존재하던 고주파 성분이 반영될 뿐 아니라, DCR 경계에서의 신호 불연속으로 인해 고주파 성분이 추가적으로 발생한다는 문제점을 갖고 있다. 이 문제를 해결하기 위해 본 논문은 우선순위 기반의 적응적 영역 확장법을 이용한 새로운 DCR 채움 알고리즘을 제안한다. 제안 알고리즘은 분수령 알고리즘을 이용하여 DCR의 각 홀 픽셀에 대한 신호 특성을 판단한 후, 이를 토대로 영역 채움의 우선순위를 결정한다. 이 우선 순위를 기반으로 영역 확장을 수행함으로써 고주파 성분을 포함하고 있는 영역의 확장이 최소화되어 전체적인 부호화 효율이 향상될 수 있다. 실험 결과를 통해 제안 알고리즘이 비교 대상 알고리즘에 비해 효율적인 신호 채움으로 우수한 부호화 성능을 가짐을 보인다.

전반사 장애를 이용한 멀티터치 시스템의 구현 (Implementation of Multi-Touch System using FTIR)

  • 차수정;이구연
    • 산업기술연구
    • /
    • 제30권A호
    • /
    • pp.25-29
    • /
    • 2010
  • In this paper, we implement a multi-touch system using FIDR. The implementation consists of hardware manufacture and development of image processing system. In the hardware system, touch screen, infrared LED placements and infrared camera are made. The image processing procedure is to extract each pointer's coordinates from image data and includes binary-coding, noise-elimination, labeling and calculation of mass center. From the implementation, we are able to make a multi-touch system with considerably lower cost than the existing ones.

  • PDF

내용분석을 통해 본 드론 방송영상의 카메라 움직임 특성 연구 (Characteristics of Drone Broadcasting Camera Moving through Content Analysis Method)

  • 임현찬
    • 한국멀티미디어학회논문지
    • /
    • 제24권8호
    • /
    • pp.1178-1183
    • /
    • 2021
  • Based on the camera movement on image expression and grammar, this study intended to analyze the characteristics of image expression filmed and broadcasted by drones. This study analyzed drone images using the movement characteristics of existing video cameras as a coding nomenclature. These were intended to examine the differences from existing video grammar and their implications. This study conducted a content analysis using the entire population of drone news footage broadcast for four years in 2015, 2016, 2017 and 2018 by TV Chosun. The size of the screen, camera work, duration of the shot, camera angle, etc. were selected and analyzed. As a result, the drone camera work showed that it uses the most dolly shots in the case of camera movement, followed by the drone camera movement in the order of pan and tilt shots. For zoom, the frequency of use was the smallest. In addition, this study analyzed the size of the screen, duration of the shot, and camera angle of drone. Analysis shows that drones use certain camera movements most frequently, and unlike grandiose modifiers such as "extension of human gaze," drone remains as a supplementary means to enhance the traditional media expression.

뉴미디어 예술 작품에 적용된 알고리즘의 미학적 함의 : 라이브 코딩을 중심으로 (Aesthetic Implications of the Algorithm Applied to New Media Art Works : A Focus on Live Coding)

  • 오준호
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.119-130
    • /
    • 2013
  • 본 논문은 알고리즘이 물질성과 표현성을 획득할 수 있음을 라이브 코딩을 통해 연구한다. 라이브 코딩은 실시간으로 코드를 작성하면서 소리를 생성하고, 코드를 스크린에 투사하는 즉흥 음악 장르이다. 기존의 라이브 코딩 연구는 공연을 효과적으로 뒷받침할 수 있는 개발 환경에 초점을 맞추어 왔다. 그러나 본 연구는 라이브 코딩에서 주로 활용되는 ChucK, Impromptu, 라이브 코드의 시각화의 언어적 특성 분석과 "aa-cell"과 "slub"의 실제 공연 사례 분석을 통해 알고리즘 구현에 내재된 미학적 태도를 연구한다. 라이브 코딩의 미학적 태도는 대수적 태도와 기하학적 태도로 나눌 수 있다. 대수적 태도는 시간상에 순차적인 개념의 전개에 초점을 맞추고, 기하학적 태도는 개념의 구조를 공간상에 시각적 구조로 물질화하는데 중심을 둔다. 이러한 태도의 차이는 개념시와 구체시를 통해 표명된 개념과 물질 사이의 긴장 관계가 라이브 코딩에서 유사하게 반복된다는 것을 의미한다. 라이브 코딩에서 언어에 대한 입장이 개념과 물질 중에서 무엇을 강조하는가에 따라 알고리즘의 표현성이 규정된다.

FRUC 알고리즘을 사용한 가상 참조 이미지 기반 부호화 기술 연구 (Virtual reference image-based video coding using FRUC algorithm)

  • 양범;한희지;최해철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.650-652
    • /
    • 2022
  • Frame rate up-conversion (FRUC) 알고리즘은 동영상의 프레임율을 향상시키는 영상 보간 기술이다. 이는 고화질 디지털 비디오 시스템에서 저프레임율 동영상으로 인한 화면 떨림이나 흐릿한 움직임 등의 문제를 해소하고 시청자에게 보다 자유롭고 매끄러운 시각 경험을 제공한다. 본 논문에서는 딥러닝 기반의 FRUC 알고리즘을 이용하여 동영상을 압축하는 기술을 제안한다. 제안 방법은 원시 동영상에서 일부 영상을 제외한 후 압축 및 전송하고, 복호화 과정에서 딥러닝 기반의 보간 방법을 이용하여 제외된 영상을 복원함으로써 고효율로 압축한다. 실험에서는 동영상을 1, 3장 단위로 건너뛰며 부호화한 후 복호된 영상과 FRUC 알고리즘에 의해 복원한 영상으로 압축 성능을 평가했다. 1장 및 3장씩 제외했을 때 실험결과는 평균 81.22%, 27.80% BD-rate 감소를 보였다. 3 장씩 제외하는 것이 1장의 제외에 비해 부호화 효율이 낮은 이유는 FRUC 방법으로 복원한 영상의 PSNR이 낮기 때문이다.

  • PDF

임의의 ROI를 포함하는 JPEG2000 이미지의 ROI 코딩 기법 (An ROI Coding Technique of JPEG2000 Image Including Some Arbitrary ROI)

  • 홍석원;김상복;서영건
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.31-39
    • /
    • 2010
  • 이미지를 사용하는 영상처리 시스템이나, 단순하게 특정 이미지를 보기를 원하는 일반 사용자에게 한 이미지 내에 특정 부분을 타 영역보다 높은 품질을 갖도록 한다면, 더 좋은 서비스를 제공할 수 있을 것이다. 특히 모바일 환경에서는 화면의 크기가 작으므로 우선적으로 보여야 될 부분이 필요하게 되었다. JPEG2000에서는 이러한 기능을 지원하고 있다. 하지만 구체적인 영역 추출 과정이나 서비스 기능은 없지만, 추가로 기능을 넣을 수 있도록 제공하고 있는데, 이것을 ROI(Region-of-Interest) 기법이라 한다. 본 논문에서는 인물이 포함된 이미지를 이용하여, 얼굴 영역이 가장 우선적으로 처리되고 높은 품질로 압축되도록 부가 서비스를 제공하는 것이다. 하나의 이미지가 사용자에게 서비스되기 전에 압축되고 저장되어야 하는데, 얼굴 영역은 배경 영역 보다 더 좋은 품질로 압축되고 배경은 품질을 상대적으로 떨어뜨리는 것이다. 전송될 때도 얼굴 영역은 우선적으로 전송하여 사용자에게는 훨씬 좋은 서비스를 제공할 수 있다. 또한 압축은 일반적인 방법으로 하고, 전송될 때 얼굴영역을 찾아 우선적으로 전송해도 된다. 얼굴영역 추출은 신경망 기반의 얼굴 검출 기법을 사용하고, 우선 처리는 JPEG2000의 EBCOT 기법을 사용한다. 실험은 여러 개의 얼굴이 포함된 이미지를 사용하며, 객관적인 평가와 주관적인 평가를 실시하며, 충분히 좋은 기법으로 증명되었다.