• 제목/요약/키워드: 블록기반 영상분할

검색결과 122건 처리시간 0.029초

블록 적응적인 Context Tree Weighting을 이용한 무손실 영상 압축 (Lossless Image Compression Using Block-Adaptive Context Tree Weighting)

  • 오은주;조현지;유훈
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.43-49
    • /
    • 2020
  • 본 논문은 입력 영상 데이터를 블록 적응적으로 Context Tree Weighting을 사용하여 산술 부호 기반의 무손실 영상 압축 방법을 제안한다. CTW 기법은 입력 데이터를 비트 단위로 예측 및 압축을 하는 특성을 가진다. 또한, CTW 기법은 미지의 모델 및 파라미터에 대해서도 효율적인 압축을 한다는 점에서 장점을 보여준다. 본 연구에서는 무손실 압축이 필요한 항공 및 위성 사진을 옵션 정보에 따라 분할한 다음 각각 CTW 기반의 산술 부호기를 적용하여 압축의 효율을 증대하고자 한다. 항공 및 위성 사진은 영상 내 정보의 가치가 높으므로 무손실 압축이 불가피하다. 또한, 영상 크기가 일반적인 영상에 비해 크기 때문에 고압축 역시 필요하다. 기존의 무손실 압축 기법으로는 대용량의 중요 영상을 압축하는 데에 어려움이 존재한다. 이러한 이유로, 본 논문에서는 분할하지 않은 영상을 압축할 때 보다 제안하는 방법을 통해 영상을 압축했을 때 더 높은 압축률을 보여주기 위한 실험을 제공한다. 실험을 통해 기존의 무손실 압축 기법을 사용하여 압축을 진행했을 때 보다 CTW 기법을 이용하여 분할한 영상을 압축했을 때의 압축률이 더 높음을 확인할 수 있다.

영역분할 및 예측을 통한 객체기반 스테레오 동영상 부호화 (Object-based Stereoscopic Video Coding Using Image Segmentation and Prediction)

  • 권순규;배태면;한규필;정의윤;하영호
    • 한국통신학회논문지
    • /
    • 제24권12B호
    • /
    • pp.2349-2358
    • /
    • 1999
  • 본 논문에서는 스테레오 동영상의 객체기반 부호화 기법을 제안하였다. 스테레오 영상열의 정보량을 줄이면서 블록화 현상이나 모스키토 현상과 같은 블록정합 기반 방법의 예측오차를 줄이기 위해서는 객체기반 부호화 기법이 필요하다. 객체기반 방법에서는 부호화에 적절한 객체를 추출하기가 어렵고, 추출된 객체에 대해서 프레임이 지남에 따라 갱신해 주어야 하는 문제점이 발생한다. 이를 개선하기 위해서 제안된 방법에서는 전처리, 객체추출, 객체갱신 과정을 사용하였다. 전처리 과정에서는 움직임과 변이 예측의 신뢰성이 낮은 영역을 비객체영역으로 분할하여 부정확한 객체의 추출을 방지하였다. 객체추출 과정에서는 좌영상의 예측을 향상시키기 위해 기존의 움직임과 밝기값을 고려하는 영상분할법에 변이를 추가함으로서 객체기반 부호화에 적합한 객체를 추출하였다. 그리고 객체갱신 과정에서는 새로운 객체의 추출, 객체분할, 객체 병합을 적용하여 누적 오차를 줄였다.

  • PDF

삼각특징추출과 GHA를 이용한 얼굴영상 압축알고리즘 (Face Image Compression Algorithm using Triangular Feature Extraction and GHA)

  • 서석배;김대진;강대성
    • 대한전자공학회논문지SP
    • /
    • 제38권1호
    • /
    • pp.11-18
    • /
    • 2001
  • 본 논문에서는 얼굴영상 압축을 위한 알고리즘으로 삼각특징 추출과 GHA를 이용한 압축 알고리즘을 제안한다. 특징추출에서 입력영상을 8개의 삼각형으로 분할한 다음 데이터의 취득순서를 설정하여 영상을 분할하면서도 위치정보를 보존할 수 있는 알고리즘을 제안하고, 압축을 위해 GHA를 도입함으로써 복원 시 생기는 블록화 현상을 대폭 개선하였으며 얼굴의 윤곽과 이목구비 등 얼굴의 전체적인 형태를 압축 알고리즘에 반영할 수 있었다. 기존의 블록기반 K-means 알고리즘과 얼굴영상을 분할하지 않고 전체를 입력으로 사용하는 알고리즘과의 비교실험결과 제안된 방법의 성능이 가장 우수함을 볼 수 있었다.

  • PDF

시공간 엔트로피 임계법과 카메라 패닝 보상을 이용한 객체 기반 동영상 분할 (Object-Based Video Segmentation Using Spatio-temporal Entropic Thresholding and Camera Panning Compensation)

  • 백경환;곽노윤
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.126-133
    • /
    • 2003
  • 본 논문은 비디오 시퀸스에 카메라 패닝 보상과 2차원 시공간 엔트로피 임계법을 적용하여 추출한 객체포함영역을 대상으로 영상 분할을 수행하는 이동객체 분할 기법에 관한 것이다. 우선, 웨이블렛 변환에 의해 구성한 피라미드 계층 구조상에서 카메라 패닝 벡터를 추정하여 전역 움직임을 보상한다. 이후, 전역 움직임이 보상된 기준영상을 대상으로 각 프레임간에서 2차원 시공간 엔트로피 임계법을 적용하여 이동 객체가 포함될 가능성이 있는 영역을 블록 단위로 추출한다 다음으로, 2차원 시공간 엔트로피 임계법에 의해 분류된 영역을 토대로 각 블록을 움직임 블록, 준 움직임 블록, 비 움직임 블록 중 어느 하나로 분류한 검색 테이블을 작성한다. 이어서, 검색 테이블을 참조하여 초기 탐색 계층 및 탐색 영역을 적응적으로 선정함으로써 피라미드 계층 구조상에서 효율적인 고속 움직임 추정을 수행하여 이동 객체에 해당하는 객체포함영역만을 추출한다. 최종적으로, 이렇게 추출된 객체포함영역에서 임계 기울기 영상을 정의한 후, 이를 기준 삼아 객체포함영역에 화소단위의 형태학 기반 영상 분할 알고리즘을 적용함으로써 비디오 시퀸스에 포함된 이동 객체를 분할한다. 컴퓨터 시뮬레이션 결과를 통해 고찰할 때, 제안된 방법은 이동 객체에 대한 상대적으로 우수한 분할 특성을 제공할 수 있고, 특히 저대조 경계면의 분할 특성을 제고시키고 있음을 확인할 수 있다.

  • PDF

영상 분할을 활용한 화학 구조 문서 이해 (Understanding Documents With Chemical Structures Using Image Segmentation)

  • 양혜윤;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1297-1300
    • /
    • 2022
  • Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.

  • PDF

클라우드 컴퓨팅에서 N-스크린 서비스를 위한 동영상 트랜스 코딩 기법 (Video Transcoding Scheme for N-Screen Service Based on Cloud Computing)

  • 임헌용;이원주;전창호
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.11-19
    • /
    • 2014
  • 본 논문에서는 클라우드 컴퓨팅 기반의 N-스크린 서비스를 위한 실시간 동영상 트랜스 코딩 기법을 제안한다. 이 기법은 동영상을 분할하여 하나의 인트로 블록과 재생 블록을 생성한다. 그리고 최초 서비스 요청이 오면 인트로 블록을 전송한 후 재생 블록들을 실시간으로 트랜스 코딩하여 전송한다. 이때 각 블록의 재생시간 내에 트랜스 코딩을 완료하기 위해 각 노드의 성능에 따라 재생 블록을 분할하여 할당한다. 또한, 기존 동영상 재생 기법은 실시간 재생 서비스를 위해 모든 포맷과 화질로 동영상을 변환하였다. 하지만 본 논문에서 제안한 기법은 클라이언트의 디바이스와 플랫폼에 적합한 화질의 포맷으로 동영상을 변환함으로써 기존 동영상 재생 기법에 비해 스토리지 사용량을 줄인다. 본 논문에서는 시뮬레이션을 통하여 제안한 동영상 재생 기법이 기존의 기법에 비해 N-스크린 서비스를 위한 실시간 동영상 재생에 효과적임을 보인다. 또한, 제안한 동영상 트랜스 코딩 기법이 기존 방법에 비해 스토리지 사용량이 적음을 보인다.

채널 간 유사도 비교를 이용한 적응형 색차 블록 분할 방법 (Adaptive Chroma Block Partitioning Method using Comparison of Similarity between Channels)

  • 백아람;최상규;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.260-261
    • /
    • 2018
  • MPEG과 VCEG은 차세대 비디오 부호화 표준 기술 개발를 위한 JVET(Joint Video Exploration Team)을 구성하여 현재 비디오 표준화인 HEVC 대비 높은 부호화 효율을 목표로 연구를 진행하며 CfP(Call for Proposal) 단계를 진행 중이다. JVET의 공통 플랫폼인 JEM(Joint Exploration Test Model)은 HEVC의 quad-tree 기반 블록 분할 구조를 대신하여 더 많은 유연성을 제공하는 QTBT(Quad-tree plus binary-tree)가 적용되었다. QTBT는 화면 내 부호화 효율을 높이기 위한 하나의 방법으로 휘도와 색차 신호에 대해 분할된 블록 구조를 지원한다. 이러한 방법은 채널 간 블록 분할 모양이 동일하거나 비슷한 경우에 중복되는 블록 분할 신호가 발생할 수 있는 단점이 있다. 따라서 본 논문에서는 화면 내 부호화에서 채널 간 유사도 비교를 이용하여 적응형 색차 블록 방법을 제안한다. 제안한 방법의 실험 결과로 JEM 6.0과 비교하여 CfE(Call for Evidence) 영상에서 평균 0.28%의 Y BD-rate 감소와 함께 평균 124.5%의 부호화 복잡도 증가를 확인하였다.

  • PDF

이진화기반 영역분할을 이용한 3D입체영상의 밝기보정 (Intensity Correction of 3D Stereoscopic Images Using Binarization-Based Region Segmentation)

  • 김상현;김정엽
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.265-270
    • /
    • 2011
  • 본 논문에서는 이진화기반 영역분할을 이용한 3D입체영상의 밝기 보정방법을 제안한다. 제안된 방법은 입력된 좌우 3D입체영상 중 우 영상을 이진화를 통한 영역분할을 하고 크기가 작은 영역들은 제거한다. 다음 우 영상의 각 영역들에 대해 대응되는 좌 영상내의 영역을 상관계수(correlation coefficient)를 이용한 정합을 통해 추출한다. 영역단위의 매칭을 할 때 영역들 간의 겹침을 방지하기 위하여 모폴로지 필터로 영역경계에 인접한 일정부분을 제거한다. 그리고 좌우 영상의 영역 간 히스토그램 명세화를 수행함으로써 우 영상의 밝기 보정을 한다. 실험에서 좌 영상으로부터 블록단위 움직임보상으로 우 영상을 생성했을 때 제안한 방법이 블록평균 정합오차가 가장 작은 것을 확인 할 수 있었다.

비정형객체 검색을 위한 향상된 분할영역 색 기술자 (Enhanced Boundary Partition Color Descriptor for Deformable Object Retrieval)

  • 정현일;김해광
    • 방송공학회논문지
    • /
    • 제20권5호
    • /
    • pp.778-781
    • /
    • 2015
  • 비정형객체 검색을 위한 향상된 경계 영역 분할에 기반을 둔 색 기술자를 제안한다. 이 논문에서는 하나의 객체를 내부영역과 경계영역으로 나눠 각각으로부터 기술자를 추출하는 기존의 기술자를 향상하는 기술을 제안한다. 먼저 주어진 영상으로부터 비정형객체영역과 배경영역을 분할한다. 분할된 객체의 중심 좌표를 구하고 이 중심 좌표를 기준으로 해서 전체 객체를 N × N 블록으로 나눈다. 각 블록은 배경픽셀의 유무를 확인하여 경계블록과 내부블록으로 구분한다. 하나의 객체 영상은 내부블록들로 구성된 내부영역과 경계블록들로 구성된 경계영역으로 구분하여 각 영역에 대해 MPEG-7 주조색 기술자 (dominant color descriptor)를 추출하여 최종 기술자를 추출한다. 비정형객체 검색 성능 실험을 위하여 핸드백 영상들을 다양한 시점으로 변화하여 구성한 1,973장의 실험 데이터베이스를 구축하였으며, 검색 성능을 ARR(Average Retrieval Ratio)를 사용하여 기존의 MPEG-7 주조색 기술과 비교하였다.