• 제목/요약/키워드: 블록기준 영상정보

검색결과 79건 처리시간 0.022초

움직임과 영상 패턴 서술자를 이용한 중복 동영상 검출 (Detecting near-duplication Video Using Motion and Image Pattern Descriptor)

  • 진주경;나상일;정동석
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.107-115
    • /
    • 2011
  • 본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.

부화소 단위의 빠른 움직임 예측을 위한 개선된 탐색 알고리즘 (An Enhanced Search Algorithm for Fast Motion Estimation using Sub-Pixel)

  • 김대곤;유철중
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권12호
    • /
    • pp.103-112
    • /
    • 2011
  • 움직임 예측은 동영상 인코딩 과정에서 가장 많은 연산량을 차지하는 매우 중요한 처리과정이다. H.264/AVC에서는 움직임 예측을 할 때 정수 화소 단위 뿐만 아니라 부화소 단위까지 예측을 실시함으로써 영상의 압축률을 매우 높일 수 있다. 하지만 이로 인해 계산량이 더욱 증가되는 문제점이 있다. 일반적으로 움직임 예측시 각 블록들 간의 절대 변환 오차(SATD : Sum of Absolute Transform Difference)는 최소점을 기준으로 포물선 형태를 가지는 특성이 있다. 본 논문에서는 이러한 특성을 이용하여 움직임 예측 과정에서 필요한 탐색점을 줄이는 방법을 제안하였다. 제안한 방법은 연산 처리 시간을 감소시킴으로써 계산의 복잡도를 줄일 수 있었다. 제안한 기법을 적용한 결과, 기존의 고속 움직임 예측 알고리즘들과 비교하여 화질 저하는 적은데 비해, 인코딩시 움직임 예측 과정에 서 약 20%정도 처리속도를 감소시키는 결과를 얻었다.

HEVC를 위한 고성능 다중 모드 2D 변환 블록의 설계 (Design of High Performance Multi-mode 2D Transform Block for HEVC)

  • 김기현;류광기
    • 한국정보통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.329-334
    • /
    • 2014
  • 본 논문에서는 4가지의 TU를 동일한 사이클에 처리하는 고성능 다중모드 2D 변환기의 하드웨어 구조를 제안한다. HEVC의 변환 기술은 고해상도, 고화소의 영상을 높은 효율로 압축하기 위해 4가지의 화소 단위 TU를 지원하여 각각의 변환 연산을 수행한 후 최적의 모드를 찾는다. 제안하는 변환기는 변환 행렬 계수들 간의 관계를 분석하여 공통 연산기를 사용한 구조로 설계하여 4가지의 TU 모드 행렬 연산을 처리하는 사이클 수가 동일하게 35cycle로 처리된다. TSMC 018nm CMOS 공정 라이브러리를 사용해 합성한 결과 $4k(3840{\times}2160)@30fps$의 영상을 기준으로 최대 동작주파수는 400MHz이고 총 게이트 수는 214k가 소요되었으며, 10-Gpels/cycle의 처리량을 갖는다.

TDS 기법을 이용한 움직임 벡터 추정 (Motion Vector Estimation using T-shape Diamond Search Algorithm)

  • 김미영;정미경
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.309-316
    • /
    • 2004
  • 본 논문은 움직임 벡터를 보다 빠르고 정확하게 추정해나가는 탐색 방법으로 상 좌 우 3 방향을 고려한 TDS(T-Shape Diamond Search) 알고리즘을 제안하였다. 이 방법에서는 실제 움직임 벡터가 탐색 영역의 중심과 상ㆍ하 ㆍ좌 ㆍ우 방향에 집중되어 있는 특성을 이용하여 먼저 탐색 원점을 중심으로 상ㆍ하ㆍ좌ㆍ우 4 방향으로 탐색 점을 배치한 후 블록 정합을 실행한다 이들 중 정합 오차가 가장 삭은 지점을 기준점으로 상 방향으로 탐색 점을 확장하여 정합 오차를 측정해보고 기준점토다 오차가 작으면 계속 상 방향으로 확장해 나가고 그렇지 않으면 기준점을 충심으로 좌우 두 점 중 정합오차가 작은 점을 선택한다. 예측된 방향으로 위의 과정을 반복하며 움직임을 추정한다. 특히 움직임이 십자방향에 집중되는 영상의 경우 접근이 빠르고, 단계적으로 움직임 가능성이 낮은 부분을 탐색 대상에서 제외해 나감으로써 탐색이 비교적 빠르고 정확하게 이루어진다. 이 방법은 기존의 부분 최적 탐색 기법인 NTSS, DS, 그리고 HEXBS 등의 탐색법과 비교할 때 유사한 화질을 유지하면서도 탐색 점수에서는 평균 38%의 개선된 결과를 얻을 수 있었다. 특히 움직임이 적은 영상에서의 탐색 점수는 50%의 향상된 결과를 얻었다.

국부 영역 중앙값 기반의 가중치 부여 방법을 이용한 보간 영상의 화질 개선 (Quality Improvement of Interpolated Image Using Weight-Granting Method Based on Median Values Of Local Area)

  • 곽내정;유성필;안재형;권동진
    • 한국콘텐츠학회논문지
    • /
    • 제7권12호
    • /
    • pp.346-354
    • /
    • 2007
  • 저해상도 영상에서 고해상도 영상으로 영상을 확대할 경우 적용하는 보간법은 알고 있는 값을 기준으로 해서 보간 값을 추론한다. 이 과정에서 블러링과 블록화 현상 등이 발생한다. 기존의 보간법은 처리과정에서 주변의 값들에 적절한 가중치를 곱하여 더함으로 이러한 단점들을 보완하고자 한다. 제안방법은 원화소의 값을 주변의 정보를 고려하여 변형하고 이 화소값을 이용하여 보간 화소를 생성함으로 보간 영상의 화질을 개선한다. 먼저 대각 방향의 차이값을 이용하여 복잡영역과 평탄 영역으로 구분하고 복잡영역일 경우 주변 영역의 메디안 값과 원화소의 값을 이용하여 변형된 화소의 값을 구한다. 즉, 평탄 영역일 경우는 원화소의 값을, 복잡영역은 변형된 화소의 값을 이용하여 양선형 보간법을 적용하여 보간 값을 구한다. 제안 방법의 성능을 평가하기 위해 기존의 보간 방법과의 PSNR과 확대 영상의 화질을 비교하였다. 실험결과 제안 방법은 기존의 방법에 비해 PSNR을 개선하였고 화질도 우수함을 보여준다.

비실시간 기반 스테레오스코픽 비디오 부호화를 위한 적응루프필터 적용기법 (Application of Adaptive Loop Filter for NRT-Based Stereoscopic Video Coding)

  • 이병탁;이봉호;최해철;김진수;윤국진;정원식;김재곤
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.261-270
    • /
    • 2013
  • 스테레오스코픽(stereoscopic) 3D 비디오 서비스는 기존 2D와의 호환성을 유지하면서 새로운 3D 비디오 서비스를 제공할 수 있다. 전송 대역이 제한된 지상파 방송의 경우 높은 부호화 효율을 갖는 스테레오스코픽 비디오 코덱이 요구된다. 따라서 기준영상은 기존 2D 비디오 서비스와의 호환성을 위해 MPEG-2로 부호화하는 반면 3D를 위한 부가영상 부호화를 위해 부호화 효율이 높은 H.264/AVC, HEVC(High Efficiency Video Coding) 등을 고려하고 있으며, 또한 부가영상을 비실시간으로 전송하는 NRT(Non-Real Time) 3D 서비스도 고려되고 있다. 본 논문에서는 NRT 3D 서비스를 위한 스테레오스코픽 비디오 부호화에 있어서, HEVC에서 고려되었던 적응루프필터(ALF: Adaptive Loop Filter)를 전/후처리 필터로 적용하는 기법을 제시한다. 특히, 부가영상의 후처리에 ALF를 적용하기 위하여 부호화 과정에 결정되는 CU(Coding Unit) 구조를 이용하는 HEVC와 달리 MVC(Multiview Video Coding)로 부호화한 부가영상의 매크로블록(MB) 부호화 모드 및 참조영상 인덱스 등의 MB 부호화 정보를 이용한 ALF 적용 기법을 제안한다. 부가 영상 부호화에 있어서 제안한 기법으로 전처리 및 후처리 과정으로 ALF를 적용함으로써 최대 약 24.9%의 비트율 감소를 확인하였다.

PCA 복원과 HOG 특징 기술자 기반의 효율적인 보행자 인식 방법 (An Efficient Pedestrian Recognition Method based on PCA Reconstruction and HOG Feature Descriptor)

  • 김철문;백열민;김회율
    • 전자공학회논문지
    • /
    • 제50권10호
    • /
    • pp.162-170
    • /
    • 2013
  • 최근 보행자의 교통안전 개선을 위한 목적으로 차량에 장착되는 보행자 보호 시스템(PPS, Pedestrian Protection System)에 대한 관심과 요구가 증가하고 있다. 본 연구에서는 보행자 검출 후보 윈도우 추출과 셀(cell) 단위 히스토그램 기반의 HOG 특징 계산 방법을 제안하였다. 보행자 검출 후보 윈도우 추출은 주변밝기 비율체크, 수직방향 에지투영, 에지펙터(edge factor), 그리고 PCA(Principal Component Analysis) 복원 영상을 이용하였다. Dalal 의 HOG 는 겹침 블록 상의 모든 픽셀에 대해 가우시안 가중치와 삼선형보간에 의한 히스토그램 계산이 필요한데 반하여 제안하는 방법은 단위 셀마다 가우시안 가중 및 히스토그램을 계산하고 그것들을 인접 셀과 결합하므로 연산 속도가 빠르다. 제안하는 PCA 복원 에러 기반의 보행자 검출 후보 윈도우 추출은 보행자의 머리와 어깨 영역과의 차이를 기준으로 배경을 효율적으로 분류한다. 제안하는 방법은 카메라 컬리브레이션이나 스테레오 카메라를 이용한 거리 정보 없이도 영상만으로 전통적인 HOG 에 비하여 연산속도가 크게 개선된다.

RSA 암호화 프로세서에 적용 가능한 효율적인 누적곱셈 연산기 설계 (Design of an Efficient MAC Unit for RSA Cryptoprocessors)

  • 문상국
    • 한국정보통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.65-70
    • /
    • 2008
  • 1024비트 이상의 고비도 RSA 프로세서에서는 몽고메리 알고리즘을 효율적으로 처리하기 위하여 전체 키 스트림을 정해진 블록 단위로 처리한다. 본 논문에서 기본으로 하는 RSA프로세서는 기본 워드를 128비트로 하고 곱셈 곁과의 누적기로는 256비트의 레지스터를 사용한다. 128 비트 곱셈을 효율적으로 수행하기 위하여 32비트${\times}$32비트 곱셈기를 사용하며 각 연산 결과는 128비트 크기의 8개 레지스터에 필요에 따라 저장되어 몽고메리 알고리즘을 수행하는데 사용된다. 본 논문에서는 128비트 곱셈에 필요한 누적곱셈 (MAC; multiply-and-aCcumultaion)을 효율적으로 계산하기 위하여 모든 연산 단계를 미리 분석하여 불필요한 연산단계를 수행하지 않고 곱셈 횟수를 줄여 효율적인 누적 곱셈 연산기를 구현하였다. 구현된 누적 곱셈 연산기는 자동으로 합성하였고, 본 논문 작성에서 기준이 되는 RSA프로세서의 동작 주파수인 20MHz에서 정상적으로 동작하였다

회화적 애니메이션에서 브러시 스트로크의 시간적 일관성을 유지하기 위한 모션 맵 생성 (Motion Map Generation for Maintaining the Temporal Coherence of Brush Strokes in the Painterly Animation)

  • 박영섭;윤경현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권8호
    • /
    • pp.536-546
    • /
    • 2006
  • 회화적 애니메이션은 비디오 동영상을 이용하여 손으로 그린 듯 한 회화적 느낌을 표현하는 방법이며 프레임 간 브러시 스트로크의 시간적 일관성을 유지하는 것이 가장 중요한 요소이다. 본 논문에서는 프레임 간 브러시 스트로크의 일관성을 유지하기 위한 모션 맵 생성을 제안한다. 모션 맵이란 모션이 발생한 에지 위치를 기준으로 해서 모션 정보를 더함으로써 프레임 간 에지가 움직이는 영역을 말한다. 본 논문에서 사용한 모션 추정 방법은 광류 (optical flow) 방법과 블록 기반 방법을 이용하였으며 여러 가지 모션 추정 방법을 통해서 얻은 모션 정보 ( 방향과 크기 ) 중 신호 대 잡음비 (PSNR)가 가장 큰 방법을 최종 모션 정보로 선택하여 모션 맵을 생성하였다. 생성된 모션 맵은 다음 프레임의 덧칠 부분을 결정해 준다. 손으로 그린 듯 한 회화적 느낌을 표현하면서도 프레임 간 브러시 스트로크의 시간적 일관성을 유지하기 위해서 브러시 스트로크의 방향을 결정해주는 강한 에지에 대해서만 모션 정보를 적용하였다. 또한 다중노출기법과 소스 영상과 캔버스간의 차이 맵을 이용하여 프레임 간 플릭커링 현상을 줄이고자 하였다. 구조적 일관성을 유지하기 위해 국부 기울기 보간법 (local gradient interpolation)을 이용하여 브러시 스트로크 간 방향의 일관성을 유지하였다.