• 제목/요약/키워드: 움직임 예측 및 보상

검색결과 77건 처리시간 0.021초

적외선영상에서 배경모델링 기반의 실시간 객체 탐지 시스템 (Real-Time Object Detection System Based on Background Modeling in Infrared Images)

  • 박장한;이재익
    • 전자공학회논문지CI
    • /
    • 제46권4호
    • /
    • pp.102-110
    • /
    • 2009
  • 본 논문은 적외선영상(infrared image)에서 배경모델링 기반의 실시간 객체 탐지 기법과 고속 PPC(PowerPC) & FPGA(Field Programmable Gate Array) 기반 개방형 구조의 하드웨어 설계 방법을 제안한다. 개방형 구조는 하드웨어 및 소프트웨어의 이식이 용이하고, 확장, 호환성, 관리 및 유지보수 등이 편리한 장점이 있다. 제안된 배경모델링 방법을 개방형 구조에 탑재하기 위하여 입력영상에서 검색영역 템플릿을 성긴 블록으로 구성하여 탐색영역의 크기를 줄인다. 또한, 이전 프레임과 현재 프레임에서 영상의 흔들림이 발생했을 때 보정하기 위해 전역움직임 보상방법을 적용한다. 배경과 객체를 분리는 픽셀 밝기의 시간 분석을 통해 적응적 값을 적용한다. 분리된 객체주변에 발생하는 클러터 제거 방법은 중앙값 필터를 적용한다. 설계된 임베디드 시스템에서 배경모델링, 객체탐지, 중앙값 필터, 라벨링, 합병 등의 방법은 PPC에서 구현하였다. 실험결과 제안된 임베디드 시스템에서 전역 움직임 보정과 배경예측을 통해 실시간으로 객체가 탐지될 수 있음을 보였다.

계산량 감축을 위한 DCT-Based H.263 양자화기의 비교 연구 (The Study of Comparison of DCT-based H.263 Quantizer for Computative Quantity Reduction)

  • 신경철
    • 융합신호처리학회논문지
    • /
    • 제9권3호
    • /
    • pp.195-200
    • /
    • 2008
  • 동영상 데이터를 효율적으로 압축하기 위해서는 입력 영상 데이터의 공간 및 시간적인 중복성 제거가 요구된다. 움직임 추정 및 보상방법은 시간적인 중성을 효과적으로 제거할 수 있지만 프래임간 예측 때문에 계산량이 증가된다. 따라서 계산량을 줄이면서 실시간 처리가 가능한 알고리즘의 연구가 요구된다. 본 논문에서는 인간 시각 특성을 고려하여 DCT 계수를 효과적으로 양자화할 수 있는 양자화기를 제안한다. 제안된 DCT-based H.263의 양자화기는 같은 전송 속도에서 TMN5보다 더 많은 프레임을 전송 처리함으로 화면 드롭현상을 줄일 수 있었다. 또한 객관적 화질 평가를 위한 평균 PSNR에서 TMN5보다 휘도 신호는 $-0.3{\sim}+0.65dB$의 차이를 보이고 색차 신호에서는 1.73dB 정도의 개선을 나타냈다. 계산량 비교에서는 NTSS에 비하여 $30{\sim}31%$, 4SS에 비하여 $20{\sim}21%$ 계산량의 감소를 나타냈다.

  • PDF

무선 멀티미디어 센서 네트워크에서 효율적인 이미지 전송을 위한 웨이블릿 기반 압축 기법 (Wavelet Based Compression Technique for Efficient Image Transmission in the Wireless Multimedia Sensor Networks)

  • 권영완;이좌형;정인범
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2323-2329
    • /
    • 2008
  • 저가형 이미지 센서 기술의 발전과 무선 센서 네트워크 기술의 발전으로 인해 WMSN(Wireless Multimedia Sensor Networks) 기술이 활발히 연구되고 있다. WMSN은 기존의 무선 센서 네트워크 기술에 멀티미디어 컨텐츠를 센싱하고 전송 및 처리하는 기반기술을 포함한다. 멀티미디어 컨텐츠는 많은 데이터량을 가지므로 이를 처리하기 위해서는 많은 컴퓨팅 자원과 높은 네트워크 대역폭을 필요로 한다. 저사양의 센서 노드에서 멀티미디어 컨텐츠를 수용하기 위해서는 컴퓨팅 자원을 고려한 압축 기법 및 효율적인 전송에 대한 연구가 필요하다. 본 논문에서는 무선 센서 네트워크에서 이미지를 효율적으로 압축하고 전송하기 위한 압축기법인 YWCE기법을 제안한다. YWCE는 웨이블릿의 Resolution Scalability 특성을 이용한 4가지 움직임 보상/예측 기법을 도입한다. 실험을 통하여 4가지 각 압축 기법들의 조합에 따라 매우 높은 성능을 나타냄을 보였다.

다시점 비디오의 휘도 및 색차 성분 불일치 보상을 위한 히스토그램 매칭 기반의 전처리 기법 (New Prefiltering Methods based on a Histogram Matching to Compensate Luminance and Chrominance Mismatch for Multi-view Video)

  • 이동석;유지상
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.127-136
    • /
    • 2010
  • 다시점 비디오는 카메라간의 다른 위치와 불완전한 카메라 보정(calibration)으로 인접한 시점의 영상 내에 존재하는 동일물체 간에 색상 차이가 발생할 수 있다. 이러한 색상 불일치(color mismatch)는 시점 간 움직임 예측(inter-view prediction) 수행 시, 오정합을 발생시켜 다시점 비디오 부호화(Multi-view Video Coding : MVC) 성능을 저하시키는 원인이 된다. 본 논문에서는 이웃하는 영상 간에 존재하는 휘도 및 색차 성분 불일치를 보상하여 다시점 비디오 부호화의 압축률을 향상시키는 전처리 기법을 제안한다. 제안된 기법에서는 모든 시점의 영상을 히스토그램 매칭 기법에 의해 정해진 참조 시점 영상의 색상을 기준으로 보정된다. 또한 히스토그램 매칭 수행 전에 YCbCr 색상공간 변경 시에 색차 성분의 대표 값 추출(chrominance subsampling)에 사용되는 Cosited filter를 영상의 각 색상성분에 적용하여 성능을 더욱 높일 수 있다. 히스토그램 매칭은 YCbCr 색상공간에서 RGB 색상공간으로 변환하여 각 색상성분에 적용한다. 이 과정에서 영상에 존재하는 에지의 방향성과 화소 값의 존재 범위를 고려한 효과적인 색상 변환 기법이 사용된다. 실험을 통해 제안하는 전처리 기법이 다른 기법들에 비해 향상된 부호화 효율을 가지는 것을 확인하였다.

관심영역 암호화 시 발생하는 H.264 영상의 비트레이트 오버헤드 최소화 방법 연구 (A Study on the Method of Minimizing the Bit-Rate Overhead of H.264 Video when Encrypting the Region of Interest)

  • 손동열;김지민;지청민;김강석;김기형;홍만표
    • 정보보호학회논문지
    • /
    • 제28권2호
    • /
    • pp.311-326
    • /
    • 2018
  • H.264/AVC-MPEG의 JM v10.2 코드 기반에서 QCIF ($176{\times}144$) 해상도를 가지는 News 샘플 영상을 사용하여 실험을 하였다. 암호화를 하게 될 관심영역(Region of Interest, ROI)이 H.264 표준의 움직임 예측 및 보상의 특성상 연속적으로 각 프레임마다 불필요하게 참조하여 드리프트를 발생시켰다. 드리프트를 완화하기 위해 암호화가 된 I픽처를 특정 주기로 재삽입하는 최신 관련연구의 방법은 추가 연산량 증가로 이어져 영상 전체의 비트레이트 오버헤드가 증가하는 요인이 된다. 따라서 움직임 예측 및 보상 단계에서 각 프레임마다 암호화가 될 관심영역에서의 Block과 Frame의 참조 탐색 범위를 제한하고, 암호화가 되지 않을 비관심영역에서의 참조 탐색 범위는 정상적인 인코딩 효율을 유지하기 위해 제한하지 않는다. 이와 같이 특정 참조 탐색 범위가 제한된 영상 인코딩을 한 후, 영상 속 개인정보 보호를 위해 얼굴과 같이 개인 식별이 가능한 관심영역에 대해 RC4 비트스트림 암호화 하는 방법을 제안한다. 그리고 동일한 환경의 조건에서 암호화되지 않은 원본 영상과 최신 관련연구 방법과 본 연구의 제안 방법을 각각 구현한 후, 실험 결과들을 비교 분석하였다. 최신 관련연구 방법과 다르게 제안방법을 통해 시간상 드리프트를 완화하면서, 제안방법이 적용된 영상 전체의 비트레이트 오버헤드가 원본 영상보다 2.35% 증가되고 최신 관련연구 방법보다 14.93% 감소되었다. 이와 같이 향상된 결과는 본 연구의 실험을 통해 입증하였다.

확장형 비디오 부호화(SVC)의 AR-FGS 기법에 대한 부호화 성능 개선 기법 (Improved AR-FGS Coding Scheme for Scalable Video Coding)

  • 서광덕;정순흥;김진수;김재곤
    • 한국통신학회논문지
    • /
    • 제31권12C호
    • /
    • pp.1173-1183
    • /
    • 2006
  • 본 논문에서는 H.264의 확장형(scalable extension) 부호화 기법인 SVC(Scalable Video Coding)에서 채택하고 있는 AR-FGS(Adaptive Reference FGS) 기법의 재생화면 화질 향상을 위한 효과적인 방법을 제안한다. 표준 FGS(Fine Granularity Scalability) 기법에서는 FGS 계층의 부호화 성능 향상을 위하여 기본계층(base layer) 재생화면과 향상계층(enhancement layer) 참조화면에 대해 가중평균(weighted average)을 적용하여 FGS 부호화를 수행하는 AR-FGS 기법을 채택하고 있다. 그러나, 향상계층 부호화 정보가 비트스트림 절삭(bitstream truncation)에 의하여 FGS 복호기에 전달이 되지 못 할 경우 FGS 부호기와 복호기에 이용이 되는 참조화면의 차이로 인하여 움직임 보상 과정에서 오류의 전파(error drift)가 발생하여 FGS 계층에서 화질 저하를 초래하게 된다. 이를 해결하기 위하여 본 논문에서는 FGS 계층에서 움직임 보상에 이용될 예측신호를 구하기 위해 활용이 되는 향상계층 참조화면을 효과적으로 생성하기 위하여 사이클 블록 부호화(cyclical block coding)의 원리를 이용한다. 사이클 블록 부호화에서는 FGS 계층의 복호화 화질에 큰 영향을 미치는 중요 양자화 변환계수(quantized transform coefficient)를 초기 부호화 사이클에 포함시킴으로써 우선적으로 부호화 및 전송이 되게 하는 부호화 기술이다. 양자화 변환계수가 사이클 블록 부호화에 포함되는 순서가 앞설 경우 대역폭 감소로 인한 비트스트림 절삭이 적용될 때에도 복호기에 우선적으로 전달될 확률이 상대적으로 높다. 이러한 원리를 바탕으로 사이클 블록 부호화에 서 각 사이클 별로 생성되는 비트스트림이 향상계층 참조화면의 생성에 기여하는 중요도에 따라 그 가중치를 다르게 조절함으로써 특정 부호화 사이클에서 생성된 비트스트림 정보가 절삭에 의해 FGS 복호기에 전달되지 못하더라도 복호화 시 그 영향을 최소화하여 화질 저하를 줄이는 방법을 제안한다. 제안된 방법을 이용하여 개선된 AR-FGS 기법을 구현할 경우 기존의 표준 방법에 비하여 재생화면의 화질이 최대 1dB 안팎으로 개선이 됨을 실험을 통해 확인하였다.

신경망 기반 비디오 압축을 위한 레이턴트 정보의 방향 이동 및 보상 (Latent Shifting and Compensation for Learned Video Compression)

  • 김영웅;김동현;정세윤;최진수;김휘용
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.31-43
    • /
    • 2022
  • 전통적인 비디오 압축은 움직임 예측, 잔차 신호 변환 및 양자화를 통한 하이브리드 압축 방식을 기반으로 지금까지 발전해왔다. 최근 인공 신경망을 통한 기술이 빠르게 발전함에 따라, 인공 신경망 기반의 이미지 압축, 비디오 압축 연구 또한 빠르게 진행되고 있으며, 전통적인 비디오 압축 코덱의 성능과 비교해 높은 경쟁력을 보여주고 있다. 본 논문에서는 이러한 인공 신경망 기반 비디오 압축 모델의 성능을 향상시킬 수 있는 새로운 방법을 제시한다. 기본적으로는 기존 인공 신경망 기반 비디오 압축 모델들이 채택하고 있는 변환 및 복원 신경망과 엔트로피 모델(Entropy model)을 이용한 율-왜곡 최적화(Rate-distortion optimization) 방법을 사용하며, 인코더 측에서 디코더 측으로 압축된 레이턴트 정보(Latent information)를 전송할 때 엔트로피 모델이 추정하기 어려운 정보의 값을 이동시켜 전송할 비트량을 감소시키고, 손실된 정보를 추가로 전송함으로써 손실된 정보에 대한 왜곡을 보정한다. 이러한 방법을 통해 기존의 인공 신경망 기반 비디오 압축 기술인 MFVC(Motion Free Video Compression) 방법을 개선하였으며, 실험 결과를 통해 H.264를 기준으로 계산한 BDBR (Bjøntegaard Delta-Bitrate) 수치(%)로 MFVC(-14%) 보다 두 배 가까운 비트량 감축(-27%)이 가능함을 입증하였다. 제안된 방법은 MFVC 뿐 아니라, 레이턴트 정보와 엔트로피 모델을 사용하는 신경망 기반 이미지 또는 비디오 압축 기술에 광범위하게 적용할 수 있다는 장점이 있다.