• 제목/요약/키워드: feature compression

검색결과 209건 처리시간 0.029초

다중 스케일 특징 융합 모듈을 통한 종단 간 학습기반 공간적 스케일러블 영상 압축 (End-to-End Learning-based Spatial Scalable Image Compression with Multi-scale Feature Fusion Module)

  • 신주연;강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.1-3
    • /
    • 2022
  • 최근 기존의 영상 압축 파이프라인 대신 신경망의 종단 간 학습을 통해 압축을 수행하는 알고리즘의 연구가 활발히 진행되고 있다. 본 논문은 종단 간 학습 기반 공간적 스케일러블 압축 기술을 제안한다. 보다 구체적으로 본 논문은 신경망의 각 계층에서 하위 계층의 학습된 특징 (feature)을 융합하여 상위 계층으로 전달하는 다중 스케일 특징 융합 (multi-scale feature fusion) 모듈을 도입해 상위 계층이 더욱 풍부한 특징 정보를 학습하고 계층 사이의 특징 중복성을 더욱 잘 제거할 수 있도록 한다. 기존 방법 대비 향상 계층(enhancement layer)에서 1.37%의 BD-rate가 향상된 결과를 볼 수 있다.

  • PDF

SIFT를 이용한 장면전환 검출 및 필터링 기술 (Scene Change Detection and Filtering Technology Using SIFT)

  • 문원준;유인재;이재청;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.939-947
    • /
    • 2019
  • 미디어 시장의 활성화로 영상의 압축, 검색, 편집, 저작권 보호등의 필요성이 높아지고 있다. 본 논문에서는 이 모든 분야에 사용되는 영상의 장면 전환을 검출하는 방법을 제안한다. 유통 과정에서 발생 가능한 해상도 변환, 자막 삽입, 압축, 영상 반전등의 변형이 추가되더라도 동일하게 장면 전환을 검출하기 위해 전처리 과정과 SIFT를 이용한 특징점 추출, 변형을 고려한 매칭 알고리즘을 제시한다. 또한 이를 필터링 기술에 적용하여 알고리즘에서 고려한 변형 이외의 변형에도 유효함을 확인한다.

영역별 대역간 양방향 예측과 확장된 SPIHT를 이용한 다분광 화상데이터의 압축 (Multispectral Image Compression Using Classified Interband Bidirectional Prediction and Extended SPHT)

  • 김승진;반성원;김병주;박경남;김영춘;이건일
    • 대한전자공학회논문지SP
    • /
    • 제39권5호
    • /
    • pp.486-493
    • /
    • 2002
  • 본 논문에서는 웨이블릿 영역에서 각 부밴드에 대한 영역별 대역간 양방향 예측과 확장된 SPIHT (set partition in hierarchical trees)를 이용한 효율적인 인공위성 다분광 화상데이터의 압축 방법을 제안하였다. 이 방법에서는 가시광선 영역과 적외선 영역에서 다른 대역과 분광적 상관성이 큰 대역을 기준대역 (feature band)으로 각각 결정하고, 이 대역들에 대해 웨이블릿 변환 (wavelet transform, WT)을 행한 후 SPIHT를 행하여 부호화함으로써 대역내 (intraband) 중복성을 제거한다. 기준대역과 대역간 상관성이 큰 예측대역 (prediction band)들에 대해서는 웨이블릿 변환을 행한 후, 각 대역의 기저밴드의 대역별 특성을 이용하여 영역분류를 하고, 각 부밴드에 대한 영역별 대역간 양방향 예측 (classified interband bidirec- tional prediction)을 행함으로써 대역간 (interband) 중복성을 제거하여 압축 효율을 향상시킨다. 또한 확장된 SPIHT의 부호화 효율을 높이기 위해 예측오차의 최대값에 따라 재배열된 대역들에 대해 확장된 SPIHT를 행하여 예측오차를 부호화함으로써, 예측에 따른 오차를 보상하여 화질을 향상시킨다. 실제 다분광 화상데이터에 대한 모의 실험을 통하여 제안한 방법의 부호화 효율이 기존의 방법에 비하여 우수함을 확인하였다.

웨이블렛을 이용한 영상 및 제어 신호의 전송에 관한 연구 (A Study on the Transmission of Image Data and Control Signal Using Wavelet)

  • 이미선;곽재혁;성하경;이종배;임준홍
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 A
    • /
    • pp.207-210
    • /
    • 2003
  • In this paper, we have implemented the DVR system which is controlled far away, and added a function of TCP/IP Network for image data and control signal transmission, the DVR system has the advantage of easy to search and of no loss in stored quality. The continuously declining price of the hard drive presents the opportunity for the DVR system to displace the analog system. Also, with spread of the internet the needs of PC based the DVR system increase. Therefore, we have implemented DVR system within a function of network. When obtained image through the PTZ camera is transmitted to digital form, very large space of storage is required, hence image compression is essential. We use JPEG2000 for compression of image. JPEG2000 adopt DWT by means of transform. DWT concentrates important information of image on subband and has feature of multi-resolution. It is effective in order to express image. Thus JPEG2000 is suitable for image compression in DVR system. The significance of this paper is to design the DVR system which is controlled through TCP/IP network and to implement transmission of image compression using JPEG2000.

  • PDF

웨이블릿 기반의 영상 압축 및 에지 검출 (Image Compression and Edge Detection Based on Wavelet Transforms)

  • 정일홍;김영순
    • 한국멀티미디어학회논문지
    • /
    • 제8권1호
    • /
    • pp.19-26
    • /
    • 2005
  • 본 논문에서 사용한 웨이블릿 변환의 기저 함수는 일반적인 웨이블릿 변환과 다른 리프팅 스킴을 사용하여 만들어 졌다. 리프팅 스킴은 푸리에 변환을 사용하여 기저 함수를 생성하지 않는 새로운 쌍직교 웨이블릿 기저 함수를 생성하는 방법이다 본 본문은 리프팅 스킴을 이용한 새로운 영상 압축 및 에지 검출 방법을 제안하고 있다. 그리고 이 방법은 부분 복원과 공간 복원을 할 수 있어 데이터 가시화를 향상시킬 수 있다. 다양한 해상도에서의 근사 영상은 원래 영상으로부터 적은 정보만으로 다양한 크기의 특징을 뽑아낼 수 있고, 적은 양의 스케일링 계수를 사용하여 생성된 근사 영상은 빠르게 원래 영상의 대략적인 개요만이 필요할 때 유용하게 사용된다. 본 논문에서 제안한 영상 압축 및 에지 검출 기법은 멀티미디어 데이터베이스에서 데이터 관리와 데이터 가시화를 향상시킬 수 있는 좋은 기틀을 마련해 준다.

  • PDF

SOFM 벡터 양자화기와 프랙탈 혼합 시스템의 영상 왜곡특성 향상에 관한 연구 (A Study on the Enhancement of Image Distortion for the Hybrid Fractal System with SOFM Vector Quantizer)

  • 김영정;김상희;박원우
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.41-47
    • /
    • 2002
  • 프랙탈 영상압축은 원 영상블록과 가장 유사한 영역을 원영상 내에서 찾는 자기유사성에 기반한 축소변환을 이용하여 영상데이터를 압축시키는 방법이다. 프랙탈은 영상데이터를 압축하는 효율적인 방법으로 인정을 받고 있으나 상대적으로 높은 영상 왜곡률과 부호화 시간이 오래 걸리는 단점을 가지고 있다. 본 논문은 프랙탈의 영상 왜곡률 특성을 개선하기 위하여 프랙탈과 벡터양자화기를 혼합하였으며, 벡터양자화기의 클러스터링 알고리듬으로는 개선한 Self Organizing Feature Map(SOFM)을 사용하였다. 제안된 시스템의 성능평가를 위하여 일반적인 SOFM을 사용한 시스템 그리고 프랙탈을 단독으로 사용한 시스템과 비교하여 전체적인 성능 향상 정도를 확인하였다. 그 결과 개선한 경쟁학습 SOFM을 사용한 벡터양자화기와 프랙탈 혼합시스템이 일반적인 SOFM을 사용한 벡터양자화기와 프랙탈 혼합시스템보다 영상 왜곡특성이 향상된 것을 확인하였다.

  • PDF

경량 딥러닝 가속기를 위한 희소 행렬 압축 기법 및 하드웨어 설계 (Sparse Matrix Compression Technique and Hardware Design for Lightweight Deep Learning Accelerators)

  • 김선희;신동엽;임용석
    • 디지털산업정보학회논문지
    • /
    • 제17권4호
    • /
    • pp.53-62
    • /
    • 2021
  • Deep learning models such as convolutional neural networks and recurrent neual networks process a huge amounts of data, so they require a lot of storage and consume a lot of time and power due to memory access. Recently, research is being conducted to reduce memory usage and access by compressing data using the feature that many of deep learning data are highly sparse and localized. In this paper, we propose a compression-decompression method of storing only the non-zero data and the location information of the non-zero data excluding zero data. In order to make the location information of non-zero data, the matrix data is divided into sections uniformly. And whether there is non-zero data in the corresponding section is indicated. In this case, section division is not executed only once, but repeatedly executed, and location information is stored in each step. Therefore, it can be properly compressed according to the ratio and distribution of zero data. In addition, we propose a hardware structure that enables compression and decompression without complex operations. It was designed and verified with Verilog, and it was confirmed that it can be used in hardware deep learning accelerators.

압축 저장 및 복원기능을 가지는 전력신호 모니터링 시스템 (Power Signal Monitering System with Compression Storage and Reconstruction)

  • 배현덕
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권2호
    • /
    • pp.148-154
    • /
    • 2016
  • 최근 들어 전력계통에서 비선형 부하의 증가와 분산전원의 증가로 전력 품질에 관한 관심이 증대 되고 있다. 전력신호로 부터 전력품질관련 파라미터 검출과 특징추출 그리고 이를 이용한 품질 개선 방안 마련을 위해 전력신호의 지속적인 모니터링이 필요하다. 본 논문에서는 전력신호의 모니터링을 위한 전력신호의 압축 저장과 저장된 신호의 복원이 가능한 방법을 제시한다. 전력신호 압축은 에너지 압축 성능이 우수한 DCT를 이용하며 압축된 신호의 복원에는 IDCT 과정을 거친다. 그리고 신호의 압축률을 높이기 위해 DCT계수를 크기에 따라 정렬하며 복원에서는 DCT계수를 원위치로 재배열하는 기법을 사용한다. IEC표준에서 규정한 고조파 크기에 의해 합성한 신호를 이용하여 압축과정을 거처 복원된 신호와 원 신호와의 오차를 비교함으로서 신호제안기법의 성능을 평가한다.

Semi-fragile Watermarking Scheme for H.264/AVC Video Content Authentication Based on Manifold Feature

  • Ling, Chen;Ur-Rehman, Obaid;Zhang, Wenjun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권12호
    • /
    • pp.4568-4587
    • /
    • 2014
  • Authentication of videos and images based on the content is becoming an important problem in information security. Unfortunately, previous studies lack the consideration of Kerckhoffs's principle in order to achieve this (i.e., a cryptosystem should be secure even if everything about the system, except the key, is public knowledge). In this paper, a solution to the problem of finding a relationship between a frame's index and its content is proposed based on the creative utilization of a robust manifold feature. The proposed solution is based on a novel semi-fragile watermarking scheme for H.264/AVC video content authentication. At first, the input I-frame is partitioned for feature extraction and watermark embedding. This is followed by the temporal feature extraction using the Isometric Mapping algorithm. The frame index is included in the feature to produce the temporal watermark. In order to improve security, the spatial watermark will be encrypted together with the temporal watermark. Finally, the resultant watermark is embedded into the Discrete Cosine Transform coefficients in the diagonal positions. At the receiver side, after watermark extraction and decryption, temporal tampering is detected through a mismatch between the frame index extracted from the temporal watermark and the observed frame index. Next, the feature is regenerate through temporal feature regeneration, and compared with the extracted feature. It is judged through the comparison whether the extracted temporal watermark is similar to that of the original watermarked video. Additionally, for spatial authentication, the tampered areas are located via the comparison between extracted and regenerated spatial features. Experimental results show that the proposed method is sensitive to intentional malicious attacks and modifications, whereas it is robust to legitimate manipulations, such as certain level of lossy compression, channel noise, Gaussian filtering and brightness adjustment. Through a comparison between the extracted frame index and the current frame index, the temporal tempering is identified. With the proposed scheme, a solution to the Kerckhoffs's principle problem is specified.

Knowledge Distillation based-on Internal/External Correlation Learning

  • Hun-Beom Bak;Seung-Hwan Bae
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.31-39
    • /
    • 2023
  • 본 논문에서는 이종 모델의 특징맵 간 상관관계인 외부적 상관관계와 동종 모델 내부 특징맵 간 상관관계인 내부적 상관관계를 활용하여 교사 모델로부터 학생 모델로 지식을 전이하는 Internal/External Knowledge Distillation (IEKD)를 제안한다. 두 상관관계를 모두 활용하기 위하여 특징맵을 시퀀스 형태로 변환하고, 트랜스포머를 통해 내부적/외부적 상관관계를 고려하여 지식 증류에 적합한 새로운 특징맵을 추출한다. 추출된 특징맵을 증류함으로써 내부적 상관관계와 외부적 상관관계를 함께 학습할 수 있다. 또한 추출된 특징맵을 활용하여 feature matching을 수행함으로써 학생 모델의 정확도 향상을 도모한다. 제안한 지식 증류 방법의 효과를 증명하기 위해, CIFAR-100 데이터 셋에서 "ResNet-32×4/VGG-8" 교사/학생 모델 조합으로 최신 지식 증류 방법보다 향상된 76.23% Top-1 이미지 분류 정확도를 달성하였다.