• 제목/요약/키워드: feature compression

검색결과 209건 처리시간 0.028초

계층 간 특징 복원-예측 네트워크를 통한 피라미드 특징 압축 (Pyramid Feature Compression with Inter-Level Feature Restoration-Prediction Network)

  • 김민섭;심동규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.283-294
    • /
    • 2022
  • 딥 러닝 네트워크에서 사용되는 특징 맵은 일반적으로 영상보다 데이터가 크며 특징 맵을 전송하기 위해서는 영상의 압축률보다 더 높은 압축률이 요구된다. 본 논문은 딥러닝 기반의 영상처리에서 객체의 크기에 대한 강인성을 가지는 FPN 구조의 네트워크에서 사용되는 피라미드 특징 맵을 높은 압축률로 전송하기 위해 제안한 복원-예측 네트워크를 통해 전송된 일부 계층의 피라미드 특징 맵으로 전송하지 않은 계층의 피라미드 특징 맵을 예측하며, 압축으로 인한 손상을 복원하는 구조를 제안한다. 제안한 방법의 COCO 데이터셋 2017 Train images에 대한 객체 탐지의 성능은 rate-precision 그래프에서 VTM12.0을 통해 특징 맵을 압축한 결과 대비 BD-rate 31.25%의 성능향상을 보였고, PCA와 DeepCABAC을 통한 압축을 수행한 방법 대비 BD-rate 57.79%의 성능향상을 보였다.

피처 프레임 구성 방안에 따른 피처 맵 압축 효율 및 머신 태스크 성능 분석 (Analysis of Feature Map Compression Efficiency and Machine Task Performance According to Feature Frame Configuration Method)

  • 이성배;이민석;김규헌
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.318-331
    • /
    • 2022
  • 최근 하드웨어 연산 장치와 소프트웨어 기반 프레임워크의 발전으로 딥러닝 네트워크를 활용한 머신 태스크가 다양한 산업 분야 및 개인 IoT 장비에서의 활용이 기대되고 있다. 그러나 딥러닝 네트워크를 구동하기 위한 장치의 고비용 문제와 서버에서 머신 태스크 결과만을 전송받을 때 사용자가 요구하는 결과를 받지 못할 수 있다는 제한 사항을 극복하기 위하여 Collaborative Intelligence (CI)에서는 피처 맵의 전송을 그 해결 방법으로 제시하였다. 본 논문에서는 CI 패러다임을 지원하기 위하여 방대한 데이터 크기를 갖는 피처 맵의 효율적인 압축 방법을 실험을 통해 분석 및 제시하였다. 해당 방법은 전통적인 비디오 코덱에서의 압축 효율을 높이기 위하여 피처 맵의 재정렬을 적용하여 중복성을 높였으며, 정지 영상 압축 포맷과 동영상 압축 포맷을 동시에 활용하여 압축 효율을 높이고 머신 태스크의 성능을 유지하는 피처 맵 방법을 제시하였다. 본 논문에서는 이와 같은 방법의 분석을 통해 MPEG-VCM의 피처 압축 앵커 대비 BPP와 mAP의 BD-rate에서 14.29%의 성능이 향상됨을 검증하였다.

색역 압축과 특징치 투영을 이용한 입술영역 분할 (Segmentation of the Lip Region by Color Gamut Compression and Feature Projection)

  • 김정엽
    • 한국멀티미디어학회논문지
    • /
    • 제21권11호
    • /
    • pp.1279-1287
    • /
    • 2018
  • In this paper, a new type of color coordinate conversion is proposed as modified CIEXYZ from RGB to compress the color gamut. The proposed segmentation includes principal component analysis for the optimal projection of a feature vector into a one-dimensional feature. The final step adopted for lip segmentation is Otsu's threshold for a two-class problem. The performance of the proposed method was better than that of conventional methods, especially for the chromatic feature.

삼각특징추출과 GHA를 이용한 얼굴영상 압축알고리즘 (Face Image Compression Algorithm using Triangular Feature Extraction and GHA)

  • 서석배;김대진;강대성
    • 대한전자공학회논문지SP
    • /
    • 제38권1호
    • /
    • pp.11-18
    • /
    • 2001
  • 본 논문에서는 얼굴영상 압축을 위한 알고리즘으로 삼각특징 추출과 GHA를 이용한 압축 알고리즘을 제안한다. 특징추출에서 입력영상을 8개의 삼각형으로 분할한 다음 데이터의 취득순서를 설정하여 영상을 분할하면서도 위치정보를 보존할 수 있는 알고리즘을 제안하고, 압축을 위해 GHA를 도입함으로써 복원 시 생기는 블록화 현상을 대폭 개선하였으며 얼굴의 윤곽과 이목구비 등 얼굴의 전체적인 형태를 압축 알고리즘에 반영할 수 있었다. 기존의 블록기반 K-means 알고리즘과 얼굴영상을 분할하지 않고 전체를 입력으로 사용하는 알고리즘과의 비교실험결과 제안된 방법의 성능이 가장 우수함을 볼 수 있었다.

  • PDF

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.56-68
    • /
    • 2022
  • 본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.

의료영상의 JPEG 압축을 위한 양자화 테이블과 허프만 테이블 설계 (Design of Quantization Tables and Huffman Tables for JPEG Compression of Medical Images)

  • 양시령;정제창;박상규
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권6호
    • /
    • pp.453-456
    • /
    • 2004
  • Due to the bandwidth and storage limitations medical images are needed to be compressed before transmission and storage. DICOM (Digital Imaging and Communications in Medicine) specification, which is the medical images standard, provides a mechanism for supporting the use of JPEG still image compression standard. In this paper, we explain a method for compressing medical images by PEG standard and propose two methods for JPEG compression. First, because medical images differ from natural images in optical feature, we propose a method to design adaptively the quantization table using spectrum analysis. Second, because medical images have higher pixel depth than natural images do, we propose a method to design Huffman table which considers the probability distribution feature of symbols. Simulation results show the improved performance compared to the quantization table and the adjusted Huffman table of JPEG standard.

적응적 멀티 레벨 코드 기반의 심전도 신호 압축 (ECG Signal Compression based on Adaptive Multi-level Code)

  • 김정준
    • 한국지능시스템학회논문지
    • /
    • 제23권6호
    • /
    • pp.519-526
    • /
    • 2013
  • 심전도 신호는 P, Q, R, S, T파를 한 주기로 하여 반복되는 특징을 가지고 있으며 일반적으로 높은 표본화 주파수로 샘플링 된다. 이러한 심전도 신호의 주기적인 특징을 이용하여 진단에 중요한 정보의 손실을 최소화하면서 압축 효율을 극대화시키는 방법이 필요하다. 그러나 이러한 주기적인 특징은 심검자와 측정 시기에 따라 진폭과 주기가 일정하지가 않다. 또한 환자의 경우, 같은 시기에 측정하더라도 주기적 특징이 다르게 나타나는 구간이 존재한다. 본 논문에서는 적응적 멀티 레벨 코드를 이용하여 주도적인 신호 구간과 비주도적인 신호 구간의 심전도 신호를 적응적으로 코드화하는 방법을 제안한다. 제안하는 방식은 주도적인 신호 구간과 비주도적인 신호 구간에 따른 손실 대비 압축률을 차등 적용함으로써 반복적인 신호를 멀티 레벨 코드를 이용하여 압축의 효율성을 극대화하는 것이다. 이는 심전도 신호의 주기성을 이용하지 않은 기존의 압축 방식에 비해 장시간 측정 데이터의 압축률을 극대화시키고 비주도적인 신호를 코드화하여 무손실 압축을 함으로써 진단에 중요한 정보를 손실 없이 보존할 수 있는 장점이 있다. MIT-BIH 부정맥 데이터베이스에 있는 심전도 신호에 대한 실험을 통하여 압축의 효용성을 검증하였다.

Three-dimensional Face Recognition based on Feature Points Compression and Expansion

  • Yoon, Andy Kyung-yong;Park, Ki-cheul;Park, Sang-min;Oh, Duck-kyo;Cho, Hye-young;Jang, Jung-hyuk;Son, Byounghee
    • Journal of Multimedia Information System
    • /
    • 제6권2호
    • /
    • pp.91-98
    • /
    • 2019
  • Many researchers have attempted to recognize three-dimensional faces using feature points extracted from two-dimensional facial photographs. However, due to the limit of flat photographs, it is very difficult to recognize faces rotated more than 15 degrees from original feature points extracted from the photographs. As such, it is difficult to create an algorithm to recognize faces in multiple angles. In this paper, it is proposed a new algorithm to recognize three-dimensional face recognition based on feature points extracted from a flat photograph. This method divides into six feature point vector zones on the face. Then, the vector value is compressed and expanded according to the rotation angle of the face to recognize the feature points of the face in a three-dimensional form. For this purpose, the average of the compressibility and the expansion rate of the face data of 100 persons by angle and face zone were obtained, and the face angle was estimated by calculating the distance between the middle of the forehead and the tail of the eye. As a result, very improved recognition performance was obtained at 30 degrees of rotated face angle.

한글의 형태적 특성을 이용한 한글 문서 압축 기법에 관한 연구 (A Study on Hangul Text Compressing Using the Structural Feature of Hangul)

  • 이기석;김유성
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1294-1306
    • /
    • 1996
  • 본 논문에서는 한글 문서에 대해 높은 압축률을 얻기 위해 한글의 형태적 특징인 조사와 어말어미의 출현 빈도를 이용한 효율적인 한글 문서 압축 기법들을 제안하였으며 제안된 기법들의 성능 분석을 위하여 기존의 압축 기법들과 압축률을 비교 분석하였다. 한글 문서에서 조사와 어말어미가 반복적으로 출현한다는 형태적인 특성으로부터 높은 압축률을 얻기 위해 출현 빈도가 상대적으로 높은 64개의 조사 및 어말어미를 선정 하여 고정 사전을 구성하고, 이를 이용하여 한글 문서를 압축하도록 기존의 LZ77기법과 LZW기법을 수정하여 각각 HLZ77기법과 HLZW기법을 제안하였다. 또한, 본 연구에서는 수정 제안된 HLZ77기법과 HLZW기법의 성능을 분석하기 위하여 4가지 기법을 실 제 재현하여 여러 형태의 한글 문서를 대상으로 압축률을 비교하였다. 성능 결과로 부터 일반적인 한글 문서에 대해 한글의 형태적인 특성을 이용하는 HLZ77기법과 HLZW 기법이 각각 LZ77기법과 LZW기법 보다 우수한 압축률을 나타냄을 알 수 있었다.

  • PDF

MPEG CDVA 전역 특징 서술자 압축 방법 (Compression Method for MPEG CDVA Global Feature Descriptors)

  • 김준수;조원;임근택;윤정일;곽상운;정순흥;정원식;추현곤;서정일;최유경
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.295-307
    • /
    • 2022
  • 본 논문은 동영상의 시각적 특징을 추출하는 MPEG CDVA 표준 기술에서 개별 프레임의 전역적인 특징을 표현하는 scalable Fisher vector (SCFV)의 새로운 압축 방법을 제안한다. CDVA 표준은 전역 특징 서술자에 대한 시간적 중복성 제거 기법을 도입하였으며, 구체적으로 부호화 단위 세그먼트 내의 SCFV 들이 서로 유사할 가능성이 높다는 점을 활용하여 SCFV에 대한 차분을 부호화하는 방식을 사용하고 있다. 그러나 SCFV의 구조적 특징에 의해 SCFV의 차분을 부호화 한 결과물이 원본 데이터보다도 용량이 큰 경우가 발생하게 된다. 이와 같은 현상을 방지하기 위해 비대칭적 SCFV의 차분 계산 방법과 변경된 SCFV 차분을 활용하여 원본 SCFV를 복원하는 새로운 방법을 제안하였다. FIVR 데이터셋을 활용한 실험결과는 전역 특징 서술자의 압축 효율이 기존 CDVA Experimental Model에 대비하여 유의미하게 증가함을 보여준다.