• 제목/요약/키워드: Feature map compression

검색결과 20건 처리시간 0.026초

피처 맵 리사이징과 보간법에 따른 압축 및 머신태스크 성능 분석 (Analysis of compression and machine task performance according to feature map resizing and interpolation)

  • 이성배;이민석;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.832-835
    • /
    • 2022
  • 최근 딥러닝 네트워크의 피처 맵을 활용하여 머신 태스크를 수행하는 Collaborative Intelligence에 대한 관심이 증가하고 있다. CI 구조는 피처 맵을 전송함에 따라서 저사양 디바이스에서 딥러닝 기반의 머신 태스크 수행을 가능하게 하여 다양한 산업에서 활용될 것으로 기대되고 있다. 그러나 CI 구조에서 전송되는 피처 맵은 데이터 크기가 방대하기 때문에 전송에 있어 효율적인 피처 맵 압축이 필요하다. 이에 본 논문에서는 MPEG-VCM에서 제안된 리사이징 (resizing)과 보간법 (interpolation)을 활용하여 피처 맵을 압축하는 Feature Coding 기술에 대하여, 다양한 리사이징 및 보간 방법을 조합하여 가장 우수한 압축 성능 대비 머신 태스크 성능을 나타내는 조합을 실험을 통해서 확인하고자 한다.

  • PDF

연속하는 공간적 특징의 시간적 유사성 검출을 이용한 고속 동영상 검색 (Fast Video Detection Using Temporal Similarity Extraction of Successive Spatial Features)

  • 조아영;양원근;조주희;임예은;정동석
    • 한국통신학회논문지
    • /
    • 제35권11C호
    • /
    • pp.929-939
    • /
    • 2010
  • 멀티미디어 기술이 발전함에 따라 대용량의 데이터베이스의 관리와 불법 복제물 검출을 위한 동영상 검색의 필요성이 커지고 있다. 본 논문에서는 이러한 요구에 맞춰 대용량 데이터베이스에서 고속 동영상 검색을 수행할 수 있는 방법을 제안한다. 고속 동영상 검색 방법은 프레임의 휘도 분포를 이용하여 공간적 특징을 추출하고, 동영상의 시간적 유사성 지도를 생성하여 시간적 특정을 추출한다. 동영상의 공간적 특정과 시간적 특정을 식별자로 구성하고 단계적인 정합 방법을 수행한다. 실험에서는 원본 동영상과 밝기 변화, 압축률 변환, 자막/로고 삽입과 같은 다양한 변형을 이용하여 정확성, 추출 및 정합 속도, 식별자 크기를 측정하여 성능을 평가하였다. 또한, 제안한 방법의 파라미터를 실험적으로 선택한 과정을 기술하고 비교 알고리즘과 공간적 특정만을 이용한 단순 정합 결과를 제시하였다. 정확성, 경색 속도 식별자 크기의 모든 결과에서, 제안한 고속 검색 방법이 대용량 데이터베이스의 동영상 경색에 가장 적합한 기술임을 보였다.

Wavelet-Based Semi-Fragile Watermarking with Tamper Detection

  • Lee, Jun-Hyuk;Jung, Hun;Seo, Yeung-Su;Yu, Chun-Gun;Park, Hae-Woo
    • 한국정보컨버전스학회:학술대회논문집
    • /
    • 한국정보컨버전스학회 2008년도 International conference on information convergence
    • /
    • pp.93-97
    • /
    • 2008
  • In this letter, a novel wavelet-based semi-fragile watermarking scheme is presented which exploiting the time-frequency feature of chaotic map. We also analyze the robustness to mild modification and fragility to malicious attack of our scheme. Its application includes tamper detection, image verification and copyright protection of multimedia content. Simulation results show the scheme can detect and localize malicious attacks with high peak signal-to-noise ratio(PSNR), while tolerating certain degree of JPEG compression and channel additive white Gaussian noise(AWGN)

  • PDF

다해상도 피처 맵 압축 손상 보상 방법 (Compression Error Compensation Method for Multi-Resolution Feature Map)

  • 권나성;이민훈;최한솔;박승진;오승준;김연희;이주영;정세윤;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1343-1345
    • /
    • 2022
  • 본 논문에서는 다해상도 피라미드 피처 맵 압축 손상 보상 방법을 제안한다. 본 논문에서 제안하는 방법은 패킹된 C-레이어 피처 맵을 비디오 코덱으로 압축할 때, 저해상도 계층의 원본 피처 맵과 복원된 피처 맵 간의 차분 값을 구해 이를 고해상도 계층의 피처 맵에 더해줌으로써 부호화 과정에서 발생하는 오차를 보상하는 방법이다. 본 논문에서 제안하는 방법의 성능을 평가하기 위하여 OpenImageV6 데이터셋 중 1000 장에 대해 객체 검출 성능을 평가하였다. 본 논문에서 제안하는 피처 맵 압축 방법은 C-레이어 피처 맵 압축 방법 대비 bpp 와 mAP 의 BD-rate 관점에서 35.10%의 성능 향상을 보인다.

  • PDF

CompressAI 를 활용한 객체 검출 네트워크 피쳐 맵 압축 (Object Detection Network Feature Map Compression using CompressAI)

  • 도지훈;이주영;김연희;최진수;정세윤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.7-9
    • /
    • 2021
  • 본 논문은 Detectron2 [1]에서 지원하는 객체 검출 임무 수행 네트워크의 과정 중에서 추출한 피쳐 맵을 신경망 기반으로 압축하는 방법을 제안한다. 이를 위해, 신경 망 기반 영상 압축을 지원하는 공개 소프트웨어인 CompressAI [2] 모델 중 하나인 bmshj2018-hyperprior 의 압축 네트워크를 활용하여 임무 수행 네트워크의 과정 중 스탬 레이어(stem layer)에서 추출된 피쳐 맵을 압축하도록 학습시켰다. 또한, 압축 네트워크의 입력 피쳐 맵의 너비와 높이 크기가 64 의 배수가 되도록 객체 검출 네트워크의 입력 영상 보간 값을 조정하는 방법도 제안한다. 제안하는 신경망 기반 피쳐 맵 압축 방법은 피쳐 맵을 최근 표준이 완료된 차세대 압축 표준 방법인 VVC(Versatile Video Coding, [3])로 압축한 결과에 비해 큰 성능 향상을 보이고, VCM 앵커와 유사한 성능을 보인다.

  • PDF

효율적인 화상회의 동영상 압축을 위한 블록기반 얼굴 검출 방식 (A block-based face detection algorithm for the efficient video coding of a videophone)

  • 김기주;방경구;문정미;김재호
    • 한국통신학회논문지
    • /
    • 제29권9C호
    • /
    • pp.1258-1268
    • /
    • 2004
  • 비디오화상회의 시스템을 위하여 동영상 압축 DCT 계수와 피부색정보를 이용하여 주파수 영역에서 정연 얼굴 을 실시간으로 검출하는 알고리즘을 제안한다. 동영상 압축과정 중에 얻어지는 DCT계수 값의 U 와 V 색상정보로 피부색 범위를 추출하며 잡음성분제거를 위해 형태학적필터와 Labeling을 적용하고 피부색블록의 방향성과 평탄도를 고려하여 검출하였다. 제안 알고리즘은, 배경에 피부색과 유사한 객체가 있는 경우와 배경이 단순한 경우에 대 해 적응적으로 검출이 가능하도록 하였다 여러 인종에 대한 모의실험결과 제안 알고리즘이 약 94% 의 검출 성공률을 보였다.

잡음추측을 이용한 자동적인 에지검출 문턱값 선택과 그 응용 (Automatic threshold selection for edge detection using a noise estimation scheme and its application)

  • 김형수;오승준
    • 한국통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.553-563
    • /
    • 1996
  • Detecting edges is one of issues with essentialimprotance in the area of image analysis. An edge in an image is a boundary or contour at which a significant change occurs in image intensity. Edge detection has been studied in many addlications such as imagesegmentation, robot vision, and image compression. In this paper, we propose an automatic threshold selection scheme for edge detection and show its application to noise elimination. The scheme suggested here applied statistical properties of the noise estimated from a noisy image to threshold selection. Since a selected threshold value in the scheme depends on not the characgreistic of an orginal image but the statistical feature of added noise, we can remove ad-hoc manners used for selecting the threshold value as well as decide the value theoretically. Furthermore, that shceme can reduce the number of edge pixels either generated or lost by noise. an application of the scheme to noise elimination is shown here. Noise in the input image can be eliminated with considering the direction of each edge pixedl on the edge map obtained by applying the threshold selection scheme proposed in this paper. Achieving significantly improved results in terms of SNR as well as subjective quality, we can claim that the suggested method works well.

  • PDF

VCM을 위한 PCA 기반 피처 맵 압축 방법 (A PCA-based feature map compression method applied to video coding for machines)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.27-29
    • /
    • 2021
  • 인공지능 기반 머신 비전 응용이 증가함에 따라 사람이 아닌 기계에서 소비되는 영상 정보를 전송하는 요구가 발생하고 있다. 일반적으로 영상 정보를 전송할 때는 전송 비용을 고려하여 정보를 압축하며 기존 영상 압축 방법은 사람의 시각 인지적 특성을 반영하여 설계되었다. 따라서 기존 영상 압축 방법은 기계에서 소비되는 영상 정보를 압축하는 방법으로 적절하지 않다고 판단하여 2019년 7월, 기계를 위한 영상 부호화 기술의 표준화가 시작되었다. 본 논문에서는 머신 비전 태스크 중, 객체 탐지를 수행하는 네트워크의 피처 맵을 압축하는 방법을 제안한다. 제안하는 방법은 피처 맵의 채널 간 중복성을 제거하기 위해 PCA 기반의 변환을 적용하여 피처 맵의 차원을 축소하며 특히 해상도 계층 구조를 갖는 네트워크의 피처 맵을 압축하기 위해 각 해상도 계층간 변환 기저를 예측하여 추가로 압축률을 높인다. 제안하는 방법을 적용하여 객체 탐지 결과의 큰 성능 하락 없이 약 92.3%에 데이터양 감소를 달성하였다.

  • PDF

한반도 동남부 백악기 경상분지 내 영덕단층의 기하와 운동학적 특성 (Geometry and Kinematics of the Yeongdeok Fault in the Cretaceous Gyeongsang Basin, SE Korea)

  • 서경한;하상민;이성준;강희철;손문
    • 암석학회지
    • /
    • 제28권3호
    • /
    • pp.171-193
    • /
    • 2019
  • 이번 연구는 영덕군 일원의 상세 지표조사를 통해 양산단층의 가지단층인 영덕단층의 내부 구조와 기하를 파악하고, 주변 퇴적층의 자세, 단층의 운동학적 자료와 단층암의 자기미세구조 분석을 통해 영덕단층의 운동학적 특성을 규명하는데 목적이 있다. 음영기복도에서 총 40 km의 연장을 보이는 영덕단층은 트라이아스기 영덕화강암, 백악기 퇴적암과 화산암을 절단하며 약 8.1 km의 우수향 수평변위를 보인다. 주로 북북서 내지 남-북 방향으로 발달하는 영덕단층은 영덕읍 화천리 이북에서 하나의 단층선으로 달리지만, 화천리 이남에서는 두 조의 단층대로 분기되는 특징을 보인다. 이들 두 조의 단층 중 서편의 것은 북북동 내지 북동 방향과 북북서 방향의 단층분절들이 지그재그 형태로 연결되는 반면, 동편의 것은 북북서 방향의 하나의 단층으로 연장되다가 영덕군 강구면에서 양산단층과 합쳐진다. 영덕단층은 대부분 지점에서 $65^{\circ}$ 이상의 고경사로 동쪽으로 경사하며, 2~15 m 폭의 단층핵과 최대 180 m 폭의 단층손상대를 가진다. 단층핵은 퇴적암류, 화산암류, 화강암 등 여러 모암으로부터 유래된 단층암으로 구성되며, 이들은 모암에 따라 뚜렷한 변형의 차이를 보인다. 화강암에서 유래된 단층핵은 주로 단층각력으로 구성되며, 10 cm 이내 폭의 단층비지대에 전단변형이 집중된다. 반면, 퇴적암에서 유래된 단층핵은 화강암의 것에 비해 두꺼우며 단층비지대와 각력대가 교호하거나 렌즈상의 모암을 단층비지대가 에워싸며 발달한다. 단층대와 인접한 퇴적층의 자세는 주 단층면과 가까워지면 단층면의 자세와 유사하게 고각으로 경동된다. 단층활면 및 전단단열에서 관찰된 운동 자료와 단층암의 대자율이방성 분석결과는 영덕단층이 북서-남동 방향 최대수평응력 하에서 좌수향 주향이동운동을 겪은 이후 북동-남서 방향 최대수평응력 하에서 우수향 주향이동운동을 겪었으며, 우수향 주향이동운동에 의한 변형 특성이 우세하게 기록되어 있다. 이번 연구를 통해 얻어진 영덕단층의 운동사를 기존 양산단층의 운동사와 비교해본 결과, 두 단층의 주향이 다소 차이가 있음에도 불구하고 백악기 말의 북서-남동 방향 최대수평응력과 고제3기의 북동-남서 방향 최대수평응력 하에서 각각 좌수향과 우수향 주향이동의 동일한 감각으로 운동한 것으로 판단된다.

윤곽선 기반 메쉬 최적화를 이용한 효율적인 스테레오 영상 데이터 표현 (Efficient Data Representation of Stereo Images Using Edge-based Mesh Optimization)

  • 박일권;변혜란
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.322-331
    • /
    • 2009
  • 본 논문은 윤곽선 기반 메쉬 최적화를 이용한 스테레오 영상의 효율적인 데이터 표현 방법을 제안한다. 스테레오 영상에 대한 메쉬 기반 2차원 워핑은 주로 제어점 선택과 선택된 제어점들의 시차 정보 추정 성능에 의존한다. 따라서 제안된 방법은 제어점 선택을 위하여 강한 윤곽선과 객체의 경계선만으로 구성된 특징 지도를 생성하고 이를 기반으로 격자형 메쉬를 생성한다. 또한, 지역단위로 2차원 워핑을 수행하며 목적영상과의 오차를 최소로 하는 제어점의 위치를 반복적으로 추정하게 된다. 최적화된 제어점 위치를 찾기 위한 반복적 2차원 워핑 과정은 많은 계산 시간을 요구하기 때문에 이를 개선하기 위하여 입력된 스테레오 영상은 수평 시차만 존재하고 최적의 제어점 위치는 객체의 경계선을 포함한 윤곽선 위에 존재함을 가정한다. 따라서 제안한 윤곽선 기반 워핑 방법은 수평선 위에 윤곽선만을 따라 반복적으로 최적화된 제어점 위치를 탐색한다. 본 논문의 실험에서는 스테레오 영상에 대하여 제어점 수에 따른 신호에 대한 잡음비(PSNR)를 측정하여 기존 방법과 제안한 방법의 품질을 비교 하였다. 뿐만 아니라 최적의 메쉬 생성을 위한 수행시간을 비교하여 평가하였다. 실험 결과를 통하여 제안한 방법은 적은 수의 제어점을 이용하여 품질의 저하를 줄이고 빠르게 최적의 메쉬를 생성함으로써 효율적인 스테레오 영상 표현 방법을 제공하였다.