• 제목/요약/키워드: Compressed Image

검색결과 451건 처리시간 0.027초

임베디드 시스템에서의 객체 분류를 위한 인공 신경망 경량화 연구 (Neural Network Model Compression Algorithms for Image Classification in Embedded Systems)

  • 신희중;오현동
    • 로봇학회논문지
    • /
    • 제17권2호
    • /
    • pp.133-141
    • /
    • 2022
  • This paper introduces model compression algorithms which make a deep neural network smaller and faster for embedded systems. The model compression algorithms can be largely categorized into pruning, quantization and knowledge distillation. In this study, gradual pruning, quantization aware training, and knowledge distillation which learns the activation boundary in the hidden layer of the teacher neural network are integrated. As a large deep neural network is compressed and accelerated by these algorithms, embedded computing boards can run the deep neural network much faster with less memory usage while preserving the reasonable accuracy. To evaluate the performance of the compressed neural networks, we evaluate the size, latency and accuracy of the deep neural network, DenseNet201, for image classification with CIFAR-10 dataset on the NVIDIA Jetson Xavier.

이산코사인변환 기반 이미지 압축 알고리즘에 관한 재구성 (Rebuilding of Image Compression Algorithm Based on the DCT (discrete cosine transform))

  • 남수태;진찬용
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.84-89
    • /
    • 2019
  • JPEG은 가장 널리 사용되는 이미지 압축 표준 기술이다. 본 논문에서는 JPEG 이미지 압축 알고리즘을 소개하고 압축 및 압축 해제의 각 단계를 서술하고자 한다. 이미지 압축은 디지털 이미지를 데이터 압축을 적용하는 과정이다. 이산코사인변환은 시간 도메인에서 주파수 도메인으로 변환하는 기술이다. 먼저, 이미지는 8 by 8 픽셀 블록으로 분할하게 된다. 둘째, 위에서 아래로 왼쪽에서 오른쪽으로 진행하면서 DCT가 각각의 블록에 적용하게 된다. 셋째, 각 블록은 양자화를 통해 압축을 진행한다. 넷째, 이미지를 구성하는 압축된 블록의 행렬은 크게 줄어든 공간에 저장된다. 끝으로, 원하는 경우 이미지는 역이산코사인변환(IDCT)을 사용하는 프로세스인 압축 해제를 통해 재구성하게 된다. 본 연구에서는 이산코사인변환 기법을 이용해 이미지 압축/복원 및 재구성하는 것에 목적을 두고 있다.

MRI 영상의 PSNR 평가 (PSNR Appraisal of MRI Image)

  • 강광수;이준행
    • 한국방사선학회논문지
    • /
    • 제3권4호
    • /
    • pp.13-21
    • /
    • 2009
  • MRI System은 각종 여러 가지 Parameter들로 구성되어 있다. 그중 MRI 영상의 화질을 빼놓고 MRI를 논한다는 것은 어려운 일이다. 각종 Parameter들이 개발되고 발전되어오면서 MRI영상에서도 예전 System에서 보여지는 영상과는 비교 할 수 없을 정도의 고화질을 출력하고 있다. 그리고 방사선 영상 System이 고식적인 Film방식에서 digital방식으로 전환되어가고 있고 그에 따른 병원의 모든 시스템이 전산화가 되어가고 있다. 방사선 영상의 관리에 있어서 저장 이라는 부분이 아주 중요한 ��을 차지하고 있다. 그 방대한 자료를 Server에 저장하는 방법으로는 압축을 이용 하여 저장하는 방법을 사용하게 된다. 이 때 발생한 문제점은 원본 영상에 비해 압축시 영상의 화질 저하가 발생한다는 것이다. 의료 영상에서는 조그마한 화질저하도 오진의 우려가 있으므로 각별히 주의해야할 사항이다. 본 논문에서는 병원에서 진료중인 영상을 대상으로 각각의 파일 변환과 원본과의 비교, 원본 영상과 진료에 사용되어지는 모니터에서의 MRI 영상의 화질을 PSNR을 이용한 평가와 영상 평가방법에 의한 평가를 하였다. 실험결과 원본과 각종 영상 압축방법을 이용하여 압축한 영상을 비교 분석 하였는데 화질저하가 거의 나타나지 않았다. 하지만 원본영상을 display하는 모니터의 화질 에서 상당한 문제점이 드러났다. 판독용 모니터 와 의료용 모니터에서는 손색없는 고해상도의 영상을 출력해 냈는가 반면 일반 CRT, LCD 모니터에서는 각종 노이즈, 영상왜곡등 많은 문제점들이 나타났다.

  • PDF

MPEG4에서의 텍스춰 및 모형정보를 고려한 새로운 비트율 변환기 (A New Bit-rate Converter for Considering Texture and Shape Information in MPEG4)

  • 이종배
    • 한국멀티미디어학회논문지
    • /
    • 제3권4호
    • /
    • pp.333-338
    • /
    • 2000
  • 일반적으로 대부분의 디지털 영상처리를 위하여 현재 MPEG2(일부분의 경우에는 MPEG1)를 이용하고 있고, 이들 처리 결과가 컴퓨터에 비트스트림으로 변환되어 저장되고 있다. 그런데 전송채널은 다양한 용량을 갖고 있으며, 이에 따라 컴퓨터에 저장된 비트스트림들도 채널의 특성에 맞도록 비트율이 재조정되어야 한다. 즉 이들 비트스트림을 채널용량에 맞도록 어떻게 비트율을 바꿀지가 이 논문에서 다루고자하는 핵심이며 이를 통상 비트율 변환이라 부른다. 실제로 지금가지 MPEG2 비트스트림에 대해서는 여러 학자들이 이들을 효율적으로 다양한 채널로 전송하기 위해서 비트율 변환을 행하는 방식들을 제안하였다. 그러나 기 존의 방식들은 MPEG4 응용에는 적합하지 않다. 이는 MPEG4에서는 텍스춰 정보 뿐만이 아니라 MPEG2에는 불필요한 모형정보까지 전송해야 하기 때문이다. 따라서 본 논문에서는 텍스춰 정보와 함께 모형정보를 고려한 새로운 비트율 변환기를 제안하고자 한다.

  • PDF

MPEG 압축 정보를 이용한 모자이크 구성 (A Composition of Mosaic Images based on MPEG Compressed Information)

  • 설정규;이승희;이준환
    • 한국통신학회논문지
    • /
    • 제28권1C호
    • /
    • pp.47-55
    • /
    • 2003
  • 본 논문에서는 압축된 MPEG2 비디오 스트림이 포함하고 있는 정보들을 이용하여 카메라의 움직임에 따른 연속적인 프래임의 변위를 추정하고 이를 기반으로 모자이크 이미지를 구성하는 방법을 제안한다. 제안된 방법에서는 MPEG의 매크로 블록 단위의 움직임 벡터로부터 근사적인 광 플로우(Optical Row)를 구성하고, 이를 이용하여 팬(Pan), 틸트(Tilt) 등의 카메라 동작에 따른 프래임의 변위량을 추출한다. 추정된 변위량은 모자이크 이미지를 구성하는데 있어서 연속되는 비디오 프래임의 기하학적인 변환을 결정한다. 본 논문의 모자이크 구성은 Nicolas가 제안한 분석적 가중치 등을 이용한 혼합(blending) 방법을 사용하였다. 실험결과 분석적인 가중치를 이용한 혼합방법은 평균이나 미디안에 의한 혼합방법보다 배경의 급격한 변화가 적으며 비디오 프래임의 정보를 충실히 활용함을 알 수 있었다. 구성된 모자이크는 압축정보를 디코딩하고 정확한 광플로우를 구성하는 방식에 비해 부호화 과정에 포함된 움직임 벡터를 이용하여 매크로 블록 단위의 근사적인 광플로우를 이용하기 때문에 계산량을 줄일 수 있다. 구성된 근사적인 모자이크는 비디오의 정보를 요약하고 있기 때문에 압축된 비디오 검색을 위한 대표 프레임 등에 사용될 수 있다.

통신에서의 무선 데이터 방송을 위한 샘플링 기법 (Sampling Techniques for Wireless Data Broadcast in Communication)

  • 이선의;박구만;김진영
    • 한국위성정보통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.57-61
    • /
    • 2015
  • 본 논문에서는 3D 방송의 기본적인 원리를 설명하고 실감영상 CS 기술을 적용하여 데이터 용량을 줄이는 방식을 제안한다. 샘플링 이론과 CS 기술의 차이점을 설명하고 개념과 동작원리를 설명한다. 압축 센싱의 복원 알고리즘인 SS-CoSaMP(Single-Space Compressive Sampling Matched Pursuit) 와 AMP(Approximate Message Passing)를 소개하고 이를 이용하여 이미지 데이터를 압축 복원하여 비교한다. 계산시간을 비교하여 낮은 복잡도를 갖는 알고리즘을 판단한다.

Deterministic Bipolar Compressed Sensing Matrices from Binary Sequence Family

  • Lu, Cunbo;Chen, Wengu;Xu, Haibo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권6호
    • /
    • pp.2497-2517
    • /
    • 2020
  • For compressed sensing (CS) applications, it is significant to construct deterministic measurement matrices with good practical features, including good sensing performance, low memory cost, low computational complexity and easy hardware implementation. In this paper, a deterministic construction method of bipolar measurement matrices is presented based on binary sequence family (BSF). This method is of interest to be applied for sparse signal restore and image block CS. Coherence is an important tool to describe and compare the performance of various sensing matrices. Lower coherence implies higher reconstruction accuracy. The coherence of proposed measurement matrices is analyzed and derived to be smaller than the corresponding Gaussian and Bernoulli random matrices. Simulation experiments show that the proposed matrices outperform the corresponding Gaussian, Bernoulli, binary and chaotic bipolar matrices in reconstruction accuracy. Meanwhile, the proposed matrices can reduce the reconstruction time compared with their Gaussian counterpart. Moreover, the proposed matrices are very efficient for sensing performance, memory, complexity and hardware realization, which is beneficial to practical CS.

초압축형 웹드라마 <72초>의 스토리텔링 특성 연구 (A Study on Storytelling Characteristic of Super-compressed Web Drama "72 seconds")

  • 정원식
    • 한국멀티미디어학회논문지
    • /
    • 제20권7호
    • /
    • pp.1148-1155
    • /
    • 2017
  • This study examined the storytelling characteristics of the super-compressed web drama "72 seconds". By analyzing all seasonal episodes of "72 seconds" and applying the various storytelling methodologies and related theories, this paper derived the main storytelling characteristics of "72 seconds" as follows. First, through the composition of the microscopic non-plot, the story value of empathy and fun is maximized, even though there is no dramatic composition compared to the general movie or drama. Second, by the specialization of everyday life, it leads to the transition from everyday experience to the new context. In other words, it provides a consensus through the cognitive expansion and interest by unfamiliarity of the ordinary experience to the audience. Third, based on the characteristics of super-compression and short theme, it utilizes fully stylistic narration like rapping. This makes the audience feel novel and further enhances the branding effect of content. And finally, based on various hybridity and variation, it uses remediation actively in all respects, especially comedy genre and comic factor.

고압축 영상의 블로킹 아티팩트 잡음 제거 (A study on removing blocking artefact noise for highly compressed images)

  • 차성원;신재호
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.153-158
    • /
    • 2008
  • JPEG 압축 영상과 같은 영상을 분할하여 압축을 하는 압축 알고리즘에서는 블록킹 아티팩트 잡음은 필수적으로 발생한다. 이런 잡음은 특히 압축률이 높을수록 더욱 눈에 뛰게 된다. 본 논문에서는 웨이브렛을 사용하여 블로킹 아티팩트 잡음을 감소하는 알고리즘을 제시한다. 그리고 영상 처리에 자주 사용되는 중간 값 필터에 대해서도 언급하였다. 본 논문의 알고리즘을 중간값 필터와 비교한 결과 본 논문의 알고리즘이 중간 값 필터보다 시각적 및 수치적 평가 모두 훨씬 월등한 결과를 얻었다.

  • PDF

Vehicle Image Recognition Using Deep Convolution Neural Network and Compressed Dictionary Learning

  • Zhou, Yanyan
    • Journal of Information Processing Systems
    • /
    • 제17권2호
    • /
    • pp.411-425
    • /
    • 2021
  • In this paper, a vehicle recognition algorithm based on deep convolutional neural network and compression dictionary is proposed. Firstly, the network structure of fine vehicle recognition based on convolutional neural network is introduced. Then, a vehicle recognition system based on multi-scale pyramid convolutional neural network is constructed. The contribution of different networks to the recognition results is adjusted by the adaptive fusion method that adjusts the network according to the recognition accuracy of a single network. The proportion of output in the network output of the entire multiscale network. Then, the compressed dictionary learning and the data dimension reduction are carried out using the effective block structure method combined with very sparse random projection matrix, which solves the computational complexity caused by high-dimensional features and shortens the dictionary learning time. Finally, the sparse representation classification method is used to realize vehicle type recognition. The experimental results show that the detection effect of the proposed algorithm is stable in sunny, cloudy and rainy weather, and it has strong adaptability to typical application scenarios such as occlusion and blurring, with an average recognition rate of more than 95%.