• 제목/요약/키워드: Compressing Codec

검색결과 8건 처리시간 0.025초

Underwater Image Preprocessing and Compression for Efficient Underwater Searches and Ultrasonic Communications

  • Kim, Dong-Hoon;Song, Jun-Yeob
    • International Journal of Precision Engineering and Manufacturing
    • /
    • 제8권1호
    • /
    • pp.38-45
    • /
    • 2007
  • We propose a preprocessing method for removing floating particles from underwater images based on an analysis of the image features. We compared baseline JPEG and wavelet codec methods to determine the method best suited for underwater images. The proposed preprocessing method enhanced the compression ratio and resolution, and provided an efficient means of compressing the images. The wavelet codec method yielded better compression ratios and image resolutions. The results suggest that the wavelet codec method linked with the proposed preprocess method provides an efficient codec processor and transmission system for underwater images that are used for searches and transmitted via ultrasonic communications.

고성능 허프만 코덱의 VLSI 구조 (VLSI Architecture of High Performance Huffman Codec)

  • 최현준;서영호;김동욱
    • 한국정보통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.439-446
    • /
    • 2011
  • 본 논문에서는 비디오 코덱을 비롯한 멀티미디어 데이터 압축에 주로 이용되는 엔트로피 코딩 방식 중의 하나인 허프만 코딩을 위한 전용 하드웨어를 제안하고 구현하였다. 제안한 허프만 코덱은 허프만 인코더와 디코더로 구성되어 있다. 허프만 인코더는 룩업 테이블을 이용하여 심볼을 허프만 코드로 변환한다. 가변 길이의 허프만 코드는 데이터 패킷화 블록에서 32 비트의 일정한 형식으로 맞추어진 후에 프레임 단위로 직렬로 출력된다. 허프만 디코더는 직렬로 입력되는 비트스트림을 버퍼링 없이 트리 구조의 FSM을 이용하여 디코딩하여 심볼로 변환한다. 제안한 하드웨어는 동작의 유연성을 위해서 인코딩과 디코딩 하드웨어를 프로그래머블하게 동작시킬 수 있도록 하여 프로그래밍 과정을 통해서 다양한 허프만 코딩을 수행할 수 있도록 하였다. 구현한 하드웨어는 Altera사의 Cyclone III FPGA를 이용하여 검증하였고, 3725개의 LUT를 사용하면서 최대 365MHz로 동작이 가능하였다.

고해상도 영상 압축을 위한 SPIHT 기반의 부대역 분할 압축 방법 (SPIHT-based Subband Division Compression Method for High-resolution Image Compression)

  • 김우석;박병서;오관정;서영호
    • 방송공학회논문지
    • /
    • 제27권2호
    • /
    • pp.198-206
    • /
    • 2022
  • 본 논문에서는 초고해상도를 갖는 복소 홀로그램을 압축하기 위한 전용 코덱에서 SPIHT (set partitioning in hierarchical trees)를 사용할 경우에 발생할 수 있는 문제점을 해결하기 위한 방법을 제안한다. 복소 홀로그램을 위한 코덱의 개발은 크게 전용 압축 방법을 만드는 방법과 HEVC 및 JPEG2000과 같은 앵커 코덱을 이용하고 전후처리 기법을 추가하는 방법으로 구분될 수 있다. 전용 압축 방법을 만드는 경우에 복소 홀로그램의 공간적인 특성을 해석하기 위한 별도의 변환 도구가 필요하다. EZW와 SPIHT 같은 부대역 단위의 제로트리 기반의 알고리즘들은 고해상도의 영상에 대해서 코딩할 경우에 비트스트림 제어 시 온전한 부대역의 정보가 제대로 전송되지 못하는 문제점을 갖는다. 본 논문에서는 이와 같은 문제를 해결하기 위한 웨이블릿 부대역의 분할 방법을 제안한다. 분할한 부대역을 각각 압축하는 것으로 부대역 전역의 정보가 균일하게 유지하도록 한다. 제안하는 방법은 기존 방법에 비하여, PSNR 대비 더 좋은 복원 결과를 보여주었다.

부복호화기 효율을 고려한 다시점 영상 합성 기법 (Multi-view Synthesis Algorithm for the Better Efficiency of Codec)

  • 최인규;정원식;이광순;유지상
    • 한국정보통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.375-384
    • /
    • 2016
  • 본 논문에서는 스테레오 영상과 스테레오 영상 바깥 시점의 위성 영상 그리고 상응하는 깊이 영상이 입력으로 주어질 때 이 입력 영상들을 압축에 적합한 포맷으로 변환하고 활용하여 중간시점 영상을 합성하는 새로운 기법을 제안한다. 송출 단에서 깊이 영상들은 하나의 global 영상으로, 위성영상은 시점 이동 시에 발생하는 프레임 밖의 영역 및 가려짐 영역과 같은 홀 영역에만 해당하는 residual 영상으로 변환 후에 데이터 량을 줄이기 위하여 다운샘플링하고 주시점의 스테레오 영상과 더불어 HEVC 코덱으로 부호화 한 후 전송한다. 수신 단에서 복호화된 각 입력 영상들을 이용하여 스테레오 영상 간 그리고 스테레오 영상과 위성 영상간의 중간시점 영상을 합성한다. 실험을 통하여 제안한 포맷을 이용하여 합성한 중간 시점 영상을 MVD(Multiview Video plus Depth) 포맷을 이용하여 합성한 중간 시점 영상과 비교했을 때 전송하는 데이터의 비트율(bit-rate) 대비 객관적 그리고 주관적 화질이 뛰어남을 확인하였다.

동영상합성시스템을 이용한 개선된 외국인고용관리시스템(EPS) 구현 (The embodiment of the advanced EPS with the synthesis system of moving picture)

  • 김록환;정병수
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.105-113
    • /
    • 2009
  • 본 논문은 외국인 110만명 시대에 양질의 외국인력을 도입하기 위하여 국가의 외국인력수급에 최적의 시스템으로 노동생산성을 높이면서, 사회비용을 감소시키는 개선된 외국인고용관리시스템(EPS) 구현에 목적이 있다. 외국인력에 대한 구직자 상세정보가 부족함으로 인하여 양질의 외국인근로자 채용에 어려움을 주고 있고, 외국인력 선발시 참고자료인 구직자명부의 신뢰성을 떨어뜨리고 있어 이를 해소하기 위하여 현행 시스템에 구직자정보동영상관리시스템을 구현할 필요가 있다. 이를 위하여 본 논문에서는 기존 시스템에 동영상 합성기능을 추가함에 있어 멀티미디어기술과 네트워크 전송 고압축코덱 데이터베이스 기술을 접목한 동영상 임베디드 시스템등을 도입하여, 기업의 수요에 부합하고 사업주가 필요로 하는 외국인근로자를 채용하는 진보된 외국인고용관리시스템에 대하여 제시하였다.

SHVC 기반 V-PCC 콘텐츠 ISOBMFF 캡슐화 및 DASH 구성 방안 (SHVC-based V-PCC Content ISOBMFF Encapsulation and DASH Configuration Method)

  • 남귀중;김준식;김규헌
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.548-560
    • /
    • 2022
  • V-PCC는 포인트 클라우드를 압축하기 위한 압축 방안 중 하나로, 기존 비디오 코덱을 활용하여 포인트 클라우드 데이터를 압축한다는 특징으로 인해 움직임을 가지는 동적 포인트 클라우드 압축에 높은 효율을 나타낸다. 이에 V-PCC는 AR/VR과 같은 실감형 콘텐츠 서비스의 핵심 기술로써 주목받고 있다. 이러한 V-PCC 콘텐츠를 효과적으로 미디어 스트리밍 플랫폼을 통해 서비스하기 위해서는 기존 미디어 파일 포맷인 ISOBMFF로 캡슐화 하는 것이 필요하다. 하지만, DASH와 같은 적응형 스트리밍 플랫폼을 통해 서비스 하기 위해서는 V-PCC 콘텐츠를 다양한 품질의 콘텐츠를 각각 인코딩하여 서버에 저장해야 하며, V-PCC의 높은 인코딩 복잡성과 방대한 데이터의 크기로 인해 기존의 2차원 미디어에 비해 인코더와 서버에 큰 부담을 발생시킨다. 이와 같은 문제점을 해결하기 위한 방법으로 SHVC 기반의 V-PCC 콘텐츠 인코딩을 통해 획득한 콘텐츠를 기반으로 스트리밍 플랫폼을 구성하는 것이 고려되어질 수 있다. 이에, 본 논문에서는 SHVC기반의 V-PCC 비트스트림을 DASH 서비스에 맞게 ISOBMFF로 캡슐화하고 이를 서비스하기 위한 구성방안을 제안하였다. 또한, 본 논문에서는 SHVC 기반 V-PCC 콘텐츠를 효과적으로 서비스하기 위한 ISOBMFF 캡슐화와 DASH 구성 방안에 대해 제안하고, 검증 실험을 통해 이를 확인한다

음악 특징점간의 유사도 측정을 이용한 동일음원 인식 방법 (Same music file recognition method by using similarity measurement among music feature data)

  • 성보경;정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.99-106
    • /
    • 2008
  • 최근 다양한 분야에서(웹 포털, 유료 음원서비스 등) 디지털 음악의 검색이 사용되고 있다. 기존의 디지털 음악의 검색은 음악 데이터에 포함된 자체 메타 정보를 이용하여 이루어진다. 하지만 메타 정보가 다르게 작성되었거나 작성되지 않은 경우 정확한 검색은 어렵다. 요즘 이러한 문제의 보완 방안으로 음악자체를 이용하는 내용기반정보 검색 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보간의 유사도 측정을 통하여 동일음원을 인식하는 방법에 대해 논하고자 한다. 디지털 음악의 특징 정보는 단순화시킨 MFCC (Mel Frequency Cepstral Coefficient)를 이용하여 음악의 파형으로부터 추출하였다. 디지털 음악간의 유사도는 Vision 및 Speech Recognition 분야에서 사용되던 DTW (Dynamic Time Warping) 기법을 활용하여 측정하였다. 제안된 동일 음원 인식 방법의 검증을 위한 같은 장르에서 무작위 추출된 1000곡에서 시행한 500번의 검색은 모두 성공했다. 검색에 사용된 500개의 디지털 오디오는 60개의 디지털음원을 압축방식과 비트율을 다르게 조합하여 만들었다. 실험의 결과로 DTW을 이용한 유사도 측정법이 동일음원을 인식할 수 있음을 증명하였다.

  • PDF

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.