• 제목/요약/키워드: encoder resolution

검색결과 168건 처리시간 0.022초

임베디드시스템 환경에서 하드웨어 기반 H.264 Encoder 최적화 (Optimization of H.264 Encoder based on Hardware Implementation in Embedded System)

  • 조정현;이명수;정한수;김창석;조대제
    • 한국산학기술학회논문지
    • /
    • 제11권8호
    • /
    • pp.3076-3082
    • /
    • 2010
  • 영상 압축 코덱(Codec)을 활용하여 군 혹은 민간 분야에서 다양한 기술과 제품들이 출시되고 있다. 기존 고성능 PC환경 하에서 영상 압축 코덱의 프로세스는 큰 문제가 되지 않았지만, 제한적인 시스템 자원을 가지는 임베디드 시스템 환경에서는 고해상도의 영상을 고밀도 압축하면서 발생하는 시스템 부하로 인하여 성능 및 활용도가 제한되는 문제가 부각되고 있는 상황이다. 본 논문에서는 임베디드 시스템 환경 상 기존 소프트웨어 알고리즘 형태의 영상 압축 방식에 대한 성능 및 주변 장치 연동 인터페이스 제약에 대한 해결책으로서 하드웨어 방식의 영상 압축코덱성능 최적화, 외부 장치 연동의 편의성 및 확장성을 부각하기 위한 DirectShow 필터 인터페이스화를 제안하였고 검증을 위해 임베디드 시스템을 구현해서 시뮬레이션 하였다.

효율적인 필터 계수 추출을 위한 HEVC 부호화기의 고성능 ALF 하드웨어 설계 (Hardware Design of High Performance ALF in HEVC Encoder for Efficient Filter Coefficient Estimation)

  • 신승용;류광기
    • 한국정보통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.379-385
    • /
    • 2015
  • 본 논문에서는 필터 계수를 효율적으로 추출하기 위한 고성능 ALF(Adaptive Loop Filter)의 하드웨어 구조를 제안한다. HEVC의 ALF 기술은 고해상도 및 고화질의 영상을 높은 효율로 압축하고 주관적 화질을 향상시키기 위해 영상의 통계적인 특성을 이용한 필터 계수를 추출하여 필터링을 수행한다. 제안하는 ALF 하드웨어 구조는 필터 계수를 추출하기 위한 촐레스키 분해의 연산 관계를 분석하여 2단 파이프 구조로 설계함으로써 수행 사이클을 감소시켰다. 또한, 촐레스키 분해의 연산 과정에서 필요한 루트 연산은 멀티플렉서와 뺄셈기, 비교기 등을 이용하여 설계함으로써 적은 면적과 연산량, 복잡도를 갖는 하드웨어 구조로 설계하였다. 제안한 하드웨어는 Xilinx ISE 14.3 Vertex-7 XC7VCX485T FPGA 디바이스를 사용하여 합성한 결과 4K(3840x2160)@40fps의 영상을 실시간 처리할 수 있고, 최대 동작주파수는 186MHz이다.

고성능 HEVC 부호기를 위한 변환양자화기 하드웨어 설계 (The Design of Transform and Quantization Hardware for High-Performance HEVC Encoder)

  • 박승용;조흥선;류광기
    • 한국정보통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.327-334
    • /
    • 2016
  • 본 논문에서는 고성능 HEVC(High Efficiency Video Coding) 부호기를 위한 변환양자화기 하드웨어 구조를 제안한다. HEVC 변환기는 율-왜곡 비용을 비교하여 최적의 변환모드를 결정하지만 율-왜곡 비용은 변환과, 양자화, 역양자화 그리고 역변환을 통해 계산된 왜곡 값과 비트 량으로 결정된다. 따라서 상당히 많은 연산량과 소요시간이 필요하기 때문에 고해상도/고화질의 영상을 실시간으로 처리하는데 어려움이 따른다. 본 논문에서는 변환을 통한 계수의 합계를 비교하여 변환모드를 결정하는 방법을 제안한다. 성능 평가 지표는 BD-PSNR과 BD-Bitrate를 사용하였으며, 실험 결과를 토대로 영상의 화질에서 큰 변화 없이 신속하게 모드를 결정할 수 있음을 확인하였다. 제안하는 하드웨어 구조는 변환모드에 따라 다른 값을 동일한 출력에 할당하고 곱셈 계수가 최대한 중복되도록 구성하여 하드웨어 면적을 감소시키고 연속적인 파이프라인 동작으로 구현함으로써 성능을 높였으며, 기존의 제안된 논문에서 사용한 공정 대비 더 큰 공정을 사용한 것을 감안하여 면적은 1/2배 감소, 성능은 2.3배 증가하였다.

벡터 양자화 변분 오토인코더 기반의 폴리 음향 생성 모델을 위한 잔여 벡터 양자화 적용 연구 (A study on the application of residual vector quantization for vector quantized-variational autoencoder-based foley sound generation model)

  • 이석진
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.243-252
    • /
    • 2024
  • 최근에 연구되기 시작한 폴리(Foley) 음향 생성 모델 중 벡터 양자화 변분 오토인코더(Vector Quantized-Variational AutoEncoder, VQ-VAE) 구조와 Pixelsnail 등 생성모델을 활용한 생성 기법은 중요한 연구대상 중 하나이다. 한편, 딥러닝 기반의 음향 신호의 압축/복원 분야에서는 기존의 VQ-VAE 구조에 비해 잔여 벡터 양자화 기술이 더 적합한 것으로 보고되고 있으며, 따라서 본 논문에서는 폴리 음향 생성 분야에서도 잔여 벡터 양자화 기술이 효과적으로 적용될 수 있을지 연구하고자 한다. 이를 위하여 본 논문에서는 기존의 VQ-VAE 기반의 폴리 음향 생성 모델에 잔여 벡터 양자화 기술을 적용하되, Pixelsnail 등 기존의 다른 모델과 호환이 가능하고 연산 자원의 소모를 늘리지 않는 모델을 고안하여 그 효과를 확인하고자 하였다. 효과를 검증하기 위하여 DCASE2023 Task7의 데이터를 활용하여 실험을 진행하였으며, 그 결과 평균적으로 0.3 가량의 Fréchet audio distance 의 향상을 보이는 것을 확인하였다. 다만 그 성능 향상의 정도가 제한적이었으며, 이는 연산 자원의 소모를 유지하기 위하여 시간-주파수축의 분해능이 저하된 영향으로 판단된다.

Wide-range Speed Control Scheme of BLDC Motor Based on the Hall Sensor Signal

  • Lee, Dong-Hee
    • Journal of Power Electronics
    • /
    • 제18권3호
    • /
    • pp.714-722
    • /
    • 2018
  • This paper presents a wide-range speed control scheme of brushless DC (BLDC) motors based on a hall sensor with separated low- and normal-speed controllers. However, the use of the hall sensor signal is insufficient to detect motor speed in the low-speed region because of low sensor resolution and time delay. In the proposed method, a micro-stepping current control method according to the torque angle variation is presented. In this mode, the motor current frequency and rotating angle are determined by the reference speed without the actual speed fed by the hall sensor. The detected torque angle is used to adjust the current value in a limited band to control the current value in accordance with the load. The torque angle is detected exactly at the changing point of the hall sensor signal. The rotor can follow the rotating flux with the variable torque angle. In a normal speed range, the conventional vector control scheme is used to control the motor current with a PI speed controller using the hall sensor. The torque characteristics are analyzed on the basis of the back EMF and current shape. To adopt the vector control scheme, the continuous rotor position is estimated by the measured speed and hall sensor position. At the mode changing point between low and normal speed range, the proper initial current command and reference rotor position are calculated. The calculated current command can reduce the torque ripple during transient mode. The proposed method is simple but effective in extending the speed control range of a conventional BLDC motor with hall sensor without the need for a high-resolution encoder. The effectiveness of the proposed method is verified by various experiments on a practical BLDC motor.

임베디드 보드에서 실시간 의미론적 분할을 위한 심층 신경망 구조 (A Deep Neural Network Architecture for Real-Time Semantic Segmentation on Embedded Board)

  • 이준엽;이영완
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.94-98
    • /
    • 2018
  • 본 논문은 자율주행을 위한 실시간 의미론적 분할 방법으로 최적화된 심층 신경망 구조인 Wide Inception ResNet (WIR Net)을 제안한다. 신경망 구조는 Residual connection과 Inception module을 적용하여 특징을 추출하는 인코더와 Transposed convolution과 낮은 층의 특징 맵을 사용하여 해상도를 높이는 디코더로 구성하였고 ELU 활성화 함수를 적용함으로써 성능을 올렸다. 또한 신경망의 전체 층수를 줄이고 필터 수를 늘리는 방법을 통해 성능을 최적화하였다. 성능평가는 NVIDIA Geforce gtx 1080과 TX1 보드를 사용하여 주행환경의 Cityscapes 데이터에 대해 클래스와 카테고리별 IoU를 평가하였다. 실험 결과를 통해 클래스 IoU 53.4, 카테고리 IoU 81.8의 정확도와 TX1 보드에서 $640{\times}360$, $720{\times}480$ 해상도 영상처리에 17.8fps, 13.0fps의 실행속도를 보여주는 것을 확인하였다.

MPEG-4 AVC를 위한 고속 다해상도 움직임 추정기의 하드웨어 구현 (Hardware Implementation of Past Multi-resolution Motion Estimator for MPEG-4 AVC)

  • 임영훈;정용진
    • 한국통신학회논문지
    • /
    • 제29권11C호
    • /
    • pp.1541-1550
    • /
    • 2004
  • 본 논문에서는 다해상도 움직임 추정 알고리즘을 이용하여 모션 리터를 검색하는 고속 다해상도 움직임 추정기에 대한 하드웨어 구조를 제안한다. 동영상 압축기술인 MPEG-4 AVC 전체 구성 중에서 핵심 부분인 움직임 추정 모듈을 하드웨어로 설계하기 위하여 기본적인 구조를 구성하고 높은 화질로 실시간 부호화를 할 수 있도록 고속 움직임 검색을 위해 특수하게 설계된 램 구주 메모리 공유, 4화소x4화소 Motion Vector 추출 등과 같은 기술들을 사용하여 전체 움직임 검색기를 구현하였다. 구현된 전체 모듈은 Altera(사)의 Excalibur 디바이스를 이용한 FPGA 구성을 통해 검증하고 최종적으로 Samsung STD130 0.18um CMOS Cell Library를 이용하며 합성 및 검증을 하였다. 이렇게 검증된 구조의 성능은 ASIC으로 구현할 경우 최대 동작 주파수가 약 140MHz이며 QCIF(176화소x144화소) 사이즈 기준으로 초당 약 1100프레임, 4CIF(704화소x576화구 사이즈 기준으로 초당 약 70프레임의 움직임을 검색할 수 있다 본 성능은 하드웨어 기반의 MPEG-4 AVC 실시간 부호화기를 설계하기에 적합한 구조임을 보여준다.

스케일러블 동적 메쉬 압축을 위한 SHVC 기반 텍스처 맵 부호화 방법 (SHVC-based Texture Map Coding for Scalable Dynamic Mesh Compression)

  • 권나성;변주형;최한솔;심동규
    • 방송공학회논문지
    • /
    • 제28권3호
    • /
    • pp.314-328
    • /
    • 2023
  • 본 논문에서는 동적 메쉬 부/복호화 시 스케일러빌리티 기능을 지원하기 위해 SHVC의 계층적 부호화 방식을 기반으로 텍스처 맵을 압축하는 방법을 제안한다. 제안하는 방법은 고해상도 텍스처 맵을 다운샘플링하여 다해상도의 텍스처 맵을 생성하고 이를 SHVC로 부호화함으로써 효과적으로 다해상도 텍스처 맵들의 중복성을 제거한다. 동적 메쉬 복호화기에서는 수신기 성능, 네트워크 환경 등에 따라 적합한 해상도의 텍스처 맵을 복호화하여 메쉬 데이터의 스케일러빌리티를 지원할 수 있도록 한다. 제안하는 방법의 성능을 검증하기 위해 V-DMC (Video-based Dynamic Mesh Coding) 참조 소프트웨어인 TMMv1.0에 제안하는 방법을 적용하고 본 논문에서 제안하는 스케일러블 부/복호화기와 TMMv1.0 기반의 시뮬캐스트 방식의 성능을 비교하였다. 제안하는 방법은 시뮬캐스트 방법 대비 AI, LD 환경에서 Luma BD-rate (Luma PSNR)가 각각 평균 -7.7%, -5.7%의 향상된 결과를 얻어 제안하는 방법을 통해 효과적으로 동적 메쉬 데이터의 텍스처 맵 스케일러빌리티 지원이 가능함을 확인하였다.

다종 위성자료와 인공지능 기법을 이용한 한반도 주변 해역의 고해상도 해수면온도 자료 생산 (Generation of Daily High-resolution Sea Surface Temperature for the Seas around the Korean Peninsula Using Multi-satellite Data and Artificial Intelligence)

  • 정시훈;추민기;임정호;조동진
    • 대한원격탐사학회지
    • /
    • 제38권5_2호
    • /
    • pp.707-723
    • /
    • 2022
  • 위성기반 해수면온도는 광역 모니터링이 가능한 장점이 있지만, 다양한 환경적 그리고 기계적 이유로 인한 시공간적 자료공백이 발생한다. 자료공백으로 인한 활용성의 한계가 있으므로, 공백이 없는 자료 생산이 필수적이다. 따라서 본 연구에서는 한반도 주변 해역에 대해 극궤도와 정지궤도 위성에서 생산되는 해수면온도 자료를 두 단계의 기계학습을 통해 융합하여 4 km의 공간해상도를 가지는 일별 해수면온도 합성장을 만들었다. 첫번째 복원 단계에서는 Data INterpolate Convolutional AutoEncoder (DINCAE) 모델을 이용하여 다종 위성기반 해수면온도 자료를 합성하여 복원하였고, 두번째 보정 단계에서는 복원된 해수면온도 자료를 현장관측자료에 맞춰 Light Gradient Boosting Machine (LGBM) 모델로 학습시켜 최종적인 일별 해수면온도 합성장을 만들었다. 개발된 모델의 검증을 위해 복원 단계에서 무작위 50일의 자료 중 일부분을 제거하여 복원한 뒤 제거된 영역에 대해 검증하였으며, 보정 단계에서는 Leave One Year Out Cross Validation (LOYOCV) 기법을 이용하여 현장자료와의 정확도를 검증하였다. DINCAE 모델의 해수면온도 복원 결과는 상당히 높은 정확도(R2=0.98, bias=0.27℃, RMSE=0.97℃, MAE=0.73℃)를 보였다. 두번째 단계의 LGBM 보정 모델의 정확도 개선은 표층 뜰개 부이와 계류형 부이 현장자료와의 비교에서 모두 상당한 향상(RMSE=∆0.21-0.29℃, rRMSE=∆0.91-1.65%, MAE=∆0.17-0.24℃)을 보여주었다. 특히, 모든 현장 자료를 이용한 보정 모델의 표층 뜰개 부이와의 정확도는 동일한 현장 자료가 동화된 기존 해수면온도 합성장보다 나은 정확도를 보였다. 또한 LGBM 보정 모델은 랜덤포레스트(random forest)를 사용한 선행연구에서 보고된 과적합의 문제를 상당부분 해결하였다. 보정된 해수면온도는 기존의 초고해상도 해수면온도 합성장들과 유사한 수준으로 수온 전선과 와동 등의 중규모 해양현상을 뚜렷하게 모의하였다. 본 연구는 다종위성 자료와 기계학습 기법을 사용해 시공간적 공백 없는 고해상도 해수면온도 합성장 제작 방법을 제시하였다는 점에서 가치가 있다.

원격 의료 진단 시스템을 위한 사용자 기반 적응 대역폭 비디오 시스템 (A User Driven Adaptable Bandwidth Video System for Remote Medical Diagnosis System)

  • 정영지;더스틴 라이트;유수프 어즈터크
    • 한국IT서비스학회지
    • /
    • 제14권1호
    • /
    • pp.99-113
    • /
    • 2015
  • Adaptive bitrate (ABR) streaming technology has become an important and prevalent feature in many multimedia delivery systems, with content providers such as Netflix and Amazon using ABR streaming to increase bandwidth efficiency and provide the maximum user experience when channel conditions are not ideal. Where such systems could see improvement is in the delivery of live video with a closed loop cognitive control of video encoding. In this paper, we present streaming camera system which provides spatially and temporally adaptive video streams, learning the user's preferences in order to make intelligent scaling decisions. The system employs a hardware based H.264/AVC encoder for video compression. The encoding parameters can be configured by the user or by the cognitive system on behalf of the user when the bandwidth changes. A cognitive video client developed in this study learns the user's preferences (i.e. video size over frame rate) over time and intelligently adapts encoding parameters when the channel conditions change. It has been demonstrated that the cognitive decision system developed has the ability to control video bandwidth by altering the spatial and temporal resolution, as well as the ability to make scaling decisions