• Title/Summary/Keyword: 연산량

Search Result 1,859, Processing Time 0.031 seconds

A Software/Hardware Codesign of the MLSE Equalizer for GSM/GPRS (GSM/GPRS용 MLSE 등화기의 소프트웨어/하드웨어 통합설계 구조제안)

  • 전영섭;박원흠;선우명훈;김경호
    • Journal of the Institute of Electronics Engineers of Korea TC
    • /
    • v.39 no.10
    • /
    • pp.11-20
    • /
    • 2002
  • This paper proposes a hardware/software codesign of the MLSE equalizer for GSM.GPRS systems. We analyze algorithms of the MLSE equalizer which consists of a channel estimator using the correlation method and the Viterbi processor. We estimate the computational complexity requirement based on the simulation of TI TMS320C5x DSP. We also estimate the gate count from the results of logic synthesis using the samsung 0.5㎛ standard cell library (STD80). Based on the results of the complexity estimation and gate count, we propose the efficient software/hardware codesign of the MLSE equalizer based on the results of the complexity estimation and gate count.

An Efficient Quadtree-based Triangulationfor DEMusing Ping-Pong Buffer (핑퐁버퍼를 이용한 DEM의 효율적인 사진 트리 삼각화)

  • Lee, Eun-Seok;Lee, Jin-Hee;Enkhtsoga, Batamgalan;Shin, Byeong-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1480-1483
    • /
    • 2015
  • 최근의 대용량 DEM 데이터는 실시간 렌더링을 하기엔 많은 양의 폴리곤을 필요로 한다. 사진 트리는 이러한 DEM 데이터를 실시간에 렌더링 하기 위해 지형 메쉬를 간략화하는데 널리 사용되는 자료구조이다. 트리구조는 재귀 연산 및 포인터 연산과 같이 GPU 에서 제공하지 않는 기능을 필요로 하기 때문에 일반적으로 CPU 상에서 구현되어 사용된다. GPU 에서 사진 트리 삼각화 기법을 사용하기 위해서 기존의 연구에서는 정점 프리미티브와 스트림 출력 단계를 이용하였다. 하지만 이 방법은 매 프레임 루트 노드부터 리프 노드까지 탐색을 하며 지형 메쉬를 새로 생성 해야하기 때문에 불필요한 연산이 많다. 제안하는 방법은 핑퐁 버퍼를 이용하여 이전 프레임에서 사용한 지형 메쉬를 다음 프레임에서 재활용하여 기존 GPU 기반 사진 트리 삼각화 기법을 가속화한다. 기존 방법이 매 프레임 사각형 패치를 세분화 하면서 지형 메쉬를 생성하는 대신 제안하는 방법은 이전 프레임에서 사용한 메쉬의 각 패치들을 병합하거나 세분화하는 방법을 사용한다. 따라서 본 방법은 GPU 기반 사진 트리 삼각화의 재귀 호출을 제거하여 연산량을 줄이고 매 프레임 CPU-GPU 간의 데이터 전송량도 효율적으로 줄여 기존의 방법을 효율적으로 가속화 한다.

An Acoustic Echo Cancelling using Modified AUMDF Algorithm (수정된 AUMDF 알고리듬을 이용한 음향 반향 제거)

  • 채상훈;천영호;백홍기
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.537-540
    • /
    • 2000
  • 일반적으로 음향 반향 제거에서 반향의 임펄스 응답이 큰 경우 주파수 영역의 알고리듬은 시간 영역 알고리듬에 비해 긴 임펄스 응답에 따른 많은 계산량과 입력신호의 통계적 특성에 의한 영향을 줄일 수 있다. 그러나 주파수 영역 알고리듬에서는 시간 영역의 신호를 주파수 영역으로 변환시킬 때 필터 차수의 2배의 FFT 연산이 필요하게 되어, 긴 차수로 인한 실행 시간 지연이 발생하고 많은 메모리가 필요하다. 이러한 문제점을 감소시키고 수렴성능을 향상시키기 위한 MDF 알고리듬이 제안되었으나 계산량이 많은 단점이 있고, UMDF와 AUMDF 알고리듬은 계산량은 감소되나 수렴성능이 저하되는 문제점이 있다. 본 논문에서는 기존의 MDF 알고리듬과 거의 동일한 수렴성능을 유지하면서 연산량과 메모리를 줄일 수 있는 수정된 AUMDF 알고리듬을 제안하였으며, 모의 실험을 통해 결과를 확인하였다.

  • PDF

A Weighted based Pre-Perform A* Algorithm for Efficient Heuristics Computation Processing (효율적인 휴리스틱 계산 처리를 위한 가중치 기반의 선수행 A* 알고리즘)

  • Oh, Min-Seok;Park, Sung-Jun
    • Journal of Korea Game Society
    • /
    • v.13 no.6
    • /
    • pp.43-52
    • /
    • 2013
  • Path finder is one of the very important algorithm of artificial intelligence and is a process generally used in many game fields. Path finder requires many calculation, so it exerts enormous influences on performances. To solve this, many researches on the ways to reduce the amount of calculate operations have been made, and the typical example is A* algorithm but it has unnecessary computing process, reducing efficiency. In this paper, to reduce the amount of calculate operations such as node search with costly arithmetic operations, we proposes the weight based pre-processing A* algorithm. The simulation was materialized to measure the efficiency of the weight based pre-process A* algorithm, and the results of the experiments showed that the weight based method was approximately 1~2 times more efficient than the general methods.

Parallel Pipelined Spatial Join Method for Efficient Query Processing In Distributed Spatial Database Systems (분산 공간 데이터베이스 시스템에서의 효율적인 질의 처리를 위한 병렬 연쇄 공간 죠인 기법)

  • Ko, Ju-Il;Lee, Hwan-Jae;Kim, Myoung-Keun;Lee, Soon-Jo;Bae, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.11-14
    • /
    • 2002
  • 분산 공간 데이터베이스 시스템에서 자주 수행되는 공간 죠인 질의는 공간 데이터의 특징인 대용량성과 복잡성으로 인하여 공간 연산 수행시 연간을 수행하는 서버의 CPU 및 디스크 I/O상의 과부하를 일으킨다. 본 논문은 이러한 분산 광간 데이터베이스 시스템에서 수행 비용이 많이 드는 원격 사이트간의 공간 죠인 질의를 병렬적이며 연쇄적으로 수행하는 기법을 제안한다. 본 기법은 공간 죠인 연산의 대상이 되는 릴레이션들을 공간 연산의 특성에 따라 순서화하고, 그 중 최하위의 죠인에 참여하는 릴레이션들 중 하나를 이등분 하는 방법으로 공간 죠인 연산을 분리한 추, 질의 수행에 참여하는 두 서버에게 죠인 연산을 분배한다. 각 서버는 분할된 공간 죠인 연산을 동시에 연쇄적으로 저리하고 결과를 병합하여 최종 죠인 결과를 생성한다. 본 기법은 릴레이션을 분할하여 죠인을 수행함으로써 공간 연산에 참여하는 객체의 수를 절반으로 줄이며 R-Tree 등의 공간 인덱스 탐색 횟수와 그 범위를 감소시킨다. 또한 연쇄적인 질의 처리로 죠인의 결과인 임시 릴레이션을 생성하지 않으므로 대용량의 데이터에 대한 복잡한 질의에 대해서도 제한 없이 수행한다.

  • PDF

Digital Hologram Generating of 3D Object with Super-multi-light-source (초다광원 3차원 물체의 디지털 홀로그램 고속 생성)

  • Song, Joongseok;Kim, Changseob;Park, Jong-Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.135-136
    • /
    • 2015
  • 컴퓨터 생성 홀로그램(CGH: computer generated hologram) 기법은 기존의 광학계 장치와 변수들을 수학적으로 모델링하여 일반 범용 컴퓨터(PC: personal computer)로도 디지털 홀로그램을 생성할 수 있는 기술이다. 이 기술은 디지털 홀로그램의 해상도와 3D 물체의 광원 수에 따라 알고리즘의 연산량이 좌우되기 때문에, 실용적인 사용을 위해서 알고리즘의 연산량을 낮추거나 하드웨어의 연산 속도를 높이는 연구가 필수적이다. 본 논문에서는 초다광원 3D 물체의 디지털 홀로그램을 고속으로 생성할 수 있는 방법을 제안한다. 제안하는 방법은 한 개의 서버 PC와 다수의 클라이언트 PC들로 구성되어 있으며, 이들은 일반적으로 사용되는 범용 GPU (graphic processing unit)가 장착되어 있다. 서버에서 3D 물체의 광원을 스캔하여 데이터화 하고, 클라이언트 PC들의 연산 능력에 따라 광원 데이터를 분할하여 클라이언트들에게 각각 전송한다. 각각의 클라이언트들은 전송받은 데이터를 이용해 다중 GPU 기반의 CGH 연산을 수행하여 간섭 패턴들을 생성하고, 생성된 패턴들은 다시 서버 PC로 재전송된다. 서버 PC로 재전송 된 패턴들이 하나로 누적되면 디지털 홀로그램이 생성된다. 본 실험에서, 기존의 방법으로는 139,655개의 광원에 대해 $1,024{\times}1,024$ 해상도의 홀로그램을 생성하는데 약 2,250 ms가 걸린 반면, 제안하는 방법은 약 478 ms의 속도로 생성할 수 있음을 확인하였다.

  • PDF

VLSI Architecture of Digital Image Scaler Combining Linear Interpolation and Cubic Convolution Interpolation (선형 보간법과 3차회선 보간법을 결합한 디지털 영상 스케일러의 VLSI 구조)

  • Moon, Hae Min;Pan, Sung Bum
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.51 no.3
    • /
    • pp.112-118
    • /
    • 2014
  • As higher quality of image is required for digital image scaling, longer processing time is required. Therefore the technology that can make higher quality image quickly is needed. We propose the double linear-cubic convolution interpolation which creates the high quality image with low complexity and hardware resources. The proposed interpolation methods which are made up of four one-dimensional linear interpolations and one one-dimensional cubic convolution perform linear-cubic convolution interpolation in horizontal and vertical direction. When compared in aspects of peak signal-to-noise ratio(PSNR), performance time and amount of hardware resources, the proposed interpolation provided better PSNR, low complexity and less hardware resources than bicubic convolution interpolation.

Adaptive One-Bit Transform Using Characteristic of Reference Block (참조 블록의 특성에 기반한 선택적 1비트 변환 알고리듬)

  • Park, Miso;Kim, Jaehun;Kim, Hyungdo;jeong, Jechang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.11a
    • /
    • pp.223-226
    • /
    • 2013
  • 정확한 움직임 추정 기술은 원본과 가장 유사한 영상의 복원에 효과적이고 압축률에도 중요한 영향을 미친다. 하지만 기존의 전역 탐색 (Full Search) 알고리듬과 Sum of Absolute Difference (SAD)라는 정합 오차 기준은 연산량이 높고 하드웨어 구현시 비효율적이다. 이를 보완하기 위한 1비트 변환 알고리듬은 움직임 벡터의 변화량을 0과 1의 연산으로 나타내는데, 이 알고리듬은 움직임이 많아 픽셀 값의 변화가 심한 블록의 변화량도 0과 1로만 표현한다. 그렇기 때문에 정확한 움직임이 반영되지 않고 그로 인해 낮은 Peak Siganl to Noise Ratio (PSNR)을 가져온다. 이 점을 개선하고자 본 논문에서는 참조블록들의 움직임 벡터를 파악하고 분류하여 선택적으로 움직임의 변화량이 큰 영역은 전역 탐색 알고리듬을, 움직임이 작거나 없는 영역은 1비트 연산을 수행하도록 하여 기존의 알고리듬과 비교하여 Peak Siganl to Noise Ratio (PSNR)측면에서 우수한 성능을 확인할 수 있었다.

  • PDF

Motion Estimation Method Using Optimal Candidate Points (최적후보점을 이용한 비디오 데이터 움직임 예측 방법)

  • Choi, Hong-seok;Kim, Jong-nam
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.05a
    • /
    • pp.836-839
    • /
    • 2016
  • In this paper, we propose a motion estimation method that is important in performance of video encoding. Conventional motion estimation methods have serious problems of low prediction quality and problems of much computation increase. In the paper, we propose a method that reduces unnecessary computations only using optimal candidate points, while keeping prediction quality almost similar to that of the full search. The proposed method takes only 3~5% in computational amount and has decreased prediction quality about 0~0.01dB compared with the fast full search algorithm.

  • PDF