• 제목/요약/키워드: Fast Computation

검색결과 747건 처리시간 0.025초

Real-time small target detection method Using multiple filters and IPP Libraries in Infrared Images

  • Kim, Chul Joong;Kim, Jae Hyup;Jang, Kyung Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권8호
    • /
    • pp.21-28
    • /
    • 2016
  • In this paper, we propose a fast small target detection method using multiple filters, and describe system implementation using IPP libraries. To detect small targets in Infra-Red images, it is mandatory that you should apply a filter to eliminate a background and identify the target information. Moreover, by using a suitable algorithm for the environments and characteristics of the target, the filter must remove the background information while maintaining the target information as possible. For this reason, in the proposed method we have detected small targets by applying multi area(spatial) filters in a low luminous environment. In order to apply the multi spatial filters, the computation time can be increased exponentially in case of the sequential operation. To build this algorithm in real-time systems, we have applied IPP library to secure a software optimization and reduce the computation time. As a result of applying real environments, we have confirmed a detection rate more than 90%, also the computation time of the proposed algorithm have been improved about 90% than a typical sequential computation time.

강소성 유한요소해석의 안정화와 고능률화에 관한 연구 (Computational strategies for improving efficiency in rigid-plastic finite element analysis)

  • 추만석;김영석
    • 대한기계학회논문집
    • /
    • 제13권3호
    • /
    • pp.317-322
    • /
    • 1989
  • 본 연구에서는 Liu의 매트릭스를 강소성 유한요소법에 도입하여 통상의 소성가공 공정중에 있는 피가공물의 3차원 변형을 실용적인 수준에서 해석 가능케 하는 강소성 유한요소법을 도입하여 통상의 소성가공 공정중에 있는 피가공물의 3차원 변형을 실용적인 수준에서 해석 가능케 하는 강소성 유한요소법을 제안하고 실례를 통하여 제안한수법에 의하여 얻어진 해의 안정성과 계산효율을 검토한다.

특이값 분해를 이용한 라만 스펙트럼 고속 탐색 알고리즘 (A Fast Search Algorithm for Raman Spectrum using Singular Value Decomposition)

  • 서유경;백성준;고대영;박준규;박아론
    • 한국산학기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.8455-8461
    • /
    • 2015
  • 본 논문에서는 라만 스펙트럼의 고속 탐색을 위해 특이값 분해(SVD, Singular Value Decomposition)를 이용한 새로운 탐색 알고리즘들을 제안한다. 제안 알고리즘에서는 SVD를 통해 얻은 특이벡터를 중요도에 따라 선별하여 실험에 사용함으로써 계산량 단축을 도모한다. 파일럿 테스트(Pilot test)를 수행하여 일부 데이터들을 미리 탐색 대상에서 제외시키고 부분탐색법(PDS, Partial Distance Search)을 적용하여 탐색을 수행함으로써 큰 폭으로 계산량을 감소시킨다. 실험에 사용한 데이터베이스는 총 14,032종의 화학 물질 라만 스펙트럼으로 구성하였으며, 기존의 탐색 방법인 전체탐색법(Full Search), PDS와 평균피라미드탐색법(MPS, Mean Pyramid Search)를 1차원공간상의 신호에 적용하기 적절하게 변형한 1DMPS에 PDS를 적용한 실험(1DMPS+PDS), 데이터의 분산을 내림차순 정렬하여 !DMPS와 PDS를 적용한 실험(1DMPS Sort with Variance+PDS), 데이터의 250차원 성분만 SVD 변환하여 PDS를 적용한 실험(250SVD+PDS), 그리고 제안 알고리즘 PSP(Partial SVD with PDS)와 PSSP(Partial SVD with Sorted Pilot test)을 적용한 실험을 비교 분석하였다. 각 알고리즘의 성능은 곱셈 및 덧셈의 연산량 비교를 통해 이루어졌는데, 실험 결과에 따르면 250SVD+PDS에 비해 제안알고리즘 PSP는 15.7%, PSSP에서는 64.8%의 계산량 감소를 확인하였다.

Efficient Design and Performance Analysis of a Hardware Right-shift Binary Modular Inversion Algorithm in GF(p)

  • Choi, Piljoo;Lee, Mun-Kyu;Kong, Jeong-Taek;Kim, Dong Kyue
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제17권3호
    • /
    • pp.425-437
    • /
    • 2017
  • For efficient hardware (HW) implementation of elliptic curve cryptography (ECC), various sub-modules for the underlying finite field operations should be implemented efficiently. Among these sub-modules, modular inversion (MI) requires the most computation; therefore, its performance might be a dominant factor of the overall performance of an ECC module. To determine the most efficient MI algorithm for an HW ECC module, we implement various classes of MI algorithms and analyze their performance. In contrast to the common belief in previous research, our results show that the right-shift binary inversion (RS) algorithm performs well when implemented in hardware. In addition, we present optimization methods to reduce the area overhead and improve the speed of the RS algorithm. By applying these methods, we propose a new RS-variant that is both fast and compact. The proposed MI module is more than twice as fast as the other two classes of MI: shifting Euclidean (SE) and left-shift binary inversion (LS) algorithms. It consumes only 15% more area and even 5% less area than SE and LS, respectively. Finally, we show that how our new method can be applied to optimize an HW ECC module.

배전계통 사고복구 구성탐색을 위한 개선된 다익스트라 알고리즘과 퍼지규칙의 적용 (An Application of advanced Dijkstra algorithm and Fuzzy rule to search a restoration topology in Distribution Systems)

  • 김훈;전영재;김재철;최도혁;정용철;추동욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 A
    • /
    • pp.537-540
    • /
    • 2000
  • The Distribution System consist of many tie-line switches and sectionalizing switches, operated a radial type. When an outage occurs in Distribution System, outage areas are isolated by system switches, has to restored as soon as possible. At this time, system operator have to get a information about network topology for service restoration of outage areas. Therefore, the searching result of restorative topology has to fast computation time and reliable result topology for to restore a electric service to outage areas, equal to optimal switching operation problem. So, the problem can be defined as combinatorial optimization problem. The service restoration problem is so important problem which have outage area minimization, outage loss minimization. Many researcher is applying to the service restoration problem with various techniques. In this paper, advanced Dijkstra algorithm is applied to searching a restoration topology, is so efficient to searching a shortest path in graph type network. Additionally, fuzzy rules and operator are applied to overcome a fuzziness of correlation with input data. The present technique has superior results which are fast computation time and searching results than previous researches, demonstrated by example distribution model system which has 3 feeders, 26 buses. For a application capability to real distribution system, additionally demonstrated by real distribution system of KEPCO(Korea Electric Power Corporation) which has 8 feeders and 140 buses.

  • PDF

CCD 영상에서의 실시간 자동 표적 탐지 알고리즘 (Real-Time Automatic Target Detection in CCD image)

  • 유정재;선선구;박현욱
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.99-108
    • /
    • 2004
  • 본 논문에서는 CCD(charge-coupled device) 영상 기반의 자동 표적 탐지 시스템(ATD System : Automatic Target Detection System)에 적합한 빠른 탐색 방법을 제안한다. 무기체계에서의 활용을 위해서는 빠른 연산이 주요한 변수인 만큼 이 논문에서는 적은 계산량으로 다양한 표적을 탐지할 수 있는 능력에 주안점을 두고 있다. 표적 훈련(train)단계에서는 구간별 수직 방향 프로젝션을 이용하여 1D의 템플릿을 구성하고 K-means clustering과 이진 트리 구조(binary tree structure)를 활용하여 실제 시험 단계에서 템플릿 정합하는 횟수를 최소화한다. 또한 Correlation-based Adaptive Predictive Search(CAPS)를 이용하여 각각의 템플릿에 적응적인 skip-width를 사용하여 탐색 속도를 높이고 클러터 제거 단계에서는 윤곽선으로부터 추출한 Fourier Descriptor계수를 비교함으로써 초기 탐지에서 타겟으로 오인된 클러터를 모양 정보에 기반해서 제거하는 방법을 사용한다.

A Non-parametric Fast Block Size Decision Algorithm for H.264/AVC Intra Prediction

  • Kim, Young-Ju
    • Journal of information and communication convergence engineering
    • /
    • 제7권2호
    • /
    • pp.193-198
    • /
    • 2009
  • The H.264/ AVC video coding standard supports the intra prediction with various block sizes for luma component and a 8x8 block size for chroma components. This new feature of H.264/AVC offers a considerably higher improvement in coding efficiency compared to previous compression standards. In order to achieve this, H.264/AVC uses the Rate-distortion optimization (RDO) technique to select the best intra prediction mode for each block size, and it brings about the drastic increase of the computation complexity of H.264 encoder. In this paper, a fast block size decision algorithm is proposed to reduce the computation complexity of the intra prediction in H.264/AVC. The proposed algorithm computes the smoothness based on AC and DC coefficient energy for macroblocks and compares with the nonparametric criteria which is determined by considering information on neighbor blocks already reconstructed, so that deciding the best probable block size for the intra prediction. Also, the use of non-parametric criteria makes the performance of intra-coding not be dependent on types of video sequences. The experimental results show that the proposed algorithm is able to reduce up to 30% of the whole encoding time with a negligible loss in PSNR and bitrates and provides the stable performance regardless types of video sequences.

다중 참조 영상 움직임 추정을 위한 고속 전역탐색법 (A fast full search algorithm for multiple reference image motion estimation)

  • 강현수;박성모
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.1-8
    • /
    • 2006
  • 본 논문은 다중 참조영상(multiple reference image)에 적용 가능한 새로운 고속 전역탐색 움직임 추정 기법을 제안한다. 제안된 방법은 기존의 비트율을 고려한 연속제거알고리즘(rate constrained successive elimination algorithm: RSEA)을 다중 참조영상에 확대 적용하는 방법이다. 첫 번째 참조영상에 대한 움직임 추정의 계산량에 비해 그 이후 참조영상에 대한 움직임 추정의 계산량이 적어질 수 있음을 보일 것이다. 계산량 감축을 위해, 본 논문에서 최적 움직임 벡터의 후보 블록의 개수를 감소시킬 수 있는 새로운 조건을 소개한다. 실험 결과을 통해 제안된 방법이 기존의 RSEA과 동일한 움직임 추정오차를 가지면서도 계산량을 감소시킴을 보일 것이다.

Performance analysis of local exit for distributed deep neural networks over cloud and edge computing

  • Lee, Changsik;Hong, Seungwoo;Hong, Sungback;Kim, Taeyeon
    • ETRI Journal
    • /
    • 제42권5호
    • /
    • pp.658-668
    • /
    • 2020
  • In edge computing, most procedures, including data collection, data processing, and service provision, are handled at edge nodes and not in the central cloud. This decreases the processing burden on the central cloud, enabling fast responses to end-device service requests in addition to reducing bandwidth consumption. However, edge nodes have restricted computing, storage, and energy resources to support computation-intensive tasks such as processing deep neural network (DNN) inference. In this study, we analyze the effect of models with single and multiple local exits on DNN inference in an edge-computing environment. Our test results show that a single-exit model performs better with respect to the number of local exited samples, inference accuracy, and inference latency than a multi-exit model at all exit points. These results signify that higher accuracy can be achieved with less computation when a single-exit model is adopted. In edge computing infrastructure, it is therefore more efficient to adopt a DNN model with only one or a few exit points to provide a fast and reliable inference service.

H.264/AVC의 인터 예측 부호화를 위한 고속 율왜곡 최적화 알고리즘 (Fast Rate Distortion Optimization Algorithm for Inter Predictive Coding of H.264/AVC)

  • 신세일;오정수
    • 한국통신학회논문지
    • /
    • 제34권1C호
    • /
    • pp.56-62
    • /
    • 2009
  • H.264/AVC에서 다양한 블록 모드에서 최적 블록 모드를 결정하기 위해 율왜곡 최적화 알고리즘이 사용되고 있다. 이는 비트율을 개선시키고 있으나 계산량을 크게 증가시키고 있다. 본 논문은 움직임 추정을 위해 이미 계산된 비용을 이용해 율왜곡 최적화의 비용을 예측하여 적응적으로 율왜곡 최적화를 생략하는 고속 율왜곡 최적화 알고리즘을 제안한다. 모의 실험 결과는 제안된 알고리즘이 평균적으로 율왜곡 최적화에 의해 생성된 비트율과 화질을 거의 유지시키면서 율왜곡 최적화에 의해 발생하는 추가적인 계산량을 CIF와 QCIF에서 각각 69.86%와 69.63%를 감소시키고 있는 것을 보여주고 있다.