• 제목/요약/키워드: 반복 연산

검색결과 501건 처리시간 0.031초

3차원 Depth Image 추출용 Differential CORDIC 기반 고속 위상 연산기의 FPGA 구현 (FPGA Implementation of Differential CORDIC-based high-speed phase calculator for 3D Depth Image Extraction)

  • 구정윤;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.350-353
    • /
    • 2013
  • 본 논문에서는 TOF(Time-Of-Flight) 센서에 의해 얻어진 정보로부터 3차원 깊이 영상(depth image)을 추출하기 위한 위상 연산기의 하드웨어 구현을 제안한다. 설계된 위상 연산기는 DCORDIC(Differential COordinate Rotation DIgital Computer) 알고리듬의 vectoring mode를 이용하여 Arctangent 연산을 수행하며, 처리량과 속도를 늘리기 위해 redundant binary 수체계와 pipelined 구조를 적용하였다. 제안된 알고리듬은 고정 소수점 MATLAB 시뮬레이션을 통해 검증하고 최적 데이터 비트 수 및 반복 횟수를 결정하였다. 설계된 위상 연산기는 MATLAB/Simulink와 FPGA 연동을 통해 가상의 3차원 데이터 복원 동작을 검증하였으며, 469 MHz의 클록 주파수로 동작하여 7.5 Gbps의 성능을 갖는 것으로 평가되었다.

  • PDF

픽셀값 연산을 이용한 자성체의 자구패턴 시각화 (Visual Recognition of Magnetc Domain Pattern Using Pixel Value Operation)

  • 김영학
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.681-684
    • /
    • 2015
  • 자성체의 자화는 자성물리의 기본 물리량으로 자성체 응용에 많은 정보를 제공한다. 광자기효과를 이용하는 자구관찰 장치에서 최초로 얻어지는 자화패턴 만으로는 자성체의 자화상태를 확인할 수 없다. 따라서 자구패턴을 시각화하기 위해 다수의 패턴을 획득하여 연산을 통해 자구패턴을 시각화하였다. 자화패턴을 8비트 디지털 카메라로 취득하였고 이를 컴퓨터로 화상 연산처리를 하였다. 연상방법은 자성체를 포화시켜 픽셀값을 최대 255값에 가깝게 하여 취득한 영상으로부터 어떤 자화상태의 자화영상의 픽셀값을 반복적으로 감산하는 것이다. 감산 연산이 진행됨에 따라 선명한 자구패턴이 얻어졌다. 연산 프로그램은 범용의 LABVIEW를 이용하였고 자구관찰장치는 편광자를 가지는 광학현미경을 이용하였다.

  • PDF

개선한 Goldschmidt 부동소수점 역수 알고리즘 (The improved Goldschmidt floating point reciprocal algorithm)

  • 한경헌;최명용;김성기;조경연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.247-250
    • /
    • 2004
  • Goldschmidt 알고리즘에 의한 부동소수점 1.f2의 역수는 q=NK1K2....Kn (Ki=1+Aj, j=2i)이다. 본 논문에서는 N과 A 값을 1.f2의 값에 따라서 선정하고 Aj의 값이 유효자리수의 반이하 값을 가지면 연산을 종료하는 개선된 Goldschmidt 부동소수점 역수 알고리즘을 제안한다. 1.f2가 1.01012보다 작으면 N=2-1.f2, A=1.f2-1로 하며, 1.01012보다 크거나 같으면 N=2-0.lf2, A=1-0.lf2로 한다. 한편 Goldschmidt 알고리즘은 곱셈을 반복해서 수행하므로 계산 오류가 누적이 된다. 이러한 누적 오류를 감안하면 배정도실수 역수에서는 2-57, 단정도실수 역수에서는 2-28의 유효자리수까지 연산해야 한다. 따라서 Aj가 배정도실수 역수에서는 2-29, 단정도실수 역수에서는 2-14 보다 작아지면 연산을 종료한다. 본 논문에서 제안한 개선한 Goldschmidt 역수 알고리즘은 N=2-0.1f2, A=1-0.lf2로 계산하는 종래 알고리즘과 비교하여 곱셈 연산 회수가 배정도실수 역수는 22%, 단정도실수 역수는 29% 감소하였다. 본 논문의 연구 결과는 테이블을 사용하는 Goldschmidt 역수 알고리즘에 적용해서 연산 시간을 줄일 수 있다.

  • PDF

사물 인터넷 프로세서 8-bit AVR 상에서의 경량암호 TinyJAMBU 고속 최적 구현 (A High Speed Optimized Implementation of Lightweight Cryptography TinyJAMBU on Internet of Things Processor 8-Bit AVR)

  • 권혁동;엄시우;심민주;양유진;서화정
    • 정보보호학회논문지
    • /
    • 제33권2호
    • /
    • pp.183-191
    • /
    • 2023
  • 암호 알고리즘은 많은 연산 자원을 요구하며 복잡한 수학적 원리를 통해 보안성을 가진다. 하지만 대부분의 사물인터넷 기기는 가용 자원이 한정적이며 그에 따라 연산 성능이 부족하다. 따라서 연산량을 적게 사용하는 경량암호가 등장하였다. 미국 국립표준기술연구소는 경량암호 표준화 공모전을 개최하여 경량암호의 원활한 보급을 꾀했다. 공모전의 알고리즘 중 하나인 TinyJAMBU는 순열 기반의 알고리즘이다. TinyJAMBU는 키 스케줄을 거치지 않는 대신 많은 순열 연산을 반복하며, 이때 시프트 연산이 주로 사용된다. 본 논문에서는 8-bit AVR 프로세서상에서 경량암호 TinyJAMBU를 고속 최적 구현하였다. 제안 기법은 시프트 연산을 반대 방향으로 하여 시프트 횟수를 최소화한 리버스 시프트 기법과 키와 논스가 고정인 환경에서 일부 연산을 사전 연산한 기법이다. 제안 기법은 순열연산에서 최대 7.03배, TinyJAMBU 알고리즘에 적용 시 최대 5.87배 성능 향상을 보였다. 키와 논스가 고정인 환경에서는 TinyJAMBU의 알고리즘이 최대 9.19배만큼 성능이 향상되었다.

유전 알고리즘을 이용한 임베디드 프로세서 기반의 머신러닝 알고리즘에 관한 연구 (A Study on Machine Learning Algorithms based on Embedded Processors Using Genetic Algorithm)

  • 이소행;석경휴
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.417-426
    • /
    • 2024
  • 일반적으로 머신러닝을 수행하기 위해서는 딥러닝 모델에 대한 사전 지식과 경험이 필요하고, 데이터를 연산하기 위해 고성능 하드웨어와 많은 시간이 필요하게 된다. 이러한 이유로 머신러닝은 임베디드 프로세서에서 실행하기에는 많은 제약이 있다.본 논문에서는 이러한 문제를 해결하기 위해 머신러닝의 과정 중 콘볼루션 연산(Convolution operation)에 유전 알고리즘을 적용하여 선택적 콘볼루션 연산(Selective convolution operation)과 학습 방법을 제안한다. 선택적 콘볼루션 연산에서는 유전 알고리즘에 의해 추출된 픽셀에 대해서만 콘볼루션을 수행하는 방식이다. 이 방식은 유전 알고리즘에서 지정한 비율만큼 픽셀을 선택하여 연산하는 방식으로 연산량을 지정된 비율만큼 줄일 수 있다. 본 논문에서는 유전 알고리즘을 적용한 머신러닝 연산의 심화학습을 진행하여 해당 세대의 적합도가 목표치에 도달하는지 확인하고 기존 방식의 연산량과 비교한다. 적합도가 충분히 수렴할 수 있도록 세대를 반복하여 학습하고, 적합도가 높은 모델을 유전 알고리즘의 교배와 돌연변이를 통해 다음 세대의 연산에 활용한다.

GPU를 이용한 반복적 물리 광학법의 가속화에 대한 연구 (Acceleration of the Iterative Physical Optics Using Graphic Processing Unit)

  • 이용희;진희철;김경태
    • 한국전자파학회논문지
    • /
    • 제26권11호
    • /
    • pp.1012-1019
    • /
    • 2015
  • 본 논문은 공동구조의 RCS(Radar Cross Section)을 계산하는 반복적 물리 광학법(Iterative Physical Optics: IPO)의 연산속도를 가속하는 기법들을 효과적으로 적용하는 방법을 제시한다. IPO는 기존에 공동 구조 내부에서 발생하는 다중 반사 효과 계산 시 기하 광학법(Geometric Optics: GO)를 사용하는 SBR(Shooting and Bouncing Rays)과는 달리 근거리 필드 식을 활용하기 때문에 정확도가 향상된 산란 계산이 가능하다. 하지만 PO(Physical Optics)에 비해 크게 느리며, 실질적인 사용을 위해서는 계산속도의 향상을 위한 기법이 필요하다. 이를 해결하기 위해 IPO에서 특징적으로 사용되는 반복적 부분을 GPU(Graphic Processing Unit)으로 계산하고, AIPO-CR(Adaptive Iterative Physical Optics-Change Rate)으로 반복횟수를 최적화하여 효과적으로 연산속도를 향상시킨다.

입력 도메인 확장을 이용한 반복 분할 기반의 적응적 랜덤 테스팅 기법 (Adaptive Random Testing through Iterative Partitioning with Enlarged Input Domain)

  • 신승훈;박승규
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.531-540
    • /
    • 2008
  • 적응적 랜덤 테스팅 (Adaptive Random Testing, ART)은 입력 도메인 내에 테스트 케이스를 넓고 고르게 분산시키는 방법을 통해 입력 도메인 내에 존재하는 오류 패턴을 순수 랜덤 테스팅 (Random Testing, RT)보다 효율적으로 찾아내기 위한 테스트 케이스 선택 기법이다. 테스트 케이스 선택에 많은 연산량을 필요로 하는 초기 ART 기법인 거리 기반 ART (Distance-based ART, D-ART)와 제한 영역 기반 ART (Restricted Random Testing, RRT)의 개선을 위해 입력 도메인을 반복 분할하는 기법들이 제안되었고, 이 기법들은 낮은 연산량 및 성능 향상등의 효과를 가져왔다. 하지만, 입력 도메인 반복 분할 기반 기법에서도 기존 ART 기법에서 나타나는 테스트 케이스 분포 불균일 문제가 존재하고, 이는 기법의 확장성에 장애 요소로 작용한다. 따라서 본 논문에서는 반복 분할 기반 기법에서 나타나는 테스트 케이스 분포의 특성을 파악하고, 이를 적정 수준으로 제어하기 위한 입력 도메인 확장 정책을 제안하였으며, 실험을 통해 2차원 입력 도메인에서 3%, 3차원 입력 도메인에서 10% 수준의 성능 향상을 확인하였다.

부분접속 복구 가능한 반복분할 부호 (Locally Repairable Fractional Repetition Codes)

  • 남미영;김정현;송홍엽
    • 한국통신학회논문지
    • /
    • 제40권9호
    • /
    • pp.1741-1753
    • /
    • 2015
  • 본 논문에서는 MBR 재생부호인 반복분할 부호의 부분접속수를 향상시킬 수 있는 방법에 대해 소개한다. 향상된 부분접속수를 갖는 반복분할 부호를 부분접속 복구 가능한 반복분할 부호라고 한다. 부분접속 복구 가능한 반복분할 부호의 서로 다른 두 가지 생성 방법을 소개하고 각각을 다양한 성능 척도를 통해 분석한다. 새로운 부호는 반복분할 부호에 비해 낮은 부분접속수를 갖는 대신 저장 가능한 최대 파일 크기나 필요한 저장 노드의 수에서 손해가 발생한다. 다른 부분접속 복구 부호와 비교해 향상된 안정성을 갖고 또한 복구시 심벌 연산이 필요 없는 단순전달 복구를 수행함으로써 복구 복잡도를 낮출 수 있다.

표준 MPI 환경에서의 무정지형 선형 시스템 해법 (A Fault-Tolerant Linear System Solver in a Standard MPI Environment)

  • 박필성
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.23-34
    • /
    • 2005
  • 대규모 병렬 연산에 있어서, 계산 노드 혹은 통신 네트워크의 장애는 연산 실패로 끝나 계산자원이 낭비된다. 이를 해결하는 무정지형 MPI 라이브러리들이 제안되어 있으나 이들은 MPI 표준을 따르지 않아 이식성의 문제가 있다. 본 논문에서는 응용 프로그램의 수준에서 비동기 연산과 표준 MPI 함수만 사용하여 이식성의 문제를 해결하고 장애 복구 메커니즘을 단순화하며 수렴속도를 높이는 무정지형 선형 시스템의 해법을 제안한다.

  • PDF

영상 특징점 추출 기반의 임베디드 객체인식 시스템 (An Embedded Object Recognition System based on SIFT Algorithm)

  • 이수현;박찬일;강철호;이혁준;이형근;정용진
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.102-103
    • /
    • 2008
  • 본 논문에서는 임베디드 환경을 위한 객체인식 시스템의 구조 및 실시간 처리를 위한 객체인식기의 하드웨어설계를 제안한다. 제안된 구조는 SIFT(Scale Invariant Feature Transform)를 이용하여 사물의 특징점을 추출하고, 비교하여 객체를 인식한다. SIFT는 영상의 크기 및 회전 등의 변화에 적응이 뛰어난 알고리즘이지만, 복잡한 연산이 반복되어 연산시간이 많은 특성상 임베디드 환경에서 실시간 처리가 어렵다. 따라서 해당 알고리즘을 하프웨어로 설계하여, 임베디드 사물인식 시스템에 적용한다. 사물인식의 빠른 처리와 인식영역의 구분을 위해 JSEG 영상분할 알고리즘을 활용하며, SIFT 특징점 추출 연산과 병렬 실행이 가능하도록 SIFT와 함께 하드웨어 구조로 설계한다.

  • PDF