• 제목/요약/키워드: Complexity of Computation

검색결과 609건 처리시간 0.024초

H.264 표준의 가변 움직임 블록을 위한 고속 움직임 탐색 기법 (Fast Motion Estimation for Variable Motion Block Size in H.264 Standard)

  • 최웅일;전병우
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.209-220
    • /
    • 2004
  • 기존 비디오 표준과 비교해 볼 때, H.264 비디오 표준이 갖는 중요한 두 가지 특징으로는 높은 부호화 효율과 네트워크 친화성을 들 수 있다. 그러나 이러한 중요한 특성에도 불구하고 H.264 표준은 구현시 요구되는 메모리 대역폭과 연산량의 복잡도가 높기 때문에 실시간 응용에 적용하는데 어려움이 있다. H.264 부호화 기술 가운데 특히 복수 참조 영상을 이용한 다양한 블록 단위 움직임 탐색은 높은 부호화 효율을 갖도록 하는 핵심 요소지만 최적의 움직임 벡터를 찾기 위해 다양한 블록 단위 조합의 모든 경우에 대하여 SAD (Sum of Absolute Difference)를 구해야 하므로 상당한 계산량을 요구한다. 그러므로 본 논문에서는 움직임 탐색의 연산량을 줄이기 위해 정수화소 움직임 탐색 및 부화소 움직임 탐색을 위한 고속 알고리즘을 제안한다. 정수화소 단위 움직임 탐색의 경우, 기존의 고속 움직임 탐색 기법은 H.264의 다양한 블록 단위 움직임 탐색 구조에 그대로 적용할 경우 효과적이지 못하기 때문에 본 논문에서는 종래 다이아몬드 탐색 기반 방법을 계층적 블록 구조에 맞게 개선한 적응적 움직임 탐색 기법을 제안하도록 한다. 또한 부화소 단위 움직임 탐색을 위해서는 움직임 벡터의 통계적 특성을 이용하여 예측벡터를 중심으로 한 다이아몬드 탐색 기반 고속 알고리즘을 제안한다.

멀티 세그먼트 곱셈 기반 저비용 타원곡선 암호 프로세서 (Low-Cost Elliptic Curve Cryptography Processor Based On Multi-Segment Multiplication)

  • 이동호
    • 대한전자공학회논문지SD
    • /
    • 제42권8호
    • /
    • pp.15-26
    • /
    • 2005
  • 본 논문에서는 효율적인 $GF(2^m)$ 멀티 세그먼트 곱셈 연산 구조를 제안하고 제안된 구조의 타원곡선 암호 프로세서 설계 응용을 연구한다. 제안된 멀티 세그먼트 곱셈 연산 구조는 유한체 크기 m에 비하여 아주 작은 워드 조합 곱셈기를 이용하여 부분곱을 계산하고 거의 모든 내부 버스는 워드 크기이며 m 비트 멀티플렉서와 m 비트 레지스터를 하나만 사용한다. 따라서 조합 곱셈기의 워드 크기 w를 줄이고 세그먼트 수 k를 크게 하여 전체 데이터패스 자원 사용량이 최소화할 수 있다. 제안된 곱셈기는 디지트 시리얼 곱셈기로 구현된 ECC 프로세서와 비교할 때 이론적으로 자원 효율성이 우수하다 암호 프로세서의 자원 사용량은 구현에 필요한 기본 하드웨어 요소 수뿐만 아니라 구성 요소들의 배치와 연결 상태에도 의존한다. 제안된 프로세서의 실질적인 자원사용량을 디지트 시리얼 곱셈기 기반 암호 프로세서와 비교하기 위하여 두 종류의 프로세서를 FPGA 상에 구현하였다. 실험 결과로 제안된 멀티 세그먼트 곱셈기 기반 EU 프로세서는 유사한 성능을 가지는 디지트 시리얼 곱셈기 기반 EU 프로세서보다 자원 사용면에서 2배 정도 우수함을 보였다.

고정 카메라에서의 시공간적 경계 정보를 이용한 이동 객체 윤곽선 검출 방법 (Moving Object Contour Detection Using Spatio-Temporal Edge with a Fixed Camera)

  • 곽재호;김회율
    • 방송공학회논문지
    • /
    • 제15권4호
    • /
    • pp.474-486
    • /
    • 2010
  • 본 논문에서는 시간적, 공간적 경계 정보를 이용한 이동 객체의 윤곽선 검출 방법을 제안한다. 일반적으로 이동 객체의 경우 객체의 윤곽선(contour)을 구성하는 경계(edge) 픽셀에서 시간 축과 공간 축을 중심으로 큰 변화량(gradient)을 가진다. 따라서 시간 축과 공간 축을 중심으로 변화량이 큰 경계 픽셀을 구하면 이동 객체의 윤곽선을 검출할 수 있다. 본 논문에서는 임의의 픽셀에 대하여 시간 축을 중심으로 한 경계 정보를 구하기 위해 Temporal Edge라는 새로운 형태의 변화량 계산 방법을 제안한다. Temporal Edge는 시간 t와, t-2에서 입력된 두 그레이 스케일 영상의 차를 시간 축을 기준으로 x방향, y방향으로 Sobel Mask를 적용하여 구한다. 검출된 Temporal Edge를 이용하여 이동 객체의 윤곽선이 존재하는 후보 영역을 검출하고, 검출된 후보 영역을 중심으로 공간적 경계 정보를 구하여 이동 객체의 대강의 윤곽선을 검출 한다. 후처리 과정에서 검출된 대강의 윤곽선으로부터 배경 경계와 노이즈 픽셀을 제거한 후 최종적으로 이동 객체의 윤곽선을 검출한다. 제안한 방법은 기존의 배경 차 방법과는 다르게 별도의 배경 영상을 만들지 않기 때문에 배경 차 방법이 가지는 문제점을 극복하였으며, 빠른 연산 속도로 실시간 적용이 가능하다. 실험을 통하여 야간에도 강인한 윤곽선을 검출할 수 있음을 확인하였고, 엔트로피 방법과의 비교를 통해 제안하는 방법의 우수성을 보였다.

JPEG2000 정지영상을 위한 블록 에너지 기반 적응적 이산 웨이블릿 변환 (Adaptive Discrete Wavelet Transform Based on Block Energy for JPEG2000 Still Images)

  • 김대원
    • 융합신호처리학회논문지
    • /
    • 제8권1호
    • /
    • pp.22-31
    • /
    • 2007
  • 본 논문에서는 웨이블릿 변환에 기반을 둔 JPEG2000 정지영상의 압축 시도 시 웨이블릿 변환을 decomposition 하는 레벨과 이를 구성하는 블록의 활성도를 내포하는 에너지에 기반 하여 그 양에 따라 적응적으로 계수 변환 후 복원시 효율적 자원 관리를 통하여 복잡도를 감소시키고 계산량을 줄이는 적응식 DWT 변환 기법을 제안하였다. 수많은 멀티미디어 응용 분야 또는 서비스 중의 하나인 디지털 카메라의 핵심 분야를 차지하고 있는 정지영상 압축 분야에서의 최첨단 기술을 꼽으라면 단연 JPEG2000 표준을 이용한 압축, 전송의 응용 분야이다. JPEG2000 기반의 정지영상압축 전송 표준의 핵심을 이루고 있는 웨이블릿 변환은 기존의 JPEG 표준에 사용된 이산 코사인 변환의 약점인, 복원 시 나타나는 블록킹 문제를 해결한 대안이다. 적응식 DWT 변환을 거친 정지영상이 복원된 후 일반적인 과정의 웨이블릿 변환 후 복원된 영상간의 MSE(Mean Square Error), PSNR(Peak Signal to Noise Ratio), 0의 계수의 개수 등을 비교하여 본 연구에서 제안된 에너지 기반의 적응적 웨이블릿 변환의 우수성을 연산 속도를 계산함으로써 검증하였다.

  • PDF

Vector-radix 2차원 고속 DCT의 VLSI 구현을 위한 효율적인 어레이 알고리듬 (An Efficient Array Algorithm for VLSI Implementation of Vector-radix 2-D Fast Discrete Cosine Transform)

  • 신경욱;전흥우;강용섬
    • 한국통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.1970-1982
    • /
    • 1993
  • 본 논문에서는 vector-radix 2차원 고속 DCT(VR-FCT)를 VLSI 병렬계산하기 위한 효율적인 어레이 알고리듬을 제안하고, 이를 집적회로로 구현하기 위한 회로를 설계하였다. VR-FCT 알고리듬의 버터플라이 연산부분을 2차원 어레이에 매핑하여 이를 병렬 및 파이프라인 처리함을써 VR-FCT 알고리듬의 고속성과 2차원 어레이의 병렬성 및 국부통신 특성을 동시에 이용할 수 있다는 특징을 갖는다. 제안된 구현방식은 RCA 방식과는 달리 transposition 메모리가 필요치 않으며, 2차원 어레이의 구조적인 규칙성, 모듈성 및 국부연결성 등에 의해 회로설계 시간의 단축, 설계검증 및 설계변경등이 용이하여 VLSI 구현에 매우 적합하다. 연산회로는 곱셈기를 사용하기않고 가산기만으로 설계하였으며, 2의 보수연산 대신에 Canonic-Signed Didit(CSD) 코드를 사용함으로써 약 30%의 가산횟수를 줄일 수 있었다. 제안된 방법의 DCT 연산과정을 C언어로 모델링하여 회로의 유한 레지스터 길이에 대한 연산정밀도를 분석하였다. 제안된 어레이 알고리듬의 시간성능은 (N*N) 2차원 DCT에 대해 O(N+Nnzd-log2N)의 시간 복잡도를 갖는다. 시뮬레이션 결과고부터 Nnzp=4이고 50MHz 클럭이 사용되는 경우, (8*8) DCT계산에 약 0.88 sec가 소요괴며, 약 72*10 pixels/sec의 연산성능이 예상된다.

  • PDF

224-비트 소수체 타원곡선을 지원하는 공개키 암호 프로세서의 저면적 구현 (A small-area implementation of public-key cryptographic processor for 224-bit elliptic curves over prime field)

  • 박병관;신경욱
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1083-1091
    • /
    • 2017
  • NIST 표준에 정의된 소수체(prime field) GF(p) 상의 224-비트 타원곡선을 지원하는 타원곡선 암호 프로세서를 설계하였다. 타원곡선 암호의 핵심 연산인 스칼라 점 곱셈을 수정형 Montgomery ladder 알고리듬을 이용하여 구현하였다. 점 덧셈과 점 두배 연산은 투영(projective) 좌표계를 이용하여 연산량이 많은 나눗셈 연산을 제거하였으며, 소수체 상의 덧셈, 뺄셈, 곱셈, 제곱 연산만으로 구현하였다. 스칼라 점 곱셈의 최종 결과값은 다시 아핀(affine) 좌표계로 변환되어 출력하며, 이때 사용되는 역원 연산은 Fermat's little theorem을 이용하여 구현하였다. 설계된 ECC 프로세서를 Virtex5 FPGA로 구현하여 정상 동작함을 확인하였다. $0.18{\mu}m$공정의 CMOS 셀 라이브러리로 합성한 결과 10 MHz의 동작 주파수에서 2.7-Kbit RAM과 27,739 GE로 구현되었고, 최대 71 MHz의 동작 주파수를 갖는다. 스칼라 점 곱셈에 1,326,985 클록 사이클이 소요되며, 최대 동작 주파수에서 18.7 msec의 시간이 소요된다.

SAN을 이용한 제한된 버퍼 크기를 갖는 출력큐잉 ATM 스위치 성능평가 (Performance Evaluation of Output Queueing ATM Switch with Finite Buffer Using Stochastic Activity Networks)

  • 장경수;신호진;신동렬
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2484-2496
    • /
    • 2000
  • 네트워크 연결을 위한 고속 스위치는 계속해서 발달하여 왔으며, 스위치가 필요한 성능을 내는가를 여러 조건으로 분석하는 것은 중요한 일이다. 하지만, 복잡한 구조를 가진 시스템을 모델링하여 그 성능을 측정하는 것은 쉬운 일이 아니다. 큐잉이론을 이용한 모델링은 큰 상태 공간을 고려해야 됨은 물론이고 성능평가에 있어서도 복잡한 계산과정을 수행해야 하지만, SAN(Stochastic Activity Networks)에 의한 모델링과 성능평가는 그에 비해 간단하다는 장점이 있다. 본 논문의 목적은 출력포트에 큐를 갖는 고속 ATM 스위치를 확장된 SPN(Stochastic Petri Net)인 SAN을 이용해 모델링하고, 셀 도착 과정은 실제 트래픽과 유사한 특징을 가지고 있는 MMPP(Markov Modulated Poisson Process)로 모델링하여 그 성능을 평가하는데 있다. MMPP 모델을 이용한 버스티 트래픽을 고겨한 성능측정과 아울러 SAN의 장점을 이용한 확장이 용이한 스위치 모델을 보이고자 한다. 제한된 버퍼 크기를 갖는 출력 큐잉 ATM 스위치에 도착하은 셀은 포아송 도착 과정에서는 정확히 표현할 수 없는 버스티 특징을 표현할 수 있어 좀더 실제 트래픽에 가까운 MMPP로 모델링한다. SAN 모델은 UltraSAN 소프트웨어 패키지를 이용해 대기행렬의크기, 지연시간 그리고 셀 손실률에 대한 성능을 측정한다.

  • PDF

혼합 도달성 분석을 이용한 상태 불변식의 단순화 (Simplification of State Invariant with Mixed Reachability Analysis)

  • 권기현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.212-218
    • /
    • 2003
  • 상태 불변식은 도달 가능한 모든 상태에서 만족되는 속성이다. 불변식은 복잡한 소프트웨어 시스템의 분석과 이해에 사용될 뿐만 아니라 안전성, 궁극성, 일관성 등과 같은 시스템 검증에도 사용된다. 이와 같은 이유로 인해서, 유한 상태 기계 모델로부터 상태 불변식을 추출하는 연구가 활발히 진행되고 있다. 상태 불변식을 생성하는 기존 연구에서는 도달 가능한 상태가 모두 고려됐다. 따라서 생성된 상태 불변식은 길고 복잡해서, 사용자가 이해하기 어려웠다. 본 논문에서는 '어떻게 상태 불변식을 단순화 할 것인가\ulcorner` 란 질문에 대한 답을 보인다. 상태 불변식의 복잡성은 고려되어진 상태의 크기에 강하게 좌우된다. 고려된 상태들이 작으면 작을수록, 상태 불변식의 길이는 짧다. 단순한 상태 불변식을 생성하기 위해서는, 전체 상태 공간보다는 관심 있는 특정 부분(즉 범위)에 집중해야 한다. 관심 있는 범위를 표현하기 위하여 본 논문에서는 CTL 논리를 사용한다. CTL로 범위가 표현되면, 혼합 도달성 분석을 이용하여 범위 내에 속하는 상태들을 찾는다. 명백히, 이 방법으로 계산된 상태 집합은 도달 가능한 모든 상태의 부분 집합이다. 따라서, 더 약하지만 더 이해력 있는 상태 불변식을 얻는다.

클러터밀도 추정 방법 개선을 통한 LM-IPDAF의 표적 추적 성능 향상 연구 (Research on improvement of target tracking performance of LM-IPDAF through improvement of clutter density estimation method)

  • 유인제;박성제
    • 한국산학기술학회논문지
    • /
    • 제18권5호
    • /
    • pp.99-110
    • /
    • 2017
  • 레이다를 이용한 다수 표적의 상태 추정을 통해 추적 성능을 향상시키는 문제는 중요하다. 클러터 환경에서 추적 필터를 이용하여 다수 표적 추적 시 트랙과 측정치 간의 결합사건이 발생하며 개수가 증가함에 따라 결합사건은 기하급수적으로 증가한다. 이러한 환경에서 다수 표적 추적 필터 설계 시 고려해야할 문제는 첫째, 신속한 거짓트랙 제거 및 표적트랙 확정을 통하여 오경보율 최소화하고, 이를 통해 FTD(False Track Discrimination) 성능을 높인다. 둘째, 다수의 트랙이 측정치를 공유하는 결합사건 발생시 효율적으로 각각의 측정치를 트랙에 할당함으로써 트랙 유지성능을 향상시키는 것이다. 두 가지 고려사항을 통해 단일 표적 추적 자료결합 기법을 다수 표적 추적 필터로 확장하여 사용하며, 대표적인 알고리듬으로 JIPDAF(Joint Integrated Probabilistic Data Association Filter)와 LM-IPDAF(Linear Multi-target IPDAF)가 있다. 본 논문에서는 측정치 할당 시 생기는 수 많은 가설들에 대한 확률적 평가를 하지 않음으로써 측정치와 트랙의 개수에 따라 비선형으로 연산량이 증가하지 않으며, 클러터밀도 추정을 통해 트랙을 쇄신하는 트랙존재확률 기반의 LM-IPDAF 알고리듬을 소개한다. 그리고 LM-IPDAF의 트랙존재확률 산출 시 필요한 클러터밀도 추정 방법을 개선함으로써 연산량을 효과적으로 감소시킬 수 있는 방법을 제안하고 시뮬레이션을 통해 기존의 알고리듬과 비교, 분석하여 성능을 검증하였다. 그 결과, 위치 RMSE, Confirmed True Track 측면에서는 동일한 성능을 내면서 시뮬레이션 처리 시간을 약 20% 감소시킬 수 있었다.

라만 스펙트럼 고속 검색 알고리즘 (The Fast Search Algorithm for Raman Spectrum)

  • 고대영;백성준;박준규;서유경;서성일
    • 한국산학기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.3378-3384
    • /
    • 2015
  • 최근에 라만스펙트럼에 대한 고속 검색 방법은 많은 관심을 받아왔다. 지금까지 가장 간단하고 널리 사용되는 방법은 주어진 스펙트럼과 데이터베이스 스펙트라 사이의 유클리드 거리를 계산하고 비교하는 방법이다. 하지만 고차원 데이터의 속성으로 검색의 문제는 그리 간단하지 않다. 가장 큰 문제점중의 하나는 검색 방법에 있어서 연산량이 많아 계산 시간이 너무 오래 걸린다는 것이다. 이러한 문제점을 극복하기 위해, 코드워드의 MPS(Mean Pyramids Search)와 PDS(Partial Distortion Search)을 사용하는 알고리즘이 현재 이미지 코딩 분야에서 고속 검색 알고리즘으로 널리 사용되고 있다. 하지만 이 방법은 1차원 데이터의 경우에는 적합하지 않다. 본 논문에서 우리는 라만 스펙트럼 데이터에 적합한 3가지 새로운 방법의 고속 검색 알고리즘을 제안한다. 이 방법은 벡터의 두 개의 주요한 특징으로 평균과 분산을 사용하여 후보가 될 수 없는 많은 코드워드를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 실험은 1DMPS+PDS와 비교하여 1DMPS Sort+PDS는 42.8%, 1DMPS Sort+PDS는 48.6%, 1DMPS Sort with Sorted Variance+PDS는 55.2%의 성능향상을 보였다. 실험결과는 제안된 알고리즘이 고속 검색에 적합함을 확인시켜 준다.