통합 검색 | Korea Science

고성능 H.264/AVC 복호기를 위한 병렬 역양자화 및 역변환 구조 설계 (Design of Parallel Inverse Quantization and Inverse Transform Architecture for High Performance H.264/AVC Decoder)

정홍균;류광기
- 한국산학기술학회:학술대회논문집
- /
- 한국산학기술학회 2011년도 추계학술논문집 2부
- /
- pp.434-437
- /
- 2011
본 논문에서는 H.264/AVC 복호기의 성능을 향상시키기 위해 병렬 역양자화 구조와 역변환 구조를 제안한다. 제안하는 역양자화 구조는 공통 연산기를 사용하여 계산 복잡도를 감소시키고, 4개의 공통연산기를 사용하여 역양자화 수행 사이클 수를 1 사이클로 감소시킨다. 제안하는 역변환 구조는 4개의 변환 연산기를 사용하여 역변환 연산을 수행하는데 2 사이클이 소요된다. 또한 제안하는 구조는 역양자화 연산과 수평 역변환 연산을 동시에 수행하는 병렬 구조를 채택하여 역양자화 및 역변환 수행 사이클 수를 2 사이클로 감소시킨다. 제안하는 구조를 Magnachip 0.18um CMOS 공정 라이브러리를 이용하여 합성한 결과 1.5MHz의 동작 주파수에서 게이트 수는 14,173이고, 표준 참조 소프트웨어 JM 9.4에서 추출한 데이터를 이용하여 성능을 측정한 결과 제안하는 구조의 수행 사이클 수가 기존 구조 대비 38.74% 향상되었다.
PDF

XML 데이타베이스 변경 연산의 즉시 부분 검증 메카니즘 (Immediate and Partial Validation Mechanism for Update Operations in XML Databases)

김상균;이규철
- 한국정보과학회논문지:데이타베이스
- /
- 제30권5호
- /
- pp.540-551
- /
- 2003
최근에 데이타베이스에 저장된 XML문서의 변경에 대한 여러 연구들이 수행되었다[1-3］. 이 연구들은 우선 변경 연산들을 정의하고 이 연산들을 수행할 때 발생하는 의미적 문제들을 해결하는 방법을 제안하였다. 이러한 연구들에서는 변경 연산을 수행한 후에 검증을 수행하기 때문에 여러 가지 충돌 문제가 발생한다. 이러한 충돌문제를 해결하기 위해서는 XML데이타베이스 시스템이 변경 연산을 수행하기 전에 이 연산이 DTD에 따르는지 즉시 검증할 수 있어야 한다. 또한 지금까지의 연구들은 변경된 XML문서를 검증할 때 변경된 부분을 검증하지 않고 문서 전체를 검증한다. 따라서 많은 응용프로그램들이 XML문서를 변경한다면 이 연산에 대한 검증 과정 때문에 심각한 성능 저하를 가져올 것이다. 이 연구에서는 이 두 가지 문제점을 해결하기 위한 방법을 제안한다. 우선 DTD정보를 추출하여 데이타베이스에 저장하고 데이타베이스에 저장된 XML문서를 변경할 때 이 저장된 DTD정보를 이용하여 변경 연산의 유효성을 검증함으로써 항상 유효한 XML문서를 데이타베이스에 유지하도록 한다. 이를 위해 유효성 검증을 변경 연산이 수행되기 전에 즉시 수행하고 검증 범위 또한 변경된 부분으로 한정시키는 메카니즘을 고안하였다.
PDF KSCI

재구성 가능한 DCT/DWT 프로세서 설계 (The Reconfigurable Processor Design of DCT/DWT)

김영진;이현수
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
- /
- pp.730-732
- /
- 2005
최근 이미지 압축, 워터마킹 또는 스케일러블 비디오 코딩 분야에서 DCT와 DWT 연산을 선택적으로 사용하거나, 혼합하여 사용하는 경우가 늘어나고 있다. 이러한 두개의 연산을 사용하는 방법은 소프트웨어적인 프로그램을 사용하거나 하드웨어를 따로 구현하여 사용하였다. 본 연구에서는 하나의 모듈로 두개의 연산을 수행할 수 있는 재구성 하드웨어를 제안한다. 또한 DCT와 DWT연산에 있어서, 가장 많은 연산을 수행하는 부분은 계수(Coefficient)값과 입력 값의 내적 연산(Inner Product)을 수행하는 것인데, 이 내적연산을 하는데 있어서 곱셈기를 사용하지 않는 분산연산을 사용함으로써 연산의 복잡도를 줄이고, 하드웨어의 속도를 빠르게 하였다. 실험 환경은 Altera FPGA를 사용한 Excalibur_ARM (EPXA10F1020Cl) 보드를 이용하여 구현하였으며, 동작속도는 47.85MHz이다.
PDF

고속 회로를 위한 비트 단위의 연산 최적화 (Optimal Bit-level Arithmetic Optimization for High-Speed Circuits)

엄준형;김영태;김태환;여준기;홍성백
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
- /
- pp.21-23
- /
- 2000
고속 회로 합성에 있어서, Wallace 트리 스타일은 연산을 위한 가장 효율적인 수행방식의 하나로 인식되어 졌다. 그러나, 이러한 방법은 빠른 곱셈기의 수행이나 여러 가지 연산수행에 있어, 입력 시그널을 고려하지 않은 일반적인 구조로 수행되어졌다. 본 논문은 연산기에 있어서 이러한 제한점을 극복하는 문제를 다룬다. 우리는 캐리-세이브 방법을 덧셈, 뺄셈, 곱셈이 혼합되어 일T는 일반적인 연산 회로에 적용한다. 그 결과 효율적인 회로를 생성하며, 시그널들이 임의의 도달시간에 대해 회로의 도달시간을 최적화 한다. 또한, 우리는 최적 지연시간의 캐리-세이브 가산회로를 생성하는 효율적인 알고리즘을 제안하였다. 우리는 이러한 최적화 방법을 여러 고속 디지털 필터에 적용시켜 보았고 이는 기존의 비트 단위가 아닌 캐리-세이브 수행방법보다 5%에서 30%사이의 수행시간 향상을 가져왔다.
PDF

SSE 명령어 기반 실시간 처리 가우시안 필터 연구 (A Study on Real-time Processing of The Gaussian Filter using The SSE Instruction Set.)

강필중;이종수
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2006년도 추계학술발표대회
- /
- pp.89-92
- /
- 2006
본 논문은 SIFT(Scale Invariant Feature Transform)알고리즘의 실시간처리 응용프로그램 작성기법을 기술하고 있는데, 단일 프로세서에서 병렬처리 기능을 지원하도록 설계된 SSE 명령어 집합을 사용하여 가우시안 convolution을 구현하고 있다. SIFT알고리즘의 Scale-space를 생성하는 과정에 수행되는 가우시안 Convolution은 연산시간이 과도하게 요구된다.[1] 2D의 가우시안 필터가 영상을 구성하는 모든 셀과 1:1로 연산을 수행하므로 이 연산의 소요시간은 영상의 가로, 세로 길이 그리고 필터의 크기에 비례하여 결정된다. 이 논문에서 제안하는 방법은 연산을 위해 CPU 내부로 한번 읽어 들인 픽셀자료에 대해 가능한 모든 연산을 SSE 명령어 집합을 사용하여 수행함으로써 병렬 연산에 의한 연산시간 절감과 메모리 접근 최소화를 통한 입출력시간 절감을 통해 전체 연산시간을 단축 하였다.
PDF

모듈라 멱승 연산의 빠른 수행을 위한 새로운 모듈라 곱셈 알고리즘 (A New Modular Multiplication Algorithm for Fast Modular Exponentiation)

홍성민;오상엽;윤현수
- 한국정보보호학회:학술대회논문집
- /
- 한국정보보호학회 1995년도 종합학술발표회논문집
- /
- pp.173-182
- /
- 1995
모듈라 멱승(modular exponentiation) 연산은 암호학에서 기본적이고 중요한 연산이다. 그러나, 이는 다정도 정수(multiple precision integer)들을 다루기 때문에 그 연산시 간이 무척 많이 걸리므로 이를 단축시킬 필요가 있다. 모듈라 멱승 연산은 모듈라 곱셈(modular multiplication)의 반복으로서, 전체 연산시간을 단축시키기 위해서는 모듈라 곱셈의 수행시간을 단축시키거나, 모듈라 곱셈의 반복횟수를 줄이는 것이 필요하다. 본 논문에서는 모듈라 곱셈을 빠르게 수행하기 위한 알고리즘 두 개를 제안한다. 하나는 서로 다른 두 수의 모듈라 곱셈 알고리즘이고, 다른 하나는 모듈라 제곱을 빠르게 수행하는 알고리즘이다. 이 둘은 기존의 모듈라 곱셈 알고리즘들에 비해 각각 절반과, l/3가량의 단정도 곱셈(single-precision multiplication)만을 필요로 한다. 실제로 PC상에서 구현한 결과 각각 100%와 30%의 속도향상을 보인다.
PDF

테이블의 모든 레코드 삭제의 효율적 수행 (An Efficient Scheme of Deleting All Records of a Table)

차명훈;박준현;박영철
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
- /
- pp.262-264
- /
- 2001
테이블의 모든 레코드들을 삭제하는 연산과 그 연산을 취소하는 작업은 그 수행에 드는 비용이 매우 크다. 상용 데이타베이스 관리 시스템들은 테이블의 모든 레코드들을 삭제하는 연산을 신속하게 수행하기 위하여 TRUNCATE TABLE문을 제공한다. 그 문을 수행하면 레코드들을 개별적으로 삭제하지 않고 그 화일에 할당된 디스크 공간을 반환하며 그 삭제 연산을 독립된 트랜잭션으로 처리하여 즉시 완료시킨다. 따라서, 그 연산은 일단 실행되고 나면 복귀가 불가능하다. 본 논문은 DELETE문을 WHERE절 없이 사용하는 경우에 대하여 모든 레코드들을 삭제하고자 하는 화일과 동일한 구조를 가지는 하나의 빈(empty)화일을 생성하고 기존 화일과 새로이 생성한 화일 간에 화일 설명자의 내용과 디스크 공간을 교체만 후, 새로이 생성한 화일 자체를 삭제함으로써 로깅 부담을 줄이면서 신속히 모든 레코드들을 삭제하고 그 연산을 복귀할 수 있도록 하는 기법을 제시한다.
PDF

고성능 HEVC 복호기를 위한 화면내 예측기의 효율적인 하드웨어 설계 (An Efficient Hardware Design of Intra Predictor for High Performance HEVC Decoder)

정홍균;강석민;류광기
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2012년도 추계학술발표대회
- /
- pp.668-671
- /
- 2012
본 논문에서는 차세대 비디오 압축 표준인 HEVC(High Efficiency Video Coding) 복호기의 연산량과 하드웨어 면적을 감소시키기 위하여 화면내 예측 하드웨어 구조를 제안한다. 제안하는 하드웨어 구조는 공통 수식에 대한 연산을 공유하는 공유 연산기를 사용하여 연산량 및 연산기 개수를 감소시키고, $4{\times}4$ PU와 $64{\times}64$ PU의 필터링 수행 여부에 대한 연산을 수행하지 않고 나머지 PU에 대해서는 LUT를 이용하여 연산을 수행하기 때문에 연산량 및 연산 시간을 감소시킨다. 또한 하나의 공통 연산기만을 사용하여 예측 픽셀을 생성하기 때문에 하드웨어 면적이 감소한다. 제안하는 구조를 TSMC 0.18um 공정을 이용하여 합성한 결과 최대 동작 주파수는 100MHz이고, 게이트 수는 140,697이다. $4{\times}4$ PU를 기준으로 제안하는 구조의 처리 사이클 수는 11 사이클로 기존 구조 대비 54% 감소하였고, 16개 참조 픽셀의 필터링 처리를 기준으로 제안하는 구조의 덧셈 연산기 개수는 37개로 표준 draft 6에 비해 22.9% 감소하였다.
https://doi.org/10.3745/PKIPS.y2012m11a.668 인용 PDF

높은 자릿수 나눗셈 연산기에서의 영역변환상수를 위한 검색테이블 설계 및 구현 (Design and Implementation of Lok-up Table for Pre-scaling in Very-High Radix Divider)

이병석;송문식;이정아
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
- /
- pp.3-5
- /
- 1999
나눗셈 알고리즘은 다른 덧셈이나 곱셈 알고리즘에 비해 복잡하고, 수행 빈도수가 적다는 이유로 그동안 고속 나눗셈의 하드웨어 연구는 활발하지 않았다. 그러나 멀티미디어의 발전 및 고성능의 그래픽 랜더링을 위한 보다 빠른 부동소수점연산기(FPU)가 필요하게 되었으며, 이에 따라서 고속의 나눗셈 연산기의 필요성이 증가하게 되었다. 특히, 전체의 수행 시간 향상을 위해서라도 고속 나눗셈 연산기의 중용성은 더욱 부각되고 있다. 그러나 고속 나눗셈 연산기는 연산 속도와 크기라는 서로 상반되는 요소를 가지고 있다. 즉, 연산 속도가 빠르면 크기는 늘어나고, 크기를 줄이면 연산 속도는 늦어지게 된다. 본 논문은 높은 자릿수(Very-High Radix) 나눗셈 알고리즘에서 영역변환상수를 구하는 방법으로 연산이 아닌 검색테이블(Look-up Table)을 이용한다. 그리고 검색테이블의 크기를 줄이는 방법으로 영역변환상수의 범위 분석 및 캐리 저장형을 이용한 검색테이블 분할 방법을 이용하였다. 전체적으로는 영역변환상수를 구하는 연산주기가 필요없게 되므로 나눗셈 연산기의 영역 크기의 변화가 적으면서 연산 속도는 빨라졌음을 알 수 있다.
PDF

IEEE754-2008을 위한 고속 부동소수점 연산기 설계 (Floating Point Unit Design for the IEEE754-2008)

황진하;김현필;박상수;이용석
- 대한전자공학회논문지SD
- /
- 제48권10호
- /
- pp.82-90
- /
- 2011
스마트폰을 비롯한 각종 매체가 발전함에 따라 우수한 성능의 부동소수점 연산기 필요성이 점차 증가하고 있다. 이러한 요구에 따라 이 논문에서는 기본이 되는 덧셈/뺄셈 뿐 아니라 기존보다 향상된 곱셈과 비교, 변환 연산을 수행하는 고속의 단정도/배정도 부동소수점 연산기의 설계를 제안한다. 가장 많이 사용하는 덧셈/뺄셈 연산기는 반올림 연산 시에 병렬화 작업을 수행함으로서 최적화를 구현하였다. 그래픽 연산 등에서 복잡한 수의 행렬연산이 많이 사용되는데, 이를 빠르게 계산하기 위해서 곱셈기 대신에 곱셈 후 덧셈을 수행하는 단일 곱셈-누산기(MAF)를 설계하였다. 분기 명령은 프로그램에서 자주 사용하는 명령으로 비교 연산에 의해 분기 조건이 결정되는데 이 논문에서는 파이프라인이 완료되기 전에 수행된 비교연산의 결과값을 바이패싱함으로서 연산의 수행시간을 감소시켰다. 또한 IEEE754-2008 표준에 추가된 변환연산을 포함하여 설계하였다. RTL 설계를 검증하기 위하여 연산기마다 40만개의 테스트 벡터를 가중치 무작위 방식으로 선별하여 시뮬레이션을 수행하였다. 검증 후에는 삼성 저전력 45nm 공정에서 합성을 수행하여 600MHz의 동작 주파수를 만족하였다. 또한 개선된 FPU와 기존의 FPU와 비교하여 면적의 감소를 확인하였다.
PDF KSCI

검색결과 2,643건 처리시간 0.044초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)