• 제목/요약/키워드: graphics hardware

검색결과 198건 처리시간 0.031초

점 샘플링 방법을 이용한 하드웨어 기반 가시성 전처리 알고리즘 (Hardware-based Visibility Preprocessing using a Point Sampling Method)

  • 김재호;원광연
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제8권2호
    • /
    • pp.9-14
    • /
    • 2002
  • 복잡한 도시환경의 경우, 주어진 셀에 대해 적은 수의 오브젝트들만이 보이므로 이러한 가상환경에 대해 가시성 검사를 수행하는 것은 렌더링 성능을 향상시키기 위한 매우 효과적인 방법 중 하나이다. 본 논문에서는 주어진 공간에 대해 잠재적으로 보이는 오브젝트들을 효과적으로 계산하는 새로운 가시성 전처리 방법론을 제안한다. 제안하는 방법론은 일반적인 3차원의 폴리곤 모델을 다루며, 다수의 occluder에 의해 가려지는 오브젝트들을 다룰 수 있다. 제안하는 접근법은 볼륨 가시성 문제를 점 가시성 문제들로 나누고, 점가시성 문제를 하드웨어 가시성 큐어리, 특히 HP_occlusion_test 와 NV_occlusion_query를 이용하여 계산한다. 본 논문에서는 다양한 대규모 가상환경에 대한 실험을 수행하고 이를 통해 본 논문에서 제안하는 알고리즘의 성능을 보인다.

  • PDF

그래픽 하드웨어를 이용한 분자용 보로노이 다이어그램 계산 (Voronoi Diagram Computation for a Molecule Using Graphics Hardware)

  • 이정은;백낙훈;김구진
    • 정보처리학회논문지A
    • /
    • 제19A권4호
    • /
    • pp.169-174
    • /
    • 2012
  • 본 논문에서는 주어진 단백질 분자에 대해 3차원 보로노이 다이어그램을 계산하는 알고리즘을 제안한다. 분자는 반경이 서로 다른 구의 집합으로 표현되며, 각 구의 반경은 원자의 반데르바스 (van der Waals) 반경에 대응한다. 보로노이 다이어그램은 3차원 공간을 복셀(voxel)의 집합으로 분할한 뒤, 보로노이 다이어그램을 포함하는 복셀을 보수적으로 추출함으로써 구성된다. 분자의 계층적 성질을 이용하여 BVH(bounding volume hierarchy)를 구성하고, CUDA 프로그래밍을 통하여 그래픽 하드웨어 가속을 활용함으로써 계산 시간 효율성을 높인다. 공간이 최대 $2^{24}$개의 복셀로 분할될 경우, 단일 코어 CPU로 구현하는 알고리즘에 비해 계산 속도가 323배 가량 향상 되었다.

3D 텍스쳐 매핑 하드웨어 하에서 법선 벡터 블렌딩을 이용한 가속화된 볼륨 렌더링 (Accelerated Volume Rendering based on 3D Texture Mapping Hardware using Normal Blending)

  • 윤성의;신영길
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권4호
    • /
    • pp.181-187
    • /
    • 2001
  • 본 논문에서는 3D 텍스쳐 매핑 하드웨어(texture mapping hardware)하에서 OpenGL를 이용하여 빠른 추출(classification) 및 음영처리(shading)를 가능하게 하는 직접 볼륨 렌더링(direct volume rendering) 방법을 제안한다. 추출과정을 위해 lookup table을 통해서 볼륨 데이터의 밀도값(density)으로부터 불투명도(opacity)값을 얻어내고, 법선 벡터 블렌딩(normal blending)방법을 제안하여 볼륨 크기에 상관없이 최종 이미지에서만 음영 처리 연산을 수행한다. 본 논문에서 제시된 볼륨 렌더링의 전과정이 그래픽스 하드웨어(graphics hardware)에서 이뤄지면, 음영처리 연산의 복잡도 감소로 인하여 상호 대화적인 볼륨 렌더링이 가능하다.

  • PDF

KAWS: Coordinate Kernel-Aware Warp Scheduling and Warp Sharing Mechanism for Advanced GPUs

  • Vo, Viet Tan;Kim, Cheol Hong
    • Journal of Information Processing Systems
    • /
    • 제17권6호
    • /
    • pp.1157-1169
    • /
    • 2021
  • Modern graphics processor unit (GPU) architectures offer significant hardware resource enhancements for parallel computing. However, without software optimization, GPUs continuously exhibit hardware resource underutilization. In this paper, we indicate the need to alter different warp scheduler schemes during different kernel execution periods to improve resource utilization. Existing warp schedulers cannot be aware of the kernel progress to provide an effective scheduling policy. In addition, we identified the potential for improving resource utilization for multiple-warp-scheduler GPUs by sharing stalling warps with selected warp schedulers. To address the efficiency issue of the present GPU, we coordinated the kernel-aware warp scheduler and warp sharing mechanism (KAWS). The proposed warp scheduler acknowledges the execution progress of the running kernel to adapt to a more effective scheduling policy when the kernel progress attains a point of resource underutilization. Meanwhile, the warp-sharing mechanism distributes stalling warps to different warp schedulers wherein the execution pipeline unit is ready. Our design achieves performance that is on an average higher than that of the traditional warp scheduler by 7.97% and employs marginal additional hardware overhead.

각 연산을 이용한 효과적인 범프 매핑 하드웨어 구조 설계 (Design of an Effective Bump Mapping Hardware Architecture Using Angular Operation)

  • 이승기;박우찬;김상덕;한탁돈
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권11호
    • /
    • pp.663-674
    • /
    • 2003
  • 범프 매핑은 복잡한 모델링 과정 없이 기하 매핑을 통하여 땅콩 껍질의 돌기와 같은 객체 표면의 세밀한 부분을 표현해내는 기법이다. 그러나 이 기법은 법선 벡터 쉐이딩과 같은 상당한 복잡도를 가진 연산을 픽셀 당 처리해줘야 하므로, 이의 하드웨어 구현은 상당한 비용을 필요로 한다. 본 논문에서는 극 좌표계를 이용한 새로운 범프 매핑 알고리즘 및 하드웨어 구조를 제안한다. 이는 참조 공간으로의 변환을 위한 새로운 벡터 회전 방식과 연산이 최소화된 조명 계산 방식을 갖는 구조로, 기존의 구조에 비해 범프 매핑을 효과적으로 수행한다. 결과적으로 제안하는 구조는 범프 매핑에 필요한 연산 및 하드웨어를 상당량 줄였다.

실시간 단일 패스 가시성 선별 기법 기반의 3차원 그래픽스 가속기 구조 (A Real-time Single-Pass Visibility Culling Method Based on a 3D Graphics Accelerator Architecture)

  • 주지원;최문희;김신덕
    • 정보처리학회논문지A
    • /
    • 제15A권1호
    • /
    • pp.1-8
    • /
    • 2008
  • 차폐 선별 기법은 가시성 선별 기법 중 하나로, 다른 물체에 가려서 보이지 않는 물체나 삼각형에 대한 연산을 제외시키는 기법이다. 이는 불필요한 연산량을 효과적으로 줄이기 ??문에 복잡한 장면을 실시간으로 처리하기 위해 필수적이다. 하지만 기존의 차폐 선별 기법인 차폐 쿼리는 가시성 검사를 위해 물체 데이터를 하드웨어에 두 번 보내야 하며, 이로 인해 불필요한 연산이 발생한다. 또 다른 기존 하드웨어 차폐 선별 기법인 VCBP는 빠른 수행을 하지만 바운딩 볼륨의 검사를 지원하지 않으며 응용으로 그 결과를 보내는 기능이 없다. 본 논문에서는 이러한 문제점들을 해결한 가시성 선별과 렌더링을 한 번에 처리할 수 있는 단일 패스 알고리즘을 제안한다. 제안하는 기법은 일차적으로 3차원 가속 하드웨어의 초기 단계인 삼각형을 픽셀로 나누는 래스터화 단계에서 캐쉬를 이용하여 빠르게 가시성 선별을 수행한다. 그와 동시에 가시성 선별 과정에서는 각 프리미티브의 가시성 정보를 응용단계로 보낸다. 응용단계에서는 하드웨어로부터 받은 이전 프레임의 가시성 정보와 공간계층 트리 구조를 이용하여 하드웨어로 보내는 보이지 않는 프리미티브를 위한 데이터량을 획기적으로 줄인다. 제안하는 구조는 하드웨어 차폐 선별 쿼리를 이용하는 기존 이중 패스 알고리즘 중 S&W 대비 최대 44%, 최저 14%의 성능이 향상되었고, CHC 대비 최대 25%, 최저 17%의 성능이 향상되었다.

영상기반 렌더링 기법을 이용한 실시간 그림자 생성 (Real-Time Shadow Generation Using Image-Based Rendering Technique)

  • 이중연;임인성
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제7권1호
    • /
    • pp.27-35
    • /
    • 2001
  • 3D 컴퓨터 그래픽에서 그림자는 매우 중요한 요소이다. 그림자가 없으면 물체와 물체간의 정확한 위치를 파악하기가 어렵기 때문이다. 즉, 물체가 다른 물체에 바로 붙어있는지 조금 떨어져 있는지를 알아내기가 곤란한 것이다. 이러한 그림자의 중요성에도 불구하고 현존하는 3D 가속 하드웨어들은 그림자의 생성을 전혀 지원하지 못하고 있다. 또한, 이것을 보완하기 위해 많은 그림자 생성 알고리즘들이 제시되었지만 모두 그 한계가 명확하였다. 많은 그림자 생성 기법 중 텍스춰 하드웨어를 이용한 그림자 지도 기법은 광원과 물체가 고정되어 있을 경우 매우 빠른 속도로 그림자를 생성시킬 수 있지만 광원이나 물체가 움직일 경우에는 속도가 느려지게 된다. 본 논문에서는 그림자 지도 기법에 영상기반 렌더링 기법을 적용하여 실시간으로 그림자를 생성하고자 하였다. 본 논문의 기법은 매우 많은 메모리를 필요로 하기 때문에 데이터를 적당히 샘플링하여 웨이블릿 기반 압축 기법으로 압축하였고, 그림자를 생성할 때는 가장 가까이 저장된 그림자들을 2차원 보간하였다.

  • PDF

연속 영상 기반 실시간 객체 분할 (Real-Time Object Segmentation in Image Sequences)

  • 강의선;유승훈
    • 정보처리학회논문지B
    • /
    • 제18B권4호
    • /
    • pp.173-180
    • /
    • 2011
  • 본 논문은 GPU(Graphics Processing Unit) 에서 CUDA(Compute Unified Device Architecture)를 사용하여 실시간으로 객체를 분할하는 방법을 소개한다. 최근에 감시 시스템, 오브젝트 추적, 모션 분석 등의 많은 응용 프로그램들은 실시간 처리가 요구된다. 이러한 단계의 선행부분인 객체 분할 기법은 기존 CPU 기반의 시스템으로는 실시간 처리에 제약이 발생한다. NVIDIA에서는 Parallel Processing for General Computation 을 위해 그래픽 하드웨어 제약을 개선한 CUDA platform을 제공하고 있다. 본 논문에서는 객체 추출 단계에 대표적인 적응적 가우시안 혼합 배경 모델링(Adaptive Gaussian Mixture Background Modeling) 알고리즘과 Classification 기법으로 사용되는 CCL (Connected Component Labeling) 알고리즘을 적용하였다. 본 논문은 2.4GHz를 갖는 Core2 Quad 프로세서와 비교하여 평가하였고 그 결과 3~4배 이상의 성능향상을 확인할 수 있었다.

모바일 멀티미디어의 효율적 처리를 위한 재구성형 병렬 프로세서의 구조 (A Reconfigurable Parallel Processor for Efficient Processing of Mobile Multimedia)

  • 유세훈;김기철;양일석;노태문
    • 대한전자공학회논문지SD
    • /
    • 제44권10호
    • /
    • pp.23-32
    • /
    • 2007
  • 본 논문에서는 3D 그래픽스(graphics), H.264/H.263/MPEG-4 같은 동영상 코덱, JPEG 혹은 JPEG2000 같은 정지영상 코덱, MP3 같은 오디오 코덱 등 다양한 멀티미디어 관련 기술을 효율적으로 구현하기 위한 재구성형 병렬 프로세서 구조가 제안된다. 제안된 구조는 메모리와 프로세서를 직접 연결하여 메모리 접근 시간과 소비전력를 감소시키고, 3D 그래픽스 처리 과정중 기하 단계의 부동소수점 연산을 지원한다. 또한 분할 SIMD(partitioned SIMD) 방식을 사용하여 하드웨어 비용을 줄이고, 명령어(instruction)의 조건부 실행(conditional execution)을 지원하여 알고리듬 개발이 용이하다.

스케일러블 그래픽스 알고리즘 (Scalable Graphics Algorithms)

  • 윤성의
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 3부
    • /
    • pp.224-224
    • /
    • 2008
  • Recent advances in model acquisition, computer-aided design, and simulation technologies have resulted in massive databases of complex geometric data occupying multiple gigabytes and even terabytes. In various graphics/geometric applications, the major performance bottleneck is typically in accessing these massive geometric data due to the high complexity of such massive geometric data sets. However, there has been a consistent lower growth rate of data access speed compared to that of computational processing speed. Moreover, recent multi-core architectures aggravate this phenomenon. Therefore, it is expected that the current architecture improvement does not offer the solution to the problem of dealing with ever growing massive geometric data, especially in the case of using commodity hardware. In this tutorial, I will focus on two orthogonal approaches--multi-resolution and cache-coherent layout techniques--to design scalable graphics/geometric algorithms. First, I will discuss multi-resolution techniques that reduce the amount of data necessary for performing geometric methods within an error bound. Second, I will explain cache-coherent layouts that improve the cache utilization of runtime geometric applications. I have applied these two techniques into rendering, collision detection, and iso-surface extractions and, thereby, have been able to achieve significant performance improvement. I will show live demonstrations of view-dependent rendering and collision detection between massive models consisting of tens of millions of triangles on a laptop during the talk.

  • PDF