• Title/Summary/Keyword: fast computation

검색결과 748건 처리시간 0.026초

GPU를 이용한 DWT 및 JPEG2000의 고속 연산 (Fast Computation of DWT and JPEG2000 using GPU)

  • 이만희;박인규;원석진;조성대
    • 대한전자공학회논문지SP
    • /
    • 제44권6호
    • /
    • pp.9-15
    • /
    • 2007
  • 본 논문에서는 GPU (Graphics Processing Unit)를 이용하여 JPEG2000 정지영상 압축 알고리즘의 DWT (Discrete Wavelet Transform) 연산을 고속으로 수행하기 위한 효율적인 구조와 방법을 제안한다. DWT 연산은 JPEG2000에서 EBCOT (embedded block coding with optimized truncation)과 더불어 많은 계산 량을 소모하는 부분이기 때문에, 본 논문에서는 DWT 알고리즘을 GPU의 화소 쉐이더에서 고속으로 수행하기 위하여 Render-To-Texture (RTT)를 활용한 구조를 설계하였다. 실제 구현을 통해 비슷한 등급의 CPU에서의 처리에 비해 DWT 자체는 10배 이상의 수행 속도의 향상을, 기존의 JPEG2000 참조 소프트웨어인 JasPer의 DWT를 대치하였을 때 2$\sim$16배의 수행 속도의 향상을 보였으며 해상도가 증가할수록 향상 폭이 크다. 본 논문에서 제시된 프레임 버퍼 객체(Frame Buffer Object)를 이용한 render-to-texture 수행 구조는 GPU 기반 영상처리의 기본 틀을 제공하며, 이를 응용하여 일반적인 영상처리와 컴퓨터 비전 처리를 GPU 상에서 고속 수행할 수 있다.

PALM시스템의 구조와 네트웍 성능 (The PALM system : Architecture and Network Performance)

  • 김석일
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.105-113
    • /
    • 1994
  • 본 논문에서는 HCH(m,p)에 기반을 둔 PALM 시스템의 구조와 네트웍의 성능을 연구 하였다. HCH(m,p)는 하나의 CP를 중심으로 p개의 AP를 연결하여 클러스터를 구성하고, 클러스터를 m-p 차원의 하이퍼큐브로 연결한 소결합 다중프로세서 시스템이다. 본 시스템에서는 AP와 CP 및 CP와 CP간을 DPR로 연결하여 워드단위의 통신이 가능하도록 구성하여 빠르고 안정된 메세지 전송을 가능하게 하였다. PALM 시스템에 사용된 네트 웍은 여러 가지 HCH 네트웍 중에서 시스템에 포함되는 AP의 갯수가 최대이나 CP 및 링크(또는 DPR)의 합이 최소인 최적 HCH(m,2) 네트웍이다. 본 논문에서는 HCH(2,2) 인 실험시스템을 구성하고 네트웍의 통신성능을 측정하였으며, PALM시스템의 작은 통 신/연산비는 메세지 통신형 다중프로세서 시스템에서도 화인 그레인(fine grain) 병렬성을 다룰 수 있음을 보인다.

  • PDF

A Dual Modeling Method for a Real-Time Palpation Simulator

  • Kim, Sang-Youn;Park, Se-Kil;Park, Jin-Ah
    • Journal of Information Processing Systems
    • /
    • 제8권1호
    • /
    • pp.55-66
    • /
    • 2012
  • This paper presents a dual modeling method that simulates the graphic and haptic behavior of a volumetric deformable object and conveys the behavior to a human operator. Although conventional modeling methods (a mass-spring model and a finite element method) are suitable for the real-time computation of an object's deformation, it is not easy to compute the haptic behavior of a volumetric deformable object with the conventional modeling method in real-time (within a 1kHz) due to a computational burden. Previously, we proposed a fast volume haptic rendering method based on the S-chain model that can compute the deformation of a volumetric non-rigid object and its haptic feedback in real-time. When the S-chain model represents the object, the haptic feeling is realistic, whereas the graphical results of the deformed shape look linear. In order to improve the graphic and haptic behavior at the same time, we propose a dual modeling framework in which a volumetric haptic model and a surface graphical model coexist. In order to inspect the graphic and haptic behavior of objects represented by the proposed dual model, experiments are conducted with volumetric objects consisting of about 20,000 nodes at a haptic update rate of 1000Hz and a graphic update rate of 30Hz. We also conduct human factor studies to show that the haptic and graphic behavior from our model is realistic. Our experiments verify that our model provides a realistic haptic and graphic feeling to users in real-time.

강성계수의 전달을 이용한 골조구조물의 정적해석 (Static Analysis of Frame Structures Using Transfer of Stiffness Coefficient)

  • 최명수;문덕홍;정하용
    • 한국전산구조공학회논문집
    • /
    • 제16권1호
    • /
    • pp.9-18
    • /
    • 2003
  • 파양한 구조물의 정적해석에서 매트릭스구조해석법은 가상 폭넓게 사용되고 있는 강력한 해석기법이다. 그러나 이 방법으로 많은 수의 자유도를 갖는 구조물을 정확히 해석하기 위해서는 많은 계산 메모리와 빠른 처리 능력을 갖춘 고성능 컴퓨터를 필요로하는 취약점이 있다. 따라서 매트릭스구조해석법으로 많은 수의 자유노를 갖는 구조물을 퍼스널 컴퓨터 상에서 정확히 해석하기에는 곤란한 경우가 많다. 매트릭스구조해석법치 이러한 취약점을 극복하기 위하여, 저자들은 전달강성계수법을 제안한다. 전달강성계수법은 해석대상 구조물에 대한 강성계수의 전달에 기본 개념을 두고 있으am로 퍼스널 컴퓨터에 매우 적합한 해석기법이다. 본 논문에서는 골조추조물에 대한 정적해석 알고리듬을 전달강성계수법으로 정식화한다. 그리고 전달강성계수법, NASTRAN, 매트릭스구조해석법 그리고 해석해에 의한 계산 결과들의 비교를 통해 전달강성계수법의 유효성을 확인한다.

다중칩 모듈 설계를 위한 Gridless 배선기 (A Gridless Area Router for Multichip Module Design)

  • 이태선;임종석
    • 전자공학회논문지C
    • /
    • 제36C권9호
    • /
    • pp.28-43
    • /
    • 1999
  • 본 논문에서는 다중칩 모듈 설계를 위한 gridless 배선 방법을 제안한다. 제안하는 배선 방법에서는 배선상태를 표현하기 위해 배선격자 (grid) 대신 corner stitching 자료구조를 사용함으로써 핀들의 위치 제한을 없애고, 네트의 특성에 맞는 와이어 폭을 선택할 수 있다. 또한 비아보다 그 폭이 작은 와이어들로 인해 남는 공간을 다른 네트의 배선에 이용하여 배선영역을 최대한 낭비 없이 이용한다. 배선격자를 사용하지 않는 배선방법은 배선격자를 기반으로 하는 배선 방법에 배해 복잡하고 어렵다. 더구나 다중칩 모듈과 같이 배선 영역이 크고 배선층의 갯수가 많은 배선 문제일 경우 배선 속도는 배선 가능성을 결정하는 중요한 요소가 된다. 그러나 제안하는 배선 방법은 빠른 속도가 증명된 SEGRA의 배선 알고리즘과 효율적인 자료구조의 특성을 적절히 이용함으로써 배선격자를 기반으로 하는 배선 방법 보다 빠른 속도와 그리 떨어지지 않는 배선 결과를 보인다.

  • PDF

가상스튜디오 구현을 위한 실시간 카메라 추적 (Real-Time Camera Tracking for Virtual Stud)

  • 박성우;서용덕;홍기상
    • 전자공학회논문지S
    • /
    • 제36S권7호
    • /
    • pp.90-103
    • /
    • 1999
  • 가상스튜디오의 구현을 위해서 카메라의 움직임을 실시간으로 알아내는 것이 필수적이다. 기존의 가상스튜디어 구현에 사용되는 기계적인 방법을 이용한 카메라의 움직임 추적하는 방법에서 나타나는 단점들을 해결하기 위해 본 논문에서는 카메라로부터 얻어진 영상을 이용해 컴퓨터비전 기술을 응용하여 실시간으로 카메라변수들을 알아내기 위한 전체적인 알고리듬을 제안하고 실제 구현을 위한 시스템의 구성 방법에 대해 다룬다. 본 연구에서는 실시간 카메라변수 추출을 위해 영상에서 특징점을 자동으로 추출하고 인식하기 위한 방법과, 카메라 캘리브레이션 과정에서 렌즈의 왜곡특성 계산에 따른 계산량 문제를 해결하기 위한 방법을 제안한다.

  • PDF

랜덤 포레스트를 이용한 심전도 기반 생체 인증 (ECG-based Biometric Authentication Using Random Forest)

  • 김정균;이강복;홍상기
    • 전자공학회논문지
    • /
    • 제54권6호
    • /
    • pp.100-105
    • /
    • 2017
  • 본 논문은 개인 인증 알고리즘에 관한 것으로 심전도를 이용한 생체 인증 방식은 특정 보정기준점을 추출하는 방법과 그렇지 않은 방법으로 분류할 수 있으며 본 논문에서 제안하는 방법은 특정 보정기준점을 추출하지 않는 방법으로 이산 코사인 변환과 랜덤 포레스트 분류기를 사용하였다. 심전도 신호는 R-Peak 점을 기준으로 단일 심박으로 나누었으며 각 심박의 특징 추출을 위해 이산 코사인 변환을 적용하였다. 이산 코사인 변환 계수는 정보가 저주파에 집중되는 특성이 있으므로 초기 저주파에 해당하는 40까지 값을 특징으로 랜덤 포레스트 분류기를 구성하였다. 랜덤 포레스트는 의사결정 트리의 앙상블 분류기로 결정 트리를 기본으로 하고 있으므로 빠른 학습 속도와 많은 양의 데이터 처리 능력, 다양한 클래스를 분류할 수 있어 실생활에 적용 가능하며 무엇보다 ID의 승인과 거절을 위한 임계값을 분류기 내부에서 조절할 수 있어 오 분류에 강건한 알고리즘을 구성할 수 있다. 18개의 심전도 파일로 구성된 MIT-BIT Normal Sinus Rhythm 데이터베이스를 선정하여 성능을 평가하였으며 99.99%의 심전도 인식률을 보였다.

이동최소제곱 유한차분법을 이용한 계면경계를 갖는 이종재료의 열전달문제 해석 (Heat Transfer Analysis of Bi-Material Problem with Interfacial Boundary Using Moving Least Squares Finite Difference Method)

  • 윤영철;김도완
    • 한국전산구조공학회논문집
    • /
    • 제20권6호
    • /
    • pp.779-787
    • /
    • 2007
  • 본 연구는 계면경계에서 특이성을 갖는 이종재료 열전달문제를 효율적으로 해석할 수 있는 이동최소제곱 유한차분법을 제시한다 이동최소제곱 유한차분법은 격자망(grid)없이 절점만으로 이동최소제곱법을 이용하여 Taylor 다항식을 구성하고 차분식을 만들어 미분방정식을 직접 푼다. 초평면함수 개념에 근거한 쐐기함수를 이동최소제곱 센스(sense)로 근사식에 매입하여 쐐기거동과 미분 점프에 따른 계면경계 특성을 효과적으로 묘사하고 고속으로 미분을 근사하는 이동최소제곱 유한차분법의 강점을 발휘하도록 했다. 서로 다른 열전달계수를 갖는 이종재료 열전도문제 해석을 통해 이동최소제곱 유한차분법이 계면경계문제에서도 뛰어난 계산효율성과 해의 정확성을 확보할 수 있음을 보였다.

실시간 노심출력분포 합성에서의 축방향 경계조건 영향평가 (Evaluation of Axial Buckling Effect in On-Line Axial Power Shape Synthesis)

  • In, Wang-Kee;Kim, Joon-Sung;Yoon, Tae-Young;Auh, Geun-Sun;Kim, Hee-Cheol
    • Nuclear Engineering and Technology
    • /
    • 제25권1호
    • /
    • pp.148-153
    • /
    • 1993
  • 노내계측기 신호로부터 노심평균 축방향 출력분포를 얻기위해 5차의 Fourier series 합성법이 노심감시계통 (COLSS)에 이용되고 있다. 이 방법은 단순하고 계산이 빠르기 때문에 실시간 계산에 이용된다. 이러한 합성법은 Fourier series 차수 및 축방향 경계조건에 따라 정확도가 달라진다. 노심감시계통에서는 현재 축방향으로 5개의 고정 노내계측기를 이용하고 있으므로 5차의 Fourier series 합성법을 적용하고 있다. 따라서 축방향 경계조건은 노심감시계통의 계산결과에 미치는 영향을 평가하여 적절히 결정되어야 한다. 본 논문에서는 영광 3,4호기를 대상으로 4가지의 축방향 경계조건 (axial buckling=0.75, 0.8, 0.9와 1.0)을 살펴보았다. 최적의 축방향 경계조건을 결정하기 위해 노심평균 축방향 출력분포와 운전여유도를 각 경우에 대해 비교하였다. 비교결과 최적의 축방향 경계조건은 axial buckling이 0.9인 것을 알 수 있었다.

  • PDF

최대 데이터율을 지원하는 DAB 수신기용 Viterbi 디코더의 설계 (Full Data-rate Viterbi Decoder for DAB Receiver)

  • 김효원;구오석;류주현;윤대희
    • 한국통신학회논문지
    • /
    • 제27권6C호
    • /
    • pp.601-609
    • /
    • 2002
  • DAB 시스템이 요구하는 최대 출력 데이터율을 지원하는 Viterbi 디코더의 효율적인 구조를 제안하고 설계하였다. DAB 수신기에서 Viterbi 디코더는 매우 많은 연산량을 수행하는 부분이며, 이를 위하여 고속으로 동작하는 전용 하드웨어로 설계하는 것이 바람직하다. 본 논문에서는 시스템의 전력소모를 줄이기 위하여 puncturing을 사용하는 Viterbi 디코더에 SST 방식을 적용하였다. 설계면적을 감소시키기 위하여 puncturing vector table을 수정.재배치하여 hardwired logic으로 구현하였으며, 새로운 re-scaling 방식을 제안하여 패스 메트릭을 저장하는데 필요한 워드길이을 최적화시켰다. 제안된 re-scaling 방식은 패스 메트릭을 re-scaling하는데 필요한 연산량을 크게 감소시킨다. 또한 브랜치 메트릭을 계산하는데 필요한 연산량을 줄이기 위하여 미리 계산된 값을 사용하는 방식을 제안하였다. 설계된 Viterbi 디코더는 삼성 0.35$\mu$ 표준셀 라이브러리를 이용하여 합성하였으며, 작은 면적을 차지하고 전력 소모가 적음을 확인하였다.