• 제목/요약/키워드: 연산시간 감소

검색결과 401건 처리시간 0.033초

데이터베이스 클러스터의 가용성 향상을 위한 온라인 확장 기법 (An Online Scaling Method for Improving the Availability of a Database Cluster)

  • 이충호;장용일;배해영
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.935-948
    • /
    • 2003
  • 온라인 확장 기법은 비공유 데이터베이스 클러스터에서 온라인 상태에서 새로운 노드를 추가하고 데이터 재조직을 수행함으로써 작업 부하를 분산시키거나 전체 트랜잭션 처리량을 늘리기 위한 기법이다. 그러나, 기존의 온라인 확장 기법에서는 과부하 상태의 노드에 데이터 전송과 일관성 유지에 대한 추가적인 부하가 발생됨으로써, 전체 시스템의 응답속도가 느려지고 노드의 결함 발생 가능성을 감소시키는 문제점이 있다. 본 논문에서는 비공유 데이터베이스 클러스터에서 높은 가용성을 위한 데이터 확장 기법으 제안한다. 제안딘 온라인 확장 기법은 확장 연산 수행 중에 발생되는 노드의 추가적 부하를 병렬 데이터 전송과정과 복제본의 완성 과정을 통해 분산시키고, 확장 중에 발생한 결함에 대해서 효율적인 회복을 수행함으로써 데이터베이스 클러스터의 가용성을 향상시킨다. 즉, 원본 노드의 데이터를 각 복제분이 저장된 노드들에서 동시에 전송함으로써 데이터 전송을 병렬화하고, 전송 영역을 서로 분배하여 원본 노드의 데이터을 각 복제본이 저장된 노드들에서 동시에 전송함으로써 데이터 전송을 병렬화사고, 전송영역ㅇ 버로 분배하여 원본 노드의 부하와 다른 트랜잭선에 대한 간섭을 줄인다. 또한, 온라인 확장 기법에서의 노드 결함에 대해 빠른 회복을 수행한다. 본 논문에서는 성능평가를 통해 제안 기법이 기존 기법에 비해 노드의 부하를 감소시켜 결함 발생 가능성을 낮추고, 온라인 확장 연산에 대한 회복 처리 시간을 단축하여 데이터베이스 클러스터의 가용성을 향상시킴을 보인다.

빔요소와 Rigid 링크를 이용한 수평하중에 대한 말뚝 거동 3차원 유한요소해석 (3D Finite Element Analysis of Lateral Loaded Pile using Beam and Rigid Link)

  • 박두희;박종배;김상연;박용부
    • 토지주택연구
    • /
    • 제4권3호
    • /
    • pp.271-277
    • /
    • 2013
  • 수평하중을 받는 말뚝의 거동 예측에는 일반적으로 비선형 p-y 곡선을 이용한 BNWF(Beam on Nonlinear Winkler Foundation) 해석법이 주로 사용된다. BNWF 해석법은 다양한 사례를 통하여 정확성이 입증된 반면 군말뚝의 경우 p-multiplier를 사용해야 하는 단점을 가지고 있다. 이와같은 단점은 유한요소 또는 차분법의 사용으로 해결할 수 있다. 이 방법 적용 시, 지반과 말뚝은 솔리드 요소로 모델링된다. 하지만, 말뚝을 솔리드 요소로 모사하게 되면 회전 자유도가 없어 정확성이 감소하며 이를 극복하기 위해서는 요소의 크기를 현저하게 감소시켜야 하지만 3D 해석에서 요소 수의 증가는 막대한 연산시간이 요구되므로 적용에 문제가 있다. 본 연구에서는 이와 같은 단점을 극복하는 빔요소와 Rigid 링크를 이용한 말뚝 모델링 방법을 구축하였으며 이의 적용성을 현장시험결과와 BNWF의 비교를 통하여 검증하였다. 사용된 해석 프로그램은 지진공학용으로 개발된 OpenSees이다. 비교 결과, 빔요소와 Rigid 링크를 이용한 방법은 비교적 정확하게 현장시험결과와 일치하는 것을 확인하였다. 추후 이 방법은 군말뚝의 해석에 효과적으로 사용될 수 있을 것으로 판단된다.

신경회로망을 이용한 새로운 충돌 경고 시스템 (Novel Collision Warning System using Neural Networks)

  • 김범성;최배훈;안종현;황재호;김은태
    • 한국지능시스템학회논문지
    • /
    • 제24권4호
    • /
    • pp.392-397
    • /
    • 2014
  • 최근 지능형 자동차의 능동적 안전 기술에 많은 관심이 집중되고 있다. 능동적 안전 기술은 시스템이 운전자에게 위험 상황을 경고 하거나 교통사고를 회피하는 방향으로 차량 제어의 일부를 도와주어 운전자의 부주의 및 과실로 발생하는 교통사고의 발생 가능성을 감소시킨다. 이러한 능동적 안전 기술을 구현하기 위해서는 주변의 환경 정보를 정확하게 인식하고 분석하는 것이 필수적인데, 주변의 차량과 자차량간의 충돌 위험도를 판단하는 것도 그중 하나이다. 하지만 충돌이 발생하기 이전에 충돌 가능성을 판단하는 것은 일반적인 방법으로는 불가능하기 때문에 몬테 카를로 모의실험을 통하여 이를 해결한다. 하지만 몬테 카를로 모의실험은 연산시간이 길기 때문에 실시간으로 동작해야하는 충돌 경고 시스템에는 적합하지 않다. 이때 신경회로망을 이용하면 이러한 문제를 해결 할 수 있으며, 본 논문에서는 자차량과 주변 차량간의 상태정보에서 충돌에 영향을 주는 충돌 특징점을 추출하여 신경회로망의 성능을 높이는 방법을 제안한다. 제안된 알고리즘은 시나리오 기반으로 Tass사의 PreScan을 이용하여 생성된 충돌 실험데이터에 적용하여 성능을 평가한다.

2차원 구조 대비 3차원 구조 GPU의 메모리 접근 효율성 분석 (Memory Delay Comparison between 2D GPU and 3D GPU)

  • 전형규;안진우;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.1-11
    • /
    • 2012
  • 최근 반도체 공정 기술이 발달함에 따라 단일 프로세서에 적재되는 코어의 수가 크게 증가하였고, 이는 프로세서의 성능을 급격하게 향상시키는 계기가 되고 있다. 특히, 많은 수의 코어들로 구성된 GPU(Graphics Processing Unit)는 대규모 병렬성을 활용하여 연산처리 성능을 크게 향상시키고 있다. 하지만, 주 메모리 접근 지연시간이 GPU의 성능 향상을 제약하는 심각한 요인 중 하나로 제기되는 상황이다. 본 논문에서는 3차원 구조를 통한 GPU의 메모리 접근 효율성 향상에 대한 정량적 분석과 3차원 구조 적용 시 발생 가능한 문제점에 대하여 살펴보고자 한다. 일반적으로 메모리 명령어 비율은 평균적으로 전체 명령어의 30%를 차지하고, 메모리 명령어 중에서 주 메모리 접근과 관련된 글로벌/로컬 메모리 명령어가 차지하는 비율 또한 평균 60%이므로 주 메모리로의 접근 지연시간을 크게 감소시키는 3차원 구조를 적용한다면 GPU의 성능 또한 크게 향상시킬 수 있을 것으로 예상된다. 그러나 본 논문에서 수행한 실험 결과에 따르면 메모리 병목현상으로 인해 3차원 구조 GPU의 성능이 2차원 구조 GPU에 비해 크게 향상되지는 않음을 확인할 수 있다. 분석 결과에 의하면, 3차원 구조 GPU는 2차원 구조 GPU와 비교하여 메모리 병목현상으로 인한 성능 지연이 최대 245%까지 증가하기 때문이다. 본 논문에서는 3차원 구조 GPU를 대상으로 메모리 접근의 효율성과 문제점을 함께 분석함으로써, 3차원 GPU에 적합한 메모리 구조를 설계하기 위한 가이드라인을 제시하고자 한다.

직접해법 기반의 FETI 알고리즘의 개선 (Further Improvement of Direct Solution-based FETI Algorithm)

  • 강승훈;공두현;신상준
    • 한국전산구조공학회논문집
    • /
    • 제35권5호
    • /
    • pp.249-257
    • /
    • 2022
  • 본 논문은 직접해법 기반 FETI 알고리즘의 개선 방안을 제시하였다. 개선 대상은 FETI-local로, 해당 알고리즘은 국부 Lagrange 승수를 통해 부영역 간 경계 문제를 정의한다. 부영역 경계 강성 및 하중 계산 단계의 경우, 전체 역행렬 계산 등 과도한 비용을 요구했던 기존 알고리즘을 Boolean 행렬 특성을 활용한 선택적 역행렬 성분 계산으로 개선하였다. 전역 경계 행렬식 계산 단계의 경우, 기존 단일 프로세서 연산을 다중 프론탈 기법 기반 병렬 연산으로 대체하였다. 제시된 FETI-local 알고리즘의 성능 개선은 64만 자유도 수치 예제를 통해 검증되었으며, 기존 대비 최대 97.8%의 계산 시간 감소가 달성되었다. 또한, 기존 대비 안정적이고 개선된 확장성이 가속 지표를 통해 확인되었다. 추가로, 432만 자유도의 대용량 계산 성능 비교가 제시된 알고리즘과 상용 프로그램인 ANSYS 간에 수행되었다. 그 결과, 계산 시간 측면에선 ANSYS가 우수하였으나, 프로세서 수에 따른 가속 성능 증가율 측면에선 제시된 알고리즘이 우수한 것이 확인되었다.

An Efficient Multiplexer-based AB2 Multiplier Using Redundant Basis over Finite Fields

  • Kim, Keewon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.13-19
    • /
    • 2020
  • 본 논문에서는 유한체상의 여분 기저(redundant basis)를 사용한 모듈러 AB2 곱셈을 수행하는 멀티플렉서(multiplexer) 기반의 기법을 제안한다. 그리고 제안한 기법을 사용하여 효율적인 멀티플렉서 기반의 세미-시스톨릭(semi-systolic) AB2 곱셈기를 제안한다. 모듈러 AB2 곱셈기의 셀 내부의 연산을 멀티플렉서로 처리할 수 있는 수식을 유도한다. 멀티플렉서를 이용하여 셀을 구현하여, 셀의 지연시간을 감소시킨다. 기존의 구조들과 비교하면, 제안한 AB2 곱셈기는 Liu 등, Lee 등, Ting 등, 및 Kim-Kim의 곱셈기들의 AT 복잡도보다 약 80.9%, 61.8%, 61.8%, 및 9.5% 가량이 감소되었다. 따라서, 제안한 곱셈기는 VLSI(very large scale integration) 구현에 적합하며 다양한 응용에 쉽게 적용할 수 있다.

계층적 메모리 구성에 따른 GPU 성능 분석 (Analysis on the GPU Performance according to Hierarchical Memory Organization)

  • 최홍준;김종면;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제14권3호
    • /
    • pp.22-32
    • /
    • 2014
  • 병렬 연산에 최적화된 하드웨어를 가진 GPU를 그래픽스 작업 이외에 범용 작업에 활용하고자, 최근에 GPGPU 기술이 큰 관심을 받고 있다. GPU와 같은 대용량 병렬처리 장치에서는 메모리 시스템이 성능에 큰 영향을 미치게 된다. GPU에서는 메모리 시스템의 효율성을 향상시키기 위하여, 메모리 대역폭 사용률을 감소시켜주는 계층적 메모리 구조와 메모리를 요청하는 트랜잭션을 줄여주는 메모리 주소 접합과 메모리 요청 합병 등의 기술들을 사용한다. 본 논문에서는 메모리 시스템 효율성 향상을 위해 활용되는 기법들이 GPU 성능에 미치는 영향을 정량적으로 평가하고 분석하기 위해, 다양한 메모리 구조에 대한 실험을 수행한다. 실험 결과에 따르면, 캐쉬를 사용하지 않는 경우에 비해 8KB, 16KB, 32KB, 64KB의 L1 캐쉬를 추가하면 평균적으로 15.5%, 21.5%, 25.5%, 30.9%의 성능이 각각 향상된다. 하지만, 일부 벤치마크 프로그램에서는 데이터 일관성을 유지하기 위하여 메모리 트랜잭션이 증가함에 따라 오히려 성능이 감소하는 결과를 보이기도 한다. 그리고 메모리 요청에 대한 미스가 많이 발생하는 경우에는 캐쉬 레벨이 증가함에 따라 평균 메모리 접근 지연 시간이 증가하기도 한다.

멤리스터-CMOS 기반의 잉여 이진 가산기 설계 (Design of Redundant Binary Adder based on Memristor-CMOS)

  • 안연규;이상진;김석만;캄란 에쉬라기안;조경록
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.67-74
    • /
    • 2014
  • 본 논문은 멤리스터-CMOS 기반의 잉여 이진 부호화 자리수 (RBSD) 가산기를 제안한다. 기존의 RBSD 가산기는 리플 캐리 가산기에 비해 큰 면적을 차지한다. 또한 처리하는 비트 수가 적을 때 연산 속도가 느린 단점이 있다. 제안된 RBSD 가산기는 기존 RBSD 가산기의 단점을 보완하기 위해 멤리스터-CMOS 회로를 사용한다. 제안된 멤리스터-CMOS 기반의 RBSD 가산기는 기존 RBSD 가산기에 비해 단위 셀 면적이 45% 감소하였고, 지연시간이 24% 감소하였다. 제안된 멤리스터-CMOS 기반의 RBSD 가산기의 구현으로 인해 RBSD 가산기의 장점이 더욱 부각되고, 대용량 회로에서 더 큰 이득을 얻는다.

모바일 애플리케이션의 특성을 이용한 하이브리드 메모리 기반 버퍼 캐시 정책 (Hybrid Main Memory based Buffer Cache Scheme by Using Characteristics of Mobile Applications)

  • 오찬수;강동현;이민호;엄영익
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1314-1321
    • /
    • 2015
  • 모바일 디바이스는 데스크톱이나 서버 등 일반 컴퓨터 시스템과 마찬가지로 주기억장치와 스토리지와의 성능 차이를 완화시키기 위해 버퍼 캐시를 사용한다. 그러나 DRAM 은 저장된 데이터를 유지하기 위해 주기적인 refresh 연산을 수행함으로써 제한된 크기의 배터리 소모를 가속화하는 문제점을 가지고 있다. 본 논문에서는 모바일 디바이스 환경에서 배터리의 수명을 연장하기 위해 DRAM과 비휘발성 메모리인 PCM으로 구성된 하이브리드 메인 메모리 구조기반의 버퍼캐시 정책을 소개한다. 또한, PCM의 성능 및 내구성 특성을 최적화시키기 위해 프로세스 상태 기반의 새로운 버퍼 캐시 정책을 제안한다. 제안 기법은 포그라운드 및 백그라운드 애플리케이션이 사용하는 페이지를 서로 다른 방법으로 배치함으로써 소량의 DRAM으로도 포그라운드 애플리케이션의 빠른 응답성을 보장한다. 실험 결과, 제안 기법은 포그라운드 애플리케이션의 총 수행시간을 평균 58% 감소시켰으며 전력 소비량도 평균 23% 감소시키는 것을 확인하였다.

하다마드 트랜스폼 차이를 사용해 효율이 낮은 화면 내 예측 모드 생략을 통한 속도 향상 기법 (Fast Algorithm for intra mode decision by using hadamard transform difference)

  • 황웅;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.172-175
    • /
    • 2011
  • 높은 효율을 가진 비디오 압축 코덱인 H.264/AVC는 예전보다 압축 성능을 향상 시키기 위한 방법 중 하나로 율-왜곡 최적화 기법이라는 것을 사용한다. 이 기법은 압축된 결과를 가지고 손실과 압축률 두 가지를 모두 고려하여 어떤 경우가 더 최적의 압축인가 하는 것을 판별하는데, 여기서 모든 경우에 대해 압축을 수행해야 함으로 이전 보다 몇 배나 높은 복잡도를 가질 수 밖에 없다. 이러한 문제를 해결하고자 하는 노력으로 본 논문에서는 SAHTD(Sum of Absolute Hadamard Transform Difference)라는 기준을 사용하여 이를 이용해 율-왜곡 최적화 기법을 사용하지 않거나, 사용을 최소화 하면서 압축 효율을 유지하는 방법을 제시하였다. 본 논문에서는 휘도 신호 $8{\times}$8과 $4{\times}4$블록을 위한 방법을 제시하고 있다. 이 두 가지 크기의 블록에 대해서 SAHTD값을 구해 SAHTD가 낮은 순으로 모드들을 정렬하고, 이것이 가장 낮은 3개의 모드를 선택해 이것 중에 MPM이 포함되지 않았을 경우에 대해서는 MPM을 포함해 4개의 모드를 선택해 압축을 수행하도록 한다. 여기서 얻은 모드들 중에 SAHTD값이 일정 값 이상 더 낮은 모드가 존재할 경우, 그 모드들에 대해서만 율-왜곡 최적화 기법을 수행한다. 이를 통해 최적의 모드일 가능성이 낮은 모드들에 대한 부가적인 연산 수행을 방지하게 된다. 휘도신호 16x16이나 색차 신호 압축의 경우에는 SAHTD를 사용하여 가장 낮은 SAHTD값을 갖는 모드를 최적의 모드로 결정한다. JM 참조 소프트웨어를 통한 실험결과 제안된 기법은 기존 JM의 방식에 비해 화면 내 프레임의 부호화 시간의 82.2% 감소와 0.042dB의 PSNR 감소율, 0.527%의 비트 증가율을 보여주었다.

  • PDF