• 제목/요약/키워드: Memory partitioning

검색결과 81건 처리시간 0.031초

메모리기반 데이터 그리드 환경에서 확장성을 고려한 분산 캐시 구조 및 데이터 조달 기법 (Distributed Cache Framework and its Data Procurement Algorithm on In-Memory Data Grid)

  • 김병상;윤찬현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1767-1769
    • /
    • 2010
  • 본 논문은 그리드 혹은 클라우드 컴퓨팅환경과 같은 인터넷 기반의 대규모 분산 환경에서 데이터집약적인 작업의 실행에 있어서 확장성을 위해 필수적으로 고려되는 데이터 전송 부하를 분산시키는 기법을 논하고 있다. 우리는 다수의 메모리기반의 데이터 노드를 활용하여 분할기법(Partitioning)을 기반으로 데이터 전송 부하를 줄이고자 하며 다수의 데이터 노드에 실시간으로 최적의 데이터의 양을 공급하는 기법에 대한 이론적인 분석과 시뮬레이션을 통한 성능 검증을 포함하고 있다.

유사 공진형 물체에 대한 TM 전자파의 산란계산을 위한 MLFMA방법 (MLFMA for Computation of TM Scattering from Near Resonant Object)

  • 안창회
    • 한국전자파학회논문지
    • /
    • 제9권6호
    • /
    • pp.735-745
    • /
    • 1998
  • 모멘트법은 전자파산란문제에 널리 사용되고 있는데, 최근에 대용량의 문제를 빠르고 효율적으로 풀 수 있는 기법들에 대한 연구가 많이 진행되고 있다. 대부분의 이런 기법에는 계산속도나 기억용량을 효율적으로 이용할 수 있는 반복법을 사용해서 행렬방정식을 풀게 되는데, 유사공진특성을 갖는 물체에 대한 산란은 물체 내부에서 전자파가 공진하는 특성을 가지므로 반복해법올 이용하여 적분방정식을 풀 경우 수렴이 잘 되지 않거나, 수렴되기까지 많은 반복회수를 필요로 한다. 본 논문에서 사용된 MLFMA(Muli-level Fast Multipole Algorithm)는 FMM(Fast Multipole Method)을 다층으로 확장한 알고리듬으로 반복회수당 계산시간을 O(NlogN)으로 줄일 수 있다. 이 MLFMA를 유사공진형구조에 적용하고, 또한 행렬식을 블록밴드행렬 전처리를 하여 반복회수를 감소시켰다. 여기서 사용된 전처리행렬은 행렬분할법을 이용하여 O(N)의 계산시간으로 구할 수 있으므로, 미지수가 많을 때는 전처리행렬을 구하는데 드는 추가계산시간을 무시할 수 있다. 여기서 제안된 방법을 비행기의 공기유입구에 대한 TM전자파산란 계산에 적용하여 효율성을 보였다

  • PDF

SPQI: 이동 환경에서 연속 범위 질의에 대한 효율적인 색인 구조 (SPQI: An Efficient Continuous Range Query Indexing Structure for a Mobile Environment)

  • 이종혁;정하림;윤희용;김응모
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.70-75
    • /
    • 2015
  • 본 논문에서는 이동객체 수의 급증에 따른 연속 범위 질의의 효율적인 처리 방법을 논한다. 각 질의들은 관심 있는 (지리적)질의 영역 내의 이동객체들을 지속적으로 검색한다. 연속 범위 질의 결과를 최신으로 유지하기 위해, 이동객체들은 현재 위치를 보고하고자 서버와 지속적으로 통신해야한다. 그러나 연속 범위 질의 및 이동객체 수가 많아지면. 서버 작업량은 증가하고 막대한 통신비용 발생을 초래한다. 본 논문에서는 가용성 메모리와 연산 자원을 바탕으로 다음과 같은 문제를 해결하고자 한다. 이를 위해 Space Partitioning Query Index(SPQI)라는 질의 색인 구조를 제안한다. 이 색인 구조는 연속 범위 질의 처리에 대해, 서버가 이동객체와 효율적으로 협력하여 처리할 수 있게 함으로써 서버 작업량과 통신비용면에서 시스템 성능을 향상시킨다. 시뮬레이션을 통해 SPQI의 우수성을 검증한다.

초-고해상도 영상 스타일 전이 (Super High-Resolution Image Style Transfer)

  • 김용구
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.104-123
    • /
    • 2022
  • 신경망 기반 스타일 전이 기법은 영상의 고차원적 구조적 특징을 반영하여 높은 품질의 스타일 전이 결과를 제공함으로써 최근 크게 주목받고 있다. 본 논문은 이러한 신경망 기반 스타일 전이의 GPU 메모리 제한에 따른 해상도 한계에 대한 문제를 다룬다. 신경망 출력이 가진 제한적 수용장 특징을 바탕으로, 부분 영상 기반의 스타일 전이 손실함수 경사도 연산이 전체 영상을 대상으로 구한 경사도 연산과 동일한 결과를 생성할 수 있을 것으로 기대할 수 있다. 이러한 아이디어를 기반으로, 본 논문에서는, 스타일 전이 손실함수의 각 구성 요소에 대한 경사도 연산 구조를 분석하고, 이를 통해 부분 영상의 생성 및 패딩에 대한 필요조건을 구하고, 전체 영상의 신경망 출력에 좌우되는 경사도 연산 요구 데이터를 확인하여 구조화함으로써 재귀적 초고해상도 스타일 전이 알고리즘을 개발하였다. 제안된 기법은, 사용하는 GPU 메모리가 처리할 수 있는 크기로 초고해상도 입력을 분할하여 스타일 전이를 수행함으로써, GPU 메모리 한계에 따른 해상도 제한을 받지 않으며, 초고해상도 스타일 전이에서만 감상할 수 있는 독특한 세부 영역의 전이 스타일 특징을 제공할 수 있다.

필터방식 얼굴검출 하드웨어의 저전력 설계 (Low Power Design of Filter Based Face Detection Hardware)

  • 김윤구;정용진
    • 대한전자공학회논문지SD
    • /
    • 제45권6호
    • /
    • pp.89-95
    • /
    • 2008
  • 본 논문에서는 필터방식 얼굴검출 하드웨어를 저전력 설계하고 그에 따른 전력 소모량을 분석하였다. 얼굴검출 하드웨어는 입력되는 영상에서 얼굴의 위치를 검출하며 내부적으로 6개 모듈과 11개의 모듈 간 버퍼가 삽입되어 각 모듈이 순환 연산한다. 따라서 저전력 설계를 위해 SLEEP 모드와 ACTIVE 모드를 적용하였고, 해당 하드웨어에 모듈별 그리고 레지스터별 클럭게이팅(Clock Gating) 기술을 적용하였다. 추가적으로 모듈간 버퍼는 메모리 파티션을 통해 메모리에서 소비하는 전력양을 줄였으며 게이트 레벨에서도 저전력 설계 기술(Gate level power optimization)을 적용하였다. 이는 삼성 0.18um 공정의 STD130 라이브러리를 사용하여 Synopsis(사)의 Power-Compiler를 통해 구현되었으며 동사의 Prime-Power에 의해 소비 전력량을 측정하였다. 그 결과 저전력 설계 기술을 적용하기 전과 비교하여 ACTIVE 모드일 경우 약 68%의 전력 소모를 줄였다.

재귀적 분할 평균에 기반한 점진적 규칙 추출 알고리즘 (An Incremental Rule Extraction Algorithm Based on Recursive Partition Averaging)

  • 한진철;김상귀;윤충화
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.11-17
    • /
    • 2007
  • 패턴 분류에 많이 사용되는 기법 중의 하나인 메모리 기반 추론 알고리즘은 단순히 메모리에 저장된 학습패턴 또는 초월평면과 테스트 패턴간의 거리를 계산하여 가장 가까운 학습패턴의 클래스로 분류하기 때문에 테스트 패턴을 분류하는 기준을 설명할 수 없다는 문제점을 가지고 있다. 이 문제를 해결하기 위하여, 메모리 기반 학습 기법인 RPA를 기반으로 학습패턴들에 내재된 규칙성을 표현하는 IF-THEN 형태의 규칙을 생성하는 점진적 학습 알고리즘을 제안하였다. 하지만, RPA에 의해 생성된 규칙은 주어진 학습패턴 집합에만 충실히 학습되어 overfitting 현상을 보이게 되며, 또한 패턴 공간의 과도한 분할로 인하여 필요 이상으로 많은 개수의 규칙이 생성된다. 따라서, 본 논문에서는 생성된 규칙으로부터 불필요한 조건을 제거함으로써 ovefitting 현상을 해결함과 동시에 생성되는 규칙의 개수를 줄일 수 있는 점진적 규칙 추출 알고리즘을 제안하였으며, UCI Machine Learning Repository의 벤치마크 데이터를 이용하여 제안한 알고리즘의 성능을 입증하였다.

압축된 공간 히스토그램을 이용한 선택율 추정 기법 (Selectivity Estimation Using Compressed Spatial Histogram)

  • 지정희;이진열;김상호;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.281-292
    • /
    • 2004
  • 공간 질의에 대한 선택율 추정은 가장 효율적인 실행 계획을 찾는데 이용되는 매우 중요한 과정이다. 공간 도메인이 큰 경우, 기존 연구의 요약정보는 상대적으로 적은 정보로 선택율을 추정하기 때문에 좋은 선택율을 유지하기 어렵다. 따라서, 이 논문에서는 작은 저장공간에 공간요약정보를 압축하는 새로운 기법인 MW 히스토그램을 제안한다. 이 히스토그램은 MinSkew 분할 알고리즘과 웨이블릿 변환이 결합되어 적은 저장공간에서도 타당한 선택율과 압축효과를 얻을 수 있고, 동적 갱신에 대해 효율적으로 대처할 수 있는 구조를 가진다. 실험 결과를 통하여, 버켓 수가 0.3M/6인 MW 히스토그램이 5%-20% 질의에서 평균적으로 좋은 성능을 보이고 있어, MW 히스토그램이 적은 저장공간에서 더 좋은 선택율을 얻을 수 있음을 확인시켜주었다.

CNN을 이용한 Quad Tree 기반 2D Smoke Super-resolution (Quad Tree Based 2D Smoke Super-resolution with CNN)

  • 홍병선;박지혁;최명진;김창헌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권3호
    • /
    • pp.105-113
    • /
    • 2019
  • 물리 기반 유체 시뮬레이션은 고해상도 연산을 위해 많은 시간이 필요하다. 이 문제를 해결하기 위해 저해상도 유체 시뮬레이션의 한계를 딥 러닝으로 보완하는 연구들이 있으며, 그중에서는 저해상도의 시뮬레이션 데이터를 고해상도로 변환해주는 Super-resolution 분야가 있다. 하지만 기존 기법들은 전체 데이터 공간에서 밀도 데이터가 없는 부분까지 연산하므로 전체 시뮬레이션 속도 면에서 효율성이 떨어지며, 입력 해상도가 큰 경우에는 GPU 메모리가 부족해 연산할 수 없는 경우가 발생할 수 있다. 본 연구에서는 공간 분할 법 중 하나인 쿼드 트리를 활용하여 시뮬레이션 공간을 분할 및 분류하여 Super-resolution 하는 기법을 제안한다. 본 기법은 필요 공간만 Super-resolution 하므로 전체 시뮬레이션 가속화가 가능하고, 입력 데이터를 분할 연산하므로 GPU 메모리 문제를 해결할 수 있게 된다.

객체 추적을 위한 SURF 기반 특이점 추출 및 서술자 생성의 하드웨어 설계 (Hardware Design of SURF-based Feature extraction and description for Object Tracking)

  • 도용식;정용진
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.83-93
    • /
    • 2013
  • 최근 영상처리 응용의 일환으로 객체 추적 시스템에 많이 활용되는 SURF 알고리즘의 경우 영상의 회전 및 크기 변화에 강인한 특이점을 추출한다는 특징이 있지만 연산이 복잡하고 연산량이 많아 임베디드 환경에서 IP로 사용되기 위해서는 하드웨어 가속기 개발이 필수적이다. 하지만 이 때 요구되는 내부 메모리 사이즈가 매우 크기 때문에 ASIC이나 SoC 시스템으로 개발 할 때 칩 회로 사이즈가 커서 IP의 가치를 떨어뜨리게 된다. 본 논문에서는 하드웨어 가속기 개발 시 회로면적에 효율적인 설계를 위해 내부 블록메모리 사용량을 줄이고 외부 메모리와 DMA를 사용하여 세분화된 Sub-IP 구조로 설계하는 것에 대해 연구하고 간단한 객체 추적 알고리즘을 개발하여 그 결과를 적용하였다. ARM Cortex-M0, AHB-lite, APB, DMA, SDRAM Controller로 구성된 시스템 환경에서 실험 결과 VGA(640x480)영상에서 SURF 알고리즘의 처리속도는 약 31frame/sec, 블록 메모리의 크기는 81Kbytes, 30nm 공정에서 회로의 크기는 약 74만 게이트 크기로 SoC 칩의 하드웨어 IP로 활용이 가능하였다. SURF와 비슷한 영상처리 알고리즘에서도 본 논문에서 제안하는 설계방법을 적용하면 타겟 어플리케이션에 효율적인 하드웨어 설계를 할 수 있을 것으로 기대된다.

중위수의 중위수에 의한 병렬 분류 알고리즘 (Parallel Sorting Algorithm by Median-Median)

  • 민용식
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.14-21
    • /
    • 1995
  • 본 논문은 SIMD 병렬 처리 컴퓨터에 적합한 병렬 분류 알고리즘을 제시키 위해서, 다음과 같이 수행이 된다. 첫째, 비순서화된 데이타 집합을 p개의 프로세서로 할당시킨후에 순차적 quicksort로 분류한다. 그 다음으로, 분류된 각 프로세서의 중위수값을 구한다음 이 값에 위해서 각 프로세서에 데이타 값을 할당시킨다. 각 프로세서에 할당된 데이타가 정확하게 분배가 되도록 중위수와 중위수 값을 구해서 각 프로세서에 적합한 데이타를 다시 할당 시키게 된다. 이때 각 프로세서가 지닌 데이타의 수는 확률이론을 이 용하였다. 마지막으로, 각 프로세서에 할당된 데이타를 순차적 quicksort로 분류하면 된다. 여기서 분류될 데이타 n가 $n{\geq}p^2$일때 본 알고리즘은 최적이 되게됨을 볼수가 있다. 실제적 구현에 있어서, 64개 프로세서를 이용해서 8백만개의 데이타를 분류할때 PSRS 방법의 speedup은 44.4인 반면에 본 알고리즘은 48.43이 된다. 즉, 다양한 공용과 분산 기억장치 기계에 관해서, 본 알고리즘의 speedup은 거의 절반 이상의 선형시간으로서 성취가 됨을 볼 수가 있다.

  • PDF