• 제목/요약/키워드: 대용량 메모리

검색결과 371건 처리시간 0.027초

고해상도 SAR 영상처리 고속화를 위한 병렬 성능 최적화 기법 연구 (A Study on Parallel Performance Optimization Method for Acceleration of High Resolution SAR Image Processing)

  • 이규범;김규빈;안솔보름;조진연;임병균;김동현;김정호
    • 한국항공우주학회지
    • /
    • 제46권6호
    • /
    • pp.503-512
    • /
    • 2018
  • SAR(Synthetic Aperture Radar)는 레이더를 이용하여 얻은 신호를 처리해 영상을 획득하는 기술로서, SAR 영상의 활용도와 고해상도 영상에 대한 요구가 증가하고 있는 상황이다. 따라서 본 연구에서는 고해상도 영상 데이터의 고속 처리를 위해 SAR 영상처리 알고리즘을 다중코어 기반의 컴퓨터 구조에서 최적의 성능을 낼 수 있도록 구현하기 위한 연구를 수행했다. 고해상도 영상에 따른 방대한 양의 입출력에 의한 성능 저하를 개선시키기 위해 메모리를 최대한 활용하는 성능 최적화 기법을 적용하고 OpenMP의 동적 스케쥴링 기법과 중첩 병렬성(nested parallelism)을 사용해 코드의 병렬화 비율을 높였다. 그 결과 전체 계산시간을 줄일 뿐만 아니라 병렬 성능의 최대 한계치를 크게 높일 수 있었으며, 제안된 기법을 10개 코어를 가진 다중코어 시스템에 적용한 결과 기존 대비 8배 이상의 성능 향상이 있었다. 본 연구 결과는 대용량 메모리를 가진 다중코어 시스템을 대상으로 하는 고해상도 SAR 영상처리 소프트웨어 개발에 효과적으로 활용될 수 있을 것으로 기대된다.

서브 그래프의 사용 패턴을 고려한 다중 계층 캐싱 기법 (Multi-layer Caching Scheme Considering Sub-graph Usage Patterns)

  • 유승훈;정재윤;최도진;박재열;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제18권3호
    • /
    • pp.70-80
    • /
    • 2018
  • 최근 소셜 미디어와 모바일 장비들의 발달로 인해 그래프 데이터들이 다양한 분야에서 활용되고 있다. 이와 함께 대용량 그래프 데이터 처리 과정에서 입출력 비용을 감소시키기 위한 캐싱 기법에 대한 연구들이 진행되고 있다. 본 논문에서는 그래프 토폴로지의 특징인 그래프의 연결성과 과거의 서브 그래프 사용 이력을 고려하여 다중 계층 캐싱 기법을 제안한다. 제안하는 기법은 캐시를 Used Data Cache와 Prefetched Cache로 구분한다. Used Data Cache는 자주 사용되는 서브 그래프 패턴에 따라 가중치를 부여하여 데이터를 캐싱하고 Prefetched Cache는 사용되지는 않았지만 최근 사용된 데이터의 주변 데이터들이 사용될 가능성이 높은 데이터를 캐싱한다. 그래프 패턴을 추출하기 위해 과거의 이력 정보를 활용하여 패턴을 추출하였다. 자주 사용되는 서브 그래프들이 다시 사용될 것을 예측하여 가중치를 부여하여 캐싱한다. 최근 사용된 데이터의 주변 데이터들이 사용 될 것을 예측하여 캐싱한다. 각각의 캐시에 캐싱된 데이터들을 관리하고 메모리가 가득 찰 경우 사용될 가능성이 낮은 데이터와 새로운 데이터를 교체하는 전략을 제안한다. 성능 평가를 통해 제안하는 캐싱 기법이 기존의 캐시 관리 기법에 비해 우수함을 증명한다.

비정렬 격자에 대한 광선 투사를 위한 셀 사이 연결정보 추출 병렬처리 알고리즘 (Parallel Cell-Connectivity Information Extraction Algorithm for Ray-casting on Unstructured Grid Data)

  • 이지훈;김덕수
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권1호
    • /
    • pp.17-25
    • /
    • 2020
  • 본 논문은 비정렬 격자에 대한 광선투사 수행의 전처리 과정 중 하나인 셀 사이 연결정보 추출에 대한 멀티코어 CPU 기반 병렬처리 알고리즘을 제안한다. 본 연구는 기존의 직렬처리 알고리즘을 단순히 병렬화하였을 때 발생하는 동기화 문제를 확인하고, 이를 해결할 수 있는 3-단계 병렬처리 알고리즘을 제안한다. 제안하는 알고리즘은 각 단계 내에서의 스레드 간 동기화를 제거함으로서 병렬처리 효율을 높인다. 또한, 연결정보 추출 알고리즘의 핵심 연산인, 삼각형 중복 검사 과정의 메모리 접근에 대한 공간적 지역성을 높이고 캐시 활용 효율을 향상시킨다. 본 연구는 나아가, 스레드 마다 자체 메모리 풀을 사용하게 함으로서 병렬처리 효율을 더욱 높인다. 본 연구의 효용성을 확인하기 위해, 제안하는 알고리즘을 두 개의 옥타코어 CPU를 가지는 시스템에 구현하고 세 개의 비정렬 격자 데이터에 적용하였다. 그 결과, 제안하는 병렬처리 알고리즘은 스레드 수 증가에 따라 지속적으로 성능 향상을 보여주었다. 또한, 32개 스레드(물리코어 16개)를 사용하여 기존 직렬처리 알고리즘 대비 최대 82.9배 높은 성능을 보여주었다. 이는 제안하는 알고리즘의 높은 병렬처리 확장성 및 캐시 활용 효율 개선 효과를 증명하며, 대용량 비정렬 격자 처리에 대한 적합성을 보여주는 결과다.

DVB-T 수신기를 위한 대규모 병렬처리 GPU 기반의 FFT 구현 (Implementation of FFT on Massively Parallel GPU for DVB-T Receiver)

  • 이규형;허서원
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.204-214
    • /
    • 2013
  • 최근 GPU의 뛰어난 병렬 연산 처리 능력을 이용하여 신호 처리나 통신 시스템을 소프트웨어로 구현하기 위한 다양한 연구가 진행되고 있다. 본 논문에서는 DVB-T에서 사용되는 2K/8K FFT를 GPU를 이용하여 처리함으로써 소프트웨어 모의실험에 소요되는 시간을 줄였다. 우리는 먼저 DTV 전송 표준 방식의 일종인 DVB-T 시스템을 CPU로 구현할 때 소요되는 처리 시간을 모의실험을 통해서 추정한다. 그리고 DVB-T의 핵심 연산 처리기의 일종인 FFT 처리를 NVIDIA사의 대용량 GPU 프로세서를 이용하여 소프트웨어로 구현한다. 본 논문은 CPU와 GPU 간의 데이터 전송에 소요되는 오버헤드를 줄이기 위해 스트림 처리 기법, 외부 전역 메모리 전송 시간을 단축하기 위한 결합 전송 기법 (coalescing), 공유 메모리 활용을 높이기 위한 변수 설계 기법 등을 통해서 연산시간을 대폭 단축하였다. 그 결과 제안된 방식은 DVB-T의 2K/8K FFT 모드의 경우 CPU 기반의 FFT 처리 방식 대비 약 20~30배, NVIDIA사에서 제공하는 FFT 라이브러리 (CUFFT version 2.1) 대비 약 1.8배 그리고 기존에 발표된 타 방식 대비 약 1.5~10배 정도 빠른 처리 능력을 보인다.

무선 인터넷 프록시 서버 클러스터 성능 개선 (A Performance Improvement Scheme for a Wireless Internet Proxy Server Cluster)

  • 곽후근;정규식
    • 한국정보과학회논문지:정보통신
    • /
    • 제32권3호
    • /
    • pp.415-426
    • /
    • 2005
  • 사회적으로 큰 관심의 대상이 되고 있는 무선 인터넷은 유선 인터넷과 달리 기술 환경과 그 특성상 여러 가지 제약점들을 가지고 있다. 대역폭이 낮고, 접속이 빈번하게 끊기며, 단말기내의 컴퓨팅 파워가 낮고 화면이 작다. 또한 사용자의 이동성 문제와 네트워크 프로토콜, 보안등에서 아직 기술적으로 부족한 부분을 보이고 있다 그리고 급속도로 증가하는 수요에 따라 무선 인터넷 서버는 대용량 트래픽을 처리할 수 있는 확장성이 요구되어지고 있다. 이에 본 논문에서는 무선 인터넷 프록시 서버 클러스터를 사용하여 앞에서 언급된 무선 인터넷의 문제와 요구들을 캐싱(Caching), 압축(Distillation) 및 클러스터 (Clustering)를 통하여 해결하려고 한다. TranSend는 클러스터링 기반의 무선 인터넷 프록시 서버로 제안된 것이나 시스템적인(Systematic) 방법으로 확장성을 보장하지 못하고 불필요한 모듈간의 통신구조로 인해 복잡하다는 단점을 가진다. 기존 연구에서 시스템적인 방법으로 확장성을 보장하는 All-in-one 이라는 구조를 제안하였으나 이 역시 모듈간의 통신 구조가 복잡하고 캐시간 협동성이 없는 단점을 가진다. 이에 본 논문에서는 모듈간의 단순한 통신 구조와 캐시간 헙동성을 가지는 클러스터링 기반의 무선 인터넷 프록시 서버를 제안한다. 16대의 컴퓨터를 사용하여 실험을 수행하였고 실험 결과 TranSend 시스템과 All-in-one 시스템에 비해 각각 54.86$\%$, 4.70$\%$의 성능 향상을 보였다. 캐시서버간 데이타를 공유할 수 있기 때문에 제안된 구조에서는 캐시서버 수에 무관하게 캐시 메모리 전체 크기를 일정하게 할 수 장점을 가진다. 반면에 All-in-one에서는 각 캐시서버가 모든 캐시 데이타를 가져야 하므로 캐시 메모리 전체 크기가 캐시 서버 수에 비례하여 증가한다.

위치기반 서비스를 위한 다중레벨 DBMS에 질의 분류 컴포넌트의 설계 및 구현 (Design and Implementation of Query Classification Component in Multi-Level DBMS for Location Based Service)

  • 장석규;어상훈;김명근;배해영
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.689-698
    • /
    • 2005
  • 현재 위치기반 서비스를 제공하기 위하여 다양한 시스템들이 사용되고 있다. 그러나 기존의 시스템들은 상당히 많은 사용자들에게 빠른 서비스를 제공하기에는 적합하지가 않다. 이러한 문제점을 해결하기 위하여 빠른 데이터 처리와 대용량의 데이터 관리를 동시에 지원하는 다중레벨 DBMS를 사용하여야 한다. 스냅샷을 갖는 다중레벨 DBMS는 디스크에 모든 데이터를 가지고 있으며, 빠른 처리를 요구하는 데이터는 스냅샷의 형태로 메인메모리 데이터베이스에서 관리한다. 이 시스템의 성능을 최적화하여 위치기반 서비스를 제공하기 위해서는 스냅샷에 존재하는 데이터를 효율적으로 사용할 수 있도록 질의를 분류하는 컴포넌트가 필요하다. 본 논문에서는 위치기반 서비스를 위한 다중레벨 DBMS에서 질의 분류 컴포넌트를 설계하고 구현한다. 제안된 컴포넌트는 입력된 질의를 메모리 질의, 디스크 질의, 하이브리드 질의로 분류하여 스냅샷 사용율을 높이고, 스냅샷의 일부분을 사용할 수 있도록 질의의 비공간과 공간 필터 조건을 분할하는 메커니즘을 사용하였다. 따라서, 제안된 컴포넌트는 효율적인 질의 분류를 통하여 스냅샷을 최대한 이용함으로써 시스템의 성능을 향상시킨다.

Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스 (Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis)

  • 박민희;조영복;김소영;박종배;박종혁
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1277-1286
    • /
    • 2018
  • 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.

반도체 검증을 위한 MPI 기반 클러스터에서의 대용량 FDTD 시뮬레이션 연산환경 구축 (Implementation of Massive FDTD Simulation Computing Model Based on MPI Cluster for Semi-conductor Process)

  • 이승일;김연일;이상길;이철훈
    • 한국콘텐츠학회논문지
    • /
    • 제15권9호
    • /
    • pp.21-28
    • /
    • 2015
  • 반도체 공정에서는 소자 내부의 물리량 계산을 통해 불순물의 움직임을 해석하여 결점을 검출하는 시뮬레이션을 수행하게 된다. 이를 위해 유한 차분 시간 영역 알고리즘(Finite-Difference Time-Domain, 이하 FDTD)과 같은 수치해석 기법이 사용된다. 반도체 칩의 집적도 향상으로 인하여 소자의 크기는 나노스케일 시대로 접어들었으며, 시뮬레이션 사이즈 또한 커지고 있는 추세이다. 이에 따라 CPU와 GPU 같은 하나의 연산 장치에서 수행할 수 없는 문제와 다중의 연산 장치로 구성된 한 대의 컴퓨터에서 수행할 수 없는 문제가 발생하기도 한다. 이러한 문제로 인해 분산 병렬처리를 통한 FDTD 알고리즘 연구가 진행되고 있다. 하지만 기존의 연구들은 단일 연산장치만을 이용하기 때문에 GPU를 사용하는 경우 연산 속도는 빠르나 메모리의 제한이 있으며 CPU의 경우 GPU에 비해 연산 속도가 느린 단점이 존재한다. 이를 해결하기 위해 본 논문에서는 CPU, GPU의 이기종 연산 장치를 포함하는 컴퓨터로 구축된 클러스터 상에서 작업 사이즈에 제한되지 않고 시뮬레이션 수행이 가능한 컴퓨팅 모델을 구현하였다. 점대점 통신 기반의 MPI 라이브러리를 이용하여 연산 장치 간 통신을 통한 시뮬레이션을 테스트 하였고 사용하는 연산 장치의 종류와 수에 상관없이 시뮬레이션이 정상 동작함을 확인하였다.

피어-투-피어 스마트워치 시스템을 위한 바이오 센싱 데이터 동기화 (Bio-sensing Data Synchronization for Peer-to-Peer Smart Watch Systems)

  • 이태규
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.813-818
    • /
    • 2020
  • 최근, 스마트기기의 기술 및 사용자의 급증과 더불어, 스마트워치 시장이 성장하고, 그 효용성 및 사용성이 지속적으로 확대되고 있다. 스마트워치의 강점은 웨어러블 휴대성, 응용의 즉시성, 데이터 다양성 및 실시간성 등이다. 이러한 강점에도 불구하고, 스마트워치는 배터리 제약, 디스플레이 및 사용자 인터페이스 크기 제약, 메모리 제약 등의 한계성을 지닌다. 또한, 개발자 및 표준 디바이스, 운영체제 표준 모델, 킬러 애플리케이션 모듈 등의 보완 필요성이 제기된다. 특히, 스마트워치는 사용자의 생체정보 모니터링 및 응용이 주요한 서비스로 자리하고 있다. 이러한 스마트워치의 생체정보는 실시간 대용량 데이터를 생성한다. 생체정보 서비스의 고도화를 위해서, 센싱 데이터를 원격 스마트폰 또는 로컬서버저장소로 안정적인 피어-투-피어 전송이 수행되어야 한다. 본 연구는 스마트워치 시스템에서 무선 원격 피어-투-피어 전송 안정성을 보장하기 위한 동기화 방법을 제안한다. 이러한 동기화 방법에 기초한 무선피어-투-피어 전송 프로세스를 설계하고, 비동기 전송 프로세스와 제안 동기 전송프로세스를 분석하여 전송량 증가에 따른 전송 효율화 방법을 제안하다.

단순 퍼지 제어기법을 이용한 온실의 천창환기에 의한 냉방제어 (Cooling Control of Greenhouse Using Roof Window Ventilation by Simple Fuzzy Algorithm)

  • 민영봉;윤용철;허무룡;강동현;김현태
    • 농업생명과학연구
    • /
    • 제44권4호
    • /
    • pp.69-77
    • /
    • 2010
  • 온실의 환기제어시 외기온도와 풍속변화에 보다 유연하게 대처하면서 온실내 온도제어성능을 향상시키기 위해서 퍼지제어가 많이 이용되고 있지만, 제어로직이 복잡하여 대용량 메모리를 갖는 컨트롤러가 필요하다. 본 연구에서는 소용량의 마이크로 컨트롤러에서 프로그램이 가능한 단순퍼지제어 알고리즘을 개발하여 시험하였다. 개발한 단순퍼지 제어 알고리즘의 성능을 비교하기 위하여 기존의 스텝제어 알고리즘을 도입한 제어프로그램으로 온실의 천창환기에 의한 온도제어를 실시하여 두 알고리즘의 성능을 직접 비교하고, 또 PID 및 표준 퍼지제어 성능과는 기존의 연구 결과와 비교하여 상대적 성능을 평가하므로써 온실의 환기냉방제어의 유리한 제어기법을 확립할 수 있는 기초자료를 얻고자 수행하였다. 단순 퍼지제어에 의한 실내온도 최대 제어오차는 $1.2^{\circ}C$, 1시간동안의 평균환기창 적산열림량과 조작회수는 각각 84%, 13회로 나타났으며, 문헌조사에 의한 퍼지제어에서 각각 $1.3^{\circ}C$, 75% 및 12회에 비해 동등한 제어성능을 보였다. 본 연구에서 개발한 단순퍼지제어는 제어로직이 PID제어보다 단순함에도 불구하고 스텝제어와 PID제어보다 성능이 우수하고, 퍼지제어와 동등한 제어성능을 갖는 것으로 나타났다.