• 제목/요약/키워드: 메모리 대역폭

검색결과 188건 처리시간 0.036초

멀티코어 프로세서를 위한 확장성 있는 온 칩 연결 망 구조 연구 (Preliminary Study on On-Chip Interconnect Architecture for Multi-Core Processors)

  • 최재영;최린
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.405-410
    • /
    • 2008
  • 성능 / 에너지를 강조하는 현재의 멀티코어 추세에서 임베디드 시스템에 사용되는 대부분의 프로세서들은 단일 프로세서와 메모리를 버스 형태로 연결하여 구현하였다. 하지만 칩 내부의 프로세서 코어 수가 증가 하게 되면, 기존 버스 형태의 구조는 제한된 대역폭으로 인하여 확장성이 제약된다. 본 논문에서는 멀티코어 프로세서에서 사용 가능한 기존 연결 망 구조들을 분석하고, 기존 계층적 링 구조에서의 지연 시간 문제를 극복하여 성능을 개선할 수 있는 새로운 이중 광역 계층 링 구조를 제안한다.

  • PDF

모바일 인터넷 상의 보안 기법 연구 (Research of Security Methods based on Mobile Internet)

  • 이원구;이재광
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 춘계 종합학술대회 논문집
    • /
    • pp.296-300
    • /
    • 2004
  • 본 논문에서는 모바일 인터넷에서 보안에 대해 논의한다. 무선 인터넷 사용자나 프로그램 및 네트워크 기술들이 지난 몇 년간 눈부시게 발전했다. 단말기의 제약사항으로 인하여 모바일 인터넷은 유선의 인터넷과 몇 가지 다른 구조를 가지고 있다. 무선 단말기가 갖는 제약 사항으로는 낮은 CPU 처리 능력, 제한된 메모리, 낮은 대역폭으로 유선과 같은 보안 서비스가 이뤄지지 않고 있다. 이를 해결하기 위한 보안 기법에 대해서 논의한다.

  • PDF

속도에 따른 세그먼트의 계층별 프리페칭 (A Segment's Layer Prefetching Scheme According to the Speed of the Mobile User)

  • 최인선;조기환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.100-102
    • /
    • 2003
  • 이동환경의 특성상 대역폭, 지연과 트래픽 등의 제약사항온 항상 존재한다. 기존의 음성위주의 통신이 아닌 통합된 멀티미디어 서비스를 추구하고 있는 현재의 상황에서는 더욱더 큰 문제로 인식된다. 이러한 문제를 해결하기 위해서 캐슁이나 프리페칭은 물론 여러 가지 방법론들이 연구되어왔다. 하지만, 실질적으로 사용자가 원하는 정보를 제공하는데 있어서 많은 한계점이 있다. 따라서, 본 논문에서는 사용자가 가까운 시간 안에 필요로 하는 정보를 미리 가져올 수 있도록 사용자의 이동 속도를 고려한 세그먼트의 계층별 정보를 프리페칭하는 방법을 제시한다. 그 결과, 정보획득의 유연성은 물론 메모리 활용률의 효율성을 향상시킬 수 있다.

  • PDF

링 구조 다중프로세서 시스템에서 링 대역폭 확장을 위한 효율적인 방안 (Efficient Schemes for Scaling Ring Bandwidth in Ring-based Multiprocessor System)

  • 장병순;정성우;장성태;전주식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권2호
    • /
    • pp.177-187
    • /
    • 2000
  • 최근 몇 년간 클리스터링 기반 다중 프로세서 시스템에서의 상호 연결망으로서의 버스의 제약을 극복하기 위한 단방향 지점간 링크를 이용한 링 구조가 제안되었다. 하지만 계속되는 프로세서의 고속화와 지역 버스 및 메모리의 고성능화로 인해 지점간 링크의 현재 표준 대역폭으로는 시스템 확장성에 한계를 보이며 이에 따라 대역폭 확장에 대한 연구가 필요하다. 본 논문에서는 클리스터링 기반 다중프로세서 시스템으로 개발된 PANDA 시스템을 기본 모델로 채택한다. 최근 대중화된 프로세서 및 지역 버스의 사양을 반영한 모의실험을 통해 현재의 지점간 링크가 전체 시스템 성능에 병목이 됨을 보여주고 두 배 이상의 대역폭 확장이 필요함을 보인다. 상호 연결망의 대역폭을 확장하기 위해, 두 배 증가된 대역폭을 지닌 새로운 링크를 개발하는 것은 과다한 설계비용과 개발시간이 요구된다. 이에 대한 대안으로 본 논문에서는 상용화되어있어 쉽게 적용 가능한 기존 IEEE 표준 대역폭을 가진 링크를 이용해 이중으로 링을 구성하는 몇 가지 방법 단순 이중 링, 트랜잭션 분리 이중 링, 방향 분리 이중 링 - 을 제시하고 모의실험을 통해 두 배 대역폭 단일 링과 더불어 각각의 방식에 대한 장단점을 분석한다.

  • PDF

멀티홈 모바일 호스트상에서 스트라이핑 전송계층 연결을 위한 적응형 버퍼튜닝기법 (An Adaptive Buffer Tuning Mechanism for striped transport layer connection on multi-homed mobile host)

  • 파라즈;허의남
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.199-211
    • /
    • 2009
  • 최근 무선네트워크 기술은 이동 응용프로그램을 위해 이종통신망 연결패스 상에서 병렬로 스트라이핑 데이터 기술을 이용해 고속 데이터를 전달을 가능케 한다 [2]. 전통적으로 대역폭지연프로덕트(BDP) 기반에서 고속전송은 송신자 측에서 다중 TCP 소켓의 튜닝을 요구한다. 더욱이, 메모리와 네트워크 요구의 균형을 유지하는 ATBT같은 기술은 유선기반의 단일 소켓상에서 하나의 플로우만 가정하여 설계되었다. 그러므로 본 논문은 여러 무선 패스를 경유하는 이종 무선네트워크 상에서 고속전송을 가능케하는 스트라이핑 전송기술에 적합한 버퍼튜닝 기술을 제안한다. 제안 기술은 이동성, 링크손실, 대역폭변동성 등의 특징을 지닌 무선 멀티홈 모바일 호스트상에서 작동하는 전송계층에서의 자원관리기술이다. 실험을 통하여 유선기반의 ATBT를 본 환경에 적용한 것보다 메모리, 평균 전송량에 있어 제안 기술의 성능이 우수하다.

  • PDF

Self-Similar 트래픽을 갖는 공유버퍼 메모리 스위치 네트워크 환경에서 호 수락 제어 방법 (Call Admission Control for Shared Buffer Memory Switch Network with Self-Similar Traffic)

  • 김기완;김두용
    • 한국통신학회논문지
    • /
    • 제30권4B호
    • /
    • pp.162-169
    • /
    • 2005
  • 패킷 스위치로부터 발생되는 트래픽이 전통적인 트래픽 모델인 포와송 분포와 마코비안 프로세스로 가정된 네트워크로부터 발생되는 트래픽과 상당히 차이가 나는 self-similar 현상을 보이고 있다는 것이 알려지고 있고 또한 기존에 제안된 대부분의 호 수락 제어 방법에 대한 성능 분석은 스위치가 단독으로 존재한다고 가정하여 이루어지고 있다. 그러나 실제 트래픽이 목적지에 도달하기 위해서는 라우팅을 통하여 여러 스위치들을 거쳐야하므로 호 수락 제어 방법에 대한 성능 분석은 다단으로 연결된 스위치로 확장되는 것이 필요하다. 본 논문을 통하여 기존에 제안된 호 수락 제어 방법이 단일 스위치 환경 하에서는 적절하게 동작이 이루어지나 다단으로 스위치가 연결되어 있는 환경에서는 뒤에 위치하고 있는 스위치에 필요 이상의 유효 대역폭을 할당 한다는 것을 알 수 있다. 그러므로 본 논문에서는 공유 버퍼 메모리를 갖는 다단 네트워크 스위치 환경에서 셀 손실률과 이용률 그리고 각 스위치 출력포트의 self-similarity를 분석하여 self-similar 트래픽 환경에서 효과적으로 대역폭을 할당할 수 있는 호 수락 제어 방법을 제안한다.

SCI 네트워크 상의 소프트웨어 VIA기반 PC글러스터 시스템 (A Software VIA based PC Cluster System on SCI Network)

  • 신정희;정상화;박세진
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권4호
    • /
    • pp.192-200
    • /
    • 2002
  • PC 클러스터 시스템에서 노드 사이의 데이타 교환을 위해 사용되는 TCP/IP 기반 통신 방식은 소프트웨어 부하가 크기 때문에 전체 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제점을 해결하기 위해 사용자 수준 통신(user-level communication) 구조가 제안되었다. 사용자 수준 통신은 성능에 치명적인 영향을 미치는 커널을 통신 단계에서 제거함으로써 적은 지연 시간과 높은 대역폭을 제공하며, 이러한 우수한 성능은 업계 표준인 VIA(Virtual Interface Architecture)를 만들었다. 본 논문에서는 공유 메모리 기반 Interconnect의 IEEE 표준인 SCI(Scalable Coherent Interface) 네트워크에 기반하여 VIA 클러스터 시스템을 구현하였다. 본 논문의 클러스터 시스템은 메시지 패싱 및 공유메모리 프로그래밍 환경을 동시에 제공하며, 최대 84MB/s의 대역폭과 $8{\mu}s$의 지연 시간을 가진다. 또한, 본 시스템이 병렬 벤치마크 프로그램의 수행시 비교 대상 시스템들에 비해 성능이 우수함을 입증하였다.

CUDA를 이용한 효율적인 합산 영역 테이블의 생성 방법 (Bandwidth Efficient Summed Area Table Generation for CUDA)

  • 하상원;최문희;전태준;김진우;변혜란;한탁돈
    • 한국게임학회 논문지
    • /
    • 제12권5호
    • /
    • pp.67-78
    • /
    • 2012
  • 합산 영역 테이블은 모든 픽셀에 대해 임의의 크기 사각영역의 이미지 필터링 처리를 일정시간 안에 가능케 한다. 이러한 특성은 각각의 픽셀에 대해서 주변 픽셀의 밝기의 합 혹은 평균을 필요로 하는 이미지 처리 적용 분야에 유용하게 쓰일 수 있다. 합산 영역 테이블의 생성은 단지 행 혹은 열 단위의 합만을 구하는 메모리 바운드 작업임에도 불구하고 기존 연구들은 이미 존재하는 데이터 병렬성만을 활용하기 위하여 대기 시간이 긴 전역 메모리에 과도한 접근을 하여야만 했다. 본 논문에서는 입력 데이터를 정방의 서브 이미지로 분할하고 매개 데이터를 이들 간에 파급시킴으로써 GPGPU 환경 적합한 알고리즘을 제안하고자 한다. 이를 통하여 기존 방법 대비 전역 메모리 접근 량을 거의 반으로 줄임으로써 주어진 메모리 대역폭을 효율적으로 사용한다. 결과에서도 성능이 대폭 향상되었다.

고화질 영상에서 고속 안개 제거를 위한 SIMD 구조에 적합한 병렬메모리 (A Parallel Memory Suitable for SIMD Architecture Processing High-Definition Image Haze Removal in High-Speed)

  • 이형
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권7호
    • /
    • pp.9-16
    • /
    • 2014
  • Dark channel prior를 이용한 안개제거 알고리즘으로 만족할만한 연구결과가 발표된 이후로 이 알고리즘의 처리 속도를 높이기 위한 많은 연구들이 진행되었다. 이들 중에서 median dark channel prior를 이용한 알고리즘이 주목을 받고 있지만 여전히 낮은 처리속도의 한계를 갖고 있다. 그래서 본 논문에서는 고화질 영상에서 고속 안개 제거를 위한 SIMD 구조에 적합한 병렬메모리 모델을 제안한다. 제안하는 병렬메모리 모델은 n개의 화소들에 동시에 접근할 수 있으며, 3, 5, 7 또는 11의 크기를 갖는 4가지 종류의 median filter를 위한 간격들을 허용한다. 그래서 충분한 데이터 대역폭을 지원하기에 median dark channel prior를 이용한 알고리즘을 고속으로 처리할 수 있다.

H.264/AVC용 CAVLC 디코더의 설계 (Design of CAVLC Decoder for H.264/AVC)

  • 정덕영;손승일
    • 한국정보통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.1104-1114
    • /
    • 2007
  • 디지털 비디오 압축 기술은 대역폭과 저장 공간이 제한되는 멀티미디어 데이터의 효율적인 전송과 저장을 가능하게 하는 중요한 역할을 해왔다. JVT가 제안한 새로운 비디오 코딩 표준인 H.264/AVC는 압축 성능에 있어서 이전의 표준들을 훨씬 능가하고 있다. 특히 비디오 및 이미지 압축 응용에서 가변길이 부호는 중요한 역할을 한다. H.264/AVC 표준은 엔트로피 코딩 방식으로서 CAVLC를 채택하였다. H.264/AVC의 CAVLC는 많은 메모리 액세스를 필요로 한다. 이는 메모리 액세스시에 상당한 전력을 소비하기 때문에 DMB와 비디오 폰 서비스와 같은 응용을 위해서는 심각한 문제가 될 수 있다. 본 논문에서는 이러한 문제점을 극복하기 위해, 산술연산에 근거한 메모리 사용없는 coeff_token, level 및 run_before 디코딩을 구현하고, total_zero 가변길이 디코딩시에만 필요한 메모리의 70%만 사용하여 구현하는 가변길이 디코딩 기법을 제안한다.