• 제목/요약/키워드: 멀티코어

검색결과 413건 처리시간 0.025초

지역망간의 트리전환을 이용하는 인터넷 멀티캐스트 라우팅 프로토콜 (An Internet Multicast Routing Protocol with Region-based Tree Switching)

  • 김원태;박용진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권2호
    • /
    • pp.234-243
    • /
    • 2000
  • 본 논문에서는 인터넷 네트워크 구조 및 트래픽 특성을 고려하여 수정 계층적 네트워크 모델을 설계하고, 이를 기반으로 확장성, 데이타 손실율, 전송지연특성 그리고 자원효율성 등을 향상시킨 EDCBT(Enhanced Dispersed Core-Based Tree) 멀티캐스트 라우팅 프로토콜을 제시한다. EDCBT는 양방향성 분산공유트리방식으로, 기존의 방식들과는 달리 도메인 내부의 트리관리와 도메인간 트리관리 모두를 통합처리할 수 있는 구조로 설계되어 있다. 도메인 내부에서는 코어 라우터를 중심으로 CBT 형태의 멀티캐스트 트리를 구성하고, 이렇게 형성된 각 도메인간의 트리구성은 경계라우터들간의 상호작용을 통해 이루어지게 된다. EDCBT의 주요 특징으로서 지역망간 트리전환이라는 새로운 개념을 도입하였는데, 이를 통해 통신의 품질과 네트워크 이용율을 획기적으로 향상시킬 수 있다. 최종적으로 제안 프로토콜의 성능평가 및 코어 라우터의 위치에 따른 효과등을 종단간 전송지연 및 데이타 손실율, 망처리율과 같은 대표적인 평가기준에 따라 네트워크 모의실험용 소프트웨어인 MIL3사의 OPNet을 이용하여 검증한다.

  • PDF

멀티코어 CPU 환경하에서 능률적인 네트워크 관리를 위한 유전알고리즘을 이용한 국부적 RED 조정 기법 (A Local Tuning Scheme of RED using Genetic Algorithm for Efficient Network Management in Muti-Core CPU Environment)

  • 송자영;최병석
    • 인터넷정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.1-13
    • /
    • 2010
  • 네트워크 장비를 관리함에 있어서 환경에 따른 RED(Random Early Detection) 매개변수에 대한 설정은 쉽지 않은 일이다. 특히 관리자가 환경의 변화에 따라 일정한 서비스율을 유지하고 싶은 경우의 매개변수 설정은 더욱 쉽지 않은 일이다. 본 논문에서는 출력 큐에 멀티 코어 CPU를 탑재한 라우터를 가정하고 라우터의 출력 큐에, RED의 환경에 따른 매개변수의 최적화에 적합한 것으로 알려진, 인공지능의 유전 알고리즘을 직접적으로 도입하여 스스로 부하에 적응하는 AI RED(Artificial Intelligence RED)를 제안한다. AI RED는 FuRED(Fuzzy-Logic-based RED) 보다 단순하고 세밀하며, 실험을 통하여 AI RED가 찾아낸 RED 매개변수는 표준 RED 매개변수보다 환경에 더욱 잘 적응하는 효율적인 서비스를 제공하여 준다는 것을 확인 할 수 있다. RED 매개변수 관리의 자동화는 네트워크 관리의 측면에서 많은 효율성의 향상을 관리자에게 제공하여 줄 수 있다.

고성능 컴퓨팅 환경에서 유전체 서열 분석 벤치마크 (A Genomes Analysis Benchmark in High Performance Computing)

  • 최재훈;정호열;박수준;최완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.30-32
    • /
    • 2012
  • 본 논문에서는 고성능 컴퓨팅 환경에서 유전체 서열 분석 도구들을 벤치마크 하기 위한 시스템을 개발하고 실제 유전체 데이터를 이용하여 성능을 비교하였다. 이 벤치마크 시스템은 유전체 분석 파이프라인 절차에 따라 다양한 분석 도구들을 CPU 멀티 코어와 GPU 매니 코어 환경에서 선택적으로 구동할 수 있도록 지원한다. 따라서, 서로 다른 환경에서 수행된 다양한 유전자 분석 도구의 성능을 실제 유전체 서열 데이터를 이용하여 비교하고 시각화할 수 있다.

CUDA 를 이용한 고속 자막 처리 기술 (High-speed caption processing technology using CUDA)

  • 김현수;김대열;권승철;손채봉
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.102-105
    • /
    • 2015
  • 본 논문에서는 멀티미디어 및 수학 관련 알고리즘 분야에서 각광 받고 있는 CUDA(Compute Unified Device Architecture) 기법을 실시간 동영상 자막 처리에 이용 한다. 실시간 고화질 동영상 자막 처리의 낮은 속도를 개선하기 위한 방법 제안으로 써, 이의 함수 구성을 제안한다. 기존의 자막 처리 방식에서는 하나의 코어만을 이용하였다. 이 방법 대신에 CUDA 를 적용 함으로써, 더 많은 코어를 이용해 실시간 자막 처리의 지각적인 성능을 향상하였다. 삽입하고자 하는 자막에 대해 비트맵 이미지를 형성하고, 이의 정보를 처리한다. Intel $Core^{TM}$ i7-4710 MQ, GTX870 환경에서 실험하였으며, 실험 결과 C code 만으로 연산을 한 것 보다 CUDA code 가 약 88% 정도의 속도 향상이 있음을 보였다.

  • PDF

메모리 시스템 구조 분석을 위한 시뮬레이터 (Bank Level Simulator to Analysis Memory System)

  • 강동우;최종무
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.40-42
    • /
    • 2014
  • 최근의 컴퓨터 시스템은 멀티 코어를 기반으로 병렬성 향상을 추구 하고 있지만 코어의 개수가 증가함에 따라 메모리가 새로운 병목 지점으로 지적되고 있다. 메모리 시스템은 가상 메모리, 물리 메모리, 뱅크 메모리 3계층으로 나눌 수 있으며, 각 계층은 상호연관 관계가 있어서 분석하기에 어려움이 있다. 본 논문에서는 이를 위해 계층 구조를 지원하는 시뮬레이터를 제안한다. 제안하는 시뮬레이터는 총 5개의 구성 요소로 이루어져 있으며, CPU 개수, 캐시 정책, 뱅크 개수등 다양한 설정을 지원한다. 또한 시뮬레이터를 통하여 운영체제 수준의 물리 메모리 관리자가 메모리 접근 지연에 영향이 있음을 보인다.

Tachyon 클러스터 시스템에서의 네트워크 성능 평가 (Network performance evaluation of Tachyon cluster systems)

  • 차광호;김성호;이식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1725-1727
    • /
    • 2010
  • 멀티 코어 또는 매니 코어 기반 시스템을 클러스터 시스템의 단위 노드로 활용하면서 클러스터 시스템은 다양한 형태의 노드내(Intra-node)및 노드간(Inter-node)네트워크를 가지게 되었다. 최적화된 어플리케이션의 개발을 위해서는 해당 시스템의 이러한 네트워크적 특징을 미리 파악하는 것이 중요하다고 할 수 있다. 본 논문에서는 서로 다른 계산 노드를 사용하는 클러스터 시스템에서 네트워크 성능을 비교 분석하였다.

SMP 슈퍼컴퓨터에서의 집합 IO 성능 (Performance evaluation of collective I/O on an SMP supercomputer)

  • 차광호;김성호;이식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1732-1734
    • /
    • 2010
  • 멀티 코어 또는 매니 코어 기반의 HPC 시스템 보급이 늘어나면서 HPC 어플리케이션이 사용하는 프로세스의 수 또한 증가하고 있다. 이런 경우, 기존의 IO 방식이 아닌 병렬 IO 의 사용을 고려하여야 하는데 그 중 특히 집합 IO 는 중요한 역할을 수행한다. 본 연구에서는 IBM Power 595 기반 슈퍼 컴퓨터에서 집합 IO 특성을 알아 본다.

한정된 전력량을 가진 멀티프로세서 시스템에서 (m,k)-firm 데드라인 태스크를 위한 실시간 스케줄링 기법 (Real-time Scheduling for (m,k)-firm Deadline Tasks on Energy-constrained Multiprocessors)

  • 공연화;조현중
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권6호
    • /
    • pp.237-244
    • /
    • 2013
  • 본 연구에서는 전력량 제약을 가진 멀티프로세서 시스템에서 (m,k)-firm 데드라인을 갖는 실시간 태스크를 효율적으로 스케줄링 할 수 있는 방법으로 EMRTS-MK(Energy-constrained Multiprocessor Real-Time Scheduling algorithms for (m,k)-firm deadline constrained tasks) 를 제안한다. EMRTS-MK는 단지 전력 소모량을 최소로 줄이는 것이 목표가 아니라 한정된 전력량을 고려하여 시스템이 주어진 임무 시간(Mission Time) 동안 최소한의 서비스 품질을 보장하고 동시에 가능하면 최대한의 서비스 품질을 제공함을 목표로 한다. 본 연구에서는 상용멀티코어 환경에서 EMRTS-MK를 구현하여 성능을 평가하였으며, 제안된 알고리즘이 (m,k)-firm 데드라인을 갖는 멀티미디어 서비스를 효과적으로 지원해 줄 수 있다는 것을 보였다.

ETSI BRAN(Broadband Radio Access Network)의 무선 ATM 및 광대역 무선 액세스 네트워크 표준화 및 기술동향

  • 이우용;김용진;강충구
    • 정보와 통신
    • /
    • 제15권11호
    • /
    • pp.124-142
    • /
    • 1998
  • ETSI BRAN (Broadband Radio Access Network)는 고속 무선 LAN 또는 고정 광대역 무선액세스 네트워크에서의 무선 접촉 계층과 ATM 및 IP(Internet Protocol) 코어 네트워크와의 연동을 위한 일부 기능을 표준화하기 위한 과제이다. 특히, BRAN의 HIPERLAN type-2(HIPERLAN/2)의 경우에는 과제의 범위는 무선 접속면, 무선 부시스템에서의 서비스 인터페이스, 서비스 구현에서 요구되는 연동 및 각종 지원 기능을 표준화하며, 무선 접속면의 경우에는 다수 벤더간의 상호 호환성을 제공할 수 있는 인터페이스를 구현하는 것이다. HIPERLAN/2의 기술 규격은 코어 네트워크와 독립적인 물리계층 및 데이터 링크 제어 (DATA Link Control: DLC) 계층과 서로 상이한 코어 네트워크와의 연동을 위한 네트워크 수렴 부계층을 다루게 될 것이며, 초기 단계에서는 ATM과 IP 코어 네트워크와의 연동 기능을 제시하게 될 것이다. 따라서 HIPERLAN/2기반의 시스템 규격을 제시하기 위해서는 네트워크 계층 및 기타 상위 계층에 대한 규격이 요규되며, 이는 ATM Forum에서의 무선 ATM 신호 방식 규격, IETF(Internet Engineering Task Force)의 IP규격, 그리고 ETSI의 SMG (Special Mobile Group) 프로젝트에서 표준화되고 있는 UMTS (Universal Mobile Telecommunication Service) 규격 등과 접목될 것이다. 결과적으로 무선 ATM 관점에서는 완전한 시스템 규격 작성은 ETSI BRAN과 ATM Forum에서 무선 접속 규격과 이동성 관리 및 신호 방식으로 각각 이원화되어 진행되고 있다. 현재 물리 계층에서의 전송 방식은 OFDM(Orthogonal Frequency Division Multiplexing)으로 확정되었으며, DLC 계층에서는 고정 길이의 TDD (Time Division Duplexing) TDMA 프레임 구조를 기반으로 AP (Access Point)에 의해 동적으로 상향 링크 자원을 예약 할당하는 매체 접근 제어 (Medium Access Control: MAC) 프로토콜이 고려되고 있다. 이와 같은 DLC 계층에서는 기본적으로 짧은 길이의 패킷을 통해 다양한 대역폭의 멀티미디어 트래픽을 효율적으로 수용하면서 ATM 네트워크뿐만 아니라 향후 IP 네트워크에서 요구하는 각 서비스별 QoS (Quality of Service)를 개별적으로 보장할 수 있는 기능을 구현하고자 한다. 향후 이 부문에 대한 표준화가 본격적으로 진행될 것으로 예상되며 HIPERLAN/2의 경우에는 1999년 중반까지 1차 기능 규격을 완료할 예정이며, BRAN 전반에 대한 완전한 규격을 2002년까지 완성하는 것을 목표로 하고 있다.

  • PDF

A Packet Processing of Handling Large-capacity Traffic over 20Gbps Method Using Multi Core and Huge Page Memory Approache

  • Kwon, Young-Sun;Park, Byeong-Chan;Chang, Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.73-80
    • /
    • 2021
  • 본 논문에서는 멀티 코어 및 Huge Page 메모리 접근법을 이용한 20Gbps 이상의 대용량 트래픽 처리 가능한 패킷 처리 방법을 제안한다. ICT 기술이 발전함에 따라 전 세계 월 평균 트래픽은 2022년 396엑사 바이트에 이를 것으로 예측된다. 이러한 네트워크 트래픽의 증가와 동시에 사이버위협 또한 증가하고 있어 트래픽 분석에 대한 중요도가 높아지고 있다. 기존 고비용의 외산 제품으로 분석되고있는 트래픽은 단순히 통계 데이터를 저장함과 동시에 가시적으로 보여주는 것에 불과하다. 네트워크 관리자들은 다양한 구간에서 트래픽을 분석하기 위해 많은 트래픽 분석 시스템을 도입하여 분석하고 있으나, 망 전체의 통합된 트래픽을 확인할 수 없다. 또한, 기존 장비는 10Gbps급이 대부분이기 때문에 매년 증가되고 있는 트래픽을 빠른속도로 처리할 수 없다. 본 논문에서는 20Gbps 이상 대용량 트래픽 처리를 하기 방법으로 단일코어와 기본 SMA 메모리 접근법을 이용한 방법에서 멀티코어와 NUMA 메모리 접근법을 이용하여 고성능으로 패킷수신, 패킷검출, 통계까지 raw 패킷을 copy 없이 처리하는 과정을 제안한다. 제안한 방법을 이용하였때, 기존 장비보다 50%이상 트래픽이 처리되는 것을 확인할 수 있었다.