• 제목/요약/키워드: Access Latency

검색결과 329건 처리시간 0.023초

이종 네트워크 간 에너지 효율적인 핸드오버를 지원하는 모바일 P2P 메시지 플랫폼 (A Mobile P2P Message Platform Enabling the Energy-Efficient Handover between Heterogeneous Networks)

  • 김태용;강경란;조영종
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권10호
    • /
    • pp.724-739
    • /
    • 2009
  • 본 논문에서는, GPS와 무선랜, 블루투스 등이 탑재된 이동 단말의 비율이 높아지게 됨에 따라, 이동 단말이 갖는 다중 무선 네트워크 기술을 활용하는 모바일 P2P 메시지 플랫폼을 제시한다. 자신과 타 단말의 GPS 정보에 근거하여 메시지 전달 방법을 '직접', '간접', '원거리'로 전달 방식을 구분한다. 근거리 무선 네트워크 접속 기술(radio access technology, RAT)를 사용하는 '직접' 방식보다 수신 단말과의 도달 거리를 늘이기 위해 릴레이 노드를 선정하여 '간접'으로 수신 단말에게 메시지를 전달한다. '직접'이나 '간접' 등의 근거리 RAT를 활용하여 메시지 전달이 불가능한 경우에는 무선 WAN(wide area network) 기술을 사용하는 '원거리' 방식으로 메시지를 전달한다. 적용할 RAT 기술을 선택하는데 있어 GPS 정보를 기반으로 함으로써 네트워크 간 핸드오버를 결정하는데 전력 소모가 적다. 네트워크 시뮬레이터를 이용하여, 메시지 전달 성능과 단말의 이동 속도와 RAT의 도달 거리에 따른 핸드오버 감지 오차에 대한 평가를 시행하였고, 제안하는 기법의 우수한 성능을 확인하였다. 제안하는 메시지 전달 기법을 포함하는 메시지 플랫폼을 스마트 폰에 실제 구현하였다. 실제 에너지 소모량 관찰과 수식적 모델링을 통해, 제안한 플랫폼을 탐재한 경우와 탑재하지 않은 경우에 대해 전력 소모를 비교하였으며, 본 플랫폼을 탑재한 경우가 그렇지 않은 경우들에 비해 전력 소모가 크게 낮음을 확인하였다.

동적 사상 테이블 기반의 버퍼구조를 통한 Solid State Disk의 쓰기 성능 향상 (A Buffer Architecture based on Dynamic Mapping table for Write Performance of Solid State Disk)

  • 조인표;고소향;양훈모;박기호;김신덕
    • 정보처리학회논문지A
    • /
    • 제18A권4호
    • /
    • pp.135-142
    • /
    • 2011
  • 본 연구는 플래시 메모리 기반의 고성능 SSD (Solid State Disk) 구조를 위하여 디스크 참조 특성에 적응적으로 구동하는 효율적인 버퍼 구조와 구동 기법을 설계한다. 기존 SSD는 삭제동작 횟수의 제약은 물론 읽기와 쓰기 동작에 대하여 비대칭적인 성능을 보이는 특징을 갖고 있다. 이러한 삭제동작 횟수와 쓰기 동작의 지연시간을 최소화 하기 위해서는 다중 플래시 메모리 칩들에 대해 쓰기 동작은 병렬적으로 수행하는 정도를 최대화하여 운영하여야 한다. 따라서 플래시 메모리 칩들에 대한 인터리빙 레벨 (interleaving level)을 최대화 하기 위하여, 본 논문에서는 혼합 위치 사상 기법 (hybrid address mapping)과 슈퍼 블록 (super-block) 기반의 SSD 구조에 대하여 성능 증대와 증가된 장치 수명을 제공하기 위한 효율적 버퍼 구조를 제안한다. 제안한 버퍼구조는 응용 수행특성을 기반으로 최적의 임의/순차쓰기를 구분하며, 수행 성능에 중요한 순차쓰기 정도의 크기를 증대시키는 동적 융합 방법, 구동되는 버퍼구조와 사상 테이블의 효율적인 관리 구조를 설계하였으며, 이를 통해 기존의 단순한 버퍼 운영기법에 비하여 35%의 성능향상을 제공한다.

연판정 Reed-Solomon 리스트 디코딩을 위한 저복잡도 Interpolation 구조 (Area-efficient Interpolation Architecture for Soft-Decision List Decoding of Reed-Solomon Codes)

  • 이성만;박태근
    • 전자공학회논문지
    • /
    • 제50권3호
    • /
    • pp.59-67
    • /
    • 2013
  • Reed-Solomon(RS) 코드는 강력한 에러 정정 능력으로 널리 사용된다. 최근 제안된 RS 코드의 리스트 디코딩 알고리즘은 일반적인 디코더보다 더 큰 디코딩 반경을 가지며 하나 이상의 코드를 찾아낸다. 리스트 디코더는 복잡도가 매우 큰 Interpolation 단계를 포함하며 효율적인 하드웨어 설계가 필요하다. 본 논문에서는 연판정 RS 리스트 디코딩 알고리즘을 위한 효율적인 저복잡도 Interpolation 구조를 제안한다. 제안된 구조는 후보다항식의 Y 차수에 대해서는 병렬로 처리하며 X 차수에 대해서는 직렬로 처리한다. 후보다항식의 처리순서는 계수의 메모리사용의 효율성을 높이기 위하여 적응적으로 결정한다. 따라서 내부 저장공간이 최소화되며 메모리 구조와 접근이 단순해진다. 또한 제안된 구조는 각 모듈의 레이턴시가 유사하고 모듈간 스케쥴링을 최대한 중첩함으로써 높은 하드웨어 효율을 보여준다. 예제로써 (255, 239) RS 리스트 디코더를 설계하였으며 동부하이텍 $0.18{\mu}m$ 표준 셀 라이브러리를 사용하여 합성하여 검증되었고 결과 최대 동작 주파수는 200MHz이고 게이트 수는 25.1K이다.

2차원 구조 대비 3차원 구조 GPU의 메모리 접근 효율성 분석 (Memory Delay Comparison between 2D GPU and 3D GPU)

  • 전형규;안진우;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.1-11
    • /
    • 2012
  • 최근 반도체 공정 기술이 발달함에 따라 단일 프로세서에 적재되는 코어의 수가 크게 증가하였고, 이는 프로세서의 성능을 급격하게 향상시키는 계기가 되고 있다. 특히, 많은 수의 코어들로 구성된 GPU(Graphics Processing Unit)는 대규모 병렬성을 활용하여 연산처리 성능을 크게 향상시키고 있다. 하지만, 주 메모리 접근 지연시간이 GPU의 성능 향상을 제약하는 심각한 요인 중 하나로 제기되는 상황이다. 본 논문에서는 3차원 구조를 통한 GPU의 메모리 접근 효율성 향상에 대한 정량적 분석과 3차원 구조 적용 시 발생 가능한 문제점에 대하여 살펴보고자 한다. 일반적으로 메모리 명령어 비율은 평균적으로 전체 명령어의 30%를 차지하고, 메모리 명령어 중에서 주 메모리 접근과 관련된 글로벌/로컬 메모리 명령어가 차지하는 비율 또한 평균 60%이므로 주 메모리로의 접근 지연시간을 크게 감소시키는 3차원 구조를 적용한다면 GPU의 성능 또한 크게 향상시킬 수 있을 것으로 예상된다. 그러나 본 논문에서 수행한 실험 결과에 따르면 메모리 병목현상으로 인해 3차원 구조 GPU의 성능이 2차원 구조 GPU에 비해 크게 향상되지는 않음을 확인할 수 있다. 분석 결과에 의하면, 3차원 구조 GPU는 2차원 구조 GPU와 비교하여 메모리 병목현상으로 인한 성능 지연이 최대 245%까지 증가하기 때문이다. 본 논문에서는 3차원 구조 GPU를 대상으로 메모리 접근의 효율성과 문제점을 함께 분석함으로써, 3차원 GPU에 적합한 메모리 구조를 설계하기 위한 가이드라인을 제시하고자 한다.

ML-AHB 버스 매트릭스 구현 방법의 개선 (An Improvement of Implementation Method for Multi-Layer AHB BusMatrix)

  • 황수연;장경선
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.629-638
    • /
    • 2005
  • 시스템 온 칩 설계에서 온 칩 버스는 전체 시스템의 성능을 결정하는 중요한 요소이다. 특히 프로세서, DSP 및 멀티미디어 IP와 같이 보다 높은 버스 대역폭을 요구하는 IP가 사용될 경우 온 칩 버스의 대역폭 문제는 더욱 심각해진다. 이에 따라 최근 ARM 사에서는 고성능 온 칩 버스 구조인 ML-AHB 버스 매트릭스를 제안하였다. ML-AHB 버스 매트릭스는 시스템 내의 다중 마스터와 다중 슬레이브간의 병렬적인 접근 경로를 제공하여 전체 버스 대역폭을 증가시켜주고, 최근 많은 프로세서 요소들을 사용하는 휴대형 기기 및 통신 기기 등에 적합한 고성능 온 칩 버스 구조이다. 하지만 내부 컴포넌트인 입력 스테이지와 무어 타입으로 구현된 중재 방식으로 인해 마스터가 새로운 전송을 수행할 때 또는 슬레이브 레이어를 변경할 때 마다 항상 1 클럭 사이클 지연 현상이 발생된다. 본 논문에서는 이러한 문제점을 해결하기 위해 기존 ML-AHB 버스 매트릭스 구조를 개선하였다. 기존 버스 매트릭스 구조에서 입력 스테이지를 제거하고, 개선된 구조에 적합하도록 중재 방식을 변경하여 1 클럭 사이클 지연 문제를 해결하였다. 개선된 결과 4-beat incrementing 버스트 타입으로 다수의 트랜잭션을 수행할 경우, 기존 ML-AHB 버스 매트릭스에 비해 전체 버스 트랜잭션 종료 시간 및 평균 지연 시간이 각각 약 $20\%,\;24\%$ 정도 짧아졌다. 또한 FPGA의 슬라이스 수는 기존의 ML-AHB 버스 매트릭스보다 약 $22\%$ 정도 감소하였고, 클럭 주기도 약 $29\%$ 정도 짧아졌다.

IoT 게이트웨이 기반 지능형 건물의 이벤트 중심 아키텍쳐 설계 (Design of IoT Gateway based Event-Driven Architecture for Intelligent Buildings.)

  • 라이오넬;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.256-259
    • /
    • 2016
  • 모바일 기기는 사물 인터넷으로 성장하여 지능형 건물과 관련된 많은 IoT 응용 프로그램으로 연계 된다. 예를 들어 주택 자동화 제어 시스템은 스마트 폰으로 제어 명령을 보냄으로써, 홈 서버에 액세스를 하는 클라이언트 구조의 웹 어플리케이션을 요구한다. 홈 서버는 광 통신 시스템으로 명령어를 수신 받고 컨트롤 한다. 게이트웨이 기반 REST 기술은 클라이언트에서 요청하는 명령어를 처리 및 증명해야 한다. 이러한 이유는 클라이언트 요청에 의해 다수의 게이트웨이 증가로 인한 인터넷이 지연 되기 때문이다. 본 논문에서는 동시성 이벤트를 처리하기 위한 IoT 게이트웨이 시스템 설계를 하고자 한다. 본 시스템을 통하여 동시성 최고의 다중 추상화 레벨을 확인 할 수 있다. 동시성을 확인하는 방법은 개체 간의 데이터 통신을 지원하는 객체 지향 시스템을 구축하는 것이다. 또한 IoT 게이트웨이 기반으로 양방향통신 방법 중 한쪽 통신 방향 프로토콜에 Node.js를 사용하여 이벤트 중심, 지능형 건물의 설계를 위한 아키텍쳐의 성능을 XMPP라는 미들웨어를 사용하여 확인하고자 한다. Node.js는 지능형 건물 제어장치가 중앙 집중화 형식의 허브를 통하여 통신이 될 수 있도록 하는 역할을 가지고 있다. Node.js는 스레드 기반의 접근 방식이 특징이며, 기존의 시스템보다 40% 이상 빠르다. Node.js를 서버 측에서 사용하기 위해 다수의 클라이언트 들로부터 요청을 한다. 따라서, IoT 환경에서 지능형 건축물의 작업수행 시간을 감소 시킨다.

  • PDF

게임서버의 CPU 사용율 기반 효율적인 부하균등화 기술의 설계 및 구현 (Design and Implementation of Game Server using the Efficient Load Balancing Technology based on CPU Utilization)

  • 명원식;한준탁
    • 한국게임학회 논문지
    • /
    • 제4권4호
    • /
    • pp.11-18
    • /
    • 2004
  • 과거의 온라인 게임은 일대일 접속으로 두 사람만이 데이터를 주고받으며 게임 할 수 있었으나 현재의 온라인 게임은 MMORPG라고 해서 수만 명의 사람들이 동시에 접속이 가능하다. 특히 우리나라는 세계 어느 나라에서 찾아 볼 수 없는 네트워크 인프라를 확보하고 있다. 거의 모든 가정에 초고속 인터넷 통신망이 설치되어 있으며 높은 인구 밀도는 이런 인프라의 형성을 가속화하는 것을 가능하게 했다. 하지만 이러한 온라인 게임의 급격한 증가는 제한적인 인터넷의 통신용량에 대하여 트래픽의 증가로 이어지고 온라인 게임이 접속이 불안정해지거나 접속이 다운되는 상태로 이어질 가능성이 높다. 이러한 문제를 해결하기 위해 각 게임 서버를 보다 확충함으로서 해결할 수 있으나 그럴 경우 고비용을 필요로 하게 된다. 본 논문에서는 이러한 문제점을 해결하고자 현재의 온라인 게임에서 사용되고 있는 컨텐츠별로 나누어진 게임 서버들을 지 역 클러스터 링 형태로 연결하고, 부하 균등화(Load Balancer)서버로써 특정한 게임 서버의 부하를 감소시키고 게임 서버의 성능 향상과 효율적인 게임 서버 운용을 위하여 부하 균등화 기법을 제안한다. 본 논문에서는 그룹별 각각 다른 서비스를 하고 CPU 사용율의 자원정보를 이용하여 효율적으로 부하를 균등화하는 기법을 제안한다. 각각 서로 다른 게임을 서비스하는 그룹들은 컨텐츠들에 대한 수정, 삭제, 추가 등 자원 정보 변경으로 인하여 깨어질 수도 있는 자원 정보 일관성을 유지하기 위해 네트워크 파일 시스템에 연결되어 운영된다. 성능 실험을 통해 기존의 RR방식과 LC방식보다 제안한 방식이 각각 12%와 10%의 응답시간 향상을 보여주었다.기간효과를 별도로 취급하기는 쉽지 않다.이즈의 영향이 가장 클 것으로 판단된다. 항원성시험에서 casein으로 피하 감작할 경우 푸른색 반점이 나타났으나 효소처리구에서는 이러한 반점이 나타나지 않아 충분히 항원성이 저감화 되었음을 확인하였다. 행동을 평가하는데 있어 적정한 신뢰도와 타당도를 가지고 있었으며 임상 장면에서 아동의 행동 문제에 대한 평가 및 진단에 유용하게 사용될 수 있을 것으로 보인다.식적인 형태소-음소 상응 규칙 적용 능력 모두에서 장애를 보였으며, 거울상 반전 오류 등 시각적 정보 처리 기능의 장애도 나타내었다. 이들 장애는 단어/비단어 읽기 검사와 글자기호감별검사를 통해 신뢰할 수 있고 타당성 있게 구분하고 평가할 수 있었다.치료 시 고려해야 할 것이다.순차처리항목과 계산능력에서 유의하게 높았고(p<.05), KEDI-WISC를 이용한 평가에서는 ADHD- HI형은 대상수가 소수여서 비교할 수 없었으며, ADHD-C형과 ADHD-Ⅰ형 사이에 유의한 차이는 보이지 않았다. CPT, WCST, SST를 이용한 신경심리학적 실행기능의 비교에서 아형간 계량적인 차이는 있었으나 통계적으로 유의한 차이는 보이지 않았다. 결 론:결론적으로 ADHD 세 아형은 임상적으로 뚜렷한 차이를 보였지만, 실행기능상 유의한 차이를 발견할 수 없었다. 향후 보다 잘 고안 된 연구와 발달중인 아동에 적절한 신경심리 평가 도구의 개발을 통해 결과를 보완해야 할 것으로 사료된다.었으나, 주의력에서는 전두엽의 실행능력(executive function)과 관련되는 검사들에서 산소흡입이 특이한 효과를 보여준다는 것이 확인되었고, 기억능력에서는 단기기억능력 평가에서 산소흡입군이

  • PDF

캐시 메모리의 유용성을 높이는 동적 선인출 필터링 기법 (A Dynamic Prefetch Filtering Schemes to Enhance Usefulness Of Cache Memory)

  • 전영숙;이병권;이춘희;김석일;전중남
    • 정보처리학회논문지A
    • /
    • 제13A권2호
    • /
    • pp.123-136
    • /
    • 2006
  • 캐시 선인출 기법은 메모리 참조에 따른 지연시간을 줄이는 효과적인 방법이다. 그러나 너무 적극적으로 선인출할 경우에 캐시 오염을 유발시켜 선인출에 의한 장점을 상쇄시킬 뿐만 아니라 버스 트래픽을 증가시켜 전체 성능의 저하를 가져 올 수 있다. 본 연구에서는 선인출로 인한 캐시의 오염을 줄이기 위해 필터 테이블을 참조하여 선인출 명령을 수행할 지의 여부를 동적으로 판단하는 선인출 필터링 기법을 제시한다. 본 논문에서는 먼저 기존 연구에서의 문제점을 분석하기 위해 선인출 해싱 테이블 lbitSC 기법을 보였는데, 이 기법은 기존 연구와 같이 N:1 매핑을 사용하는 반면, 각 엔트리의 값을 1비트로 하여 두 가지 상태값을 갖도록 하였다. 비교 연구를 위해 완전 블록주소 테이블 기법을 제시하여 비교 기준으로 사용하였다. 마지막으로 본 논문의 주 아이디어인 정교한 필터링을 위한 선인출 블록주소 참조 테이블 기법을 제안하였다. 이 구조는 선인출 해싱 테이블 1bitSC기법과 같은 테이블 길이를 가지며, 각 엔트리의 내용은 완전 블록주소 테이블 기법과 같은 항목을 가지도록 하여 최근에 미 사용된 데이터의 블록주소가 필터 테이블의 하나의 엔트리와 대응되도록 1:1 매핑을 하였다. 일반적으로 많이 사용되는 선인출 기법과, 일반 벤치마크 프로그램과 멀티미디어 벤치마크 프로그램들에 대하여 캐시의 매개변수들을 변화시켜가면서 실험을 하였다. PBALT기법은 필터링 하지 않은 경우에 비해 최대 22% 향상된 결과를 보이고, 기존 PHT2bSC 기법과 비교하여 캐시 미스율이 7.9% 감소하였다. 메모리 참조 지연 시간(MADT)은 제안하는 PBALT 기법이 기존 연구에 비해 6.1% 감소하여 전체 수행 시간에 있어서 성능이 향상되었다.

클라우드 시스템에서 해양수치모델 성능 최적화 (Performance Optimization of Numerical Ocean Modeling on Cloud Systems)

  • 정광욱;조양기;탁용진
    • 한국해양학회지:바다
    • /
    • 제27권3호
    • /
    • pp.127-143
    • /
    • 2022
  • 최근 클라우드 컴퓨팅 환경에서 해양수치모델 실험을 수행하는 많은 연구가 활발하게 진행되고 있다. 클라우드 컴퓨팅 환경은 대규모 자원이 필요한 해양수치모델을 구현하는데 매우 효과적인 수단이 될 수 있다. 정보처리 기술의 발달로 클라우드 컴퓨팅 시스템은 가상화와 원격 고속 네트워크, 직접 메모리 액세스와 같은 수치모델의 병렬처리에 필요한 다양한 기술과 환경을 제공한다. 이러한 새로운 기능은 클라우드 컴퓨팅 시스템에서 해양수치모델링 실험을 용이하게 한다. 많은 과학자들과 엔지니어들은 해양수치모델 실험에 있어서 가까운 미래에 클라우드 컴퓨팅이 주류가 될 것으로 기대하고 있다. 해양수치모델링을 위한 클라우드 컴퓨팅의 처리성능 분석은 수치모델의 수행 시간과 리소스 활용량을 최소화하는 데 도움이 될 수 있으므로 최적의 시스템을 적용하는 데 필수적이다. 특히 모델 격자 내 다양한 변수들이 다차원 배열 구조로 되어 있기 때문에 대량의 입출력을 처리하는 해양수치모델의 구조는 캐시메모리의 효과가 크며, 대량의 자료가 이동하는 통신 특성으로 인해서 네트워크의 속도가 중요하다. 최근에 주요한 컴퓨팅환경으로 자리잡고 있는 클라우드 환경이 이러한 해양수치모델을 수행하기에 적합한지 실험을 통해서 검토할 필요가 있다. 본 연구에서는 상용 클라우드 시스템에서 해양수치모델로 대표적인 Regional Ocean Modeling System (ROMS)와 더불어 다른 해양모델의 클라우드 환경으로 전환에도 도움이 될 수 있게 병렬처리 시스템의 성능을 측정할 수 있는 표준 벤치마킹 소프트웨어 패키지인 High Performance Linpack을 활용하여 초당 부동소수점 연산횟수 처리능력과 및 STREAM 벤치마크를 활용하여 다중 노드들로 구성된 수치모델용 클러스터의 메모리처리성능을 평가하고 비교하였다. 이러한 평가내용은 클라우드 환경에서 해양수치모델을 어떻게 수행할 것인가에 대해 중요한 정보를 제공할 수 있다. 가상화 기반 상용 클라우드에서 얻은 실제 성능 자료와 구성 설정 분석을 통해 가상화 기반 클라우드 시스템에서 해양수치모델의 다양한 격자 크기에 대한 컴퓨터 리소스의 효율성을 평가했다. 본 연구를 통해서 캐시 계층과 용량이 큰 메모리를 사용하는 HPC 클러스터가 ROMS의 성능에 매우 중요하다는 것을 발견했다. 수치모델링의 실행 시간을 줄이기 위해 코어 수를 늘리는 것은 작은 격자 보다 큰 격자 모델에서 더 효과적이다. 이러한 처리 성능 분석 결과는 클라우드 컴퓨팅 시스템에서 해양수치모델을 효율적으로 구축하는 데 중요한 자료로 이용될 것이다.