• 제목/요약/키워드: Kernel Memory

검색결과 179건 처리시간 0.024초

ARM PA를 통한 경량화된 파일 디스크립터 권한 관리 시스템 (Lightweight Capability-Based Access Control System on File Descriptor via ARM PA)

  • 조규원;이호준
    • 정보보호학회논문지
    • /
    • 제33권2호
    • /
    • pp.319-323
    • /
    • 2023
  • 프로세스 내부 격리(Intra-process Isolation)에서 파일 디스크립터는 메모리 이외에 또 다른 공격 벡터로써 작용한다. 공격자는 파일 디스크립터를 변조함으로 주어진 권한 이상의 파일에 읽거나 쓰는 방식을 통해 격리된 환경을 벗어날 수 있다. 본 논문에서는 ARM 아키텍처의 하드웨어 보안 기술인 PA(Pointer Authentication) 기반의 경량화된 새로운 파일 디스크립터의 권한 관리 시스템을 제시한다. 우리의 무결성 보장 기법은 리눅스 커널 모듈의 형태로 제작되었으며 5% 정도의 오버헤드만으로 파일 디스크립터에 대한 권한 관리를 수행하였다.

RPC 기반 GPU 가상화 환경에서 다중 가상머신의 GPU 메모리 입력으로 인한 커널 함수의 지연 문제 분석 (Analyzing delay of Kernel function owing to GPU memory input from multiple VMs in RPC-based GPU virtualization environments)

  • 강지훈;김수균
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.541-542
    • /
    • 2021
  • 클라우드 컴퓨팅 환경에서는 고성능 컴퓨팅을 지원하기 위해 사용자에게 GPU(Graphic Processing Unit)가 할당된 가상머신을 제공하여 사용자가 고성능 응용을 실행할 수 있도록 지원한다. 일반적인 컴퓨팅 환경에서 한 명의 사용자가 GPU를 독점해서 사용하기 때문에 자원 경쟁으로 인한 문제가 상대적으로 적게 발생하지만 독립적인 여러 사용자가 컴퓨팅 자원을 공유하는 클라우드 환경에서는 자원 경쟁으로 인해 서로 성능 영향을 미치는 문제를 발생시킨다. 본 논문에서는 여러 개의 가상머신이 단일 GPU를 공유하는 RPC(Remote Procedure Call) 기반 GPU 가상화 환경에서 다수의 가상머신이 GPGPU(General Purpose computing on Graphics Processing Units) 작업을 수행할 때 GPU 메모리 입력 경쟁으로 인해 발생하는 커널 함수의 실행 지연 문제를 분석한다.

  • PDF

Providing scalable single-operating-system NUMA abstraction of physically discrete resources

  • Baik Song An;Myung Hoon Cha;Sang-Min Lee;Won Hyuk Yang;Hong Yeon Kim
    • ETRI Journal
    • /
    • 제46권3호
    • /
    • pp.501-512
    • /
    • 2024
  • With an explosive increase of data produced annually, researchers have been attempting to develop solutions for systems that can effectively handle large amounts of data. Single-operating-system (OS) non-uniform memory access (NUMA) abstraction technology is an important technology that ensures the compatibility of single-node programming interfaces across multiple nodes owing to its higher cost efficiency compared with scale-up systems. However, existing technologies have not been successful in optimizing user performance. In this paper, we introduce a single-OS NUMA abstraction technology that ensures full compatibility with the existing OS while improving the performance at both hypervisor and guest levels. Benchmark results show that the proposed technique can improve performance by up to 4.74× on average in terms of execution time compared with the existing state-of-the-art opensource technology.

커널 레벨 RTP를 지원하는 확장 BSD 소켓 API (Extended BSD Socket API Supporting Kernel-level RTP)

  • 최문선;김경산;김성조
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권6호
    • /
    • pp.326-336
    • /
    • 2006
  • 유무선 통신 기술 및 인터넷의 발전으로 인터넷 방송, VOD 등과 같은 멀티미디어 서비스가 일반화되고 있다. RTP는 인터넷상에서 실시간 멀티미디어 데이타를 전송하는데 적합하도록 IETF에서 제정한 프로토콜이다. RTP는 주로 라이브러리 형태로 구현되어 다양한 애플리케이견에 사용되나, 라이브러리 형태로 사용되는 RTP는 성능 측면에서 문제가 있어 이를 개선한 프로토콜이 embeddedRTP이다. 본 논문에서는 기존의 커널 레벨 RTP인 embeddedRTP를 기반으로 그 문제점을 보완하며, API를 네트워크 애플리케이션에서 널리 사용되는 BSD 소켓 API와 통합하고 그 성능을 개선한 ExtendedERTP를 제안한다. embeddedRTP의 API가 BSD 소켓 API에 통합되어 기존의 네트워크 스택이 RTP를 내장하게 되면, 사용자들은 별도의 RTP 라이브러리를 사용할 필요 없이 익숙한 BSD 소켓 API 형태의 인터페이스를 통해 실시간 데이타를 송수신할 수 있다. 본 논문은 또한 embeddedRTP에 비해 패킷 처리 속도를 15$\sim$20% 가량 향상시키는 방안과 패킷 처리에 필요한 메모리 요구량을 기존의 3.5% 수준으로 줄일 수 있는 방안을 제시한다.

H.264/AVC 디코더를 위한 Embedded SoC 설계 (Embedded SoC Design for H.264/AVC Decoder)

  • 김진욱;박태근
    • 대한전자공학회논문지SD
    • /
    • 제45권9호
    • /
    • pp.71-78
    • /
    • 2008
  • 본 논문에서는 H.264AVC baseline 디코더를 ARM926EJ-S 코어를 탑재한 FPGA(XC4VLX60)기반의 타겟 보드와 임베디드용 Linux Kernel 2.4.26의 개발환경에서 SW/HW 분할을 통해 설계 및 구현하였다. 하드웨어 가속기로는 움직임 보상 모듈 디블록킹 필터 모듈, YUV2RGB 변환 모듈을 사용하였으며 AMBA 버스 프로토콜을 통하여 소프트웨어와 함께 동작한다. 참조 소프트웨어(JM 11.0)를 OS(Linux)상에서 하드웨어 가속 모듈을 추가하고 메모리 접근 등을 최소화함으로써 성능을 향상시키고자 노력하였다. 설계된 하드웨어 IP와 시스템은 여러 단계로 검증하였으며 시스템의 복호화 속도 개선을 도모하였다. QCIF (176$\times$144) 영상을 24MHz의 클록 주파수의 타겟 보드상에서 약 2 frames/sec의 결과를 얻었으며 타겟 보드의 주파수를 증가시키고 FPGA영역의 IP를 ASIC으로 구현하면 더 좋은 성능을 기대할 수 있다.

클러스터링 웹 서버 환경에서 차별화 서비스를 위한 3단계 동적 부하분산기법 (The three-level load balancing method for Differentiated service in clustering web server)

  • 이명섭;박창현
    • 한국통신학회논문지
    • /
    • 제30권5B호
    • /
    • pp.295-303
    • /
    • 2005
  • 최근 들어, 인터넷 사용자의 폭발적인 증가로 인하여 차별화된 웹 서비스를 제공해주는 웹 응용프로그램들의 개발이 활발해지고 있다. 이에 따라 웹 서버내의 품질향상을 보장해주는 웹 QoS 기술은 전자상거래나 웹 호스팅 같은 부분에서 점점 더 중요한 문제로 대두되고 있다. 그러나 대부분의 웹 서버들은 FIFO 방식의 최선 서비스만을 제공하고 있으며, 정보의 중요도나 정보를 제공받는 사용자의 중요도에 따라 차별화된 품질보장을 제공하지 못한다. 본 논문에서는 클러스터링 웹 서버 환경에서 차별화 서비스를 위한 3단계 동적 부하분산 기법을 제안한다. 먼저, 커널 수준 접근 방식에서는 커널 상에 실시간 스케줄링 프로세스를 두어 웹 서버에서 수행중인 스케줄링 프로세스와 연동시키고, 커널 내부에서도 웹 서버에서 할당된 사용자 요청 우선순위를 유지하도록 한다. 둘째, 웹 서비스의 신뢰성과 반응속도를 개선하기 위하여 IP수준의 가장법과 터널링 기술을 이용하여 웹 서버의 부하를 분산을 수행한다. 셋째, 동적 부하분산을 제공하기 위해 SNMP중에 시스템 부하관련 MIB-II 정보를 검출하여 부하 분산에 반영한다.

NRD 접근을 위한 리눅스 블록 디바이스 드라이버 (Block Device Driver of Linux for Accessing the NRD)

  • 손태영;임성락
    • 한국산학기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.3399-3406
    • /
    • 2015
  • NRD(Network RamDisk)는 원격 시스템의 메모리를 네트워크를 통하여 마치 자신의 블록 디바이스처럼 사용할 수 있도록 하는 기법이다. 기본적으로 이 기법은 NRD 접근을 요청하는 NRD 클라이언트와 NRD를 제공하는 NRD 서버 시스템으로 구성된다. 본 논문에서는 리눅스 커널(2.6) 수준에서 NRD 접근을 지원하기 위한 블록 디바이스 드라이버의 설계, 구현 그리고 실험을 제시한다. 이를 위하여 우선 기존 리눅스 커널에서 블록 디바이스에 대한 접근 요청이 처리되는 과정을 분석하여 NRD를 지원하기 위하여 요구되는 추가적인 기능들을 도출한다. 그리고 이 기능들을 제공하는 NRD 클라이언트의 디바이스 드라이버와 NRD 서버를 설계 및 구현한다. 마지막으로 NRD 서버 시스템을 구축하고, 구현된 NRD 디바이스 드라이버를 통한 NRD 클라이언트의 NRD 접근 요청을 실험함으로써 제시한 기법의 기능적 타당성을 검토한다.

실시간 SAR 영상 생성을 위한 Range Doppler Algorithm의 GPU 가속 (GPU Acceleration of Range Doppler Algorithm for Real-Time SAR Image Generation)

  • 정동민;이우경;이명진;정윤호
    • 전기전자학회논문지
    • /
    • 제27권3호
    • /
    • pp.265-272
    • /
    • 2023
  • 본 논문에서는 FMCW(Frequency Modulated Continuous Wave) SAR(Synthetic Aperture Radar) 기반 실시간 영상 형성을 위해 RDA(Range Doppler Algorithm)의 GPU 가속 커널을 개발하였다. Host와 GPU device 사이의 데이터 전송 시간을 최소화하기 위해 pinned 메모리를 사용하였고, 데이터의 전송 횟수를 최소화하기 위해 모든 RDA 연산을 GPU에서 수행하도록 커널을 구성하였다. FMCW 드론 SAR 실험을 통해 데이터셋를 획득하였고, intel i7-9700K CPU, 32GB RAM과 Nvidia RTX 3090 GPU 환경에서 GPU의 가속 효과를 측정하였다. Host-device간 데이터 전송 시간을 포함했을 경우 CPU 대비 최대 3.41배 가속된 것으로 측정되었고, 데이터 전송 시간을 포함하지 않고 연산의 가속 효과만을 측정했을 때, 최대 156배 가속 가능함을 확인할 수 있었다.

공정 모니터링 기술의 최근 연구 동향 (Recent Research Trends of Process Monitoring Technology: State-of-the Art)

  • 유창규;최상욱;이인범
    • Korean Chemical Engineering Research
    • /
    • 제46권2호
    • /
    • pp.233-247
    • /
    • 2008
  • 공정 모니터링 기술은 공정 내에서 일어나는 예상치 못한 조업변화 및 이상을 조기에 감지하고 조업 이상에 영향을 끼친 근본 원인을 밝혀내어 제거해 줌으로써 공정의 안정적인 조업과 양질의 제품생산의 기반을 제공하여 준다. 데이터에 기반한 통계적 공정 모니터링 방법은 양질의 공정 데이터만 주어진다면 통계적 처리를 접목하여 비교적 쉽게 모니터링을 할 수 있고 공정의 데이터 분석에 이용할 수 있는 도구를 얻을 수 있다는 장점이 있다. 그러나 실제 공정에서는 비선형성, non-Gaussianity, 다중 운전모드, 공정상태변화로 인해 기존의 다변량 통계적 방법을 이용한 공정 모니터링 기법은 비효율적이거나, 공정 감시 성능의 저하, 종종 신뢰할 수 없는 결과를 야기한다. 이러한 경우 기존의 방법으로는 더이상 공정을 정확히 감시할 수 없기 때문에 최근에 많은 새로운 방법들이 개발 되었다. 본 총설에서는 이러한 단점을 보안하기 위해 최근 주목할 만한 연구결과인 공정 비선형성을 고려한 커널주성분분석(kernel principle component analysis) 모니터링 기법, 주성분분석 모델 조합을 이용한 다중모델(mixture model) 모니터링 기법, 공정 변화를 고려한 적응모델(adaptive model) 모니터링 기법, 그리고 센서 이상진단과 보정의 이론과 응용결과에 대하여 소개한다.

리눅스 넷필터 기반의 인터넷 웜 탐지에서 버퍼를 이용하지 않는 빠른 스트링 매칭 방법 (A Fast String Matching Scheme without using Buffer for Linux Netfilter based Internet Worm Detection)

  • 곽후근;정규식
    • 정보처리학회논문지C
    • /
    • 제13C권7호
    • /
    • pp.821-830
    • /
    • 2006
  • 전 세계적으로 큰 피해를 주는 웜을 탐지하고 필터링 하는 것은 인터넷 보안에서 큰 이슈중의 하나이다. 웜을 탐지하는 하나의 방법으로서 리눅스 넷필터 커널 모듈이 사용된다. 웜을 탐지하는 기본 동작으로서 스트링 매칭은 네트웍 상으로 들어오는 패킷을 미리 정의된 웜 시그니쳐(Signature, 패턴)와 비교하는 것이다. 웜은 하나의 패킷 혹은 2개(혹은 그 이상의) 연속된 패킷에 나타난다. 이때, 웜의 일부분은 첫 번째 패킷에 있고 나머지 부분은 연속된 패킷 안에 있다. 웜 패턴의 최대 길이가 1024 바이트를 넘지 않는다고 가정하면, 2048 바이트의 길이를 가지는 2개의 연속된 패킷에 대해서 스트링 매칭을 수행해야만 한다. 이렇게 하기 위해, 리눅스 넷필터는 버퍼에 이전 패킷을 저장하고 버퍼링된 패킷과 현재의 패킷을 조합한 2048 바이트 크기의 스트링에 대해 매칭을 수행한다. 웜 탐지 시스템에서 다루어야 하는 동시 연결 개수의 수가 늘어날수록 버퍼(메모리)의 총 크기가 증가하고 스트링 매칭 속도가 감소하게 된다. 이에 본 논문에서는 메모리 버퍼 크기를 줄이고 스트링 매칭의 속도를 증가시키는 버퍼를 이용하지 않는 스트링 매칭 방식을 제안한다. 제안된 방식은 이전 패킷과 시그니쳐(Signature)의 부분 매칭 결과만을 저장하고 이전 패킷을 버퍼링하지 않는다. 부분 매칭 정보는 연속된 패킷에서 웜을 탐지하는데 사용된다. 제안된 방식은 리눅스 넷필터 모듈을 수정하여 구현하였고, 기존 리눅스 넷필터 모듈과 비교하였다. 실험 결과는 기존 방식에 비해 25%의 적은 메모리 사용량 및 54%의 속도 향상을 가짐을 확인하였다.