• 제목/요약/키워드: K-코어 알고리즘

검색결과 124건 처리시간 0.03초

사물인터넷 기기를 위한 통합 보안 코어의 하드웨어 설계 (The Hardware Design of Integrated Security Core for IoT Devices)

  • ;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.584-586
    • /
    • 2017
  • 본 논문에서는 인터넷 장치의 보안을 위해 경량 대칭 암호화와 경량 인증을 통합 한 하드웨어 아키텍처를 제안한다. 암호화 핵심은 PRESENT 알고리즘과 제안된 새로운 경량 암호화 알고리즘으로 구성된다. 또한 HB 및 HB +, HB-MP, HB-MP + 인증 알고리즘들을 포함한다. 통합 보안 시스템은 Verilog HDL을 사용하여 설계되었으며 Modelsim SE 및 Xilinx Design Suite 14.3 프로그램을 사용하여 검증 및 합성되었다. 제안하는 암호화 코어 하드웨어 구조는 Spartan6 FPGA 장치에서 합성한 결과 189Mhz 주파수와 1130개 슬라이스를 가진다.

  • PDF

소형셀 환경에서 사용자 컨텍스트 기반 무선 캐시 알고리즘 (Wireless Caching Algorithm Based on User's Context in Smallcell Environments)

  • 정현기;정소이;이동학;이승규;김재현
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.789-798
    • /
    • 2016
  • 본 논문에서는 home 소형셀 대비 넓은 커버리지를 갖고 많은 사용자를 서비스 하는 enterprise/urban 소형셀 환경에서 적용할 수 있는 사용자 컨텍스트 기반 캐시 알고리즘을 제안한다. 소형셀 캐시 기법은 소형셀 사용자의 웹 트래픽을 소형셀 내부에 위치한 저장 공간에 저장하는 방법으로 코어망 트래픽을 감소시키는 효과가 있다. 본 논문에서는 기존의 알고리즘과 달리 Mobile Edge Computing(MEC)의 개념을 적용하여 소형셀 내부가 아닌 edge server에 사용자 트래픽을 캐시하며 사용자 특성을 반영하기 위해 사용자를 그룹화한다. 또한, 그룹별 저장 공간의 크기를 달리하고, 캐시 업데이트 주기를 캐시 적중률에 따라 변경하여 코어망으로부터 제공받는 트래픽을 감소하고자 하였다. 성능 분석 결과 기존 알고리즘 대비 캐시 적중률 측면에서 약 11%, cache efficiency 측면에서 약 5.5%의 성능 향상을 확인할 수 있었다.

비정렬 격자 볼륨 렌더링을 위한 다중코어 CPU기반 메모리 효율적 광선 투사 병렬 알고리즘 (Memory Efficient Parallel Ray Casting Algorithm for Unstructured Grid Volume Rendering on Multi-core CPUs)

  • 김덕수
    • 정보과학회 논문지
    • /
    • 제43권3호
    • /
    • pp.304-313
    • /
    • 2016
  • 본 논문은 비정렬 격자 볼륨 렌더링을 위한 다중 코어 CPU기반의 메모리 효율적 광선 투사 병렬처리 알고리즘을 제안한다. 본 연구는 Bunyk 광선 투사(ray casting) 알고리즘에 기반을 두며, Bunyk 알고리즘의 높은 메모리 소모량 문제를 개선하기 위해 스레드별로 고정된 크기의 지역 버퍼를 할당한다. 지역 버퍼는 최근 방문된 면(face)의 정보를 저장하며, 이 정보는 다른 광선들에 의해 재사용되거나 다른 면의 정보로 대체된다. 지역 버퍼에 저장된 정보의 활용률을 높이기 위해 본 연구는 이미지 평면을 기반으로 일관성(coherency)이 높은 광선들을 하나의 광선 그룹으로 묶고, 생성된 광선 그룹들을 스레드들에게 분배한다. 각각의 스레드들은 할당 받은 광선 그룹들을 지역 버퍼를 활용하여 독립적으로 처리한다. 본 연구는 또한 지역 버퍼 활용률을 더욱 높이기 위해 면의 번호에 기반을 둔 해시 함수를 제안한다. 본 연구의 효용성을 확인하기 위해 제안하는 알고리즘을 서로 다른 크기의 비정렬 격자에 적용하였으며, 면 정보 저장을 위해 Bunyk 알고리즘 대비 약 6%의 메모리만 사용하여 정확한 볼륨 렌더링을 수행할 수 있었다. 이처럼 훨씬 적은 메모리 사용에도 불구하고 Bunyk 알고리즘과 대등한 성능을 보여주었으며, 대용량 데이터에 대해서는 최대 22% 높은 성능을 보여주었다. 이는 본 연구의 효용성 및 대용량 데이터의 볼륨 렌더링에 대한 적합성을 증명하는 결과이다.

ROHC(RObust Header Compression) 알고리즘을 이용한 PoV(Push-to-Talk over VoIP) 설계 (Design of PoV(Push-to-Talk over VoIP) using ROHC(RObust Header Compressiong) Algorithm)

  • 김수희;정인상;정인환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.324-329
    • /
    • 2006
  • PTT(Push-To-Talk)란 모든 IP기반의 유, 무선 통합 인터넷 환경으로 진화하고 있는 이동통신망을 통하여 음성 및 텍스트 기반의 일대일 및 그룹 즉시 통신을 제공하기 위한 서비스이다. 스위치를 누르고 말하면서 즉시 의사소통을 할 수 있으므로 일반적인 통화 유형의 대기 시간에 비해 매우 빠른 통화 서비스를 제공함에 따라 각 업체 및 사무실에서 사용하고 있으며 카메라폰에 이은 새로운 어플리케이션으로 부상하고 있다. 현재 이동통신망은 기본의 TDM 방식의 코어 망에서 IP방식의 코어 망으로 천이하고 있으며, 인터넷의 보급과 확산에 따른 인터넷 기술의 발전과 IMT-2000, WIBRO 등의 시스템 도입에 의해 점차 이동통신망 내의 모든 NE를 권고하고 있다. 그러나 무선망에서의 음성 통신은 기존의 통신망에서 보다는 대역폭을 많이 차지하는 단점이 있다. 또한 통화 연결에서 1:1이 아닌 1:N의 관계에 의해 통화 연결이 폭발적으로 일어나기 때문에 대역폭의 확보가 필요하며 안정적인 주파수 사용률 확보가 필요하다. 따라서 본 논문에서는 VoIP망에서의 SIP를 이용한 PTT를 서비스를 설계하고 위와 같은 문제점을 해결하기 위하여 ROHC 알고리즘을 적용하여 PTT 서비스를 설계한다.

  • PDF

다빈치 기반 스마트 카메라 S/W 설계 및 구현 (Design and Inplementation of S/W for a Davinci-based Smart Camera)

  • 유희재;정선태;정수환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.116-120
    • /
    • 2008
  • 스마트 카메라는 종래의 획득한 영상을 압축하여 전송하는 네트워크 카메라 기능에 더하여, 획득한 영상을 해석하여 상황을 인지하고 이에 따른 실시간 조치가 가능한 지능 비젼 기능을 추가적으로 갖춘 카메라이다. 지능 비젼 알고리즘들은 연산량이 많다. 따라서 싱글 CPU로 영상을 압축하고 전송하는 일 뿐만 아니라 지능 비젼 처리까지 모두 실시간으로 처리하기에는 무리가 있다. Texas Instruments 사가 제공하는 다빈치 프로세서는 ARM 코어와 DSP 코어의 듀얼 코어이며 네트워킹 인터페이스 및 비디오 획득 인터페이스를 비롯하여 디지털 비디오 응용 임베디드 제품 개발에 필요한 다양한 I/O을 지원하는 인기 있는 ASSP(Application Specific Standard Product)이다. 본 논문에서는 다빈치 프로세서 기반 스마트 카메라의 S/W 를 설계하고 구현한 결과를 기술한다. 얼굴 검출 응용을 예로 구현하였고 동작이 잘 수행됨을 확인하였다. 향후 보다 광범위하고 실시간으로 동작되는 비젼 기능이 지원되는 스마트 카메라 개발을 위해 보다 효율적인 비젼 응용 S/W 구조와 알고리즘의 최적화에 대한 연구가 필요하다.

  • PDF

면적 제약 조건을 고려한 NTC 매니코어 설계 방법론 (Area-constrained NTC Manycore Architecture Design Methodology)

  • 장진규;한태희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.866-869
    • /
    • 2015
  • 시스템-온-칩(system-on-chip, SoC)내에 집적되는 소자의 수가 기하급수적으로 증가함에 따라 에너지 효율을 높이기 위한 전압 스케일링은 필수적인 요소가 되었다. 문턱전압 근처 동작(near-threshold voltage computing, NTC)은 칩 에너지 효율을 10배 가까이 향상시킬 수 있는 기술로서 전통적인 초 문턱전압 동작(super-threshold voltage computing, STC)의 한계를 극복할 수 있을 것으로 기대되고 있다. 저성능 매니코어(manycore) 시스템으로 동작하는 NTC는 에너지 효율을 극대화할 수 있지만 성능 유지를 위한 코어 수의 증가는 상당한 면적 증가를 수반한다. 본 논문에서는 성능, 전력 및 면적 간의 trade-off를 고려하여 면적 제약조건 하에서 NTC 코어 수 및 캐시 및 클러스터 크기 결정 알고리즘을 통해 요구 성능을 만족시키면서 전력 소모를 최적화하는 방법을 제안한다. 실험을 통해 면적 제약조건 속에서 기존의 STC 코어에서의 성능을 유지한 채 전력소모를 약 16.5% 감소시킬 수 있음을 보여준다.

  • PDF

저 전력을 고려한 스캔 체인 수정에 관한 연구 (Scan Chain Modification for Low Power Design)

  • 박수식;김인수;정성원;민형복
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.835-837
    • /
    • 2005
  • 이동기기들이 늘어가고 있는 추세에서 기기들의 구성품인 디지털 회로들의 테스트 시간과 전력소모는 성능에 상당한 영향을 미친다. 테스트 시간을 줄이는 방법은 병렬 코어 테스트 방법으로 줄일 수 있으나, 다양한 코어들이 동시에 테스트 되면 많은 전력 소모를 야기 시킨다. 스캔 구조를 기반으로 한 회로에서 전력 소모는 테스트 데이터의 불필요한 천이에 의해 많이 발tod한다. 그러므로 스캔 체인을 수정함으로 인해 입력 값과 출력 간의 천이를 줄일 수 있다. 제안하는 스캔 체인의 수정은 스캔 셀의 재배치와 특정한 회로의 추가로 이루어진다. 또한 회로의 추가는 그에 적합한 그룹화를 시킴으로써 최소의 수를 결정한다. 천이 주기를 해석하여 효과적인 알고리즘을 세움으로써 최적의 스캔 체인구조와 그룹을 구함으로써 전력 소모를 최소화할 수 있다.

  • PDF

CUDA 를 이용한 고속 자막 처리 기술 (High-speed caption processing technology using CUDA)

  • 김현수;김대열;권승철;손채봉
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.102-105
    • /
    • 2015
  • 본 논문에서는 멀티미디어 및 수학 관련 알고리즘 분야에서 각광 받고 있는 CUDA(Compute Unified Device Architecture) 기법을 실시간 동영상 자막 처리에 이용 한다. 실시간 고화질 동영상 자막 처리의 낮은 속도를 개선하기 위한 방법 제안으로 써, 이의 함수 구성을 제안한다. 기존의 자막 처리 방식에서는 하나의 코어만을 이용하였다. 이 방법 대신에 CUDA 를 적용 함으로써, 더 많은 코어를 이용해 실시간 자막 처리의 지각적인 성능을 향상하였다. 삽입하고자 하는 자막에 대해 비트맵 이미지를 형성하고, 이의 정보를 처리한다. Intel $Core^{TM}$ i7-4710 MQ, GTX870 환경에서 실험하였으며, 실험 결과 C code 만으로 연산을 한 것 보다 CUDA code 가 약 88% 정도의 속도 향상이 있음을 보였다.

  • PDF

맥동파 전자해머 구동시스템의 개발 (Development of Pulsating Type Electromagnetic Hammer Drive Systems)

  • 안동준;남현도
    • 한국산학기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.269-274
    • /
    • 2016
  • 본 연구는 호퍼와 같은 공정에서 필연적으로 발생하는 스케일 또는 막힘 현상을 방지하기 위해 적용할 수 있는 저주파 전자해머 구동 시스템의 개발에 관한 것이다. 전자기계식 hammering 구동 방식은 진동과 충격량을 동시에 발생시키는 방식으로, 본 논문에서는 전자해머의 특성을 고찰하기 위하여 전자해머에 장착된 직/병렬 스프링 상수 해석을 하였고 발생에너지는 E코어에 부착된 스프링 상수가 모두 같을 경우에 계산된 등가 스프링 상수와 E코어와 I코어 사이의 동작 변위의 곱으로 계산할 수 있음을 보였다. 또한 전자해머의 충격량을 최대화하기 위하여 맥동파 구동 알고리즘을 적용하였으며, 이 알고리즘은 논리 AND 연산과 마이크로 콘트롤러(atmega128)의 타이머 인터럽트와 PWM 기능을 사용하여 구현하였다. 전자해머의 구동회로는 IGBT로 구성된 H-브리지 방식으로 설계하였고, 가속도계 측정법으로 개발한 전자 해머 시스템의 성능을 검증하였다. 실험 결과 제안한 시스템이 기계적 에너지를 양호하게 발생시킬 수 있으며, 호퍼와 같은 공정에 적용할 수 있음을 보였다.

HD-Tree: 고성능 Lock-Free NNS KD-Tree (HD-Tree: High performance Lock-Free Nearest Neighbor Search KD-Tree)

  • 이상기;정내훈
    • 한국게임학회 논문지
    • /
    • 제20권5호
    • /
    • pp.53-64
    • /
    • 2020
  • KD-Tree에서 NNS의 구현은 다차원 데이터를 다루는 응용 프로그램에서 필수적이다. 본 논문에서는 자료구조의 동시 수정, 검색이 일어나는 멀티스레드 상황에서 NNS를 지원하는 고성능 Lock-Free KD-Tree인 HD-Tree를 제안한다. HD-Tree는 동기화에 사용되는 노드 수를 최소화하고, 사용하는 원자 연산자의 수를 감소시켜 성능을 개선하였다. 실험 결과 HD-Tree는 8코어 16스레드의 멀티코어 시스템에서 기존의 NNS보다 성능이 최대 95% 향상되었고, 삽입/삭제연산은 코어보다 스레드가 많은 상황에서 기존 알고리즘보다 최대 15%향상된 성능을 보여준다.