• 제목/요약/키워드: K-코어 알고리즘

검색결과 124건 처리시간 0.029초

실시간 화재 특징 추출을 위한 임베디드 매니코어 프로세서의 디자인 공간 탐색 (Design Space Exploration of Embedded Many-Core Processors for Real-Time Fire Feature Extraction)

  • 서준상;강명수;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.1-12
    • /
    • 2013
  • 본 논문에서는 많은 연산량이 요구되는 화재 특징 추출 알고리즘을 위한 최적의 매니코어 프로세서에 대한 디자인 공간을 탐색한다. 최적의 매니코어 디자인 공간을 선택하기 위해 매니코어를 구성하는 프로세서 엘리먼트 (PE)의 개수와 로컬 메모리 사이즈를 변화시키면서 시뮬레이션을 수행하여 성능, 에너지 효율 및 시스템 면적 효율에서 최적인 매니코어 구조를 결정한다. 본 논문에서는 $256{\times}256$ 해상도의 30 프레임으로 구성된 화재/비화재 비디오 영상을 대상으로 하여 움직임 검출, 색상 분할 및 이산 웨이블릿 변환으로 구성된 화재 특징 추출 알고리즘을 여섯가지 매니코어 구조(PEs=16, 64, 256, 1,024, 4,096, 16,384)를 사용하여 모의 실험한 결과, 모든 화재/비화재 비디오 영상에 대해1,024개와 4,096개의 PE를 갖는 매니코어 구조가 각각 최적의 시스템 면적 효율과 에너지 효율을 보였다. 또한, 실험에서 사용한 여섯가지 매니코어 구조 모두가 실시간 비디오 처리에서 요구되는 초당 30 프레임 처리 기준을 만족하였다.

다빈치 프로세서 기반 스마트 카메라에서의 객체 추적 알고리즘의 최적 구현 (An Optimal Implementation of Object Tracking Algorithm for DaVinci Processor-based Smart Camera)

  • 이병은;;정선태
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.17-22
    • /
    • 2009
  • 다빈치 프로세서는 임베디드 멀티미디어 응용 구현 프로세서로 많이 사용된다. ARM 9 코어 및 DSP 코어의 듀얼 코어로 되어 있어 ARM 코어 에서는 주변 장치 제어, 비디오 입출력 제어, 네트워킹 등을 지원하며, DSP 코어는 보다 효율적인 디지털 신호 처리 연산을 지원한다. 본 논문에서는 본 저자들의 연구실에서 만들고 있는 다빈치 프로세서 기반의 스마트 카메라에 있어서 객체 추적 알고리즘의 최적 구현 방안 노력을 기술한다. 본 논문의 스마트 카메라는 입력 영상에서 관심 객체를 검출하고 이를 추적하며, 분류하고 감시구역에 침입한 경우 이를 IP 프로토콜로 원격 클라이언트에게 통보하는 기능을 보유한다. 객체 추적은 전방 마스크 추출, 전방 마스크 교정, 연결 요소 레이블링, 블롭 지역 계산 등 계산량이 많은 절차들로 구성되어 효율적으로 구현되지 않으면 실시간 처리가 힘들다.

  • PDF

다중 큐를 지원하는 고속 I/O 장치를 위한 동적 코어 친화도 (Dynamic Core Affinity for High-Performance I/O Devices Supporting Multiple Queues)

  • 조중연;엄준용;진현욱;정성인
    • 정보과학회 논문지
    • /
    • 제43권7호
    • /
    • pp.736-743
    • /
    • 2016
  • 멀티코어 시스템에서 코어 친화도가 네트워크 I/O 성능에 미치는 영향은 다양한 연구들을 통해 관찰 되었다. 점차 고속화되는 네트워크 연결의 발전에 따라 효율적인 코어 친화도 정책은 중요한 성능 요소가 될 수 있다. 미들웨어 수준의 동적 코어 친화도 프레임워크는 네트워크와 디스크 I/O를 함께 고려한 코어 친화도 정책을 제안하였지만 다중 큐에 대한 고려는 이루어지지 않았다. 본 논문에서는 기존 동적 코어 친화도 프레임워크에 사용된 알고리즘을 다중 큐를 지원하기 위한 구조로 확장하고, 40 기가비트 이더넷과 NVMe 디바이스를 장착한 시스템에서 파일 업로드 성능을 분석한다. 실험 결과 다중 큐를 지원하기 위한 동적 코어 친화도는 하둡 분산 파일 시스템의 파일 업로드 처리량을 최대 32% 향상시켰으며 매니코어 시스템에서 더 나은 확장성을 제공할 수 있음을 확인하였다. 또한 다중 큐 조합에 따른 성능 영향에 대해 분석하여 다중 큐 분배 조합을 위해 고려해야 할 성능 요소들에 대해 논의한다.

네트워크 기반 세계종교 분석 (Analysis of the World Religions Based on Network)

  • 김학용
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.24-34
    • /
    • 2022
  • 하나의 종교를 집중적으로 본다면 신앙과 믿음의 문제이지만, 세계종교 전체를 보면 역사, 문화, 인간의 삶과 생활이 담겨진 콘텐츠가 된다. 종교를 콘텐츠로 보고 세계종교 13개를 중심으로 각 네트워크를 만들어 네트워크의 구조를 분석하였다. 13개 종교를 합쳐 전체 네트워크를 구축하였는데, 일반적인 사회네트워크와 같은 멱함수 분포를 가지는 척도없는 네트워크의 특성을 보여주었다. 세계종교 네트워크는 일반적인 척도없는 네트워크와 달리 뭉침계수 값이 매우 적었다. 이는 종교를 설명하는 용어들의 다양성의 결과라 보여 진다. 전체 네트워크에 단순하지만 핵심 네트워크를 만드는데 사용되는 K-코어 알고리즘을 적용하여 코어 네트워크를 구축하였으나 K-3를 적용했을 때는 너무 복잡하고, K-4를 적용했을 때는 너무 단순하여 유의미한 결과를 얻기 어려웠다. 뭉침계수가 낮은 네트워크에 K-코어 알고리즘을 적용하기 어려운 것으로 판단되어, 허브 노드 중심의 핵심단어 수에 따른 네트워크를 구축하여 세계종교의 특성을 분석하였다. 이외에도 세계 5대 종교 네트워크와 동아시아 종교 네트워크를 만들어 유의미한 정보를 도출하였다. 본 연구에서는 세계종교를 콘텐츠로 보고 분석하여 다양한 정보를 얻었으며, 뭉침계수 값이 적은 네트워크는 핵심단어를 기반으로 코어 네트워크를 만들어 분석하는 새로운 방법을 제시하였다.

유전자 알고리즘의 유전 연산자 구현 (Implementation of a Genetic Operator for Genetic Algorithm)

  • 유명근;송기용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.357-360
    • /
    • 2005
  • 유전자 알고리즘(Genetic Algorithm, GA)은 자연적 진화과정에서 생존 경쟁 측면의 가장 적합한 메커니즘이다. GA를 소프트웨어로 수행하는데 큰 지연시간은 필수적이기 때문에 하드웨어 설계를 이용하여 알고리즘 실행 속도를 증가시키기 위한 많은 연구가 진행되어 왔다. 본 논문에서는 염색체의 임의의 유전인자를 기준으로 입력 받은 염색체에 대하여 GA 연산을 수행하는 유전 연산자를 설계한다. 설계된 디자인을 ARM 코어와 PLD로 구성된 Altera사의 Excalibur칩에 구현하여 동작을 검증하였다.

  • PDF

멀티코어 이기종메모리 환경에서의 유전 알고리즘 기반 실시간 전력 절감 스케줄링 (Real-Time Power-Saving Scheduling Based on Genetic Algorithms in Multi-core Hybrid Memory Environments)

  • 류수현;조예원;조경운;반효경
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.135-140
    • /
    • 2020
  • 최근 사물인터넷, 지능형 시스템 등의 활성화로 실시간 임베디드 시스템의 전력 절감 기술이 중요해지고 있다. 본 논문은 멀티코어 이기종메모리 환경에서 실시간 시스템의 전력 소모량을 절감하는 P-GA (parallel genetic algorithm) 스케줄링 알고리즘을 제안한다. P-GA는 멀티코어를 위한 PF (proportional fairness) 알고리즘에 기반한 프로세서의 전압 및 주파수 동적 조절 기법에 차세대 비휘발성메모리 기술을 결합하여 시스템의 전력 소모를 더욱 줄인다. 특히, 유전 알고리즘을 사용하여 태스크별 수행 프로세서의 전압 및 주파수 모드와 메모리의 종류를 최적화하여 태스크 집합의 전력 소모량을 최소화한다. 시뮬레이션 실험을 통해 P-GA가 기존 방식 대비 최대 2.85배의 전력 소모량을 감소할 수 있음을 보인다.

토마술로 알고리즘을 이용하는 비순차실행 프로세서의 설계 및 모의실행 (The Design and Simulation of Out-of-Order Execution Processor using Tomasulo Algorithm)

  • 이종복
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권4호
    • /
    • pp.135-141
    • /
    • 2020
  • 오늘날 서버, 데스크탑, 노트북과 같은 범용 컴퓨터뿐만이 아니라, 가전, 임베디드 시스템에서 중앙처리장치는 대부분 멀티코어 프로세서로 구성된다. 멀티코어 프로세서의 성능향상을 위하여, 토마술로 알고리즘을 적용한 비순차실행 프로세서를 각 코어 프로세서로 이용하는 것이 요구된다. 토마술로 알고리즘을 적용한 비순차실행 프로세서는 명령어 간의 종속성이 없고 피연산자가 준비된 명령어를 순서와 관계없이 먼저 실행하고, 분기어 너머로 예측실행을 수행함으로써, 모든 명령어를 순서대로 실행하는 순차실행 프로세서보다 성능을 크게 높일 수가 있다. 본 논문에서는 VHDL의 레코드 데이터형을 이용하여 토마술로 알고리즘을 이용하는 비순차실행 프로세서를 설계하고, GHDL로 검증하였다. 모의실험 결과, ARM 명령어로 구성된 프로그램에 대한 연산을 성공적으로 수행할 수 있었다.

그룹특징기반 슬라이딩 윈도우 클러스터링에서의 k-means와 k-medoids 비교 평가 (Comparison between k-means and k-medoids Algorithms for a Group-Feature based Sliding Window Clustering)

  • 양주연;심준호
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.225-237
    • /
    • 2018
  • 대용량 데이터의 발생과 처리가 대중화되면서 대용량 데이터 스트림 처리에 대한 수요가 급격하게 증가하고 있다. 이 수요에 따라 다양한 대용량 데이터 처리 기술이 개발되고 있다. 한 분야로 주목받고 있는 방식은 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링이다. 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링은 윈도우가 이동할 때마다 새로운 클러스터를 생성한다. 기존의 슬라이딩 윈도우 상의 클러스터링 기법은 코어셋(Coreset)을 기반으로 데이터 스트림 클러스터링을 구현하고 있다. 이 연구에서는 코어셋을 활용한 그룹특징을 이용한 알고리즘 내에서 이용하는 클러스터링 알고리즘을 변경하였다. 그리고 이를 통해 제안 알고리즘과 기존 알고리즘의 파라미터 값 변화에 따른 성능 비교 실험을 진행하였다. 개선된 사항에 대해 논하여 두 알고리즘을 비교하고 실험자에게 파라미터에 따른 이용 방향을 제시한다.

스마트 모바일 장치의 에너지 보존성을 높이기 위한 비대칭 멀티 코어 기반 실시간 태스크 스케쥴링 (Real-time Scheduling on Heterogeneous Multi-core Architecture for Energy Conservation of Smart Mobile Devices)

  • 임성화
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1219-1224
    • /
    • 2018
  • 사물인터넷 (Internet of Things)은 우리의 실생활에서 그 범위가 급격히 커지면서, 스마트 모바일 장치들에 대용량 실시간 데이터를 모바일 환경에서 고속으로 처리 및 전송하기에 적합한 처리능력이 요구되고 있다. 배터리 파워가 중요한 모바일 기기에서 성능과 에너지 보존성을 높이기 위해 big.LITTLE 멀티코어 구조와 같은 비대칭 멀티코어 구조가 널리 사용되고 있다. 에너지 보존성을 높이기 위해서는 에너지 효율이 높은 LITTLE 코어의 활용도를 높여하며, 이룰 위해 본 논문에서는 실시간 태스크를 대상으로 하여 마감 시간을 보장하는 범위 내에서 LITTLE 코어에 우선적으로 할당하는 코어 선택 알고리즘을 제안하다. 또한, 시뮬레이션을 통하여 기존 기법에 비해 마감시간을 보장하면서 에너지 소비량을 줄 있 수 있음을 보였다.

TBB, Cilk Plus를 이용한 병렬 접미사 트리 생성 알고리즘 구현 및 성능 분석 (Implementation and analysis of a parallel suffix tree construction algorithm using TBB and Cilk Plus)

  • 서준호;나중채
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.403-405
    • /
    • 2012
  • 접미사 트리는 문자열 압축, 텍스트 처리, 생물정보학 등 다양한 응용 분야에서 사용되는 인덱스 자료구조이다. 최근 64bit 하드웨어와 멀티코어 CPU가 보급됨에 따라 메모리상에서 병렬로 접미사 트리를 생성하는 알고리즘이 활발히 연구되고 있다. 본 논문에서는 McCreight의 선형시간 알고리즘과 Chen의 병렬 알고리즘을 기반으로 메모리상에서 접미사 트리를 병렬로 생성하는 구현 방법을 보였으며, TBB, Cilk Plus와 같은 병렬 프로그래밍 라이브러리를 이용하여 병렬 알고리즘을 구현하였다. 알고리즘 실험 결과 병렬로 수행한 알고리즘이 직렬로 수행한 결과보다 최대 4배 가량 성능 향상을 얻을 수 있었으며, 병렬 라이브러리를 사용함으로써 가지는 오버헤드는 극히 적은 것으로 나타났다.