• 제목/요약/키워드: 병렬탐색

검색결과 188건 처리시간 0.025초

GPU 하드웨어 아키텍처 기반 sub-warp 단위 병렬 프리픽스(prefix) 연산의 정확한 구현 (Correct Implementation of Sub-warp Parallel Prefix Operations based on GPU Hardware Architecture)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권3호
    • /
    • pp.613-619
    • /
    • 2017
  • 본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA (Compute Unified Device Architecture) 코드를 제시한다. 이미 Mark Harris와 Michael Garland가 이러한 목적을 수행하기 위한 CUDA 코드를 이미 발표한 바 있으나 본 논문에서는 로컬 세그먼트의 길이가 32 미만일 때 기존 코드의 결과가 정확하지 않다는 사실을 살펴 보고 그 원인을 논의한 후, 정확한 결과를 출력하는 코드를 제안한다. 본 논문에서 다루는 로컬 세그먼트 단위의 병렬 프리픽스 연산은 최인접 요소 탐색(k-nearest neighbor search) 등은 물론 다양한 대규모 병렬 처리 알고리즘을 구성하는 기본 연산으로 활용 가능하다.

SIMD 최적화를 이용한 CPU 기반 그래프 엔진의 성능 개선 (SIMD Optimization for Improving the Performance of a CPU-Based Graph Engine)

  • 조익현 ;장명환;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.383-385
    • /
    • 2023
  • Single-machine-based 그래프 엔진의 state-of-the-art 모델인 RealGraph 는 쓰레드를 이용한 병렬화로 성능을 향상하였으나 쓰레드 내부에서의 병렬성은 고려되지 않았다. 본 논문은 SIMD 명령어를 이용해 RealGraph 의 병렬성을 향상시켰다. 쓰레드 내부의 효율성을 높이기 위해 RealGraph 의 구조와 그래프 알고리즘의 분석을 통한 SIMD 명령어의 적용 가능한 영역을 탐색하였다. 실험으로 SIMD 명령어의 적용을 통해 쓰레드 내부에서 벡터 연산을 수행하여 평균 7.6%, 11.7%, 9.2%의 수행 시간 단축을 이끌어냈으며 SIMD 명령어의 적용이 그래프 엔진의 분석 성능에 얼마나 도움이 될 수 있는지 확인하였다.

PC Clustering을 이용한 배전계통 선로재구성 및 커패시터 설치 방안 (Reconfiguration and Capacitor Control in Distribution System Using PC Cluster System)

  • 송명기;문경준;김형수;박준호;이화석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 추계학술대회 논문집 전력기술부문
    • /
    • pp.113-115
    • /
    • 2003
  • 본 논문에서는 확률적인 전역 최적해 탐색 방식인 유전알고리즘과 경험적인 최적화 알고리즘인 Tabu 탐색법을 이용하여 실시간으로 적용 가능한 배전계통 선로 재구성 및 커패시터 용량결정 방안을 제안하고자 한다. 제안한 알고리즘은 PC Cluster System으로 병렬처리하여 배전계통의 손실 최소화를 위한 선로 재구성 및 커패시터 용량 결정문제의 최적해 탐색에 소요되는 계산시간을 단축하고, 실시간 지원시스템의 성능 개선을 도모하고자 한다. PC Cluster System은 이용자의 편의를 위해서 MS Windows 환경에서 구축하였고, Visual C++ 환경에서 개발하였다. 제안한 방법의 유용성을 입증하기 위해 참고 문헌의 예제 계통에 적용한 후 종래의 방법과 비교함으로써 제안한 방법이 해의 탐색속도 및 해의 성능면에서 우수함을 입증하였다.

  • PDF

DS/CDMA 시스템에서 하이브리드 동기 획득의 성능 분석 (Performance evaluation of hybrid acquisition in CDMA systems)

  • 강법주;강창언
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.914-925
    • /
    • 1998
  • 본 논문은 코드분할다중접속 순방향 링크에서 파일롯 선호가 존재하는 경우 하이브리드 동기 획득에 대한 성능을 평가한다. 하이브리드 동기 획득 방식은 병렬 및 직렬 동기 획득 방식의 결합된 형태이다. 제안된 동기 획득 방식의 성능 평가는 평균 동기 획득 시간에 의해 이루어지는데 평균 동기 획득 시간은 두 가지 유형(유형 1, 2)을 고려하여 유도하였다. 여기서 유형l은 정확한 코드 위상 오프셋들이 하나의 부분 탐색 구간에 모두 포함되어 있는 경우이고 유형 2는 정확한 코드 위상 오프셋틀이 두개의 부분 탐색 구간에 분포되어 있는 경우이다. 또한 신호 검출, 오경보, 그리고 miss 확률들은 다경로 페이딩과 다수의 정확한 코드 위상 오프셋이 존재하는 상황을 고려하여 유도하였다. 수치해석 결과는 탐색 및 확인 모드에서의 후치 검출 적분 길이, 부분 탐색 구간 크기, 그리고 동기 획득 시간에 따른 I/Q 넌코히런트 상관기의 수 등의 시스템 설계 파라미터에 대한 하이브리드 동기 획득 성능을 분석하고, 하이브리드 및 병렬 동기 획득에 동일한 하드웨어를 적용했을 경우에 대하여 동기 획득 시간의 관점에 서 두 가지의 동기 획득 시스템의 성능을 비교하였다.

  • PDF

전문용어 탐지와 해석 모델: 한국어 의학용어 중심으로 (Detecting and Interpreting Terms: Focusing Korean Medical Terms)

  • 염하람;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.407-411
    • /
    • 2022
  • 최근 COVID-19로 인해 대중의 의학 분야 관심이 증가하고 있다. 대부분의 의학문서는 전문용어인 의학용어로 구성되어 있어 대중이 이를 보고 이해하기에 어려움이 있다. 의학용어를 쉬운 뜻으로 풀이하는 모델을 이용한다면 대중이 의학 문서를 쉽게 이해할 수 있을 것이다. 이런 문제를 완화하기 위해서 본 논문에서는 Transformer 기반 번역 모델을 이용한 의학용어 탐지 및 해석 모델을 제안한다. 번역 모델에 적용하기 위해 병렬말뭉치가 필요하다. 본 논문에서는 다음과 같은 방법으로 병렬말뭉치를 구축한다: 1) 의학용어 사전을 구축한다. 2) 의학 드라마의 자막으로부터 의학용어를 찾아서 그 뜻풀이로 대체한다. 3) 원자막과 뜻풀이가 포함된 자막을 나란히 배열한다. 구축된 병렬말뭉치를 이용해서 Transformer 번역모델에 적용하여 전문용어를 찾아서 해석하는 모델을 구축한다. 각 문장은 음절 단위로 나뉘어 사전학습 된 KoCharELECTRA를 이용해서 임베딩한다. 제안된 모델은 약 69.3%의 어절단위 BLEU 점수를 보였다. 제안된 의학용어 해석기를 통해 대중이 의학문서를 좀 더 쉽게 접근할 수 있을 것이다.

  • PDF

DEVS 형식론을 이용한 실시간 고속 대규모 데이터 저장 시스템의 설계 (Design of a Real Time, High Speed, Large Scale Data Storage System using the DEVS formalism)

  • 이찬수;성영락;오하령
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1997년도 춘계 학술대회 발표집
    • /
    • pp.75-80
    • /
    • 1997
  • 본 연구에서는 대용량의 데이터를 고속으로 입출력할 수 있는 데이터 저장 시스템 이 가져야할 요구사항을 분석하고, 그것을 만족하는 시스템을 설계하였다. 본 논문에서는 우선 고속 대용량, 랜덤 억세스의 조건을 만족시키기 위해 여러 대의 하드 디스크를 병렬로 연결하여 입력되는 데이터들을 나누어 저장하도록 하였다. 그러나 하드 디스크의 성능은 디 스크 아암의 탐색동작에 의해 크게 영향을 받으므로 실시간 요구 조건을 만족시키기 위해선 단순히 디스크의 수를 늘이는 것 외에 디스크 아암의 탐색 동작을 효율적으로 제어할 수 있 는 방법이 필요하다. 그래서 본 논문에서 설계된 시스템에서는 시스템을 MCU(Master Control Unit), DDU(Data Distribution Unit), SCU(Slave Control Unit), DSU(Data Storage Unit)의 4부분으로 나누고, 각 디스크의 디스크 아암 탐색 동작을 독립된 SCU에서 제어하 도록 하였다. 설계된 내용이 주어진 요구사항들을 만족하는 것을 확인하기 위해, 본 논문에 서는 이산사건 시스템을 기술하는 수학적인 언어인 DEVS 형식론을 이용하여 제안된 시스 템을 기술하고 시뮬레이션하였다. 그리고 시뮬레이션되는 과정에서 생산되는 사건들의 궤적 을 분석하였다. 분석결과 제안된 시스템은 앞에서 제시한 여러 요구사항들을 잘 수용함을 보았다.

  • PDF

GPU-based Parallel Ant Colony System for Traveling Salesman Problem

  • Rhee, Yunseok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.1-8
    • /
    • 2022
  • 본 논문에서는 개미 집단 시스템(ant colony system)을 통한 순회 외판원 문제(traveling salesman problem)를 효과적으로 해결하기 위해 GPU 기반 병렬 알고리즘을 설계 구현하였다. TSP에서 동시에 수백 또는 수천의 탐색 여정(tour)을 생성하는 반복 과정을 GPU의 작업 병렬성을 활용하여 처리성능을 개선하고, 페로몬 자취 데이터의 업데이트 과정은 32x32의 쓰레드 블럭을 사용하여 데이터 병렬성을 적극 활용하였다. 특히 다중 쓰레드의 메모리 동시 접근을 통해 연속 메모리공간의 병합 접근 효과와 공유 메모리의 동시 접근을 지원하였다. 본 실험은 TSPLIB에서 제공되는 127개부터 1002개에 이르는 도시 데이터를 사용하였고, Intel Core i9-9900K CPU와 Nvidia Titan RTX 시스템을 사용하여 순차 알고리즘과 병렬 알고리즘의 성능을 비교하였다. GPU 병렬화에 의한 성능 향상은 약 10.13~11.37배의 성능 개선 효과를 보였다.

m-비트 병렬 BCH 인코더의 새로운 설계 방법 (A new design method of m-bit parallel BCH encoder)

  • 이준;우중재
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.244-249
    • /
    • 2010
  • 차세대 멀티 레벨 셀 플래시 메모리들을 위해 복잡도가 낮은 에러 정정 코드 구현에 대한 요구가 커지고 있다. 일반적으로 부 표현 (sub-expression) 들을 공유하는 것은 복잡도와 칩 면적을 줄이기 위한 효과적인 방법이다. 본 논문에서는 직렬 선형 귀환 쉬프트 레지스터 구조를 기반으로 부 표현들을 이용한 저 복잡도 m-비트 병렬 BCH 인코더 구현 방법을 제안한다. 또한, 부 표현들을 탐색하기 위한 일반화된 방법을 제시한다. 부 표현들은 패리티 생성을 위해 사용하는 행렬(생성 행렬, generator matrix)의 부 행렬 (sub-matrix)과 다른 변수들의 합과의 행렬 연산에 의해 표현된다. 부 표현들의 수는 개로 한정되며, 탐색된 부 표현들은 다른 병렬 BCH 인코더 구현을 위해 공유되어질 수 있다. 본 논문은 구현 과정에서 다수의 팬 아웃에 의해 발생하는 문제점(지연)의 해결이 아닌 복잡도(로직 사이즈) 감소에 그 목적이 있다.

병렬처리 알고리즘 적용 유도탄 점검 (Inspection of guided missiles applied with parallel processing algorithm)

  • 정의재;고상훈;이유상;김영성
    • 한국항행학회논문지
    • /
    • 제25권4호
    • /
    • pp.293-298
    • /
    • 2021
  • 일반적으로 유도무기의 탐색기와 유도조종장치는 유도탄의 상태를 나타내기 위해 표적, 탐색, 인지, 포착정보를 처리하여 유도무기의 운용 및 제어를 담당하는 역할을 한다. 유도에 필요한 신호는 시선 변화율 신호, 시각 신호, 종말 단계 동체 지향 신호이며, 발사 통제에 필요한 신호는 표적, 감지 신호가 필요하다. 최근 유도탄의 복잡하고 처리하기 어려운 유도탄 신호를 실시간으로 처리하기 위해 유도탄의 데이터 처리 속도를 높여야 한다. 본 연구는 PLINQ(Parallel Language-Integrated Query)의 병렬 알고리즘 방법 중 스톱앤고와 역 열거형 알고리즘을 적용한 후 유도탄 점검 프로그램을 이용하여 실시간으로 유도탄 필요 신호 데이터 처리속도를 비교 후 처리결과를 나타내었다. 도출된 데이터 처리결과 기준으로 다중코어 처리방식과 단독코어 처리방식 CPU(Central Processing Unit) 처리속도 비교, CPU 코어 이용률을 비교하고 병렬처리 알고리즘 적용 시 유도탄 데이터 처리에 효과적 방법을 제안한다.

병렬 마이크로 유전자 알고리즘을 이용한 복합재 적층 구조물의 최적설계 (Optimal Design of Laminated Stiffened Composite Structures using a parallel micro Genetic Algorithm)

  • 이무근;김천곤
    • Composites Research
    • /
    • 제21권1호
    • /
    • pp.30-39
    • /
    • 2008
  • 본 논문에서는 기존의 유전자 알고리즘을 대신하여 병렬 마이크로 유전자 알고리즘을 사용한 복합재료 적층 구조물의 최적설계를 수행하였다. 마이크로 유전자 알고리즘은 한 세대 당 보통 5개의 개체로 해를 탐색한다 비록 세대를 구성하는 인구수는 적지만 공칭수렴 판단과 재초기화 과정을 통해 다양성을 제공하기 때문에 최적해 탐색이 가능하다. 2가지의 복합재 구조물의 최적화 문제를 가정하고 이를 마이크로 유전자 알고리즘을 사용하여 해를 구하였다. 효율성 판단을 위해서 기존의 유전자 알고리즘과 결과를 비교하였다. 두 문제 모두 마이크로 유전자 알고리즘이 비슷한 결과를 도출하면서도 약 70%의 계산량 감소를 보였다. 마이크로 유전자 알고리즘을 사용하여 일정 범위 내에서 변하는 하중을 받고 있는 복합재 적층 구조물의 최적설계를 수행하였다. 계산 결과 고정된 하중상태 하에서 얻은 최적해보다 하중 변화에 덜 민감한 설계변수를 얻을 수 있었다. 이상의 문제를 통해 다양한 설계변수를 갖는 복합재 적층 구조물의 최적설계의 한 방법으로서 마이크로 유전자 알고리즘이 효율적임을 확인하였다.