• 제목/요약/키워드: 병렬시스템

검색결과 2,501건 처리시간 0.032초

다양한 블록 크기의 전역 탐색 알고리즘을 위한 효율적인 구조를 갖는 움직임 추정기 설계 (The Motion Estimator Implementation with Efficient Structure for Full Search Algorithm of Variable Block Size)

  • 황종희;최윤식
    • 대한전자공학회논문지SD
    • /
    • 제46권11호
    • /
    • pp.66-76
    • /
    • 2009
  • 움직임 추정은 영상 부호화 시스템에서 큰 비중을 차지하는 부분으로, 실시간 동작을 위해서는 효율적인 구조를 필요로 한다. 따라서 H.264 전체 시스템을 위한 움직임 추정기 블록의 구현은 부호화 과정을 고속으로 수행할 수 있도록 별도의 전용 하드웨어 모듈로 설계하는 것이 바람직하다. 본 논문에서는 많은 연산량을 효율적으로 줄일 수 있도록 병렬 처리를 바탕으로 움직임 추정 감지 블록, 41개의 SAD(Sum of Absolute Difference)값 계산 블록, 최소의 SAD값 계산과 움직임 벡터 생성 블록을 제안하고자 한다. 움직임 추정 감지 블록과 최소의 SAD값 계산기에서는 선계산(pre-computation) 방법을 적용함으로써, 입력 Switching Activity를 줄여 고속 구현이 가능하도록 하였으며, 움직임 추정 감지 블록과 41개의 SAD값 계산 블록에서 가장 많은 부분을 차지하는 가산기 구조를 일반적으로 사용되는 Ripple Carry Adder 대신에 Carry Skip Adder를 적용함으로써, Adder Tree 구조를 고속으로 처리할 수 있도록 하였다. 또한 외부에서 탐색 영역 제어와 같은 주요 변수를 쉽게 제어할 수 있도록 하여, 하드웨어 구조의 효율성을 높였다. 시뮬레이션 및 FPGA 검증 결과, 움직임 추정기의 임계 경로를 발생시키는 MED블록에서 일반적인 구조를 적용했을 때보다 19.89%의 Delay 감소 효과를 얻을 수 있었다.

UHF대역 지상국용 무지향 고이득 안테나 (An Omnidirectional High Gain Antenna for UHF Band Ground Station)

  • 배기형;장민수;주재우;황찬호;홍기표
    • 한국지식정보기술학회논문지
    • /
    • 제12권4호
    • /
    • pp.539-550
    • /
    • 2017
  • 본 논문에서는 UHF대역 원통형 다이폴 배열 안테나에 대해서 설계, 제작 및 시험을 하였다. 제안하는 안테나는 원통형 다이폴을 수직으로 4단 배열하였다. 원통형 다이폴 내부에는 병렬구조 급전회로를 설치하여 광대역 매칭이 되도록 구현하였다. 급전회로를 원통형 다이폴 중심에 설치하여 방위각 방향 무지향 방사패턴의 이득평탄도 특성을 최적화하였다. 급전회로에서 분기되는 신호의 차이를 최소화하여 대칭적인 방사패턴을 구현하였다. 요구 규격은 UHF대역에서 대역폭 11.2% 이상, 이득 6dBi 이상, 2:1 이하의 정재파비, 수평방향 방사패턴 이득평탄도 ${\pm}1dB$ 이내, 고각 방향 방사패턴 3dB 빔폭 13도 이상이다. M&S를 통해서 구현 가능성을 확인하고, 제작 및 시험을 통해서 M&S 결과를 검증하였다. 시험결과는 UHF대역에서 대역폭 11.2%, 이득 6.30~8.31dBi, 정재파비 1.53:1 이하, 방위각 방향 방사패턴 이득평탄도 ${\pm}0.2dB$ 이내, 고각 방향 방사패턴 3dB 빔폭은 15.62~15.84도이다. 시험결과 모든 규격을 충족하였다.

딥러닝 기반 한국어 실시간 TTS 기술 비교 (Comparison of Korean Real-time Text-to-Speech Technology Based on Deep Learning)

  • 권철홍
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.640-645
    • /
    • 2021
  • 딥러닝 기반 종단간 TTS 시스템은 텍스트에서 스펙트로그램을 생성하는 Text2Mel 과정과 스펙트로그램에서 음성신호를 합성하는 보코더 등 두 가지 과정으로 구성되어 있다. 최근 TTS 시스템에 딥러닝 기술을 적용함에 따라 합성음의 명료도와 자연성이 사람의 발성과 유사할 정도로 향상되고 있다. 그러나 기존의 방식과 비교하여 음성을 합성하는 추론 속도가 매우 느리다는 단점을 갖고 있다. 최근 제안되고 있는 비-자기회귀 방식은 이전에 생성된 샘플에 의존하지 않고 병렬로 음성 샘플을 생성할 수 있어 음성 합성 처리 속도를 개선할 수 있다. 본 논문에서는 비-자기회귀 방식을 적용한 Text2Mel 기술인 FastSpeech, FastSpeech 2, FastPitch와, 보코더 기술인 Parallel WaveGAN, Multi-band MelGAN, WaveGlow를 소개하고, 이를 구현하여 실시간 처리 여부를 검증한다. 실험 결과 구한 RTF로 부터 제시된 방식 모두 실시간 처리가 충분히 가능함을 알 수 있다. 그리고 WaveGlow를 제외하고 학습 모델 크기가 수십에서 수백 MB 정도로, 메모리가 제한되어 있는 임베디드 환경에 적용 가능함을 알 수 있다.

붕괴모드 조합 예측법에 의한 PSC사장교의 위험도평가 (Probabilistic Risk Assessment of a Cable-Stayed Bridge Based on the Prediction Method for the Combination of Failure Modes)

  • 박미연;조효남;조태준
    • 대한토목학회논문집
    • /
    • 제26권4A호
    • /
    • pp.647-657
    • /
    • 2006
  • 허용응력설계법과 극한한계 상태 설계법에 근거한 케이블과 보강형을 갖는 PSC 사장교의 예를 통해서 통계학적 확률분포를 고려한 확률론적인 위험성을 평가하였다. 사용성 한계상태 및 극한 한계상태에서의 케이블요소의 파괴확률과 거더의 최대 정모멘트. 부모멘트 발생단면, 그리고 최대전단력의 작용단면에서 각각의 요소 파괴 확률을 설계변수의 응답면에서 검토하였다. 응답면 기법(RSM)은 복잡한 다자유도 구조물에서 MCS를 사용하여 얻을 수 없는 상대적으로 매우 작은 파괴 확률값을 얻기 위해 사용이 가능할 뿐만 아니라, FOSM으로 쉽게 얻을 수 없는 한계상태방정식의 미분형태에도 성공적으로 적용이 가능 하다. 케이블과 보강형으로 구성된 병렬저항구조를 시스템 해석을 위해 각각 직렬구조로 연결하여 전체구조물의 체계신뢰성을 평가하고, 제안된 붕괴모드조합 예측값과 비교분석하였다. 제안된 붕괴모드의 조합에 의한 파괴확률검토는 조건부 파괴에 대한 동일한 발생확률을 구하며, 순열방법보다 개선된 시간비용과 효율성을 제공하며, 상하한계파괴확률을 구하는 체계 신뢰성해석에서 검토되지 않는 요소파괴의 조합에 의한 시스템의 위험성 검토를 제공한다.

인공부화기의 실시간 중량감지를 위한 로드셀을 이용한 시스템 연구 (Study of system using load cell for real time weight sensing of artificial incubator)

  • 정진형;김애경;이상식
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.144-149
    • /
    • 2018
  • 인공부화기 내에 종란이 입란하여 18일간 발생기를 거쳐 발육기로 이란을 한다. 발생기 동안 계태아 무게 손실은 곧 기실형성과 상관되며 적당한 기실 형성은 곧 건강한 초생추와 입란 대비 부화율과도 연결된다. 그러나 국내 부화장의 부화기에는 현재 무게를 측정하는 장치 없이 부화실장과 관계자의 경험과 발육기로 이란시 표준 무게 측정으로 결과적 측면을 습득하는 것이 현실이다. 그로 인하여 부화 중 조기 폐사, 약추, 병약한 초생추 발생이 빈번한 실정이다. 종란 중량 감소를 모니터링하는 것은 발육장치기 안에서의 무게 변화에 따른 병아리 품질과 부화율 성과를 얻는 데에 절대적으로 중요하다. 종란의 크기와 난각질, 노계 군에 따라 수분 손실은 각기 다르다. 발육기 안에서 무게 변화를 실시간 측정하고 그에 따른 환기 변화를 최적화하여 부화율의 증가를 기대할 수 있으며 부화 시 전체 무게의 10~13% 감소를 컨트롤할 수 있는 실시간 측정 시스템의 개발 필요성이 대두된다. 본 연구를 통한 시스템은 기존의 입란과 이란시 직접적으로 일회성을 체크하는 방식으로 발육 기간 내에는 계태아 수분 증발 측정 제어가 불가능하여 부화율에 영향을 못 미치는 시스템과 달리 아두이노 스케치 보드에 로드셀 4개를 병렬로 연결하고 실시간으로 휴대폰, 컴퓨터를 연결하기 위해 Hyper-terminal 프로그램을 이용하여 AT-command 명령어를 활용하여 정상적으로 연동하였다. 블루투스의 통신속도는 15200으로 설정하여 아두이노와 Hyper-terminal 프로그램의 통신 속도를 맞춰주었다. 실시간 모니터링을 하여 인공부화기 내의 계태아 무게의 변화를 육안으로 확인할 수 있도록 시스템을 설계하였다. 이와 같은 방법으로 종란의 부화율 상승 및 건강상태의 향상을 목표로 하였으며 실시간 모니터링으로 인하여 사용자의 편의성을 확대하고자 하였다.

타원곡선을 암호시스템에 사용되는 최적단위 연산항을 기반으로 한 기저체 연산기의 하드웨어 구현 (A Hardware Implementation of the Underlying Field Arithmetic Processor based on Optimized Unit Operation Components for Elliptic Curve Cryptosystems)

  • 조성제;권용진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.88-95
    • /
    • 2002
  • 1985년 N. Koblitz와 V. Miller가 각각 독립적으로 제안한 타원곡선 암호시스템(ECC : Elliptic Curve Cryptosystems)은 보다 짧은 비트 길이의 키만으로도 다른 공개키 시스템과 동일한 수준의 안전도를 유지할 수 있다는 장점을 인해 IC 카드와 같은 메모리와 처리능력이 제한된 하드웨어에도 이식가능 하다. 또한 동일한 유한체 연산을 사용하면서도 다른 타원곡선을 선택할 수 있어서 추가적인 보안이 가능하기 때문에 고수준의 안전도를 유지하기 위한 차세대 암호 알고리즘으로 각광 받고 있다. 본 논문에서는 효율적인 타원곡선 암호시스템을 구현하는데 있어 가장 중요한 부분 중 하나인 타원곡선 상의 점을 고속으로 연산할 수 있는 전용의 기저체 연산기 구조를 제안하고 실제 구현을 통해 그 기능을 검증한다. 그리고 기저체 연산의 면밀한 분석을 통해 역원 연산기의 하드웨어 구현을 위하여 최적인 단위 연산항의 도출에 기반을 둔 효율적인 방법론을 제시하고, 이를 바탕으로 현실적인 제한 조건하에서 구현 가능한 수준의 게이트 수를 가지는 고속의 역원 연산기 구조를 제안한다. 또한, 본 논문에서는 제안된 방법론을 바탕으로 실제 구현된 설계회로가 기존 논문에서 비해 게이트 수는 약 8.8배가 증가하지만, 승법연산 속도는 약 150배, 역원연산 속도는 약 480배 정도 향상되는 우수한 연구 결과가 얻어짐을 보인다. 이것은 병렬성을 적용함으로서 당연히 얻어지는 속도면에서의 이득을 능가하는 성능으로, 본 논문에서 제안한 구조의 우수성을 입증하는 결과이다. 실제로, 승법 연산기의 속도에 관계없이 역원연산의 수행시간은 [lo $g_2$(m-1)]$\times$(clock cycle for one multiplication)으로 최적화가 되며, 제안한 구조는 임의의 유한체 $F_{2m}$에 적용가능하다. 제안한 전용의 연산기는 암호 프로세서 설계의 기초자료로 활용되거나, 타원곡선 암호 시스템 구현시 직접 co-processor 형식으로 임베드 되어 사용할 수 있을 것으로 사료된다.다.

그래픽 프로세서를 이용한 탄성파 수치모사의 계산속도 향상 (Acceleration of computation speed for elastic wave simulation using a Graphic Processing Unit)

  • Nakata, Norimitsu;Tsuji, Takeshi;Matsuoka, Toshifumi
    • 지구물리와물리탐사
    • /
    • 제14권1호
    • /
    • pp.98-104
    • /
    • 2011
  • 탐사 지구물리학에서 수치 모사는 지하매질에서의 탄성파 전파 현상을 이해하는데 중요한 통찰력을 제공한다. 탄성파 모사는 음향파 근사에 의한 수치 모사보다 계산시간이 많이 소요되지만 전단응력 성분을 포함하여 보다 현실적인 파동의 모사를 가능하게 한다. 그러므로 탄성파 모사는 탄성체의 반응을 탐사하는데 적합하다고 할 수 있다. 계산 시간이 길다는 단점을 극복하기 위해 본 논문에서는 그래픽 프로세서(GPU)를 이용하여 탄성파 수치 모사 시간을 단축하고자 하였다. GPU는 많은 수의 프로세서와 광대역 메모리를 갖고 있기 때문에 병렬화된 계산 아카텍쳐에서 사용할 수 있는 장점이 있다. 본 연구에서 사용한 GPU 하드웨어는 NVIDIA Tesla C1060으로 240개의 프로세서로 구성되어 있으며 102 GB/s의 메모리 대역폭을 갖고 있다. NVIDIA에서 개발된 병렬계산 아카텍쳐인 CUDA를 사용할 수 있음에도 불구하고 계산효율을 상당히 향상시키기 위해서는 GPU 장치의 여러 가지 다양한 메모리의 사용과 계산 순서를 최적화해야만 한다. 본 연구에서는 GPU 시스템에서 시간영역 유한차분법을 이용하여 2차원과 3차원 탄성과 전파를 수치 모사하였다. 파동전파 모사에 가장 널리 사용되는 유한차분법 중의 하나인 엇갈린 격자기법을 채택하였다. 엇갈린 격자법은 지구물리학 분야에서 수치 모델링을 위해 사용하기에 충분한 정확도를 갖고 있는 것으로 알려져 있다. 본 논문에서 제안한 모델링기법은 자료 접근 시간을 단축하기 위해 GPU 장치를 메모리 사용을 최적화하여 가능한 더 빠른 메모리를 사용한다. 이점이 GPU를 이용한 계산의 핵심 요소이다. 하나의 GPU 장치를 사용하고 메모리 사용을 최적화함으로써 단일 CPU를 이용할 경우보다 2차원 모사에서는 14배 이상, 3차원에서는 6배 이상 계산시간을 단축할 수 있었다. 세 개의 GPU를 사용한 경우에는 3차원 모사에서 계산효율을 10배 향상시킬 수 있었다.

클라우드 컴퓨팅을 이용한 유시티 비디오 빅데이터 분석 (An Analysis of Big Video Data with Cloud Computing in Ubiquitous City)

  • 이학건;윤창호;박종원;이용우
    • 인터넷정보학회논문지
    • /
    • 제15권3호
    • /
    • pp.45-52
    • /
    • 2014
  • 유비쿼터스 시티(유시티)에서는 수많은 비디오 카메라들이 설치된다. 이렇게 설치된 많은 카메라로부터 대용량의 비디오 데이터가 실시간으로 끊임없이 발생하고 유시티의 관리 시스템으로 전달된다. 유시티의 다양한 서비스들을 뒷받침하기 위해서는 이러한 비디오 데이터를 저장하고, 이렇게 저장된 대용량의 비디오 데이터를 분석할 수 있는 방법과 관리 시스템이 요구된다. 그래서, 이 논문에서는 클라우드 컴퓨팅을 기반으로 한 유시티 비디오 관리 시스템을 제안한다. 또한, 근래 주목받고 있는 데이터 병렬처리 프레임워크인 Hadoop MapReduce를 이용하여 이러한 빅데이터 비디오를 분석하는 방법을 제안하고, 이에 따른 우리의 성능 평가를 소개한다.

휴대용 초음파 영상처리를 위한 멀티미디어 확장 명령어 및 최적의 매니코어 프로세서 구조 탐색 (Multimedia Extension Instructions and Optimal Many-core Processor Architecture Exploration for Portable Ultrasonic Image Processing)

  • 강성모;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권8호
    • /
    • pp.1-10
    • /
    • 2012
  • 본 논문에서는 휴대용 초음파 영상의 고성능 및 저전력 처리를 위해 멀티미디어 전용 명령어를 내장한 매니코어의 디자인 공간 탐색 방법론을 제안한다. 이를 위해서 멀티미디어 확장 명령어로 인한 서브워드 병렬처리 방식을 적용한 프로그램과 적용하지 않은 프로그램의 성능을 비교하여 에너지 효율 및 면적효율을 측정하였다. 모의실험 결과, MMX 형태 명령어를 사용한 프로그램은 베이스라인 프로그램 보다 $256{\times}256$ 해상도에서 실행시간은 평균 3.16배, 에너지 효율은 평균 8.13배, 면적 효율은 평균 3.16배의 향상을 보였다. $240{\times}320$ 해상도와 $240{\times}400$ 해상도에서는 각각 실행시간 평균 2.16배, 2.25배, 에너지 효율은 4.04배 4.34배, 면적 효율은 2.16배, 2.25배 향상되었다. 더불어 이러한 MMX 형태 명령어를 포함한 매니코어의 프로세싱 엘리먼트 (Processing Element: PE) 개수 및 메모리 사이즈를 변화시키면서 각 초음파 영상의 해상도별로 최적의 시스템 면적 및 에너지 효율을 보이는 PE 구조를 탐색하였다.

알고리즘 적용이 용이한 시뮬레이터 개발 지원 도구에 관한 연구 (A Study on the Support Tool for Simulator Algorithm Development)

  • 이영주;김아영;박세길;오재용;김정수
    • 한국항해항만학회지
    • /
    • 제38권4호
    • /
    • pp.385-390
    • /
    • 2014
  • 시뮬레이터는 다양한 형태와 기능을 갖춘 여러 장치들로 구성되어 있으며, 이 장치들이 네트워크로 연동된 복잡한 구조를 이루고 있다. 이러한 이유로 시뮬레이터 개발 및 유지보수 과정에 많은 시간과 비용이 소요된다. 시뮬레이터의 성공적인 개발을 위해서는 관련 전문가들이 협력하고 업무를 분담하여 병렬적으로 수행하는 것이 이상적이지만 업무의 상호 의존성이 이를 어렵게 한다. 본 논문에서는 시뮬레이터 개발 업무를 알고리즘 구현과 이를 제외한 시스템 구현으로 나누어 두 업무의 상호 의존성을 낮추고 전문가를 지원하는 방안을 검토하였다. 특히 알고리즘 구현을 담당하는 도메인 전문가의 요구 사항을 분석함으로써 시뮬레이터 개발 지원 도구를 설계하고, 이를 활용한 시뮬레이터 개발 절차를 제안하였다. 또한 도메인 전문가의 알고리즘 개발 지원과 유연한 데이터 관리를 위해 데이터셋 개념을 도입하였고, 시뮬레이터 장비들이 유연하게 재구성될 수 있도록 네트워크 구조를 설계 하였다. 시뮬레이터 개발 지원 도구를 통해서 도메인 전문가는 알고리즘 개발에 전념할 수 있고, 효율적인 협업이 가능할 것으로 기대된다. 또한 개발 절차가 체계화 되고 더 명확해지기 때문에 개발 계획 및 관리가 용이해질 것으로 예상 된다.