• 제목/요약/키워드: 병렬 구조

검색결과 1,741건 처리시간 0.034초

SIMD상에서 이산대수 문제에 대한 병렬 알고리즘 (Parallel Algorithms for the Discrete Logarithm Problem dn SIMD Machines)

  • 김양희;정창성
    • 정보보호학회지
    • /
    • 제4권2호
    • /
    • pp.40-46
    • /
    • 1994
  • 고속 계산을 요구하는 분야에서는 여러개의 프로세싱 소자를 사용하여 속도를 증가시키는 병렬 처리의 필요성이 점점 증대되고 있다. 특히 암호처리에서 이산대수 문제나 factorization문제는 많은 시간이 걸리므로 고속계산을 위한 병렬처리가 매우 중요하다. 본 논문에서는 Pohlig-Hellman에 의한 이산대수 알고리즘을 SIMD구조의 병렬 컴퓨터상에서 고속으로 처리할 수 있는 두가지 병렬 이산대수 알고리즘을 제시하며, 이를16개의 트랜스퓨터로 구성된 병렬 컴퓨터인 KOPS(Korea Parallel System)상에서 구현한 성능평가를 제시한다.

  • PDF

HPF FORALL 구조의 스칼라화(Scalarization) (Scalarization of HPF FORALL Construct)

  • 구미순
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.121-129
    • /
    • 2007
  • 스칼라화(Scalarization)는 포트란 90의 array statement나 HPF FORALL 등의 병렬 구조를 동일한 의미의 순차 DO 루프로 변환하는 과정이다. 표준 자료 병렬 언어인 HPF 컴파일러도 HPF로 작성된 프로그램을 메시지 패싱 프리미티브가 삽입된 포트란 77 프로그램으로 변환하고, 병렬 구조인 FORALL을 스칼라화하여 포트란 77의 순차 DO 루프로 변환해야 한다. 본 논문에서는 병렬 구조의 시맨틱을 지닌 다중문장 FORALL 구조를 개선된 성능의 순차 DO 루프로 변환하는 스칼라화 알고리즘을 제안한다. 이를 위해 필요한 종속성 정보를 유지하는 수단으로 관계거리벡터를 정의하여 사용한다. 끝으로 제안된 알고리즘을 적용하여 생성된 코드와 기존 PARADIGM 컴파일러에 의해 생성된 코드의 성능을 비교 평가한다.

  • PDF

동해 가스 하이드레이트 자료 깊이영역 구조보정 (Depth Migration for Gas Hydrate Data of the East Sea)

  • 장성형;유동근;서상용
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2006년도 춘계학술대회
    • /
    • pp.382-385
    • /
    • 2006
  • 한국지질자원연구원은 1997년부터 새로운 에너지 자원으로 활용 가능성을 포함하고 있는 가스 하이드레이트를 조사하기 위해 동해 일원에서 탄성파탐사를 실시하고 있다. 탄성파 반사 자료로부터 가스 하이드레이트 부존여부를 확인하는 방법은 해저면과 평행하면서 위상이 반대로 나타나는 고진폭 반사파 BSR (Bottom Simulating Reflection)과 BSR상부에서의 진폭감소, 하부에서 진폭증가와 구간속도 감소 등을 들 수 있다. 여기에서는 가스 하이드레이트 탐사자료에 대한 일반자료처리와 함께 BSR을 포함하고 있는 탄성파 반사자료에 대해 코드 병렬화된 PSPI를 이용하여 깊이영역 구조보정을 실시하였다. 고용량 탐사자료로 구성된 탄성파 반사자료에 깊이영역 구조보정을 적용하기 위해서는 고성능 컴퓨터와 병렬처리 기술이 필요하다. PSPI(Phase Shift Plus Interpolation)법은 적은 컴퓨터 계산량과 효율성 그리고 주파수 영역에서 구조적으로 병렬화가 용이한 특성을 지니고 있어 구조보정에 많이 이용되고 있다. 여기에서는 MPI(Message Passing Interface)-LAM을 이용하여 병렬코드화된 PSPI를 개발하고 인공합성모델과 동해 가스 하이드레이트 깊이영역 구조보정에 적응하였다.

  • PDF

HEVC 부호화기 고속화를 위한 타일 기반 병렬화 (Tile-based Parallelizing for a Fast HEVC Encoder)

  • 김연희;전동산;정순흥;석진욱;최진수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.290-293
    • /
    • 2012
  • 본 논문에서는 기존 AVC 보다 50% 압축성능 향상을 목표로 표준화가 진행되고 있는 차세대표준인 HEVC 부호화기의 속도를 높이기 위한 방안으로, HEVC 의 기술 중 화면 분할 기술인 타일(Tile)을 기반으로 효율적으로 부호화기를 병렬화하는 구조를 제안한다. 부호화기에서 복잡도가 높은 율왜곡 기반 모드 결정 과정을 멀티코어 병렬프로그래밍으로 구현하고, 병렬처리에 의한 속도 개선 결과를 제시한다. 타일은 병렬처리를 지원하기 위해 HEVC 가 채택한 구조로, 화면을 여러 개로 분할하여 부/복호화 할 수 있어 병렬처리 단위로 적합하며, 표준화의 기고서를 통해 화면분할로 인한 압축성능 변화량은 여러 차례 보고되고 있다. 본 논문의 결과에 의하면 타일의 수만큼 쓰레드를 생성하여 각 타일 단위로 율왜곡 기반 부호화 모드 결정을 하도록 병렬화 하였을 때 기존 참조 소프트웨어 대비 12 개의 쓰레드 생성 시 6 배의 속도 개선을 보인다. 향후 병렬로 처리할 수 있는 모듈을 확장하면 쓰레드 수 증가에 따른 속도개선 효과가 증대되어 부호화기 실용화를 위한 실시간 부호화기 개발에 한 걸음 다가갈 수 있을 것이라 기대한다.

  • PDF

Lifting scheme을 이용한 고속 병렬 2D-DWT 하드웨어 구조 (A High Speed 2D-DWT Parallel Hardware Architecture Using the Lifting Scheme)

  • 김종욱;정정화
    • 대한전자공학회논문지SD
    • /
    • 제40권7호
    • /
    • pp.518-525
    • /
    • 2003
  • 본 논문은 리프팅 스킴(lifting scheme)의 분할 방법을 개선하여 고속 병렬 처리가 가능한 2차원 DWT(Discrete Wavelet Transform) 하드웨어 구조를 제안한다. 2차원 DWT 변환은 2차원 입력 데이터 전체에 대하여 연산이 수행되고 순차적으로 2차원 처리가 됨에 따라서 초기 및 전체 지연시간(latency)이 많이 걸린다. 본 논문에서는 처리속도와 지연 시간을 향상시키기 위해 개선된 분할 방법과 새로운 자원 공유 하드웨어 구조를 제안한다. 상호 연관성이 없는 데이터들을 4 개의 데이터 집합으로 분할하여 병렬 처리에 적합하도록 새로운 분할 방법을 제안하였다. 병렬처리 하드웨어 구조는 하드웨어의 자원 공유가 가능하도록 하기 위해 필터연산의 중간 값을 메모리에 저장할 수 있는 파이프라인 구조를 갖도록 설계하였다. 제안된 구조를 효율적으로 동작시킬 수 있도록 하드웨어 자원의 공유를 스케쥴링하여 초기지연과 전체지연 시간을 줄였다. 제안하는 구조는 기존의 병렬 처리 구조에 비해 초기 지연 및 전체 지연 시간을 각각 50%와 66%감소시키는 결과를 얻을 수 있었다.

시스톨릭 구조 기반의 효율적인 양방향 중앙 병렬 가우스 소거법 (An Efficient Central Two-Sided Parallel Gaussian Elimination Method Based on Systolic Structure)

  • 이연규;김학원;이광희;이충세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.683-685
    • /
    • 2000
  • 이 논문에서는 새로운 중앙 소거 방식과 행렬 이분법의 개념을 시스톨릭한 구조 위에 결합시켜{{{{ { O}^{ } }}}}({{{{ { N}^{ 3} }}}})의 문제를 해결한다. 새로운 중앙 소거 방식은 주어진 시스톨릭한 구조의 병렬성을 최대한 증가시키는 것을 가능하게 해주며, 행렬 이분법은 기존의 가우스 소거 방식 상에서 나타나는 {{{{ { O}^{ } }}}}({{{{ { N}^{ 2} }}}})의 복잡도를 요구하는 후진 대입을 효과적으로 제거 시켜준다. 새로운 소거 방법은 독립적인 선형방정식으로 이루어진 시스템의 차수를 N이라 할 때 2N(N+1)의 저장 공간과 4N+2log2N-4의 시간 복잡도를 갖는다. 제안 한 새로운 소거 방식은 단순한 구조와 연결 방식을 가진 그물 구조의 시스톨릭 병렬 시스템에 적용되기에 충분히 적합한 단순한 알고리즘을 사용하면서도 이전의 방법과 동일한 구조의 저정공간을 요구하고 동시에 훨씬 우수한 시간 성능을 나타내는 것이 가능하다.

  • PDF

ATM/B-ISDN통신망에서의 PCS Mobility 지원을 위한 병렬.분산 라우팅 기법연구 (A Study on the Parallel & Distributed Routing to support PCS Mobility in ATM/B-ISDN)

  • 신상헌;구수용;김영탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.246-247
    • /
    • 1998
  • PCS를 포함한 차세대 이동통신은 ATM/B-ISDN을 core network으로 하여 다양한 서비스를 제공하는 방향으로 발전할 것으로 예상된다. 이러한 유.무선 통합환경에서 PCS mobility를 효율적으로 제공하기 위해서 TINA와 같은 계층적 연결관리 구조와 이 구조에 적합한 라우팅 기법이 필요하다. 본 논문에서는 ATM/B-ISDNTINA통신망에서 기존의 라우팅 기법에 비해 장점을 가지면서, TINA의 계층적 연결관리 구조를 기바능로 하는 병렬.분산 라우팅 기법을 제안한다. 제안된 병렬.분산 라우팅 기법은 라우팅 알고리즘이 서브네트워트 단위로 병렬적, 계층적으로 실행되어 사용자가 원하는 QoS연결을 제한된 시간내에 빠르게 설정할 수 있으므로, PCS mobility지원을 위한 빈번한 경로 재설정 요구에 유연하게 대처 할수 있다. 또한, 연결관리 체계가 계층적으로 이루어져 있어 TMN/TNA를 통한 체계적인 통신망 관리에도 효율적이다.

  • PDF

MACE 개념을 이용한 병렬 나무 구조로부터의 왜곡에 무관한 한글문자 인식 (Distortion-Invariant Korean Character Recognition With Parallel Tree Structure Using MACE Concept)

  • 유위경;김정우;도양희;김수중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.148-153
    • /
    • 1989
  • 본 논문에서는 광 상관기 (optical correlator) 에 의한 한글문자 분리 인식의 한 방법을 제안하였다. 효율적인 분리 인식을 위해서 병렬 나무 (tree) 구조로부터 입력 신호를 두 방향으로 병렬 처리하여 각 방향으로 자음과 모음을 따로 분리시켜 2단계 만에 인식한 뒤 이들을 위치에 따라 조합하여 문자 분리 인식하도록 하며, 아울러 이러한 병렬 나무구조의 각 단계에서 필터 합성시 MACE (minimum average correlation energy) 개념을 이용하여 광 상 관평면상에서 부엽의 문제를 줄이고, 실제 광 시스템에서 생길 수 있는 왜곡을 학습표본에 포함하여 광 상관기 시스템에 의한 실질적인 한글 문자의 왜곡에 무관한 분리인식을 하도록 하였다.

  • PDF

개선된 자료 종속성 제거 알고리즘 (An Improved Data Dependency Elimination Algorithm)

  • 장유숙;박두순;이원규;유헌창
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.833-838
    • /
    • 2001
  • 프로그램 수행시간의 대부분이 루프 구조에서 소비되고 있기 때문에 루프 구조를 가진 순차프로그램에서 병렬성을 추출하는 연구들이 많이 행해지고 있고 그 연구들은 하나의 프로시저 내 루프 구조의 변환에 치중되고 있다. 그러나 대부분의 프로그램들은 프로시저 간 잠재된 병렬성을 가지고 있다. 본 논문에서는 프로시저 호출을 가진 루프에서 병렬성 추출방식을 제안한다. 프로시저 호출을 포함하는 루프의 병렬화는 대부분 자료종속거리가 uniform 형태의 코드에서만 집중되었다. 본 논문에서는 자료종속거리가 uniform 코드, nonuniform 코드 그리고 복합된 코드를 가진 프로그램에서 적용 가능한 알고리즘을 제시하였으며, 제안된 알고리즘과 loop extraction, loop embedding 그리고 procedure cloning 변환 방법을 CRAY-T3E로 성능 평가하였다. 성능평가 결과는 제안된 알고리즘이 효율적이라는 것을 보여준다.

  • PDF

CUDA를 사용한 병렬 컴퓨팅 기반 신경망 구현 및 수행 속도 측정 (Implementing Neural Network and measuring execution speed using CUDA based on Parallel Computing)

  • 장용석;전웅기;오병진;최흥국
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2012년도 춘계학술발표대회논문집
    • /
    • pp.275-278
    • /
    • 2012
  • 신경망 이론은 그 특성상 각각의 뉴런과 신경들 사이의 병렬적인 처리에 의해 Input에 대한 Output을 계산해 낸다. 하지만, 현대 컴퓨터들은 CPU를 통한 순차처리 방식으로 정보를 취급하기에 그 근본 구조가 달라 병렬구조를 모사하기 위해 계산하는 과정에 많은 시간이 소요된다. 본 논문에서는 신경망 학습을 NVIDIA사에서 제공한 CUDA를 사용하여 병렬 컴퓨팅 구조로 수행함으로서 시간을 단축시키는 것을 확인하고자 한다.

  • PDF