• 제목/요약/키워드: 병렬 응용프로그램

검색결과 162건 처리시간 0.036초

미래의 구조공학 자동화시스템 (The Next Generation of Structural Engineering Automation Systems)

  • 황의승
    • 전산구조공학
    • /
    • 제10권2호
    • /
    • pp.51-55
    • /
    • 1997
  • 미래의 구조공학 자동화시스템은 Windows NT 운영체제의 저가의 데스크탑 컴퓨터에서 작동하며 객체지행적 CAD를 사용할 것이다. 모든 구조공학 관련 프로그램들은 객체지향 프로그램기법과 병렬처리기술로 재개발될 것이다. 구조공학 관련 소프트웨어프로그램의 통하븐 Microsoft사의 Objected Linking and Embedding(OLe)자동화 기술과 강력한 다중처리, 그리고 Windows NT의 다중연결 서버 기능에 의하여 이루어진다. 이 논문에서는 먼저 Windows NT의 다중연결 서버 기능에 의하여 이루어진다. 이 논문에서는 먼저 Windows NT 운영체제의 데스크탑 컴퓨터에서 구조공학 자동화시스템의 응용현황을 설명하고 미래의 구조공학 자동화 소프트웨어의 개발경향과 전략에 대해 논하게 될 것이다.

  • PDF

OpenCL을 이용한 돈사 감시 응용의 효율적인 태스크 분배 (Efficient Task Distribution for Pig Monitoring Applications Using OpenCL)

  • 김진성;최윤창;김재학;정연우;정용화;박대희;김학재
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권10호
    • /
    • pp.407-414
    • /
    • 2017
  • 다수의 태스크로 구성된 돈사 감시 응용은 내재된 데이터 병렬성을 활용하고 성능가속기를 사용하여 병렬 처리가 가능하다. 본 논문에서는 멀티코어 CPU와 매니코어 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 돈사 감시 응용 수행 시 태스크 분배 방법을 제안한다. 즉, 각 태스크별로 OpenCL을 이용한 병렬 프로그램을 작성한 뒤, deviceCPU와 deviceGPU 각각에서 수행시켜 측정된 수행시간을 기준으로 가장 적합한 처리기를 결정한다. 제안 방법은 간단하지만 매우 효과적이고, CPU와 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 다수의 태스크로 구성된 다른 응용을 병렬화하는 경우에도 적용될 수 있다. 실험 결과, 상이한 이기종 컴퓨팅 플랫폼에서 최적의 태스크 분배로 수행한 경우 가 전체 태스크들을 deviceGPU에서 수행한 GPU-only 방법에 비교하여 각각 2.7배, 8.7배, 2.7배 성능 개선이 되었음을 확인하였다.

범용 그래픽 처리 장치의 메모리 설계를 위한 그래픽 처리 장치의 메모리 특성 분석 (Analysis on Memory Characteristics of Graphics Processing Units for Designing Memory System of General-Purpose Computing on Graphics Processing Units)

  • 최홍준;김철홍
    • 스마트미디어저널
    • /
    • 제3권1호
    • /
    • pp.33-38
    • /
    • 2014
  • 소비전력 증가와 같은 문제점들로 인하여, 마이크로프로세서만으로는 컴퓨팅 시스템의 성능을 향상시키기 점점 어려워지고 있다. 이와 같은 상황에서, 대용량 병렬 연산에 특화된 그래픽 처리 장치를 활용하여 중앙 처리 장치가 담당하던 범용 작업을 수행하게 하는 범용 그래픽 처리 장치 기술이 컴퓨터 시스템의 성능을 개선시킬 수 있는 방안으로 주목을 받고 있다. 하지만, 그래픽스 관련 응용프로그램과 범용 응용프로그램의 특징은 매우 상이하기 때문에, 그래픽 처리 장치가 범용 응용프로그램을 수행하는 경우에는 많은 제약 사항으로 인하여 자신의 뛰어난 연산 자원을 활용하지 못하는 실정이다. 일반적으로 그래픽스 관련 응용프로그램에 비해 범용 응용프로그램은 메모리를 매우 많이 요청하기 때문에 범용 그래픽 처리 장치 기술을 효율적으로 활용하기 위해서는 메모리 설계가 매우 중요하다. 특히, 긴 접근 시간을 요구하는 외부 메모리 요청은 성능에 큰 오버헤드이다. 그러므로 외부 메모리로의 접근 횟수를 줄일 수 있는 다중 레벨 캐쉬 구조를 효율적으로 활용할 수 있다면, GPU의 성능은 크게 향상 될 것이 분명하다. 본 논문에서는 다중 레벨 캐쉬 구조에 따른 그래픽 처리 장치의 성능을 다양한 벤치마크 프로그램을 통하여 정량적으로 분석하고자 한다.

실시간 운영체제 DSP/BIOS를 이용한 3상 무정전전원공급장치(UPS) 소프트웨어 설계 (Software design of three phase uninterruptible power supply(UPS) using the realtime operating system DSP/BIOS)

  • 오성진;김경환;이동근
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2006년도 전력전자학술대회 논문집
    • /
    • pp.465-466
    • /
    • 2006
  • 대부분의 전력전자 시스템과 마찬가지로 3상 UPS 시스템 역시 전력전자 알고리즘 개발자가 응용프로그램을 작성할 때 하드웨어를 조작하고 초기화하는 하위 수준 코드를 작성해 왔다. 이와 같은 응용 소프트웨어와 하드웨어의 밀접한 통합은 시스템 성능차원에서는 부족함이 없으나 이식성과 유지보수 측면에서 많은 문제점을 보여왔다. 또한, 다양화 된 고객요구에 의하여 시스템이 점점 더 복잡해짐에 따라서 기존 소프트웨어 구성은 한계를 이르렀다. 본 논문에서는 TI사의 실시간 운영체제인 DSP/BIOS를 이용하여 3상 UPS 시스템 하드웨어와 응용프로그램을 분리하는 추상화 작업을 통해서 이루어진 성과에 관하여 제시한다. 분업화되고 상호 연동하는 방식의 개발 패러다임의 변화는 전력전자 알고리즘 개발자가 더 많은 시간을 알고리즘 개발에 투입 할 수 있게 하였고 다른 분야 개발자가 병렬로 소프트웨어 개발을 진행함에 따라서 전체적으로 개발기간의 단축을 가져왔다.

  • PDF

영상처리를 위한 Pipelined 병렬처리 시스템 (Pipelined Parallel Processing System for Image Processing)

  • 이형;김종배;최성혁;박종원
    • 전기전자학회논문지
    • /
    • 제4권2호
    • /
    • pp.212-224
    • /
    • 2000
  • 본 논문에서는 영상 응용프로그램의 처리 속도를 향상하기 위한 병렬처리 시스템을 제안한다. 병렬처리 시스템은 Pipelined SIMD 구조를 갖고 있으며, 다수개의 처리기와 다중접근 기억장치로 구성된다. 다중접근 기억장치는 메모리 모듈들과 메모리 제어부로 구성되며, 메모리 제어부는 메모리 모듈 선택 모듈, 데이터 라우팅 모듈, 그리고 주소 계산 및 라우팅 모듈로 구성되어 있으며, 블록, 행, 그리고 열 내의 데이터를 동시에 접근할 수 있는 기능을 제공한다. 제안한 병렬처리 시스템을 검증하기 위해서 형태학적 필터를 적용하여 기능 검증 및 처리속도를 확인하였다.

  • PDF

Java를 이용한 병렬 프로그래밍 환경 (A Java Parallel Programming Environment)

  • 황석찬;최재영;김명호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권1호
    • /
    • pp.24-32
    • /
    • 1999
  • 네트워크 컴퓨터를 이용하여 병렬 프로그래밍 환경을 개발하려는 많은 연구가 진행되었다. 그러나 기존의 연구들에서는 응용 프로그램들이 호환되지 않고 이기종 컴퓨터사이에서 시스템이 이식되지 않는등 여러 가지 문제가 지적되고 있다. 이러한 이식성과 호환성의 문제를 해결하기 위하여 JPVM과 같은 연구도 진행되었디만, JPVM 은 병렬 환경을 위한 충분한 기능과, 견고한 메시지 통신, 편리한 사용자 인터페이스 등이 제대로 지원되고 있지 않다. 본 논문에서는 기존의 문제들을 해결하고 사용자에게 더욱 편리한 병렬 프로그래밍 환경을 제공하기 위한 JPE를 소개한다. JPE는 자바를 이용하여 호환성과 이식성의문제를 해결하였으며, 견고한 메시지 통신, 웹 기반의 그래픽 콘솔을 제공하여 인터넷상에서도 더욱 쉽게 사용할수 있도록 구현하였다.

중첩 루프의 병렬화를 위한 동기화 기법 (A Synchronization Method for Parallelizing Nested Do Loop)

  • 박현호;김영만;배은호;윤성대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.239-242
    • /
    • 2001
  • 일반적인 응용 프로그램에서 병렬성이 많은 구조는 루프 구조이며, 루프를 병렬로 처리하기 위해 동기화가 필요하다. 본 논문에서는 다중첨자를 갖는 1차원 배열의 루프의 병렬화를 위해 다수 개의 동일한 종속값을 이용하여 종속함수를 생성하고 이를 이용하여 종속관계가 성립하지 않는 비종속 구간(Non-dependence part)을 구한다. 그리고 동일한 값을 가지는 복수개의 종속값 간의 동기화는 외부루프 분할 기법을 이용하여 간소화 한 후 단일 첨자를 갖는 루프에 동기화를 수행하는 기법을 제시한다.

  • PDF

메모리 상주 DBMS 기반의 OLTP 응용을 위한 다중프로세서 시스템 캐쉬 성능 분석 (Cache Performance Analysis of Multiprocessor Systems for OLTP Applications based on a Memory-Resident DBMS)

  • 정용화;한우종;윤석한;박진원;이강우;김양우
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권4호
    • /
    • pp.383-392
    • /
    • 2000
  • 다중프로세서 시스템에 대한 대부분의 기존 연구는 과학계산용 응용을 중심으로 수행되어 왔으며, 또 다른 응용 분야인 상용 응용을 이용한 연구는 아직까지 초보 단계에 머물고 있는 실정이다. 이는 상용 DBMS의 소스 프로그램을 액세스하기가 쉽지 않으며, POSTGRES와 같은 공개된 소스 프로그램을 액세스 할 수 있더라도 컴퓨터 구조 설계자가 수십만 라인의 그 소스 프로그램을 이해하여 의미있는 성능분석을 수행하기는 사실상 불가능하기 때문이다. 본 연구에서는 상용 응용을 이용하여 다중프로세서 시스템을 분석하기 위하여, SQL로 작성된 병렬 프로그램을 아키텍처 시뮬레이터 상에서 수행할 수 있는 EZDB라는 병렬 DBMS를 자체 개발하였다. EZDB가 POSTGRES와 다른점은 그 목적이 다중프로세서 시스템에서 상용 응용을 수행시키고 그 성능을 쉽게 분석할 수 있다는 점이다. EZDB의 유용함을 확인하기 위해, 본 논문에서는 다중프로세서 시스템에서 TPC-B 작업부하를 수행시켰을 때의 캐쉬 성능을 분석한다. 구축된 작업부하를 기반으로 프로그램 구동 시뮬레이션을 수행한 결과, 상용 응용에서 데이터 구조의 공유 특성이 매우 특별하며 국부성 및 작업 세트가 과학계산 응용의 경우와 매우 상이함을 확인하였다.

  • PDF

PC 클러스터를 위한 TCP/IP 기반 하이퍼큐브 네트워크 구현 (Implementations of Hypercube Networks based on TCP/IP for PC Clusters)

  • 이형봉;홍준표;김영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.221-233
    • /
    • 2008
  • 일반적으로 병렬처리가 필요한 경우 병렬처리 전용으로 제조된 시스템을 사용하지만, 가까운 주위에서 쉽게 얻을 수 있는 PC들을 클러스터로 구축하여 병렬처리에 활용할 수도 있다. PC들을 클러스터로 구축하기 위한 가장 쉬운 방법은 PC들을 스위치 허브 중심의 스타 네트워크로 연결하는 방법이지만, 이 논문에서는 병렬처리 연구 및 활용에 더 적합하도록 8개의 PC들이 직접 연결된 클러스터 구축을 위한 TCP/IP 기반 하이퍼큐브 네트워크의 효율적인 구현 방안을 모색하고, 그 기능 및 효율성을 ping, netperf, MPICH 등의 도구를 이용하여 검증하였다. 구현 방안으로 링크 위주의 IP 설정 방법과 노드 위주의IP 설정 방법을 제안하고 두 방법을 비교 분석하였는데, 그 결과 두 방법간에 시간적 성능 차이는 없지만 라우팅 테이블의 단순화 측면에서 노드 위주의 IP설정 방법이 우수함을 볼 수 있었다. 기능적 측면을 검증하기 위하여 응용프로그램의 병렬처리 결과를 스타 네트워크 기반클러스터에서의 결과와 비교하였는데, 두 방법 모두 완벽한 병렬처리 환경을 지원하는 것으로 나타났다.

  • PDF

소프트웨어 파이프라이닝에서 레지스터 변경을 통한 성능 개선 (Improving Software Pipelining Performance Using a Register Renaming Technique)

  • 조두산
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1642-1643
    • /
    • 2010
  • 멀티미디어 도메인의 응용 프로그램에는 풍부한 병렬성이 내재하기 때문에 VLIW (Very Long Instruction Word) 형식의 신호처리 프로세서가 많이 사용되고 있다. VLIW 프로세서를 구성하는 복수의 연산처리유닛 (processing unit, PU)의 사용률은 컴파일러의 명령어 스케쥴러의 성능에 의하여 결정된다. 명령어들 사이의 병렬성을 분석하여 동시 수행가능한 명령어들을 각기 다른 PU 에서 수행되도록 프로그램 코드를 최적화한다. 하지만 기존의 명령어 스케쥴러는 복잡한 데이터 디펜던스 그래프 (data dependence graph, DDG)를 구성하여 복수의 PU 를 충분히 사용하도록 하지 못하는 문제점을 내재하고 있다. 이는 명령어 스케쥴러가 각 레지스터 사용시간을 별도로 고려하지 않기 때문에 실제로 내재된 데이터 디펜던스 보다 복잡성이 높은 디펜던스 그래프를 구성하게 되어 스케쥴러가 올바르게 최적화된 코드 스케쥴링 결과를 제공하지 못하기 때문이다. 본 연구에서는 레지스터의 라이프타임을 다른 레지스터를 이용하여 적절히 끊어주는 것으로 데이터 디펜던스 복잡도 완화하여 시스템 성능 향상의 가능성을 보이고 있다.