• 제목/요약/키워드: 멀티쓰레딩

검색결과 25건 처리시간 0.026초

칩 멀티쓰레딩 서버에서 OpenMP 프로그램의 성능과 확장성 (Performance and Scalability of OpenMP Programs on Chip-MultiThreading Server)

  • 이명호;김용규
    • 정보처리학회논문지A
    • /
    • 제13A권2호
    • /
    • pp.137-146
    • /
    • 2006
  • 최근 Chip-level MuitiThreading(CMT) 기술을 내장한 프로세서 들이 출시되면서 그들을 기반으로 하는 공유 메모리 다중 프로세서(SMP: Shared Memory Multiprocessor) 서버 또한 그 사용이 점점 더 보편화 되고있다. OpenMP는 그 사용의 효율성으로 인하여 SMP 시스템을 위한 응용 프로그램의 병렬화를 위한 표준이 되었다. 고성능 컴퓨팅(HPC: High Performance Computing) 응용프로그램 분야에서 더욱 더 빠른 컴퓨터의 처리 능력에 대한 요구가 증가함에 따라, OpenMP 지시어를 사용하여 병렬화된 HPC 응용 프로그램 들의 성능과 확장성을 높이는 일은 그 중요성이 점차 증대되고 있다. 본 논문에서는 CMT 기술을 내장한 대용량 SMP서버인 Sun Fire E25K에서 OpenMP 지시어를 사용하여 병렬화된 HPC 응용 프로그램 들의 suite인 SPEC OMPL(OpenMP를 위한 표준 벤치마크 suite)의 성능과 확장성에 관해 연구했다. 본 논문에서는 또한 SPEC OMPL에 대한 CMT 기술의 효능을 평가하였다.

효율적인 유체 시뮬레이션을 위한 투영 단계에서의 멀티 코어 프로세서와 그래픽 프로세서의 병렬처리 (Parallel Processing of Multi-Core Processor and GPUs in Projection Step for Efficient Fluid Simulation)

  • 김선태;정휘룡;홍정모
    • 한국콘텐츠학회논문지
    • /
    • 제13권6호
    • /
    • pp.48-54
    • /
    • 2013
  • 최근 영화나 CF등에 사용되는 컴퓨터 그래픽스(Computer Graphics, 이하 CG)분야의 유체 시뮬레이션에서는 CPU와 GPU를 혼합하여 사용하는 기술들이 소개되고 있다. 본 논문에서는 유체 시뮬레이션 수행을 위한 투영 단계에서 멀티쓰레드를 이용하여 기존의 CPU와 GPU 간의 작업을 순차적으로 수행하던 방식을 개선하여 CPU와 GPU 간의 작업을 병렬처리 방법을 제시하였다. 제시된 방법을 통해 많은 계산량을 필요로 하는 유체시뮬레이션의 효율성을 높일 수 있었다.

RFID에 기반한 유비쿼터스 환경에서의 어플리케이션 프레임웍 구조 (Application Framework Architecture In ubiquitous environment based on RFID)

  • 김기현;이정태;류기열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.571-573
    • /
    • 2004
  • 유비쿼터스 컴퓨팅 환경에서 공통적으로 필요로 하는 요구는 사물의 이동을 자동으로 인식하고 위치론 파악하는 것이고 이를 위해서 현재 RFID를 통한 사물의 인식이 각광을 받고 있다. 하지만 RFID에 기반한 어플리케이션은 일반 어플리케이션과는 달리 태그 인식에 의한 실시간 이벤트의 처리가 가장 중요하며, 이로 인해서 RFID 어플리케이션에는 실시간 이벤트 모니터링과 실시간 이벤트 처리, 비동기 이벤트 처리, 멀티 쓰레딩, 분산 처리 등이 반드시 필요하다. 이러한 RFID 어플리케이션의 특성 때문에 RFID 어플리케이션은 일반 어플리케이션과는 다른 구조가 요구된다. 이에 돈 논문에서는 RFID 어플리케이션에서 공통적으로 요구되는 컴포넌트들을 추출하고 이를 효과적으로 결합하기 위한 프레임웍을 설계, 구현하였다.

  • PDF

칩 멀티 프로세서 구조에서 온칩 유휴 캐시의 효과적인 활용 방안 (Efficient On-Chip Idle Cache Utilization Technique in Chip Multi-Processor Architecture)

  • 곽종욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.13-21
    • /
    • 2013
  • 최근 들어 칩 멀티 프로세서 상의 코어 개수는 지속적으로 증가하는데 반해, 이를 효율적으로 뒷받침하기 위한 멀티 프로그래밍 혹은 멀티 쓰레딩 기법은 부족한 실정이다. 이로 인해 실제 작업을 수행하지 않는 유휴 코어가 발생하였고, 해당 코어가 소유한 자원들 중 개별 캐시 부분은 유휴 캐시로 낭비되었다. 본 논문에서는 유휴 개별 캐시의 발생이 불가피함을 인지함과 동시에 그것을 칩 내 메모리 공간으로써 효율적으로 활용할 수 있는 기법을 제안한다. 제안된 기법은 유휴 캐시를 희생 캐시로 활용하는 방법이며, 이를 위해 요구되는 새로운 시스템 구성 및 캐시 일관성 프로토콜의 세부 동작을 소개한다. 본 논문에서 제시된 기법은 유휴 캐시를 사용하지 않을 때와 비교하여 4-코어 및 16-코어 기반 칩 멀티 프로세서 환경에서 각각 19.4%와 10.2%의 IPC 향상을 가져왔다.

정보보호를 위한 고성능 백업 및 복구 시스템의 설계 및 구현 (Design and Implementation of High Efficiency Backup and Recovery Systems for Information Protection)

  • 이문구;성해경
    • 전자공학회논문지CI
    • /
    • 제44권6호
    • /
    • pp.10-18
    • /
    • 2007
  • 데이터의 증가 추세와 중요성을 고려할 때, 효율적인 대용량의 백업시스템이 필요하다. 그러나 기존의 백업시스템들은 저장매체의 속도와 기술적인 문제 등을 갖고 있다 이러한 문제들을 해결하기 위하여 제안하는 고성능, 대용량 백업 및 복구시스템은 고속화, 압축 기술 및 백업 가속기 등을 이용하여 설계 및 구현하였다. 구현된 백업 및 복구시스템은 고속화를 위하여 멀티 쓰레딩 기술과 멀티 프로세싱 기술 그리고 멀티 스트리밍 기술을 적용하였다. 그리고 기존의 백업미디어가 테이프 기반이지만 제안하는 백업운영모델은 디스크기반으로 설계하였다. 때문에 구현된 백업시스템은 백업미디어의 한계를 극복하면서, 고속화 및 고용량이 가능하다.

멀티 쓰레딩 방식을 이용한 군집 로봇의 중앙 제어 시스템 구현 (Implementation of the Centralized Control System for Swarm Robots using Multi-Threading method)

  • 전봉기
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.349-354
    • /
    • 2014
  • 이 논문에서는 여러 대의 로봇들이 협력하여 미로를 탈출하는 방법을 제안한다. 논문에서 사용된 교육용 로봇들은 ZigBee로 서로 통신할 수 있으나, 로봇들의 연산기능이 낮아 서로 협력하여 문제를 해결할 수 없다. 로봇의 모션제어로 통로를 직립 보행하도록 하였으며, 절대거리 센서를 이용하여 교차로와 막다른 골목을 인식하면 중앙제어 시스템에 전송하여 명령을 받는다. 여러 로봇들이 동시에 미로에 들어가서 효과적으로 미로를 탐색하도록 하는 미로 탐색 알고리즘을 수정하였다.

링크 분석에 기반한 웹 문서 중요도 평가 알고리즘의 구현 (An Implementation of the Ranking Algorithm for Web Documents based on Link Analysis)

  • 임성채
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.75-78
    • /
    • 2010
  • 웹 검색에는 기존의 정보검색(Information Retrieval) 시스템에서와 다르게 문서 간 하이퍼링크 정보를 바탕으로 각 웹 문서의 고유 중요도를 추정하는 방식이 자주 이용된다. 링크 분석에 기반한 알고리즘 중 PageRank 알고리즘은 구글의 웹 검색 서비스에 적용된 것으로 알려져 있다. 이런 PageRank 알고리즘에 따라 중요도를 계산하는 경우 색인된 웹 문서수가 증가함에 따라 계산에 필요한 CPU 자원의 사용도 함께 증가하며, 문서 수가 수 억 페이지에 달하면 하나의 서버에서는 계산을 수행할 수 없다는 문제가 있다. 본 논문에서는 이런 문제점을 해소하기 위해 여러 대의 서버를 PageRank 계산 용 클러스터로 사용할 수 있는 방법을 제시한다. 제시된 방법은 고속의 LAN을 이용하여 여러 대의 서버를 연결하고 반복적인 행렬 계산을 병렬로 수행할 수 있어 계산 시간을 단축시킬 수 있다. 이런 서버 클러스터 구현을 위해 멀티 쓰레딩 프로그램이 작성되었으며, PageRank 계산에 사용되는 행렬 데이터를 적은 양의 메모리만으로 표현 가능하도록 하였다.

  • PDF

자바 언어 기반 디지털 방송용 MPEG-2 패킷 분석 시스템 (The Java-based MPEG-2 Packet Analyzing System for the Digital Broadcast)

  • 김인희;황준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.658-660
    • /
    • 2004
  • 디지털 방송을 위한 Java 언어 기반 MPEG-2 TS(전송 스트림) 패킷 분석 시스템은 TS 패킷의 내용을 분석하고. PSI Table과 SI Table 데이터를 수집하여 분석 할 수 있도록 해준다. 구현된 패킷 분석 시스템은 PAT PMT, NIT, CAT 등의 PSI Table과 BAT, NIT, EIT, SDT 등의 SI Table의 정보를 계층적으로 분류 시켜준다. 또한 그 안의 포함된 다양한 의미의 컨텐츠를 포함하는 여러 종류의 Descriptor들의 정보도 분석해준다. 패킷 분석 시스템은 멀티-쓰레딩과 편리한 데이터 관리를 위해서 몇몇 클래스들로 구성 되어있다. 그리고 패킷 분석 시스템의 GUI는 Swing 라이브러리로 구현되었기 때문에, 시스템은 GUI의 변화 없이 윈도우즈. 리눅스와 같은 여러 가지 플랫폼에서도 안정적으로 동작된다. 본 연구의 시스템은 향후 DSM-CC 메카니즘과 의미적 분석의 구현 그리고 데이터베이스 시스템과의 연동 등으로 심화되어 연구될 것이다.

  • PDF

모바일 그래픽 응용을 위한 파이프라인 구조 특수 목적 연산회로의 하드웨어 설계 (Hardware Design of Pipelined Special Function Arithmetic Unit for Mobile Graphics Application)

  • 최병윤
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1891-1898
    • /
    • 2013
  • 3차원 그래픽 API인 OpenGL과 Direct3D를 효율적으로 처리하기 위해 sine, cosine, 역수, 역제곱근, 지수 및 로그 연산을 처리하는 부동소수점 연산회로를 설계하였다. 고속 연산과 2 ulp 보다 작은 오차를 만족시키기 위해 2차 최대최소 근사 방식과 테이블 룩업 방식을 사용하였다. 설계된 회로는 65nm CMOS 표준 셀 조건에서 2.3-ns의 최대 지연시간을 갖고 있으며, 약 23,300 게이트로 구성된다. 최대 400 MFLOPS의 연산 성능과 높은 정밀도로, 설계한 연산회로는 3차원 모바일 그래픽 분야에 효율적으로 적용 가능하다.

멀티카메라 비전시스템을 위한 산업용 PC와 PLC간 제어 방법 개발 (The implementation of interface between industrial PC and PLC for multi-camera vision systems)

  • 김현수
    • 한국산학기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.453-458
    • /
    • 2016
  • 머신비전은 고속화된 자동화 생산 시스템의 품질 검사 방법으로 널리 활용되어 왔다. 본 연구에서는 멀티카메라를 사용하여 PC와 PLC 간 제어를 통해 용접부위의 치수를 실시간으로 측정하여 검사하는 머신비전 시스템을 개발하였다. 제안한 검사시스템은 맞대기 용접부위의 길이와 폭을 측정하여 용접부의 치수 균일성을 검사하도록 설계하였다. 광학계 및 물류는 병렬제어를 위해 PC와 PLC 간 TCP/IP 멀티쓰레딩 통신기법을 적용하였다. 금속재료의 반사 특성을 고려하여 용접비드의 형태나 용접시 발생하는 그을음에도 균일하게 검사부위의 영상획득이 가능한 동축조명계를 적용하였고, 검사 알고리즘은 OpenCV 라이브러리를 사용하여 용접치수검사에 맞게 개발하였다. 제작한 시스템을 실제 전자부품의 용접 자동화 라인에 설치하여 시스템의 작동오류 및 검사 성능을 검증한 결과, 요구되는 기능 및 검사 성능을 모두 성공적으로 수행하였다.