• 제목/요약/키워드: 멀티쓰레딩

검색결과 25건 처리시간 0.025초

다수의 PC를 이용한 디지털 비디오 홀로그램의 고속 생성 (Fast Generation of Digital Video Holograms Using Multiple PCs)

  • 박한훈;김창섭;박종일
    • 방송공학회논문지
    • /
    • 제22권4호
    • /
    • pp.509-518
    • /
    • 2017
  • GPU를 탑재한 여러 대의 PC를 클러스터(서버-클라이언트 구조)로 구성함으로써 고해상도 디지털 홀로그램을 고속으로 생성할 수 있다. 그러나, 비디오 홀로그램의 경우, PC 사이의 데이터 전송 시간이 프레임 수에 비례하여 선형적으로 증가하기 때문에 비디오 홀로그램을 고속 생성하는 데 있어 큰 걸림돌이 된다. 본 논문에서는 이러한 데이터 전송 시간의 증가를 해결하기 위해 멀티쓰레드를 활용하는 방법을 제안한다. 기본적으로 각 클라이언트 PC에서의 홀로그램 생성은 서버로부터 광원 정보 획득, GPU를 이용한 CGH 연산, 서버로의 결과 전송의 과정으로 이루어지는데, 각 과정을 순차적으로 하지 않고 멀티쓰레딩을 통해 병렬로 수행함으로써 전체 홀로그램 생성 시간에서 데이터 전송 시간의 비율을 크게 줄일 수 있다. 실험을 통해, 150 프레임을 가지는 고해상도 비디오 홀로그램을 생성하는 시간을 약 30% 줄일 수 있음을 확인하였다.

공간 제약하의 센서 운영체제를 위한 동적 쓰레드 스택관리 기법 (Dynamic Threads Stack Management Scheme for Sensor Operating Systems under Space-Constrained)

  • 이상호;조유근;홍지만
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권11호
    • /
    • pp.572-580
    • /
    • 2007
  • 무선 센서 네트워크는 자연 환경의 정보를 수집하고, 수집한 정보를 가공하고, 가공된 정보를 무선 통신을 통하여 사용자에게 실시간으로 전달하는 기능을 가진 설비이다. 이러한 센서 네트워크는 다수의 무선 센서 노드들로 이루어지고, 이 센서 노드들은 비용 효율성의 이유로 매우 제한적인 하드웨어 칩들로 구성된다. 예를 들어, UC Berkeley에서 설계한 MICA센서 노드에는 8-bit CPU, 4KB RAM, 그리고, 128KB FLASH 등으로 구성된다. 따라서 이것들을 동작시키는 센서 운영체제는 이러한 하드웨어 제약성을 감내할 수 있어야 한다. 본 논문에서는 멀티 쓰레디드 센서 운영체제를 위한 공간 효율적인 쓰레드 스택 관리 기법을 제안한다. 제안한 기법은 컴파일 시점에 각 쓰레드 함수의 스택 사용량 정보를 측정한다. 측정된 결과를 바탕으로, 함수 호출 시와 같은 스택 영역의 요구가 발생할 경우에 스택의 할당 및 반환 작업을 수행하여 쓰레드 스택 영역을 동적으로 관리한다. 본 기법은 나노 Qplus 센서 운영체제에서 구현되었다. 본 논문의 성능 실험을 통하여, 제안한 기법을 사용하는 것이 기존의 정적인 스택 관리 방법을 사용하는 것 보다 스택 메모리 공간을 보다 효율적으로 관리할 수 있음을 확인한다.

다중 시그니처 비교를 통한 트랜잭셔널 메모리의 충돌해소 정책의 성능향상 (Multiple Signature Comparison of LogTM-SE for Fast Conflict Detection)

  • 김덕호;오두환;노원우
    • 정보처리학회논문지A
    • /
    • 제18A권1호
    • /
    • pp.19-24
    • /
    • 2011
  • 다중 코어 프로세서가 널리 보급되면서 멀티 쓰레디드 프로그램 상의 동기화를 용이하게 구현할 수 있는 해결 방안으로 트랜잭셔널 메모리가 각광을 받고 있다. 이를 위해 고성능의 하드웨어 트랜잭셔널 메모리에 관한 연구가 활발히 진행되고 있으며, 대표적인 연구결과로 UTM, VTM, FastTM, LogTM, LogTM-SE 등이 소개되었다. 특히, 충돌 감지 정책으로 시그니처를 사용한 LogTM-SE는 효율적인 메모리 관리와 쓰레드 스케쥴링을 통해 고성능의 트랜잭셔널 메모리를 구현하였다. 하지만, 이 방식은 프로세서 내부의 코어 수가 증가하는 것에 비례하여 한 코어가 비교해야 하는 시그니처의 수가 증가하는 문제점을 갖고 있다. 이는 시그니처 처리 과정에서 병목현상을 야기하여 전체 성능을 저해하는 요인이 될 수 있다. 본 논문에서는 시그니처 비교 과정에서 나타날 수 있는 이러한 병목 현상을 개선하여 전체 트랜잭셔널 메모리의 성능 향상을 이루고자 다중 시그니처 비교 방식의 새로운 구조를 제안한다.

대용량 위성영상의 무감독 분류를 위한 K-means 군집화 알고리즘의 병렬처리 (Parallel Processing of K-means Clustering Algorithm for Unsupervised Classification of Large Satellite Imagery)

  • 한수희
    • 한국측량학회지
    • /
    • 제35권3호
    • /
    • pp.187-194
    • /
    • 2017
  • 본 연구는 대용량 위성영상의 신속한 무감독 분류를 위해 k-means 군집화 알고리즘을 병렬처리하는 방법을 소개한다. K-means 군집화 알고리즘은 대표적인 무감독분류 알고리즘으로서 주로 감독분류의 전처리 단계로 활용되지만 연산 집약적이고 사용자의 개입이 적어 병렬처리의 효과를 분명하게 나타낼 수 있다. 병렬처리 코드는 OpenMP 기반의 멀티쓰레딩을 이용하여 구현하였다. 실험은 1대의 PC에서 시행하였으며 이 PC의 CPU에는 8개의 멀티코어가 집적되어 있다. 실험 영상으로는 7개 밴드로 구성한 30m 해상도의 LANDSAT 8 OLI 영상과 8개 밴드로 구성한 10m 해상도의 Sentinel-2A 영상을 사용하였다. 각각 10개 군집을 사용하여 순차처리 및 병렬처리를 수행한 결과 병렬처리가 순차처리에 비해 6배 내외의 속도를 나타내었다. 순차처리와 병렬처리 결과의 일치성 평가를 위해 각 군집의 중심값과 분류된 화소의 수를 비교하고 분류 결과 영상간 차분을 수행하였고 결과로 모든 정보가 일치하였다. 본 연구는 병렬처리를 통해 대용량 위성영상의 처리 속도를 상당히 향상시킬 수 있음을 입증하고 있다는 점에서 의미가 있다고 판단된다. 아울러 OpenMP 기반의 멀티쓰레드를 이용하면 비교적 쉽게 병렬처리를 구현할 수 있지만 false sharing의 발생을 억제하도록 코드를 설계하는데 주의를 기울여야 함도 확인할 수 있었다.

낙관 인식을 위한 애플리케이션의 설계 및 구현 (Design and Implementation of Luo-kuan Recognition Application)

  • 김한슬;서귀빈;강민구;류기수;홍민
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.97-103
    • /
    • 2018
  • 대부분의 동양화 작품에는 작가의 정보를 압축시켜 하나의 그림으로 표현한 낙관이 존재하고 이러한 낙관은 작품의 제목이나 작가의 이름 등 다양한 정보를 포함하고 있다. 따라서 동양화를 수집하거나 즐기는 사람들에게 낙관은 동양화에 대한 중요한 정보를 제공하는 단서 역할을 한다. 하지만 낙관에 있는 글자들은 대부분 어려운 한자나 간자 혹은 다양한 모양으로 변형되어 있어 일반인들이 쉽게 해석하기 어려운 문제점이 있다. 본 논문에서는 낙관의 정보를 손쉽게 확인할 수 있도록 안드로이드 기반의 낙관 검색 애플리케이션을 개발하였다. 해당 애플리케이션은 촬영한 낙관 이미지를 분석하여 서버에 전송해 서버 내의 데이터베이스에서 촬영한 낙관 사진과 가장 유사한 낙관 후보에 대한 정보를 검색하는 알고리즘을 적용하였다. 또한 제안하는 알고리즘의 성능 분석을 위해서 촬영된 낙관 사진과 170개의 낙관 데이터 후보 중에서 정확하게 낙관을 찾아내는지에 대한 여부와 제공되는 낙관의 순위를 바탕으로 알고리즘의 정확도를 비교 및 분석하였다. 정확도 분석 실험 결과 본 애플리케이션의 검색 알고리즘의 정확도는 약 90%로 확인되었으며 추후 알고리즘의 최적화와 멀티쓰레딩 알고리즘의 보완을 통해 빅 데이터 환경에서 자동으로 이미지를 분석 및 검색하는 플랫폼으로의 발전이 가능할 것으로 기대한다.