• 제목/요약/키워드: Multiple Streams

검색결과 206건 처리시간 0.032초

Large-scale 3D fast Fourier transform computation on a GPU

  • Jaehong Lee;Duksu Kim
    • ETRI Journal
    • /
    • 제45권6호
    • /
    • pp.1035-1045
    • /
    • 2023
  • We propose a novel graphics processing unit (GPU) algorithm that can handle a large-scale 3D fast Fourier transform (i.e., 3D-FFT) problem whose data size is larger than the GPU's memory. A 1D FFT-based 3D-FFT computational approach is used to solve the limited device memory issue. Moreover, to reduce the communication overhead between the CPU and GPU, we propose a 3D data-transposition method that converts the target 1D vector into a contiguous memory layout and improves data transfer efficiency. The transposed data are communicated between the host and device memories efficiently through the pinned buffer and multiple streams. We apply our method to various large-scale benchmarks and compare its performance with the state-of-the-art multicore CPU FFT library (i.e., fastest Fourier transform in the West [FFTW]) and a prior GPU-based 3D-FFT algorithm. Our method achieves a higher performance (up to 2.89 times) than FFTW; it yields more performance gaps as the data size increases. The performance of the prior GPU algorithm decreases considerably in massive-scale problems, whereas our method's performance is stable.

데이터 스트림에서 다중 조인 질의의 최적화 기법 (Optimization of Multiple Join Queries over Data Streams)

  • 박연경;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.38-41
    • /
    • 2007
  • 최근 산업발달과 더불어 금융, 의료, 건설 등 다양한 산업분야에서는 대용량의 데이터 들이 실시간에 연속적으로 빠르게 발생되는 경우가 많다. 이런 스트림데이터 형태의 경우 전통적인 DBMS에서 처리하는 방식으로는 모든 데이터를 처리하는 것이 불가능하기 때문에 기존의 방식과 다른 데이터 처리방식이 요구된다. 본 논문에서는 데이터 스트림에 대한 다중 연속 질의들 사이에서 2개 이상의 스트림을 조인하는 다중 조인 연속 질의를 효율적으로 처리하는 방법을 연구하였다. 다중 조인 연속 질의에 사용되는 조인 조건들 가운데 공통으로 사용된 조인 조건을 공유해 불필요하게 반복되는 질의 수행을 최소화시키고 공통부분을 우선적으로 수행시킴으로써 그 조인 결과의 공유 최대화 및 질의 수행비용의 최소화 할 수 있는 질의 수행 최적화 기법을 제안하고 실험을 통해 제안된 공유 기반의 질의 수행 최적화 기법을 검증하고자 한다.

접근 제어를 위한 반응적 방식의 그룹키 관리 기법 (Group Key Management Scheme for Access Control with Reactive Approach)

  • 김희열;이윤호;박용수;윤현수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권11호
    • /
    • pp.589-598
    • /
    • 2007
  • 다양한 종류의 데이타 스트림과 다양한 권한을 가지는 사용자들을 위한 그룹 통신을 위해서는 접근 제어(access control)가 필수적이다. 동일한 접근 권한을 가지는 그룹 멤버들은 하나의 클래스에 속하게 되며, 이러한 클래스들은 주어진 접근 관계를 표현한 하나의 계층을 구성한다. 그리고 각 클래스에는 하나의 비밀키가 할당된다. 기존의 기법들에서는 계층으로부터 하나의 논리적 키 트리를 생성하고 각 사용자는 항상 자신이 접근할 수 있는 모든 클래스의 키를 관리하는 방식, 즉 선행적(proactive)인 방식이었다. 하지만, 계층의 규모가 큰 경우에 사용자가 키를 저장하기 위한 공간이 늘어나고 키 갱신을 위한 메시지 또한 커진다는 단점을 가진다. 그리고 대부분의 경우 사용자는 극히 일부의 스트림만을 동시에 접근하게 되며, 이를 위해 모든 키를 지속적으로 갱신하는 것은 낭비가 된다. 본 논문에서는 이를 고려한 반응적(reactive)인 방식의 키 관리 기법을 제안한다. 각 사용자는 자신이 속한 서브그룹의 키만을 관리하며 다른 키가 필요한 경우에만 자신의 키와 공개 파라미터를 이용해서 해당 키를 추출하게 된다. 이로 인해 키 갱신을 위한 비용이 줄어들게 되고, 특히 접근 관계가 복잡하고 규모가 큰 그룹에 대해 좋은 성능을 가진다. 그리고 접근 관계가 변하는 경우, 이를 쉽게 반영할 수 있다는 장점을 가진다.

동적 레인 제어방식을 적용한 에너지 절감형 광 이더넷 시스템의 성능분석 (Performance of Energy Efficient Optical Ethernet Systems with a Dynamic Lane Control Scheme)

  • 서인수;양충열;윤종호
    • 전자공학회논문지
    • /
    • 제49권11호
    • /
    • pp.24-35
    • /
    • 2012
  • 본 논문에서는 광 이더넷 시스템에 대하여 상용 광 트랜시버 모듈의 사용이 가능하면서도 에너지 절감기능을 제공할 수 있도록 트래픽 예측모듈을 사용하는 동적 레인제어방식을 제안한다. 40/100Gbps급 상용 광 트랜시버는 4개 또는 10개의 광 트랜시버를 사용하는데 이들 각각은 트래픽 부하와 상관없이 항상 켜져 있어 많은 에너지를 소모한다. 이러한 에너지 소모를 감소시키기 위하여 제안된 동적 레인제어방식은 부하에 따라 일부 레인의 트랜시버를 끄고 나머지 활성화된 레인으로만 프레임을 처리하도록 한다. 이때 레인의 갯수가 변동될 때 발생할 수 있는 바이트 전송순서 어긋남을 보완하기 위하여 새로운 전송율 제어모듈을 xGMII 인터페이스 상위에 위치한 정합부계층에 설치하는 것을 제안하였다. 이것은 비활성화된 레인상으로 가상적인 바이트열을 삽입하는 기능을 수행하는 것으로써 이 바이트열들은 비활성화된 PMD에서 무시된다. 실제 이 모듈의 구현은 PHY모듈과 별개로 동작하므로 상용 PHY모듈의 사용이 가능한 장점을 제공한다. 이러한 시스템에서 변동되는 부하에 적응하여 활성화된 레인의 갯수를 결정하는 것이 중요하므로 구현관점에서 용이한 트래픽 예측기를 제시하였다. 이것은 주기적으로 샘플링된 현재의 송신버퍼크기와 지금까지 사용되었던 버퍼크기 예측값에 서로 다른 가중치를 부여하여 변화하는 트래픽에 적응하도록 한다. 이러한 시스템에 대하여 OMNET++기반의 시뮬레이터를 구현하여 적응정도와 에너지 절감효과를 분석하였다.

스트림 데이터에서 슬라이딩 윈도우를 사용한 조인 연산의 효율에 관한 연구 (A Study on the Efficiency of Join Operation On Stream Data Using Sliding Windows)

  • 양영휴
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.149-157
    • /
    • 2012
  • 이 논문은 슬라이딩 윈도우를 사용하는 스트림 데이터에서 모든 조인 연산의 상태를 저장하기에 메모리가 충분하지 않을 경우에, 연속적인 슬라이딩 윈도우 조인 연산의 근사치 답을 구하는 문제에 대한 연구이다. 근사치를 구하는 두 가지 방법으로는 최대 부분집합으로 근사치를 구하는 방법과 조인 결과에서 임의의 결과를 택하는 방법이 있다. 전자는 잃어버리는 튜플의 수를 최소화 하고, 후자는 조인의 결과가 집계로 나타날 때 사용된다. 이 논문에서는 임의의 입력 데이터에 슬라이딩 윈도우가 사용되는 경우 두 가지 방법으로 얻는 근사치 모두 효율적이지 못함을 보여준다. 기존의 최대 부분집합에 의해 근사치를 구하는 모델에서는 빈도-기반 모델을 사용하였는데. 샘플링이 문제가 되었다. 오히려 스트림 도착한 이후의 연령-기반 모델이 많은 응용분야에서 더 적절하게 사용 될 수 있음을 보여주고 있다. 이 논문에서는 최대 부분 집합과 임의의 결과라는 두 가지 근사치 측정법을 분석, 그 효율성을 비교하여 보여 준다. 또한, 메모리가 제한 되어있는 환경에서 다중 조인 연산이 수행 될 경우에, 어떤 경우에도 근사치 측정을 최적화할 수 있도록, 조인 연산 전체에 필요한 메모리를 적절하게 할당하는 알고리즘의 효율성을 분석한다.

전자상거래 데이터의 실시간 분석을 위한 데이터 스트림과 다수 릴레이션 간의 효율적인 연속 조인 처리 기법 (Efficient Processing of Continuous Join Queries between a Data Stream and Multiple Relations for Real-Time Analysis of E-Commerce Data)

  • 김해리;이기용
    • 한국전자거래학회지
    • /
    • 제18권3호
    • /
    • pp.159-175
    • /
    • 2013
  • 최근 들어 전자상거래 데이터의 실시간 공급이 가능해지면서, 전자상거래 데이터를 실시간으로 분석하고자 하는 요구가 급증하고 있다. 이를 위해서는 전자상거래 데이터 스트림과 디스크에 저장된 대규모 릴레이션 간의 연속 조인 질의를 효율적으로 처리하는 것이 매우 중요하다. 본 논문에서는 전자상거래 데이터 스트림과 디스크에 저장된 다수 릴레이션 간의 효율적인 연속 조인 질의 기법을 제안한다. 제안 방법은 기존 방법에 비해 서비스율을 크게 향상시키는 한편, 메모리 사용량을 크게 줄인다. 분석과 다양한 실험을 통해, 제안 방법은 기존 방법에 비해 서비스율과 메모리 사용량에서 더 효율적임을 보인다.

첨단 의료산업분야 정책형성과정 연구 -첨단의료복합단지 조성정책을 중심으로- (Formulation of Industrial Policy for Nurturing the Bio-medical Sector: A Case Study on the Construction the Bio-medical Complexes of Korea)

  • 정용일;김상태
    • 기술혁신학회지
    • /
    • 제16권3호
    • /
    • pp.839-860
    • /
    • 2013
  • 본 연구는 대표적인 지식기반산업인 생명의료산업의 첨단의료복합단지 조성정책을 대상으로 하여 정책형성과정을 분석하고자 한다. 첨단의료복합단지는 다양한 분석요소와 속성들을 내포하고 있기 때문에 국내외 정치적 경제적 사회적 환경변화에 따른 정책형성과정을 Kingdon(1984, 1995, 2003)의 '정책흐름모형'을 적용하여 분석하였다. 2005년 8월 의료산업선진화위원회가 출범한 시기에서 2008년 3월 '첨단의료복합단지특별법'이 제정되기까지 정책형성 과정을 대상으로 하였다. 분석결과 첨단 의료산업분야의 정책형성 과정은 여러 요인들과 정책흐름들이 간여되어 있으며, 특히 정책의제가 정부의제로 공식화되는 법제화의 과정은 정책선도자 뿐만 아니라 다양한 이해관계자의 역동적인 역할에 의하여 진행된다는 점을 조명하였다.

  • PDF

THE MULTIPLE PROTO STELLAR SYSTEM L1551 IRS5 AT 5 AU RESOLUTION

  • LIM JEREMY;TAKAKUWA SHIGEHISA
    • 천문학회지
    • /
    • 제38권2호
    • /
    • pp.237-240
    • /
    • 2005
  • We present images of L1551 IRS5 at angular resolutions as high as ${\~}$30 mas, corresponding to a spatial resolution of ${\~}$5 AU, made at 7 mm with the VLA. Previously known to be a binary protostellar system, we show that L1551 IRS5 is likely a triple protostellar system. The primary and secondary components have a projected separation of ${\~}$46 AU, whereas the tertiary component has a projected separation of ${\~}$11 AU from the primary component. The circumstellar dust disks of the primary and secondary components have dimensions of ${\~}$15 AU, whereas that of the tertiary component has a dimension of ${\~}$10 AU. Their major axes are closely, but not perfectly, aligned with each other, as well as the major axis of the surrounding flattened, rotating, and contracting molecular condensation (pseudodisk). Furthermore, the orbital motion of the primary and secondary components is in the same direction as the rotational motion of this pseudodisk. We suggest that all three protostellar components formed as a result of the fragmentation of the central region of the molecular pseudo disk. The primary and secondary components, but apparently not the tertiary component, each exhibits a bipolar ionized jet that is centered on and which emergers perpendicular to its associated dust disk. Neither jets are resolved along their base, implying that they are driven within a radial distance of ${\~}$2.5 AU from their central protostars. Finally, we show evidence for what may be dusty matter streams feeding the two main protostellar components.

다중경로 네트워크에서 H.264 SVC에 기반한 비디오 스트링 추출 및 전송 기법 (Extracting and Transmitting Video Streams based on H.264 SVC in a Multi-Path Network)

  • 류은석;이정환;유혁
    • 한국정보과학회논문지:정보통신
    • /
    • 제35권6호
    • /
    • pp.510-520
    • /
    • 2008
  • 오늘날 모바일 디바이스(Mobile Device)는 하나 이상의 네트워크 인터페이스를 가지고 있으며, 이를 효과적으로 활용하기 위한 네트워크 융합(Network Convergence) 기술이 활발히 연구되고 있다. 하지만, 이러한 네트워크 융합 환경을 효과적으로 활용하기 위해서는 물리적 네트워크 인터페이스의 특성뿐 아니라 비디오 부호화 기술에 대한 이해를 바탕으로 한 전송이 필수적이다. 따라서, 본 논문은 전송하려는 비디오 데이타의 특성 및 채널 환경을 이해하고 이에 따라 서로 다른 네트워크 경로로 전송하는 최적의 방법론을 밝힌다. 본 연구는 스케일러블 부호화(Scalable Coded)된 비디오를 계층적 중요성, 스트림 정보의 중요성, 그리고 비디오 디코더의 강인성(Robustness)을 고려한 중요성으로 나누어 다중 채널로 차별적 전송 한다. 실험 결과는 화질기준(PSNR)으로 평균 1dB 이상의 효과를 가졌다. 본 연구 결과는 모바일 디바이스가 하나 이상의 네트워크 인터페이스를 가지는 차세대 네트워크 컨버젼스 환경에 최적인 비디오 전송 기법이 될 것이다.

H-ARQ가 적용된 OFDMA 기반 연접할당자원에 대한 전송률 향상을 위한 채널 할당 방법 (Channel Allocation Method for OFDMA Based Contiguous Resources Units with H-ARQ to Enhance Channel Throughput)

  • 김상현;정영호
    • 한국항행학회논문지
    • /
    • 제15권3호
    • /
    • pp.386-391
    • /
    • 2011
  • 인접한 OFDMA 부반송파를 그룹으로 자원을 할당하는 연접할당자원 전송은 IEEE 802.16e/m을 포함한 최근의 다양한 이동통신시스템에서 사용되고 있다. 한 사용자에게 2개 이상의 서로 다른 신호 대 잡음 비를 갖는 연접할당자원이 스케줄러에 의해 할당되고, 해당 사용자는 할당된 채널을 이용하여 복수의 독립된 패킷 스트림을 H-ARQ 전송하는 경우, 재전송 패킷과 신규 전송 패킷을 각각 어떤 채널에 할당하는가에 따라 전송률이 달라진다. 본 논문에서는 상기 문제에 대한 최적 채널 할당 방식을 살펴보고, 최적 할당 방식의 복잡도를 낮출 수 있는 준 최적 할당 방법을 제시하였다. 또한 이에 대한 실험적 성능 분석을 통해 초기전송에 우선하여 우수한 채널을 할당하는 준 최적 방식을 적용할 경우 최적 할당 방식의 복잡도를 대폭 낮추면서도 최적 할당 방식에 근접하는 성능을 얻을 수 있음을 보였다.