• 제목/요약/키워드: 병렬전송

검색결과 468건 처리시간 0.034초

광학 네트워크-온-칩에서 WDM/TDM 기반 채널 할당 기법 (WDM/TDM-Based Channel Allocation Methodology in Optical Network-on-Chip)

  • 홍유민;이재훈;한태희
    • 전자공학회논문지
    • /
    • 제52권7호
    • /
    • pp.40-48
    • /
    • 2015
  • 광학 네트워크-온-칩(Optical Network-on-Chip, ONoC) 아키텍처는 향후 폭증하는 칩 내부 커뮤니케이션 병목 현상을 해결 할 새로운 패러다임으로 대두되고 있다. ONoC에 대한 최근의 연구들은 파장 분할 다중화(Wavelength division multiplexing, WDM) 방식을 이용하여 광 신호의 병렬 전송을 지원하고 경로 충돌을 방지하는데 초점을 두었다. 하지만 신호의 간섭 및 감쇄에 의해 하나의 도파관에서 수용할 수 있는 파장 수는 제한되어 있고, 이로 인하여 노드 수 증가에 따라 파장이 다른 광 신호 개수를 증가시키는 기존의 파장 분할 방식 연구들은 구현의 한계를 보일 것이라 전망된다. 이러한 문제를 해결하기 위하여 본 논문에서는 WDM에 시 분할 다중화(Time division multiplexing, TDM) 방식을 접목시켰다. 또한 채널 최적화 기법을 제안함으로써 TDM 방식의 접목으로 인한 여분채널 및 지연시간 문제를 최소화 하였다.

초음파 센서 통신선 연장을 위한 인터페이스 변환 (Interface Conversion to Extend Communication Cable of Ultrasonic Sensor)

  • 서대일;권병혁;김상진
    • 한국전자통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.467-472
    • /
    • 2022
  • 3차원 초음파풍속계는 PC와 RS232C(:Recommended Standard 232C) 인터페이스로 연결하여 관측 자료를 전송한다. 관측 장소에 따라 PC와 센서를 연결하는 케이블 연장이 필요한 경우가 종종 발생한다. 항공기상청 항공기상관측장비 테스트베드에서 PC를 두는 콘테이너와 장비 설치하는 곳까지 거리가 30 m 이상 되어 본래의 AWM2919(:Appliance Wiring Material 2919) 케이블로의 연장이 필요했다. 문제 해결을 위해서 AWM2919 케이블 연장, PC와의 인터페이스를 RS232C에서 RS485로 개조, RS485 검사 등의 조치를 하였다. 연장된 케이블로 장비를 설치한 후에 원격으로 자료를 수집하고 분석하여 성공적인 케이블 연장을 확인하였다.

Resolving Memory Bottlenecks in Hardware Accelerators with Data Prefetch

  • Hyein Lee;Jinoo Joung
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.1-12
    • /
    • 2024
  • 최근 다양한 분야에서 딥러닝이 사용되면서, 더 빠르고 정확한 결과를 내는 딥러닝이 더욱 중요해졌다. 이를 위해서는 많은 양의 저장 공간이 필요하고, 대용량 연산을 진행해야 한다. 이에 따라 여러 연구는 빠르고 정확하게 연산 처리가 가능한 하드웨어 가속기를 이용한다. 하지만 하드웨어 가속기는 CPU와 하드웨어 사이를 이동하면서 병목현상이 발생하게 된다. 따라서 본 논문에서는 하드웨어 가속기의 병목현상을 효율적으로 줄일 수 있는 데이터 프리패치 전략을 제안한다. 데이터 프리패치 전략의 핵심 아이디어는 Matrix Multiplication Unit(MMU)가 연산을 진행하는 동안 다음 연산에 필요한 데이터를 예측하여 로컬 메모리로 올려 병목현상을 줄인다. 또한, 이 전략은 듀얼 버퍼를 이용하여 읽고 쓰는 두 가지 동작을 동시에 진행하여 처리율을 높인다. 이를 통해 데이터 전송의 지연시간 및 실행 시간을 감소시킨다. 시뮬레이션을 통해 듀얼 버퍼를 이용한 병렬 프로세싱과 데이터 프리패치를 이용한 메모리 간 병목현상을 최대한 감소시켜 하드웨어 가속기의 성능이 24% 향상함을 알 수 있다.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

MHEMT를 이용한 광대역 특성의 밀리미터파 Cascode 증폭기 연구 (Research on Broadband Millimeter-wave Cascode Amplifier using MHEMT)

  • 백용현;이상진;백태종;최석규;윤진섭;이진구
    • 대한전자공학회논문지SD
    • /
    • 제45권4호
    • /
    • pp.1-6
    • /
    • 2008
  • 본 논문에서는 밀리미터파 대역에서 광대역 특성을 갖는 MHEMT (Metamorphic High Electron Mobility Transistor) cascode 증폭기를 설계 및 제작하였다. Cascode 증폭기 제작을 위해 먼저 $0.1{\mu}m$ InGaAs/InAlAs/GaAs MHEMT를 설계 및 제작하였다. 제작된 MHEMT는 드레인 전류 밀도가 670 mA/mm이고, 최대 전달컨덕턴스(gm)는 688 mS/mm이며, 주파수 특성으로 전류이득 차단 주파수($f_T$)는 139 GHz, 최대 공진 주파수($f_{max}$)는 266 GHz의 특성을 나타내었다. 설계된 cascode 증폭기는 회로의 발진을 막기 위해서 저항과 캐패시터를 commom gate 소자의 드레인이 병렬로 연결하였다. Cascode 증폭기는 CPW (Coplanar Waveguide) 전송선로를 이용하여 광대역 특성을 얻을 수 있도록 정합회로를 설계하였다. 설계된 증폭기는 본 실험실에서 개발된 MHEMT MMIC 공정을 이용해 제작되었다. 제작된 cascode 증폭기의 측정결과, 3 dB 대역폭이 20.76$\sim$71.13 GHz로 50.37 GHz의 넓은 대역 특성을 얻었으며, 대역내에서 평균 7.07 dB 및 30 GHz에서 최대 10.3 dB의 S21 이득 특성을 나타내었다.

IEEE 1149.1을 이용한 확장된 스캔 경로 구조 (An Extended Scan Path Architecture Based on IEEE 1149.1)

  • 손우정;윤태진;안광선
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1924-1937
    • /
    • 1996
  • 본 논문에서는 다중 보드를 시험하기 위한 새로운 구조인 확장된 스캔 경로 (ESP: Exlended Scan Path)와 절차를 제안한다. 보드률 시험하기 위한 기존의 구조로는 단일 스캔 경로와 다중 스캔 경로가 있다. 단일 스캔 경로 구조는 시험 데이자의 전송 경로 인 스캔 경로가 하나로 연결되므로 스캔 경로가 단락이나 개방으로 결함이 생기면 나머지 스캔 경로에 올바른 시험 데이타를 입력할 수 없다. 다중 스캔 경로 구조는 다중 보드 시험 시보드마다 별도의 신호선이 추가된다. 그러므로 기존의 주 구조는 다중 보드 시험에는 부적절하다. 제안된 ESP구조를 단일 스캔 경로 구조와 비교하면, 스캔 경로 상에 결함이 발생하더라도 그 결함은 하나의 스캔 경로에만 한정되어 다른 스캔 경로의 시험 데이타에는 영향을 주지 않는다. 뿐만 아니라, 비스트(BIST: BUILT In Self Test)와 IEEE 1149.1 경계면 스캔 시험을 병렬로 수행함으로써 시험에 소요되는 시간을 단축한다. 또한 ESP 구조를 다중 스캔 경로 구조와 비교하면, 스캔 경로마다 신호선을 공통으로 사용함으로써 다중 보드 시험 시 추가되는 신호선이 없다. 본 논문 에서는 제안한 ESP 구조와 기존 시험 구조의 성능을 비교하기 위해서, ISCAS '85벤치 마크 회로를 대상으로 각 구조의 시험 수행 시간을 비교하여 우수함을 보였다.

  • PDF

하둡 기반 빅 데이터 기법을 이용한 웹 서비스 데이터 처리 설계 및 구현 (Design and Implementation of an Efficient Web Services Data Processing Using Hadoop-Based Big Data Processing Technique)

  • 김현주
    • 한국산학기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.726-734
    • /
    • 2015
  • 데이터를 구조화하여 사용하는 관계형 데이터베이스가 현재까지 데이터 관리에 가장 많이 사용되고 있다. 그러나 관계형 데이터베이스는 데이터가 증가되면 데이터를 저장하거나 조회할 때 읽기, 쓰기 연산 수행에 제약 조건이 발생되어 서비스가 느려지는 현상이 나타난다. 또 새로운 업무가 추가되면 데이터베이스 내 데이터는 증가되고 결국 이를 해결하기 위해 하드웨어의 병렬 구성, CPU, 메모리, 네트워크 등 추가적인 인프라 구성을 필요로 하게 된다. 본 논문에서는 관계형 데이터베이스의 데이터 증가로 느려지는 웹 정보서비스 개선을 위해 기존 관계형 데이터베이스의 데이터를 하둡 HDFS로 전송하고 이를 일원화하여 데이터를 재구성한 후 사용자에게 하둡 데이터 처리로 대량의 데이터를 빠르고 안전하게 추출하는 모델을 구현한다. 본 시스템 적용을 위해 웹 기반 민원시스템과 비정형 데이터 처리인 이미지 파일 저장에 본 제안시스템을 적용하였다. 적용결과 관계형 데이터베이스 시스템보다 제안시스템 데이터 처리가 0.4초 더 빠른 결과를 얻을 수 있었고 기존 관계형 데이터베이스와 같은 대량의 데이터를 처리를 빅 데이터 기법인 하둡 데이터 처리로도 웹 정보서비스를 지원이 가능하였다. 또한 하둡은 오픈소스로 제공되어 소프트웨어 구매 비용을 줄여주는 장점이 있으며 기존 관계형 데이터베이스의 데이터 증가로 효율적인 대용량 데이터 처리를 요구하는 조직에게 도움을 줄 수 있을 것이다.

무선 애드혹 망을 위한 연결 지배 집합 다중-링 위상의 분산적 구성-볼츠만 기계적 접근 (Distributed Construction of the Multiple-Ring Topology of the Connected Dominating Set for the Mobile Ad Hoc Networks: Boltzmann Machine Approach)

  • 박재현
    • 한국정보과학회논문지:정보통신
    • /
    • 제34권3호
    • /
    • pp.226-238
    • /
    • 2007
  • 본 논문은 연결 지배 집합에 속하는 노드들로 애드혹 망의 위상을 구성하는 완전 분산형 위상 제어 프로토콜을 제시한다. 제안한 프로토콜은 가능한 최소의 노드 수로 위상을 구성할 수 있게 하여 패킷 전송 시 발생하는 간섭을 줄일 수 있다. 제안한 프로토콜의 알고리즘 복잡도는 O(1)이다. 각 노드는 분산된 병렬 볼츠만 기계의 한 노드로서 동작한다. 이 볼츠만 기계의 목적 함수를 연결의 차수와 연결 지배 정도를 표현하는 두 개의 볼츠만 인수로 구성한다. 이 볼츠만 인수들을 정의하기 위해 두 개의 퍼지 집합을 정의한다. 하나는 연결 지배 노드로 이루어진 퍼지 집합이며, 다른 하나는 다중-링 위상 구성이 가능한 노드로 이루어진 퍼지 집합이다. 제안한 프로토콜은 이 두 퍼지 집합의 강한 원소 노드들을 애드혹 망의 클러스터 헤드로 선택한다. 모의 실험을 통해 패킷 손실율과 에너지 소비율 측면에서 제안 프로토콜이 기존 방법에 비해 우수함을 확인하였다.

TDM 수신 방식의 멀티 대역 OFDM 통신 시스템에서 STO 특성 분석 및 보상 (Analysis and Compensation of STO Effects in the Multi-band OFDM Communication System of TDM Reception Method)

  • 이희규;유흥균
    • 한국통신학회논문지
    • /
    • 제36권5A호
    • /
    • pp.432-440
    • /
    • 2011
  • 4세대 이동통신에서 LTE-Advanced 시스템은 최대 1Gbps의 전송 속도를 구현하기 위해 최대 l00MHz의 넓은 주파수 대역을 필요로 한다. 그러나 현재의 상태에서는 이러한 넓은 대역의 주파수를 얻기가 힘들어 대안으로 여러개의 조각난 대역을 합쳐서 사용하는 Carrier Aggregation기법이 제안되었다. 기본적으로 Carrier Aggregation과 같이 다중 대역을 통해 수신되는 신호는 대역별 여러 개의 수신기를 이용해 각각의 대역별로 병렬 수신 처리하는 Multi-Chain방식이 사용되는데 이는 효과적인 방법이 아니다. 그러므로 본 논문에서는, Time division Multiplexing(TDM)방법을 이용하여 단일 수신기로 수신할 수 있는 방법을 연구한다. TDM 방식은 수신된 여러 대역의 신호를 시간적으로 나누어 수신하고 하나의 DSP를 통해 처리할 수 있는 방식이다. 그런데, 이러한 TDM 방식 기반에서는 Sampling Timing Offset (STO)에 의하여 심각하게 성능 왜곡이 발생하게 된다. 그러므로 본 연구에서는 TDM 방식 기반에서 발생하는 샘플링 타이밍 오프셋의 영향을 분석한다. 그리고 그 분석을 통해 구한 STO 추정 값을 이용하여 보상하는 방법을 제안한다. 마지막으로 시뮬레이션을 통해 BER 성능을 확인하고 제안된 시스템이 OFDM 기반의 시스템에서 다중 대역을 단일 수신기로 수신하는 방법에 적합함을 보인다.

CUDA와 OPenMP를 이용한 빠르고 효율적인 신경망 구현 (Fast and Efficient Implementation of Neural Networks using CUDA and OpenMP)

  • 박안진;장홍훈;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.253-260
    • /
    • 2009
  • 컴퓨터 비전이나 패턴 인식 분야에서 이용되고 있는 많은 알고리즘들이 최근 빠른 수행시간을 위해 GPU에서 구현되고 있지만, GPU를 이용하여 알고리즘을 구현할 경우 크게 두 가지 문제점을 고려해야 한다. 첫째, 컴퓨터 그래픽스 분야의 지식이 필요한 쉐이딩(shading) 언어를 알아야 한다. 둘째, GPU를 효율적으로 활용하기 위해 CPU와 GPU간의 데이터 교환을 최소화해야 한다. 이를 위해 CPU는 GPU에서 처리할 수 있는 최대 용량의 데이터를 생성하여 GPU에 전송해야 하기 때문에 CPU에서 많은 처리시간을 소모하며, 이로 인해 CPU와 GPU 사이에 많은 오버헤드가 발생한다. 본 논문에서는 그래픽 하드웨어와 멀티코어(multi-core) CPU를 이용한 빠르고 효율적인 신경망 구현 방법을 제안한다. 기존 GPU의 첫 번째 문제점을 해결하기 위해 제안된 방법은 복잡한 쉐이팅 언어 대신 그래픽스적인 기본지식 없이도 GPU를 이용하여 응용프로그램 개발이 가능한 CUDA를 이용하였다. 두 번째 문제점을 해결하기 위해 멀티코어 CPU에서 공유 메모리 환경의 병렬화를 수행할 수 있는 OpenMP를 이용하였으며, 이의 처리시간을 줄여 CPU와 GPU 환경에서 오버 헤드를 최소화할 수 있다. 실험에서 제안된 CUDA와 OpenMP기반의 구현 방법을 신경망을 이용한 문자영역 검출 알고리즘에 적용하였으며, CPU에서의 수행시간과 비교하여 약 15배, GPU만을 이용한 수행시간과 비교하여 약 4배정도 빠른 수행시간을 보였다.