• 제목/요약/키워드: In-network computation

검색결과 800건 처리시간 0.025초

WiFi 신호를 활용한 CNN 기반 사람 행동 인식 시스템 설계 및 구현 (Design and Implementation of CNN-Based Human Activity Recognition System using WiFi Signals)

  • 정유신;정윤호
    • 한국항행학회논문지
    • /
    • 제25권4호
    • /
    • pp.299-304
    • /
    • 2021
  • 기존의 사람 행동 인식 시스템은 웨어러블 센서, 카메라와 같은 장치를 통해 행동을 탐지하였다. 그러나, 이와 같은 방법들은 추가적인 장치와 비용이 요구되고, 특히 카메라 장치의 경우 사생활 침해 문제가 발생한다. 이미 설치되어 있는 WiFi 신호를 사용한다면 해당 문제를 해결할 수 있다는 장점이 있다. 본 논문에서는 WiFi 신호의 채널 상태 정보를 활용한 CNN 기반 사람 행동 인식 시스템을 제안하고, 가속 하드웨어 구조 설계 및 구현 결과를 제시한다. 해당 시스템은 실내 공간에서 학습 중 나타날 수 있는 네 가지 행동에 대해 정의하였고, 그에 대한 WiFi의 채널 상태 정보를 CNN으로 분류하여 평균 정확도는 91.86%를 보였다. 또한, 가속화를 위해 CNN 분류기에서 연산량이 가장 많은 완전 연결 계층에 대한 가속 하드웨어 구조 설계 결과를 제시하였다. FPGA 디바이스 상에서 성능 평가 결과, 기존 software 기반 시스템 대비 4.28배 빠른 연산 시간을 보임을 확인하였다.

FEC 환경에서 다중 분기구조의 부분 오프로딩 시스템 (Partial Offloading System of Multi-branch Structures in Fog/Edge Computing Environment)

  • 이연식;띵 웨이;남광우;장민석
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1551-1558
    • /
    • 2022
  • 본 논문에서는 FEC (Fog/Edge Computing) 환경에서 다중 분기구조의 부분 오프로딩을 위해 모바일 장치와 에지서버로 구성된 2계층 협력 컴퓨팅 시스템을 제안한다. 제안 시스템은 다중 분기구조에 대한 재구성 선형화 기법을 적용하여 응용 서비스 처리를 분할하는 알고리즘과 모바일 장치와 에지 서버 간의 부분 오프로딩을 통한 최적의 협업 알고리즘을 포함한다. 또한 계산 오프로딩 및 CNN 계층 스케줄링을 지연시간 최소화 문제로 공식화하고 시뮬레이션을 통해 제안 시스템의 효과를 분석한다. 실험 결과 제안 알고리즘은 DAG 및 체인 토폴로지 모두에 적합하고 다양한 네트워크 조건에 잘 적응할 수 있으며, 로컬이나 에지 전용 실행과 비교하여 효율적인 작업 처리 전략 및 처리시간을 제공한다. 또한 제안 시스템은 모바일 장치에서의 응용 서비스 최적 실행을 위한 모델의 경량화 및 에지 리소스 워크로드의 효율적 분배 관련 연구에 적용 가능하다.

인공지능을 이용한 신규간호사 이직률 예측 (Artificial Intelligence to forecast new nurse turnover rates in hospital)

  • 최주희;박혜경;박지은;이창민;최병관
    • 한국융합학회논문지
    • /
    • 제9권9호
    • /
    • pp.431-440
    • /
    • 2018
  • 본 연구에서는 인공지능 기술 중 구글에서 개발하여 오픈소스로 제공하고 있는 텐서플로우(Tensorflow) 활용하여 신규간호사 이직률을 예측해 보았고, 이를 통해 전략적 인적자원관리 방안을 제시하였다. 부산지역 한 대학병원의 2010년에서 2017년 사이 퇴직한 간호사 데이터 1,018건을 수집하였다. 학습에 사용된 자료는 순서를 임의로 재배열 한 뒤 전체 데이터의 80%를 학습에, 나머지 20%를 테스트에 이용하였다. 활용된 알고리즘은 다중신경망회로(multiple neural network)로서 입력층과 출력층, 3개 층의 은닉층을 가지도록 설계 되었다. 본 연구의 결과 텐서플로우 플랫폼을 활용하여 1년 이내 이직률을 88.7%, 3년 이내 조기 이직률은 79.8%의 정확도로 예측하였고, 대상자들의 퇴직 시 연령은 20대 후반부터 30대에 집중되어 있었다. 가장 높은 빈도를 차지한 이직 사유로는 '결혼, 출산, 육아, 가정 및 개인사정'이었으나, 근무기간 1년 이하 대상자 들의 가장 높은 이직사유는 '업무 부적응 및 대인관계 문제'로 나타났다.

도로 노면 파손 인식을 위한 Multi-scale 학습 방식의 암호화 형식 의미론적 분할 알고리즘 (Encoder Type Semantic Segmentation Algorithm Using Multi-scale Learning Type for Road Surface Damage Recognition)

  • 심승보;송영은
    • 한국ITS학회 논문지
    • /
    • 제19권2호
    • /
    • pp.89-103
    • /
    • 2020
  • 고령화 사회에 접어들면서 거동이 어려운 장애인과 고령자의 개인 교통수단에 대한 수요가 증가하고 있다. 실제로 2017년 기준 전국 전동보장구 보급수는 9만여 대로 지속해서 증가하는 추세다. 하지만 장애인 및 고령자의 판단 능력과 조정 능력은 정상인보다 상대적으로 차이가 있는 관계로 주행 중 사고 발생의 가능성이 크다. 다양한 사고의 원인 중 하나는 도로 노면상태의 불균형으로 인해 개인 이동 수단 조향 제어의 간섭이다. 본 논문에서는 이 같은 사고를 예방하고자 도로 노면 상태를 고속으로 인지할 수 있는 암호화 형식 의미론적 분할 알고리즘을 소개한다. 이를 위하여 도로 노면 파손이 포함된 1,500여 장의 학습용 데이터와 150여 장의 테스트용 데이터를 새롭게 구성하였다. 그리고 이를 활용하여 기존의 Encoder와 Decoder 단계로 구성된 Auto-encoder 방식과 달리 Encoder 단계로 이루어진 심층 신경망을 제안하였다. 이 심층 신경망은 기존의 방식과 비교했을 때 평균 정확도(Mean Accuracy)는 4.45% 증가하였고 파라미터는 59.2% 감소하였으며 연산 속도는 11.9% 향상되었다. 이 같은 고속 알고리즘을 활용하여 안전한 개인 이동 수단이 확대 적용되길 기대한다.

AR에 적용 가능한 마커리스 기반의 실내 위치 측정 기법 (Measurement Technique of Indoor location Based on Markerless applicable to AR)

  • 김재형;이승호
    • 전기전자학회논문지
    • /
    • 제25권2호
    • /
    • pp.243-251
    • /
    • 2021
  • 본 논문에서는 AR에 적용 가능한 마커리스 기반의 실내 위치 측정 기법을 제안한다. 제안한 기법은 다음과 같은 독창성을 갖는다. 첫 번째는 특징점을 추출하고 이를 이용하여 지역 패치를 생성하여 전체 이미지를 학습하지 않고 주변보다 더 유용한 지역 패치만을 학습하고 사용함으로써 더 빠른 연산이 가능하도록 한다. 두 번째는 Convolution Neural Network 구조를 사용한 딥러닝을 통해 학습을 진행하여 오차율을 줄여 정확도를 향상시킨다. 세 번째는 기존의 특징점 매칭 기법과는 다르게 좌우 이동을 포함한 실내 위치 측정이 가능하도록 한다. 네 번째는 매 프레임마다 새롭게 실내 위치를 측정하기 때문에 이동 중 앞쪽에서 발생한 오차가 누적되어 발생되는 것을 방지한다. 따라서 이동 거리가 길어져도 최종 도착점과 예측 실내 위치 간의 오차가 증가하지 않는다는 장점을 갖는다. 본 논문에서 제안하는 AR에 적용 가능한 마커리스 기반의 실내 위치 측정 기법의 소요시간과 정확도를 평가하기 위해 시행한 실험결과, 실제 실내 위치와 측정된 실내 위치의 차이가 평균 12.8cm, 최대 21.2cm로 측정되어서, 기존 IEEE 논문의 결과보다 우수한 실내 위치 측정 정확도를 나타내었다. 또한, 초당 20프레임으로 측정된 결과를 나타내어서 실시간으로 사용자의 실내 위치를 측정하는 것이 가능하다고 판단되었다.

고속DRAM모듈 설계에 대한 전원평면의 임피던스계산 (Impedance Calculation of Power Distribution Networks for High-Speed DRAM Module Design)

  • Lee, Dong-Ju;Younggap You
    • 대한전자공학회논문지SD
    • /
    • 제39권3호
    • /
    • pp.49-60
    • /
    • 2002
  • 본 논문에서는 DRAM 모듈의 전원 평면에 대한 효과적인 설계 방법을 제시하였고 그 방법은 다음과 같이 세 단계로 구성되어 있다. 1) PEEC 등가회로를 이용한 2D 전송선 구조로 전원평면의 모델링 및 해석. 2) 측정값 비교를 통한 해석 결과 검증. 3) 전원 평면의 물리적 파라미터를 이용한 설계 가이드 제시. 제시한 내용을 바탕으로 하여 DRAM 모듈에서 전원 및 접지평면 성능을 안정화를 이루기 위한 효과적인 De-coupling 커패시터의 용량과 개수를 결정하는 방법을 기술하였다 이 설계 방법론은 스트립 구조 및 do-coupling 커패시터를 갖는 DRAM 모듈에서 효과적으로 사용할 수 있다.

다중 프로그램 환경에 적합한 이중 연결 CC-NUMA 시스템 (A dual-link CC-NUMA System Tolerant to the Multiprogramming Environment)

  • 서효중
    • 정보처리학회논문지A
    • /
    • 제11A권3호
    • /
    • pp.199-206
    • /
    • 2004
  • 다중 프로세서 시스템에서 여러 개의 프로그램이 동시에 수행될 경우의 프로그램 수행 성능은 각 프로세스를 어떠한 물리적 위치의 프로세서에 할당하여 수행하는가에 따라 다르게 나타난다. 일반적으로 시공간적으로 인접한 프로세서에 동일 프로그램의 프로세서를 할당할 경우 프로세스간 통신비용이 절감되므로 가장 효율적인 결과를 얻을 수 있다. 그러나 프로세스를 할당하는 운영체제는 이와 같은 친화성을 고려하기 위하여 부가적인 처리를 필요로 하며, 실제 수행시 각 프로그램은 독립적으로 수행되므로, 여러 프로그램으로부터 발생한 프로세스를 할당하는 방법은 많은 계산을 필요로 한다. 이중 링 구조의 CC-NUMA 시스템의 경우 특히 다수의 공유 메모리 접근에 의한 많은 트랜잭션이 발생하며, 연결망 부하의 불균등에 따른 병목 현상을 나타내므로, 프로세스의 할당 정책에 따라서 큰 성능 차이를 나타내게 된다. 본 논문은 규일한 연결망 부하특성을 나타내며, 프로세스 할당 정책을 필요로 하지 않는 CC-NUMA 시스템을 제시한다. 논문에서 제시하는 구조는 이중 링 구조와 동일한 연결망 비용을 나타내며, 건너뜀 연결을 이용한 균등한 부하 분배를 수행함으로써 프로세스 할당 정책의 유무와 무관한 성능을 보이다. 프로그램 구동 시뮬레이션을 통한 검증 결과 시스템은 이중 링 구조의 CC-NUMA 시스템에 비하여 1.5배의 성능 개선을 나타냈다.

중복 데이터 관리 기법을 통한 저장 시스템 성능 개선 (Storage System Performance Enhancement Using Duplicated Data Management Scheme)

  • 정호민;고영웅
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권1호
    • /
    • pp.8-18
    • /
    • 2010
  • 기존의 전통적인 저장 서버는 중복 데이터 블록에 의해서 저장 공간과 네트워크 대역폭의 낭비가 발생되고 있다. 이와 같은 문제를 해결하기 위하여, 다양한 중복 제거 메커니즘이 제시되었으나, 대부분 Contents-Defined Chunking (CDC) 기법을 사용하는 백업 서버에 한정되었다. 왜냐하면 CDC 기법은 앵커를 사용하여 중복 블록을 쉽게 추적할 수 있기 때문에 파일의 업데이트를 관찰하기 유리한 백업 시스템에서 널리 사용되고 있는 것이다. 본 논문에서는 저장 시스템 성능을 개선하기 위하여, 새로운 중복 제거 메커니즘을 제시하고 있다. 범용적인 중복제거 서버를 구축하기 위한 효율적인 알고리즘에 초점을 맞추고 있으며, 이를 통하여 백업 서버, P2P 서버, FTP 서버와 같은 다양한 시스템에 활용이 가능하게 하는 것을 목표로 한다. 실험 결과 제안한 알고리즘이 중복 영역의 블록을 찾아내는 시간을 최소화하고 효율적으로 저장 시스템을 관리하는 것을 보였다.

모바일 네트워크에서 로밍을 위한 계층적 인증 방법 (A Fast Authentication based on Hierarchical Key Structure for Roaming Mobile Nodes Between Domains)

  • 홍기훈;정수환
    • 한국통신학회논문지
    • /
    • 제31권12C호
    • /
    • pp.1288-1296
    • /
    • 2006
  • 이 논문에서는 모바일 네트워크에서 이동 노드의 로밍을 위한 해시 기반의 인증 방법을 제안한다. IEEE 802.11과 802.16 기반의 인증 방법은 많은 지연 시간과 계산 과부하로 인하여 핸드오버와 로밍의 인증방법으로 적용하기 부적절하다. 따라서 다양한 방법들이 제안되었지만, 기존의 방법들은 인증의 보안을 약화시키거나 이동시마다 홈 인증 서버에 과도한 인증 부담?을 부여한다. 이 논문에서는 계층적 인증키 관리 구조를 통해 홈 인증 서버의 관리 부담 감소와 핸드오버를 위한 인증 방법의 보안 강화에 초점을 맞추고 있다. 제안하는 방법은 인증키에 해시 키 체인을 적용하여 계층적으로 관리함으로써 흠 인증 서버의 관리 부담을 로컬 인증 서버와 엑세스 포인트로 분산시키고 각 인증 서버와 엑세tm 포인트간에 인증키를 독립화하여 보안을 강화한다.

Development of Real time Air Quality Prediction System

  • Oh, Jai-Ho;Kim, Tae-Kook;Park, Hung-Mok;Kim, Young-Tae
    • 한국환경과학회:학술대회논문집
    • /
    • 한국환경과학회 2003년도 International Symposium on Clean Environment
    • /
    • pp.73-78
    • /
    • 2003
  • In this research, we implement Realtime Air Diffusion Prediction System which is a parallel Fortran model running on distributed-memory parallel computers. The system is designed for air diffusion simulations with four-dimensional data assimilation. For regional air quality forecasting a series of dynamic downscaling technique is adopted using the NCAR/Penn. State MM5 model which is an atmospheric model. The realtime initial data have been provided daily from the KMA (Korean Meteorological Administration) global spectral model output. It takes huge resources of computation to get 24 hour air quality forecast with this four step dynamic downscaling (27km, 9km, 3km, and lkm). Parallel implementation of the realtime system is imperative to achieve increased throughput since the realtime system have to be performed which correct timing behavior and the sequential code requires a large amount of CPU time for typical simulations. The parallel system uses MPI (Message Passing Interface), a standard library to support high-level routines for message passing. We validate the parallel model by comparing it with the sequential model. For realtime running, we implement a cluster computer which is a distributed-memory parallel computer that links high-performance PCs with high-speed interconnection networks. We use 32 2-CPU nodes and a Myrinet network for the cluster. Since cluster computers more cost effective than conventional distributed parallel computers, we can build a dedicated realtime computer. The system also includes web based Gill (Graphic User Interface) for convenient system management and performance monitoring so that end-users can restart the system easily when the system faults. Performance of the parallel model is analyzed by comparing its execution time with the sequential model, and by calculating communication overhead and load imbalance, which are common problems in parallel processing. Performance analysis is carried out on our cluster which has 32 2-CPU nodes.

  • PDF