• 제목/요약/키워드: CPU 시간

검색결과 518건 처리시간 0.034초

상관 계수를 이용한 다층퍼셉트론의 계층별 학습 (A Layer-by-Layer Learning Algorithm using Correlation Coefficient for Multilayer Perceptrons)

  • 곽영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권8호
    • /
    • pp.39-47
    • /
    • 2011
  • 다층퍼셉트론의 계층별 학습 방법의 하나인 Ergezinger 방법은 출력 노드가 1개로 구성되어 있고, 출력층의 가중치를 최소자승법으로 학습하기 때문에 출력층의 가중치에 조기포화 현상이 발생할 수 있다. 이런 조기 포화현상은 학습 시간과 수렴 속도에 장애가 된다. 따라서, 본 논문은 Ergezinger의 학습 방법을 출력층에서 벡터 형태로 학습할 수 있는 알고리즘으로 확대하고 학습 시간과수렴 속도를 개선하기 위해서 학습 상수를 도입한다. 학습상수는 은닉층 가중치 조정 시, 새로이 계산된 가중치와 기존 가중치의 상관 관계를 계산하여 학습 상수에 반영하는 가변적인 방법이다. 실험은 제안된 방법과 기존 방법의 비교를 위해서 iris 문제와 비선형 근사화 문제를 대상으로 실험하였다. 실험에서, 제안 방법은 기존 Ergezinger 방법보다 학습 시간과 수렴 속도에서 우수한 결과를 얻었으며, 상관 관계를 고려한 CPU time 측정에서도 제안한 방법이 기존 방법보다 약 35%의 시간을 절약할 수 있었다.

백그라운드 서비스가 안드로이드 스마트폰의 성능에 미치는 영향 (The Effect of Background Services on Android Smartphone Performance)

  • 안우현;오윤석;오재원
    • 한국정보통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.399-410
    • /
    • 2018
  • 안드로이드 스마트폰에서 많은 앱들이 백그라운드로 실행되기 위해 서비스 앱으로 개발된다. 메모리가 부족하면 오랫동안 CPU를 사용하지 않은 사용자 앱뿐만 아니라 서비스 앱도 강제로 종료된다. 하지만, 서비스 앱은 잠시 후 자동으로 재실행되기 때문에 메모리 공간을 지속적으로 소비한다. 본 논문은 사용자들의 스마트폰에서 실행 중인 서비스 앱의 개수와 메모리 사용량을 조사한다. 서비스 앱의 개수는 전체 실행 중인 앱 개수의 최대 65%, 서비스 앱의 메모리 사용량은 전체 메모리의 최대 55%까지 차지한다. 또한, 실행 중인 서비스 앱의 개수가 스마트폰과 앱의 응답 시간에 미치는 영향을 분석한다. 서비스 앱의 개수가 증가할수록 사용자 앱의 시작 시간이 최대 22배까지 증가한다. 부팅 시간과 앱 설치 시간이 서비스 앱의 개수가 증가함에 따라 크게 증가한다.

분산 ATM 교환제어시스템에서 프로세서간 통신 정합부에 대한 성능 분석 (Perfomance Analysis for the IPC Interface Part in a Distributed ATM Switching Control System)

  • 여환근;송광석;노승환;기장근
    • 전자공학회논문지S
    • /
    • 제35S권6호
    • /
    • pp.25-35
    • /
    • 1998
  • 교환기 제어계의 구조는 전기통신 서비스에서 필요로 하는 다양한 호처리 기능을 제공하기 위하여 많은 구조적인 변화가 진행되어 왔따. 특히 분산 교환제어 환경하에서의 호처리 수행에 있어 프로세서들간의 통신에 의한 지연은 시스템의 성능에 영향을 미치는 중요한 요소중의 하나이다. 본 논문에서는 분산 제어 구조를 갖는 ATM 교환기에서 호처리 수행에 필수적으로 요구되는 프로세서간 메시지 통신이 ATM 스위치를 통해서 이루어지는 경우, 각 프로세서내의 한 기능으로 구현되는 IPC(Inter Processor Communication) 정합부에 대한 성능 분석 모델을 제안하고, 시뮬레이션을 통해서 프로세서의 성능에 미치는 병목 요인에 대해서 검토하였다. 결과적으로, 프로세서간 통신 메시지의 입력율 변화에 따라 이를 처리하는 각 성분(자원)의 이용율과, 메시지 입력율의 변화에 따른 각 성분에서의 큐길이 및 처리 지연시간과의 관계로부터 IPC에 관련되는 주요 성분중 로컬 CPU가 프로세서 시스템의 최대 성능을 제한하는 주 요인이 됨을 정량적으로 확인하였다. 또한 로컬 CPU의 성능 변화에 따른 IPC 메시지 처리 지연효과와, 평균 메시지 길이의 가변에 따른 로컬 CPU의 처리 능력을 정량적으로 제시하였으며, 이 결과는 향후 프로세서의 성능 개선이나 시스템 확장을 위한 기초 자료로 활용될 수 있을 것이다.

  • PDF

CUDA 연산을 이용한 개선된 영상 매칭 방법에 관한 연구 (A Study on Improved Image Matching Method using the CUDA Computing)

  • 조경래;박병준;윤태복
    • 한국산학기술학회논문지
    • /
    • 제16권4호
    • /
    • pp.2749-2756
    • /
    • 2015
  • 최근 데이터의 질이 높아짐에 따라 영상을 처리하는데 많은 시간이 소모되는 문제가 제기되어 영상 처리 알고리즘의 가속화가 필요하게 됨으로써, 기존의 CPU와 CUDA(Compute Unified Device Architecture) 기반의 인식 시스템에서 연산속도와 성능이득 비교를 위해 OpenMP를 가지고 측정할 수 있는 문자 인식시스템으로 학습된 문자데이터가 입력되면 매칭이 가장 잘 되는 영상의 영역을 인식하는 환경으로 구현하여 각 영문 알파벳의 글씨체가 일정하고 크기가 규격화 되어 있으므로 문자를 학습하고 문자 정합도를 계산하기 위한 영상 매칭 방법을 구현하게 되었다. GPGPU(General Purpose GPU)프로그래밍 플랫폼 기술인 CUDA연산 기법을 이용하여 알고리즘을 빠르고 효율적으로 처리하는 OpenMP에서 인텔 i5 2500의 네 개의 코어를 사용하여 인식 할 때, 기존 CPU의 성능보다 4배의 속도가 나오지 않고 데이터의 분할과 병합 연산의 지연으로 인해 약 3.2배의 속도로 향상되는 가속화 방법을 제안하고 그래픽카드에서 처리하는 병렬처리 결과, 순차적 연산을 수행하였던 CPU 기반의 처리에 비해 성능이득이 약 21X(배)로 향상됨을 확인하였다.

실시간 운영체제 iRTOS상에서의 HISR을 이용한 DPC설계 및 구현 (Design and Implementation of DPC using a HISR on iRTOS Real-Time Operating System)

  • 권재국;손재열;이철훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.371-374
    • /
    • 2010
  • 실시간 운영 체제는 운영체제로서 논리적 정확성이 중요하지만 시간적 정확성 또한 중요한 운영체제이다. 그렇기 때문에 시스템에서 발생하는 사건들을 처리할 때의 지연시간은 낮아야 한다. 특히 인터럽트 서비스 루틴에서는 현재 인터럽트 레벨보다 낮은 인터럽트는 마스킹되기 때문에 모든 인터럽트들이 원활히 동작하기 위해서 인터럽트 서비스 루틴은 보다 짧은 시간 동안만 CPU를 점유해야 한다. 처리시간이 긴 인터럽트 서비스 루틴의 지연시간을 줄이기 위해 윈도우 운영체제에서는 DPC(Deferred Procedure Call)를 이용하고 있다. 본 논문에서는 실시간 운영체제 iRTOS상에서 HISR을 이용하여 DPC를 설계 및 구현 하였다.

  • PDF

SSE 명령어 기반 실시간 처리 가우시안 필터 연구 (A Study on Real-time Processing of The Gaussian Filter using The SSE Instruction Set.)

  • 강필중;이종수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.89-92
    • /
    • 2006
  • 본 논문은 SIFT(Scale Invariant Feature Transform)알고리즘의 실시간처리 응용프로그램 작성기법을 기술하고 있는데, 단일 프로세서에서 병렬처리 기능을 지원하도록 설계된 SSE 명령어 집합을 사용하여 가우시안 convolution을 구현하고 있다. SIFT알고리즘의 Scale-space를 생성하는 과정에 수행되는 가우시안 Convolution은 연산시간이 과도하게 요구된다.[1] 2D의 가우시안 필터가 영상을 구성하는 모든 셀과 1:1로 연산을 수행하므로 이 연산의 소요시간은 영상의 가로, 세로 길이 그리고 필터의 크기에 비례하여 결정된다. 이 논문에서 제안하는 방법은 연산을 위해 CPU 내부로 한번 읽어 들인 픽셀자료에 대해 가능한 모든 연산을 SSE 명령어 집합을 사용하여 수행함으로써 병렬 연산에 의한 연산시간 절감과 메모리 접근 최소화를 통한 입출력시간 절감을 통해 전체 연산시간을 단축 하였다.

  • PDF

CUDA FORTEAN을 이용한 GPU 가속 운동파모형 적용성 분석 (Application Analysis of GPU-Accelerated Kinematic Wave Model Using CUDA Fortran)

  • 김보람;김형준;김수영;윤광석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.346-346
    • /
    • 2022
  • 본 연구에서는 GPU(Graphic Processing Unit) 가속 분포형모형을 실제 유역에 적용하여 강우 유출모의 결과의 정확성과 모의시간의 효율성에 대한 분석을 수행하였다. 분포형모형의 지배방정식은 운동파모형과 Green-Ampt모형으로 구성되어 있으며, 운동파모형은 유한체적법을 이용하여 이산화 하였다. GPU 가속 모형은 CUDA(Compute Unified Device Architecture) 포트란(Fortran)을 사용하여 개발된 모형으로 수치모의시 연산시간 단축을 고려한 모형이다. 모형의 정확성과 효율성은 미호천 유역에서 발생하는 강우유출현상에 GPU 가속 운동파모형을 적용하여 분석하였다. 수치모의 결과값은 대상유역에 속한 수위관측소의 관측값과 비교하여 정확성을 검증하였고, 수치모의 소요시간은 CPU(Central Processing Unit) 기반 운동파모형의 수치모의 소요시간과 비교하여 효율성을 검증하였다. GPU 가속 운동파모형의 수치모의 결과는 관측값과 유사한 결과를 나타냈으며, 수치모의 소요시간은 본 연구에 사용된 장비를 기준으로 최대 100배 정도 단축되었다.

  • PDF

스크립트 언어를 사용한 DSSAT 모델 기반 격자형 작물 생육 모의 시스템 개발 (Development of a gridded crop growth simulation system for the DSSAT model using script languages)

  • 유병현;김광수;반호영
    • 한국농림기상학회지
    • /
    • 제20권3호
    • /
    • pp.243-251
    • /
    • 2018
  • 작물 생산량의 시 공간적 분석은 정책입안자와 이해관계자들에게 중요한 정보를 제공할 수 있으나, 이를 위해서는 공간적 기상자료를 처리하고 이에 맞추어 작물 모형을 구동할 수 있는 작업들이 필요하다. 이에 따라 DSSAT (Decision Support System for Agrotechnology Transfer)을 기반으로 지역내 작물 생산성 자료를 생산할 수 있는 자동화 시스템을 개발하고자 하였다. 이 시스템은 전문적인 컴퓨터 프로그래머가 아니더라도 사용가능한 R과 shell script를 기반으로 개발되었다. 먼저, 격자형 기상자료의 각 격자에 해당하는 정보를 텍스트 형식의 기상 입력자료 형식으로 변환하는 기능을 가지는 모듈을 작성하였다. 다음으로 R 패키지를 사용하여 GIS자료 처리와 병렬 처리기능이 구현된 R script을 작성하였다. 또한, 작물 모델을 자동으로 구동하는 기능을 shell script를 사용하여 구현하였다. 사례 연구로, 미국 Illinois 주에서 콩의 최대 수량을 얻을 수 있는 재배관리 조건의 공간적인 분포를 파악하고자 하였다. 개발된 도구를 통해 AgMERRA 자료로부터 Illinois 주의 1981 - 2005년 까지의 기상입력자료를 생산하였다. 해당 지역에서 1개의 CPU 코어를 사용하여 1년간의 자료를 처리하기 위해 7.38 시간이 걸렸으나, 병렬처리를 통해 16개의 CPU 코어를 사용하였을 때 처리 시간이 크게 줄어, 35분만에 처리가 가능하였다. 이렇게 생산된 기상 입력자료들을 작물 모형 자동 구동 시스템에 활용하여 해당 지역에서의 최대 수량과, 최대 수량을 가지는 성숙군 및 파종일 지도를 작성할 수 있었다. 특히, 본 연구에서 개발된 도구는 DSSAT 모델뿐만 아니라 국내에서 사용되는 다른 작물모델들에게 적용될 수 있어 공간적 작물 생산성 평가에 도움을 줄 수 있을 것으로 보인다.

쿠버네티스 환경에서 컨테이너 워크플로의 실행 시간 개선을 위한 컨테이너 재시작 감소 기법 (Technique to Reduce Container Restart for Improving Execution Time of Container Workflow in Kubernetes Environments)

  • 강태신;유헌창
    • 정보처리학회 논문지
    • /
    • 제13권3호
    • /
    • pp.91-101
    • /
    • 2024
  • 데이터 집약적이고 메모리 변동성이 높은 워크플로의 이식성 보장을 위해 컨테이너 가상화 기술이 사용되고 있다. 그리고 쿠버네티스는 이러한 컨테이너 애플리케이션들을 관리하기 위한 오케스트레이션 도구로써 사실상 표준으로 사용되고 있다. 클라우드 사용자는 리소스 부족으로 인한 컨테이너 재시작을 방지하기 위해 컨테이너 애플리케이션을 오버프로비저닝하는 경향이 있다. 그러나 과도한 오버프로비저닝은 CPU, 메모리 등 시스템 리소스의 사용량을 낮아지게 만든다. 이 문제를 해결하기 위해 컨테이너 리소스를 초과 사용하는 방식이 널리 사용되고 있으나, 지나친 메모리 리소스 초과 사용은 노드의 메모리 부족으로 인해 연쇄적인 컨테이너 재시작을 유발할 수 있다. 컨테이너 재시작 발생 시 작업을 처음부터 다시 시작해야 하므로 많은 상태저장 애플리케이션이 포함된 메모리 변동성이 높은 컨테이너에 큰 오버헤드를 유발할 수 있다. 본 논문은 쿠버네티스 환경에서 메모리 초과 사용 시 컨테이너 재시작을 완화하는 기법을 제안한다. 메모리 사용량이 많은 노드에서 메모리 할당을 요청할 가능성이 큰 컨테이너를 식별하고 이러한 컨테이너를 일시정지한다. 컨테이너의 CPU 사용량을 크게 줄이면 컨테이너가 일시정지하는 상태와 유사한 효과를 얻을 수 있다. 해당 노드의 메모리 사용량이 개선된 것으로 판단되면 컨테이너의 일시정지를 해제한다. 제안기법을 적용하여 쿠버네티스 환경에서 메모리 변동성이 높은 워크플로를 구동한 경우 제안기법을 사용하지 않았을 때에 비해 컨테이너의 재시작 횟수가 평균 40%, 최대 58% 감소하였다. 그리고 컨테이너 재시작 횟수 감소로 인해 컨테이너 워크플로의 총 실행 시간이 평균 7%, 최대 13% 단축되었다.

멀티미디어 태스크와 경성 실시간 태스크를 위한 동적 스케쥴링 기법 (Dynamic Scheduling Methods for Mutlimedia Tasks and Hard Real-time Tasks)

  • 김진환;김남윤
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.541-544
    • /
    • 2003
  • 본 논문에서는 분산 실시간 멀티미디어 시스템에서 경성 실시간 태스크들과 멀티미디어 태스크들을 효율적으로 통합할 수 있는 동적 스케줄링 기법이 제시된다. 경성 실시간 태스크가 최악의 경우에 대한 실행 시간을 기반으로 하는 반면 멀티미디어 태스크는 평균 실행 시간을 기반으로 스케줄링된다. 동일한 시스템에 존재하는 두가지 태스크들에 대하여 CPU 대역폭을 분할하고 해당 대역폭의 비율을 동적으로 조정하는 스케줄링 기법을 제시함으로써 한 부류의 태스크들의 수와 도착 비율이 변동될 때 발생하는 과부하 문제를 해결할 수 있다 경성 실시간 태스크가 서버의 주기내에서 실행될 수 있는 시간이 제한되는 반면 멀티미디어 태스크에 설정된 대역폭은 동적으로 변할 수 있다 제시된 기법은 경성 실시간 태스크들의 실시간성을 모두 보장하는 한편 멀티미디어 태스크들의 평균 지연 시간을 최소화할 수 있다.

  • PDF