• 제목/요약/키워드: Embedded Hardware

검색결과 684건 처리시간 0.026초

광디스크 디지털 서보의 저전력 구현 아키텍쳐 (Low Power Digital Servo Architecture for Optical Disc)

  • 허준호;김수원
    • 전자공학회논문지SC
    • /
    • 제38권2호
    • /
    • pp.31-37
    • /
    • 2001
  • 광디스크 재생기에서 사용되는 디지털 서보는 주변 블록과의 집적화가 유리하고, 온도변화에 따른 열화가 적으며, 각종 픽업에 대한 유연한 대응이 가능한 장점 때문에 이용도가 점점 높아지고 있는 추세이다.[6] 그러나 디지털 시그널 프로세서를 내장한 디지털 서보는 전력 소비량이 매우 큰 단점을 가지고 있다. 본 논문에서는 광디스크 재생기의 특성 상 초기화 시간에 대부분의 기능이 몰려 있으므로 DSP의 사이클 수는 많이 차지 하나, 실제로 전력 소비에 주된 영향을 끼치는 시간은 초기화 시간이 아닌 재생 모드 시간 임에 착안하여 디지털 서보의 소비 전류를 획기적으로 줄일 수 있는 방안을 제시하였다. 재생 모드에서의 필터 처리 사이클 수를 최대한 줄일 수 있도록 아키텍쳐를 변환함과 동시에 디지털 서보의 재생 모드를 병렬 처리함으로써, 전체 시스템의 소비 전력을 크게 줄이는 효과를 얻을 수 있도록 하였다. 즉, 광디스크 재생기의 디지털 서보에 포함되는 DSP 코아의 리소스 공유를 통해DSP의 동작 속도와 부하를 크게 줄임으로써 소비 전류를 획기적으로 줄이는 효과를 얻어낸 것이다. 이러한 개념은 DSP-코아 뿐만 아니라, ROM, RAM에도 모두 적용되어 기존 아키텍쳐의 디지털 서보에 비해 소비 전류를 83% 가까이 줄일 수 있는 효과를 얻을 수 있었다.

  • PDF

가상 동기화 기법을 이용한 SystemC 통합시뮬레이션의 병렬 수행 (Parallel SystemC Cosimulation using Virtual Synchronization)

  • 이영민;권성남;하순회
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권12호
    • /
    • pp.867-879
    • /
    • 2006
  • 이 논문에서는 여러 개의 소프트웨어 혹은 하드웨어 컴포넌트가 존재하는 MPSoC(Multiprocessor-System-on-a-chip) 아키텍처를 빠르면서도 정확하게 통합시뮬레이션 하는 내용을 다룬다. 복잡한 시스템을 설계하기 위해서 MPSoC 아키텍처가 점점 일반화되고 있는데, 이러한 아키텍처를 통합시뮬레이션 할 때는 시뮬레이터의 개수가 증가하고 그에 따라 시뮬레이터들 간의 시간 동기화 비용도 증가하므로 전체적인 통합시뮬레이션 성능이 감소된다. 최근의 통합시뮬레이션 연구들에 의해서 등장한 SystemC 통합시뮬레이션 환경이 빠른 성능을 보이고 있으나, 시뮬레이터의 개수가 증가할수록 성능은 반비례한다. 본 논문에서는 효율적인 시간동기를 통해 통합시뮬레이션의 성능을 증가시키는 기법인 가상동기화 기법을 확장하여, (1) SystemC 커널을 수정하지 않고도 가상 동기화 기법을 적용한 SystemC 통합시뮬레이션을 수행할 수 있고, (2) 병렬적으로 가상동기화 기법을 수행할 수 있게 하였다. 이를 통해 SystemC 통합시뮬레이션의 병렬적인 수행이 가능해졌는데, 널리 알려진 상용 SystemC 통합시뮬레이션 도구인 MaxSim과 비교하였을 때, H.263 디코더 예제의 경우 11배 이상의 성능 증가를 얻었고 정확도는 5% 이내로 유지되었다.

저전력을 위한 버퍼 캐쉬 관리 기법 (Buffer Cache Management for Low Power Consumption)

  • 이민;서의성;이준원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권6호
    • /
    • pp.293-303
    • /
    • 2008
  • 컴퓨팅 환경이 무선과 휴대용 시스템으로 변화하면서, 전력효율이 점점 중요해지고 있다. 특히 내장형 시스템일 경우에 더욱 그러한데 이중 메모리에서 소모되는 전력이 전체 전력소모의 두 번째 큰 요소가 되고 있다. 메모리 시스템에서의 전력소모를 줄이기 위해서 SDRAM의 저전력 모드를 활용할 수 있다. RDRAM의 경우 냅모드(nap mode)는 액티브 모드(active mode)의 5%이하의 전력만을 소모한다. 하지만 하드웨어 컨트롤러는 운영체제가 협조하지 않으면 이 기능을 효율적으로 활용하지 못한다. 이 논문에서는 SDRAM의 액티브 유닛(active unit)의 수를 최소화하는 방법에 초점을 맞춘다. 운영체제는 참조되지 않는 메모리를 저전력 모드에 놓음으로써 최소한의 유닛들만을 액티브 모드에 놓은 상태로 프로그램이 수행될 수 있도록 피지컬(physical) 페이지들을 할당한다. 이것은 PAVM(Power Aware Virtual Memory) 연구의 일반화된 시스템 전반에 대한 연구라고 할 수 있다. 우리는 모든 피지컬 메모리를 고려하고 있으며, 특히 평균적으로 전체 메모리의 절반을 사용하는 버퍼 캐시를 고려하고 있다. 버퍼 캐시의 용량과 그 중요성 때문에 PAVM 방식은 버퍼 캐시를 고려하지 않고는 완전한 해법이 되지 못한다. 이 논문에서 우리는 메모리의 사용처를 분석하고 저전력 페이지 할당 정책을 제안한다. 특히 프로세스의 주소공간에 매핑(mapping)된 페이지들과 버퍼 캐시가 고려된다. 이 두 종류의 페이지들간의 상호작용과 그 관계를 분석하고 저전력을 위해 이러한 관계를 이용한다.

실시간 얼굴 검출을 위한 Cascade CNN의 CPU-FPGA 구조 연구 (Cascade CNN with CPU-FPGA Architecture for Real-time Face Detection)

  • 남광민;정용진
    • 전기전자학회논문지
    • /
    • 제21권4호
    • /
    • pp.388-396
    • /
    • 2017
  • 얼굴 검출에는 다양한 포즈, 빛의 세기, 얼굴이 가려지는 현상 등의 많은 변수가 존재하므로, 높은 성능의 검출 시스템이 요구된다. 이에 영상 분류에 뛰어난 Convolutional Neural Network (CNN)이 적절하나, CNN의 많은 연산은 고성능 하드웨어 자원을 필요로한다. 그러나 얼굴 검출을 위한 소형, 모바일 시스템의 개발에는 저가의 저전력 환경이 필수적이고, 이를 위해 본 논문에서는 소형의 FPGA를 타겟으로, 얼굴 검출에 적절한 3-Stage Cascade CNN 구조를 기반으로하는 CPU-FPGA 통합 시스템을 설계 구현한다. 가속을 위해 알고리즘 단계에서 Adaptive Region of Interest (ROI)를 적용했으며, Adaptive ROI는 이전 프레임에 검출된 얼굴 영역 정보를 활용하여 CNN이 동작해야 할 횟수를 줄인다. CNN 연산 자체를 가속하기 위해서는 FPGA Accelerator를 이용한다. 가속기는 Bottleneck에 해당하는 Convolution 연산의 가속을 위해 FPGA 상에 다수의 FeatureMap을 한번에 읽어오고, Multiply-Accumulate (MAC) 연산을 병렬로 수행한다. 본 시스템은 Terasic사의 DE1-SoC 보드에서 ARM Cortex A-9와 Cyclone V FPGA를 이용하여 구현되었으며, HD ($1280{\times}720$)급 입력영상에 대해 30FPS로 실시간 동작하였다. CPU-FPGA 통합 시스템은 CPU만을 이용한 시스템 대비 8.5배의 전력 효율성을 보였다.

MVC+Prefetch Controller 패턴을 사용한 모바일 기기의 성능향상 기법 (Performance improvement on mobile devices using MVC+Prefetch Controller Pattern)

  • 임병재;이은석
    • 정보처리학회논문지D
    • /
    • 제18D권3호
    • /
    • pp.179-184
    • /
    • 2011
  • 모바일 기기는 유연한 이동성을 제공하는 대신에 제한된 자원을 가지고 있는 휴대용 장치로서, 최근에는 단순한 몇 가지의 기능만 제공하던 기존의 한계를 넘어서 많은 부가기능들을 추가적으로 제공하고 있다. 하지만 낮은 성능의 프로세서와 제한된 배터리용량으로 인해 사용자가 만족할 수 있는 성능을 제공하지 못하는 문제점이 발생하고 있다. 이러한 성능이슈는 하드웨어 교체를 통해 쉽게 해결될 수 있으나, 제품가격 상승이라는 치명적 단점을 가지고 있다. 본 논문에서는 성능이슈와 제품가격 상승 이라는 두 가지 문제를 동시에 해결하기 위하여 사용자 체감성능을 개선하는 방법을 제시한다. 사용자 체감성능은 사용자가 화면터치 또는 키패드를 통해 모바일 기기에 화면갱신 명령을 입력하고 모바일 기기의 출력장치인 LCD화면에 화면구성을 완료하는데 까지 걸리는 시간이 매우 중요한 요소이다. 모바일 기기는 물리적으로 작은 LCD화면을 사용하기 때문에 한번에 보여줄 수 있는 데이터의 양이 제한적이다. 화면을 구성하기 위해서 LCD화면에 보여줄 수 있는 양의 데이터만 사용한다면 빠른 화면구성을 할 수 있다. 이렇게 최소한의 데이터를 계산하고 DB에서 가져와 빠른 화면구성을 할 수 있도록 하는 Controller를 기존의 MVC 패턴에 추가한 MVC+Prefetch Controller 패턴을 제안한다. 제안한 패턴을 사용하면 사용자가 만족할 만한 체감성능을 보장할 수 있다. MVC+Prefetch Controller 패턴을 삼성전자 휴대폰 모델 S8500에 적용하여 사용자 체감성능 개선을 확인하였다.

바이오 응용을 위한 직접 통로 기반의 GPU 가상화 (Direct Pass-Through based GPU Virtualization for Biologic Applications)

  • 최동훈;조희승;이명호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권2호
    • /
    • pp.113-118
    • /
    • 2013
  • 현재 개발된 GPU 가상화 기술은 모두 미세한 시분할 기법에 의한 스케줄링을 사용하기 때문에 어플리케이션 실행을 위한 오버헤드를 필요 이상으로 유발한다. 또한 이들은 가상 머신 모니터에 GPU 컴퓨팅 API를 포함하고 있어서, 가상 머신 모니터의 이식성이 약하다. 본 논문에서는 이질적 컴퓨팅 시스템에서 바이오 어플리케이션에 최적화된 GPU 가상화 기술을 제안하며, 공개 소스 Xen을 사용하여 개발하였다. 우리가 제안하는 방법은 가상 머신 간의 GPU 공유를 시분할에 의존하지 않는다. 대신에 하나의 가상 머신이 GPU를 할당 받으면 그 가상 머신이 어플리케이션을 종료할 때까지 GPU를 사용하도록 허용한다. 이렇게 하여 바이오 어플리케이션의 성능을 향상시키고 GPU의 활용률을 높인다. GPU 가상화의 이식성을 높이기 위해 하드웨어가 지원하는 IOMMU 가상화를 이용하여 GPU에 대한 직접 접근 통로를 제공한다. 미생물 유전체 분석 어플리케이션을 대상으로 성능을 분석한 결과, 본 연구에서 제안하는 직접 통로 방식에 의한 GPU 가상화는 Domain0를 통한 접근에 비해 오버헤드가 적었다. 또한 직접 접근 방식에 의한 가상 머신의 GPU 접근은, 비가상화된 머신과 거의 성능의 차이가 없었다.

Development of Metrics to Measure Reusability of Services of IoT Software

  • Cho, Eun-Sook
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.151-158
    • /
    • 2021
  • 인터넷을 기반으로 실세계에 존재하는 여러 사물들과 가상 세계에 있는 사물들이 연결되어 서비스를 제공하는 사물인터넷(IoT) 기술이 4차 산업혁명 시대의 초연결 사회를 가능하게 하는 기술로 부각되고 있다. 사물 인터넷 기술은 디바이스, 네트워크, 플랫폼, 서비스를 아우르는 융합 기술이기 때문에 여러 다양한 연구들이 진행되고 있다. 이러한 연구들 중에 IoT 소프트웨어가 제공하는 서비스 품질을 측정할 수 있는 척도들에 관한 연구는 아직 많이 미흡한 실정이다. IoT 소프트웨어는 사물인터넷이 가지는 하드웨어 부분과 이를 바탕으로 하는 기술, 임베디드 소프트웨어가 가지는 특징, 네트워크의 특징 들을 가지고 있다. 이러한 특징들은 IoT 소프트웨어 품질 측정 메트릭을 정의하는 요소로 활용된다. 그러나 현재까지의 IoT 소프트웨어 품질 측정 관련 메트릭들에서는 이러한 특징들을 고려하고 있지 있다. 따라서 본 논문에서는 이러한 요소들을 고려하여 IoT 소프트웨어의 여러 가지 품질 요소 가운데 재사용성 측정을 위한 메트릭을 제시한다. 특히 IoT 소프트웨어는 사물인터넷 디바이스를 통해 활용되기 때문에 IoT 소프트웨어 내 서비스가 변경이나 교체 또는 확장이 가능하도록 설계되어야 하며, 이를 측정할 수 있는 메트릭이 매우 필요하다. 따라서, 본 논문에서는 IoT 소프트웨어의 서비스들에 대한 재사용성을 측정 및 평가할 수 있는 변경성, 교체성, 확장성이라는 3가지 메트릭을 제시하고, 사례연구를 통해 제시한 메트릭에 대한 검증을 하였다. 본 논문에서 제시한 메트릭을 통해 IoT 소프트웨어의 서비스 품질 검증이 이루어짐으로써 사용자들의 서비스 만족도 향상에 기여할 수 있을 것이라 기대한다.

유도비행체계 내부 통신채널 상태 검사를 위한 신호 품질 지시자 설계 (Design of Signal Quality Indicator(SQI) for the Verification of the Communication Channel Condition in Guided Flight Systems)

  • 홍언표;정상문;공민식
    • 한국항공우주학회지
    • /
    • 제46권12호
    • /
    • pp.1049-1055
    • /
    • 2018
  • 본 논문은 유도비행체계 내부 부체계들 사이에 연결된 유선 통신채널의 상태를 검사할 수 있는 신호 품질 지시자(SQI)를 제안한다. 유선 통신채널을 통해 전달되는 통신신호는 빈약한 통신채널 연결 상태, 전자기적 간섭신호, 부가 백색 가우시안 잡음 등에 의해서 왜곡이 발생할 수 있다. 통신채널의 상태를 검사하는 방법으로서, 해밍 거리 기반으로 수신신호 왜곡정도를 계산하는 H-SQI와 유클리디언 거리 기반으로 계산하는 E-SQI를 제안한다. 제안하는 두 SQI는 왜곡정도에 대한 분해성능인 SQI 분해성능과 필요 하드웨어 자원 양에 대하여 서로 비교하였다. E-SQI는 뛰어난 SQI 분해성능을 가짐에도 불구하고 H-SQI보다 약 10배의 FPGA 자원과 아날로그-디지털 변환기가 더 필요하다. 또한, H-SQI는 오버샘플링 비율을 증가시켜 채널상태를 확인할 수 있을 정도의 충분한 SQI 분해성능을 얻을 수 있으므로 H-SQI가 E-SQI보다 유도비행체계의 신호 품질 지시자로서 더 적절하다.

암부백을 이용한 저가형 자동 인공호흡기 설계 및 제작 (Design of Low-cost Automated Ventilator Using AMBU-bag)

  • 신희빈;이효경;오가영
    • 적정기술학회지
    • /
    • 제7권1호
    • /
    • pp.51-58
    • /
    • 2021
  • 본 연구는 COVID-19의 대유행으로 인해 자동 인공 호흡기의 공급이 세계적인 긴급 수요에 비해 원활하지 않은 상황에 도움이 될 수있는 저가형 응급 인공 호흡기의 설계 및 구현을 제안한다. AMBU-bag과 기성용 임베디드 마이크로컨트롤러 보드를 사용하여 구현이 용이하고 비용을 최소화했다. 또한, 3D 프린팅은 전 세계 기업과 전문가들이 프로토타입 하드웨어를 구축하는 데 사용하는 반면, 주변 환경에서 쉽게 구할 수 있는 재료는 많은 첨단 기술에 접근하기 어려운 국가의 사람들이 시스템을 제조할 수 있도록 한다. 설계한 간이 인공호흡기 모형의 특징은 암부 백을 자동화했다는 점, 3d 프린팅을 사용하지 않는다는 점, 속도조절이 가능하다는 점이다. 속도 조절이 가능하게 함으로써 사용하는 환자의 상황에 맞게 환기가 가능하다. 연구 시 보완할 점으로는 첫 번째, 사용한 와이퍼 모터의 구동 시작점을 고정하기 어렵다는 것이다. 이를 보완하기 위한 방법으로 위치 피드백기능이 있는 브러시 DC모터로 교체하는 방법이 있다. 두 번째로 팔부분과 고정 틀이 나무 재질이라 암부 백을 장기적으로 압축하는 과정에서 암부백이 마모될 가능성 있다는 것이다. 이를 보완하기 위해 암부백이 닿는 틀과 팔 부분을 실리콘과 같은 재료로 감싸 마찰을 최소화해야 할 필요가 있다.

에지 클라우드 협동 이미지 처리기반 메타버스에서 스트리밍 가능한 저전력 AI 소프트웨어의 런타임 실행 (Low-Power Streamable AI Software Runtime Execution based on Collaborative Edge-Cloud Image Processing in Metaverse Applications)

  • 강명진;김호;박정원;양승범;윤준서;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1577-1585
    • /
    • 2022
  • 최근 4차산업혁명과 함께 메타버스에 대한 관심이 증가하는 가운데, 메타버스를 구축하는 멀티 에지 기반의 구조가 제시된다. 메타버스는 멀티 에지 시스템에서 많은 양의 영상처리와 데이터 전송을 통해 디지털 의사와 같은 시스템을 만들어 낼 수 있는 구조이다. 하지만 에지는 부족한 연산능력이라는 제약이 있으므로, 런타임 스트리밍이 가능한 서비스제공을 위해서는, 에지에서만 이루어졌던 영상처리와 데이터 전송을 에지-클라우드 협동을 통해 처리하여 저전력 시스템을 구축해야한다. 많은 에지들이 연결되는 시스템에서는, 그 무엇보다도 에지 경량화를 통해 효율적인 전체 시스템의 경량화 및 소모전력의 감소를 이루어낼 수 있다. 본 논문에서는 원격영상 처리방법과 Region of Interest (RoI) 기법을 사용하여, AI 소프트웨어의 저전력 런타임 스트리밍이 가능해지는, 에지-클라우드 협동 메타버스 애플리케이션을 제안한다. 에지-클라우드 협동 메타버스의 구조는 PC와 임베디드 보드를 사용하여 구현하였으며, 본 논문의 후반부에서는 에지의 시간 감소와 그에따른 전력 소모, 네트워크 통신량 감소를 검증하였다.