• 제목/요약/키워드: 명령어 처리량

검색결과 32건 처리시간 0.023초

확장 가능한 범용 Associative Processor 구조 및 응용 (Architecture of a scalable general-purpose associative processor and its applications)

  • 윤재복;김주영;김진욱;박태근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.1141-1144
    • /
    • 2005
  • 일반 컴퓨터에서 중앙처리장치와 메모리 사이의 병목 현상인 "Von Neumann Bottleneck"을 보이는데 본 논문에서는 이러한 문제점을 해소하고 검색위주의 응용분야에서 우수한 성능을 보이는 확장 가능한 범용 Associative Processor(AP) 구조를 제안하였다. 본 연구에서는 Associative computing을 효율적으로 수행할 수 있는 명령어 세트를 제안하였으며 다양하고 대용량 응용분야에도 적용할 수 있도록 구조를 확장 가능하게 설계함으로써 유연한 구조를 갖는다. 12 가지의 명령어가 정의되었으며 프로그램이 효율적으로 수행될 수 있도록 명령어 셋을 구성하고 연속된 명령어를 하나의 명령어로 구현함으로써 처리시간을 단축하였다. 제안된 프로세서는 bit-serial, word-parallel로 동작하며 대용량 병렬 SIMD 구조를 갖는 32 비트 범용 병렬 프로세서로 동작한다. 포괄적인 검증을 위하여 명령어 단위의 검증 뿐 아니라 최대/최소 검색, 이상/이하 검색, 병렬 덧셈 등의 기본적인 병렬 알고리즘을 검증하였으며 알고리즘은 처리 데이터의 개수와는 무관한 상수의 복잡도 O(k)를 갖으며 데이터의 비트 수만큼의 이터레이션을 갖는다.

  • PDF

Content-Addressable Memory를 이용한 확장 가능한 범용 병렬 Associative Processor 설계 (Design of a scalable general-purpose parallel associative processor using content-addressable memory)

  • 박태근
    • 대한전자공학회논문지SD
    • /
    • 제43권2호
    • /
    • pp.51-59
    • /
    • 2006
  • 일반 컴퓨터에서 중앙처리장치와 메모리 사이의 병목현상인 "Von Neumann Bottleneck"을 보이는데 본 논문에서는 이러한 문제점을 해소하고 검색위주의 응용분야에서 우수한 성능을 보이는 Content-addressable memory(CAM) 기반의 확장 가능한 범용 Associative Processor(AP) 구조를 제안하였다. 본 연구에서는 Associative computing을 효율적으로 수행할 수 있는 명령어 세트를 제안하였으며 다양하고 대용량 응용분야에도 적용할 수 있도록 구조를 확장 가능하게 설계함으로써 유연한 구조를 갖는다. 12 가지의 명령어가 정의되었으며 프로그램이 효율적으로 수행될 수 있도록 명령어 셋을 구성하고 연속된 명령어를 하나의 명령어로 구현함으로써 처리시간을 단축하였다. 제안된 프로세서는 bit-serial, word-parallel로 동작하며 대용량 병렬 SIMD 구조를 갖는 32 비트 범용 병렬 프로세서로 동작한다. 포괄적인 검증을 위하여 명령어 단위의 검증 뿐 아니라 최대/최소 검색, 이상/이하 검색, 병렬 덧셈 등의 기본적인 병렬 알고리즘을 검증하였으며 알고리즘은 처리 데이터의 개수와는 무관한 상수의 복잡도 O(k)를 갖으며 데이터의 비트 수만큼의 이터레이션을 갖는다.

유비쿼터스 응용 개발을 위한 센서 네트워크 시뮬레이터 (Sensor Network Simulator for Ubiquitous Application Development)

  • 김방현;김종현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권6호
    • /
    • pp.358-370
    • /
    • 2007
  • 유비쿼터스 컴퓨팅의 인프라가 되는 무선 센서 네트워크의 설계 및 응용 개발을 위하여 소프트웨어 시뮬레이션이 널리 사용되고 있다. 본 연구에서는 센서 네트워크 응용프로그램의 동작을 확인할 수 있고, 실행시간 및 전력소모량을 예측할 수 있으며, 많은 수의 센서노드들을 시뮬레이션 할 수 있는 센서 네트워크 시뮬레이터를 개발하였다. 시뮬레이터는 명령어 수준의 병렬 이산 사건 시뮬레이션 방법을 이용하여 구현되었다. 명령어 수준의 시뮬레이션은 실제 센서보드에 적재되는 실행이미지를 시뮬레이션 작업부하로 사용하기 때문에 시뮬레이션 정밀도가 높다. 병렬 시뮬레이션은 여러 대의 컴퓨터를 사용하여 작업부하를 분산 처리하므로 대규모의 센서 네트워크를 시뮬레이션 할 수 있게 해준다. 구현된 시뮬레이터는 센서보드 내의 모듈 별 동작시간 및 실행된 명령어 수를 근거로 하여 전력소모량을 예측할 수 있다. 또한 다양한 시나리오의 유비쿼터스 응용프로그램의 수행 과정을 시뮬레이션 할 수 있으며, 디버깅도 가능하다. 이 연구에서 시뮬레이션의 작업부하인 명령어 트레이스로는 ATmega128L 마이크로컨트롤러용 크로스컴파일러에 의해 생성된 실행이미지를 사용하였다.

SCSI 명령어를 이용한 SANtopia 백업시스템 설계 및 구현 (Desion of SANtopia Backup system and implemented using of SCSI Command)

  • 오상기;최경웅;김정기;신범주;김창수;박순철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.653-656
    • /
    • 2002
  • 본 연구는 데이터웨어하우징/의사결정시스템, 그리고 업무 처리 자동화 소류션등 새로운 애플리케이션 개발로 이하여 발생하는 엄청난 양의 데이터를 효율적으로 관리하기 위한 백업 서장 시스템을 SAN 환경을 지원하는 SANtopia 파일시스템에서 동작하도록 설계 구현하였다. 지금까지 데이터 저장시스템은 하나의 서버에 접속되어 있어서 네트워크 상의 다른 컴퓨터가 직접 활용하는 것을 허용하지 않기 때문에 기존의 네트웍을 기반으로 하는 파일서버 형태로는 이러한 대용량의 자료를 저장하고 관리하는데 한계가 있다. 이러한 문제를 해결할 수 있는 방법으로 Fibre Channel과 LAN 네트워크 모델을 결합하여 대역폭(Bandwidth)의 병목 현상을 크게 완화할 수 있는 SCSI 명령어를 이용하여 SANtopia 파일 시스템에서 파티션별 Full backup과 Restore 할 수 있는 시스템을 리눅스 기반에서 구현하였다.

  • PDF

완전한 파이프라인 방식의 비순차실행 프로세서의 설계 및 모의실행 (Design and Simulation for Out-of-Order Execution Processor of a Fully Pipelined Scheme)

  • 이종복
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권5호
    • /
    • pp.143-149
    • /
    • 2020
  • 현재 컴퓨터 시스템의 중앙처리장치로 멀티코어 프로세서가 주로 이용되고 있으며, 고성능의 비순차실행 프로세서를 각 코어로 채택하여 시스템의 성능을 극대화할 수 있다. 초기의 토마술로 알고리즘을 적용한 비순차실행 프로세서는 부동소수점 명령어를 목표로 하였고, 복잡한 구조를 갖는 재배열버퍼와 예약스테이션의 사용 때문에 그 실행에 여러 싸이클이 소요되었다. 그러나, 프로세서가 비순차실행을 제대로 활용하여 명령어의 처리량을 높이기 위해서는 완전한 파이프라인 방식으로 동작해야한다. 본 논문에서는 예측실행 기능이 있는 완전한 파이프라인 방식의 비순차실행 프로세서를 VHDL로 설계하고, GHDL로 검증하였다. 모의실험 결과, ARM 명령어로 구성된 프로그램에 대한 연산을 성공적으로 수행할 수 있었다.

수동형/반능동형 RFID 시스템의 태그 충돌 방지 알고리즘 -Part I : QueryAdjust 명령어를 이용한 AFQ 알고리즘과 Grouping에 의한 성능개선- (Tag Anti-Collision Algorithms in Passive and Semi-passive RFID Systems -Part I : Adjustable Framed Q Algorithm and Grouping Method by using QueryAdjust Command-)

  • 송인찬;범효;장경희;신동범;이형섭
    • 한국통신학회논문지
    • /
    • 제33권8A호
    • /
    • pp.794-804
    • /
    • 2008
  • 본 논문에서는 EPCglobal Class-1 Generation-2 (Gen2) 기반 Probabilistic Slotted 충돌방지 알고리즘에 대하여 살펴보고, 태그인식시간, 충돌 비율을 감소시키고, 데이터 처리량, 시스템 효율을 증가 시킬 수 있는 QueryAdjust 명령어를 사용한 FAFQ (fixed adjustable framed Q) 알고리즘과 AAFQ (adaptive adjustable framed Q) 알고리즘을 제안하며, 또한 Gen2 기반으로 태그 인식 효율을 향상 시킬 수 있는 Grouping 방법을 제안한다. 제안한 방법들 모두 Q 알고리즘의 성능 향상을 보이며, 제안하는 방법 중 AAFQ 알고리즘이 가장 높은 성능 향상을 나타낸다. 즉, AAFQ 알고리즘에 의하여 5% 정도의 시스템 효율 성능 향상과 4.5% 정도의 충돌 비율 감소를 얻을 수 있다. Grouping 방법은 FAFQ 알고리즘과 AAFQ 알고리즘에 대해선 Ungrouping 방법과 비슷한 성능을 보이지만, Gen2 Q 알고리즘의 경우 Ungrouping 방법과 비교 하였을 때 태그인식시간 및 충돌 비율을 감소시키고, 데이터 처리량 및 시스템 효율을 증가 시킨다.

Mathematica 소개

  • 민경원
    • 전산구조공학
    • /
    • 제5권3호
    • /
    • pp.52-55
    • /
    • 1992
  • 이 글에서는 Mathematica의 고유한 특징과 많은 기능 중의 일부분만을 예를 들어 설명을 하였다. 그러나 Mathematica의 피할 수 없는 단점은 많은 수학적 기능이 포함되어 있기 때문에 처리속도가 늦다는 점이다. 예를 들면 많은 량의 반복작업이나 차수가 큰 매트릭스의 연산작업은 다소 속도가 늦어 PC기종에서는 곤란을 겪을 때가 많다. 따라서 PC대신 workstation 같은 상위기종의 컴퓨터를 이용한다면 처리속도가 빨라져 진행에 문제점이 없다. 한 예로 workstation에서는 차수가 30개인 고유치 해석도 내장함수인 명령어만으로 단지 몇초만에 할 수 있는 데 비하여 PC에서는 기종에 따라 몇배, 몇백배의 시간이 요구되는 것이다. 그리고 또 하나의 단점으로는 방대한 프로그램을 운용하기 위한 비용(ram)이 많이 든다는 점이다. 한 예로 PC에서는 기본적으로 Mathematica를 작동하기 위해 최소한 4 mega ram이 필요하며 여러 수학적 기능을 충분히 이용하기 위해 많은 량의 ram이 필요하다는 점이다. 그러나 위의 단점은 Mathematica가 지니고 있는 고유한 장점을 생각한다면 매우 미미한 것이라 여겨진다. 수학의 대부분의 기능을 포함하고 있으며 기호처리가 가능하고 프로그래밍 기법이 다양하기 때문에 수학을 이용하여 연구를 하는 사람에게는 훌륭한 도구가 생긴 것이라 할 수 있다.

  • PDF

분산 이동 객체 데이터베이스를 위한 실시간 모니터링 시스템 (Real-time Monitoring System for Distributed Moving Object Databases)

  • 김상우;전세길;나연묵
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.55-58
    • /
    • 2006
  • 최근의 위치 측위 기술과 무선 통신 기술의 발전에 따라 위치 기반 서비스에 대한 관심이 크게 증가하고 있다. 휴대폰 사용자와 같은 대용량의 객체를 처리하기 위해서 기존의 단일 노드 기반 시스템으로는 어려움이 있어, 클러스터 기반 분산 컴퓨팅 구조로 GALIS 아키텍처가 제안되었다. 본 논문에서 제안하는 실시간 모니터링 시스템은 클러스터 기반 분산 컴퓨팅 구조로 제안된 GALIS 구현에 있어 기존 명령어 인터페이스를 GUI 로 개선하여 질의 처리 과정에 대한 직관성을 높이고, 각 노드의 부하를 모니터링 함으로써 각 노드의 역할을 동적으로 조정할 수 있게 각 노드별 이동 객체 처리 상황을 관리한다.

  • PDF

윈도우 기반 응용프로그램 제공 서비스를 위한 Win32 API 메시지 인가 시스템의 개발 (Development of Win32 API Message Authorization System for Windows based Application Provision Service)

  • 김영호;정민아;원용관
    • 정보처리학회논문지C
    • /
    • 제11C권1호
    • /
    • pp.47-54
    • /
    • 2004
  • 컴퓨터 자원의 대용량화 및 네트워크 속도의 증가로 인하여 사용자가 네트워크를 통해 원격지의 서버에 접속하여 컴퓨터론 사용하는 요구가 증가되었다. 이에 따라 중앙집중형 컴퓨팅을 통한 응용프로그램 제공 서비스도 활성화되었다. 중앙집중형 컴퓨팅 시스템은 중앙의 대용량컴퓨터 시스템에 설치된 응용프로그램을 공유 프로토콜을 통하여 원격 사용자에게 제공하는 응용프로그램 공유 서비스(ASP: Application Service Provision) 시스템 모델이다. 중앙집중형 컴퓨팅 시스템을 통한 응용프로그램 공유 서비스는 기밀성, 가용성 무결성 등의 보안 사항이 반드시 유지되어야 한다. 기존 원격 컴퓨팅인 Telnet, FTP 접속은 단순히 파일 및 데이터의 접근 권한을 제어함으로 보안이 유지된다. 그러나 윈도우 기반 시스템의 경우 다수의 사용자가 통일한 권한을 통해 통일한 응용프로그램을 제공받기 때문에 사용자들 사이에 기밀성 및 무결성을 저해 할 수 있다. 또한 다수의 사용자가 하나의 응용프로그램에 파일열기, 복사, 서식 수정 등의 여러 기능 명령어를 전송하기 때문에 파일 및 데이터 접근 제어만을 통해서는 시스템의 기밀성 유지한 수 없다. 또한 기밀성의 문제는 곧 가용성 및 무결성의 문제로 이어질 수 있다. 본 논문에서는 윈도우 기반 중앙집중형 컴퓨팅 시스템의 응용프로그램 공유 서비스를 지원함에 있어 사용자가 실행하는 Win32 API 메시지 명령어 접근제어 시스템을 제안한다. 제안하는 시스템은 GUI(Graphical User Interface) 기반의 서버에서 사용자가 서버에 접속하여 발생하는 모든 메시지(마우스, 키보드, I/O, etc....)들을 감시한다. 감시된 메시지 기반의 명령어는 미리 설정된 사용자별 보안 정책에 기반 하여 해당 응용프로그램에게 전달 여부가 결정된다. 이러한 메시지 기반 상세 보안을 통해 기밀성 침해의 우려가 있는 메시지 명령어를 차단하고, 기능 명령어 차단에 의한 자원의 기밀성을 해결하였다.

내장형 음성 인식 시스템을 위한 심층 신경망 최적화 방법 (Deep Neural Network Optimization for Embedded Speech Recognition)

  • 정훈;최우용;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.231-233
    • /
    • 2015
  • 본 논문에서는 심층 신경망 기반의 내장형 음성 인식 시스템에서 음성 인식 속도를 개선하기 위한 최적화 방법에 대해 논한다. 심층 신경망 기반의 음성 인식은 기존의 Gaussian Mixture Model (GMM) 기반에 비해 좋은 인식 성능을 보이지만 높은 연산량으로 인해 리소스가 제약된 내장형 단말기에 적용하기에는 어려움이 따른다. 따라서, 본 연구에서는 심층 신경망의 계산량 문제를 해결하고자 ARM 코어에 내장된 병렬 명령어를 사용한 최적화 기법과 특이값 분해를 통해 심층 신경망 매트릭스 연산량 감소 방안에 대해 제안한다.

  • PDF