• Title/Summary/Keyword: 명령어 처리량

Search Result 32, Processing Time 0.043 seconds

Architecture of a scalable general-purpose associative processor and its applications (확장 가능한 범용 Associative Processor 구조 및 응용)

  • Yun, Jae-Bok;Kim, Ju-Young;Kim, Jin-Wook;Park, Tae-Geun
    • Proceedings of the IEEK Conference
    • /
    • 2005.11a
    • /
    • pp.1141-1144
    • /
    • 2005
  • 일반 컴퓨터에서 중앙처리장치와 메모리 사이의 병목 현상인 "Von Neumann Bottleneck"을 보이는데 본 논문에서는 이러한 문제점을 해소하고 검색위주의 응용분야에서 우수한 성능을 보이는 확장 가능한 범용 Associative Processor(AP) 구조를 제안하였다. 본 연구에서는 Associative computing을 효율적으로 수행할 수 있는 명령어 세트를 제안하였으며 다양하고 대용량 응용분야에도 적용할 수 있도록 구조를 확장 가능하게 설계함으로써 유연한 구조를 갖는다. 12 가지의 명령어가 정의되었으며 프로그램이 효율적으로 수행될 수 있도록 명령어 셋을 구성하고 연속된 명령어를 하나의 명령어로 구현함으로써 처리시간을 단축하였다. 제안된 프로세서는 bit-serial, word-parallel로 동작하며 대용량 병렬 SIMD 구조를 갖는 32 비트 범용 병렬 프로세서로 동작한다. 포괄적인 검증을 위하여 명령어 단위의 검증 뿐 아니라 최대/최소 검색, 이상/이하 검색, 병렬 덧셈 등의 기본적인 병렬 알고리즘을 검증하였으며 알고리즘은 처리 데이터의 개수와는 무관한 상수의 복잡도 O(k)를 갖으며 데이터의 비트 수만큼의 이터레이션을 갖는다.

  • PDF

Design of a scalable general-purpose parallel associative processor using content-addressable memory (Content-Addressable Memory를 이용한 확장 가능한 범용 병렬 Associative Processor 설계)

  • Park, Tae-Geun
    • Journal of the Institute of Electronics Engineers of Korea SD
    • /
    • v.43 no.2 s.344
    • /
    • pp.51-59
    • /
    • 2006
  • Von Neumann architecture suffers from the interface between the central processing unit and the memory, which is called 'Von Neumann bottleneck' In this paper, we propose a scalable general-purpose associative processor (AP) based on content-addressable memory (CAM) which solves this problem and is suitable for the search-oriented applications. We propose an efficient instruction set and a structural scalability to extend for larger applications. We define twelve instructions and provide some reduced instructions to speed up which execute two instructions in a single instruction cycle. The proposed AP performs in a bit-serial, word-parallel fashion and can be considered as a 32-bit general-purpose parallel processor with a massively parallel SIMD structure. We design and simulate a maximum/minumum search greater-than/less-than search, and parallel addition to verify the proposed architecture. The algorithms are executed in a constant time O(k) regardless of the number of input data.

Sensor Network Simulator for Ubiquitous Application Development (유비쿼터스 응용 개발을 위한 센서 네트워크 시뮬레이터)

  • Kim, Bang-Hyun;Kim, Jong-Hyun
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.13 no.6
    • /
    • pp.358-370
    • /
    • 2007
  • Software simulations have been widely used for the design and application development of a wireless sensor network that is an infrastructure of ubiquitous computing. In this study, we develop a sensor network simulator that can verify the behavior of sensor network applications, estimate execution time and power consumption, and simulate a large-scale sensor network. To implement the simulator, we use an instruction-level parallel discrete-event simulation method. Instruction-level simulation uses executable images loaded into a real sensor board as workload, such that it results in the high degree of details. Parallel simulation makes simulation of a large-scale sensor network possible by distributing workload into multiple computers. The simulator can predict the amount of power consumption based on operating time of modules in a sensor node and counting the number of executed instructions by kind. Also it can simulate ubiquitous applications with various scenarios and debug programs. Instruction traces used as workload for simulations are executable images produced by the cross-compiler for ATmega128L microcontroller.

Desion of SANtopia Backup system and implemented using of SCSI Command (SCSI 명령어를 이용한 SANtopia 백업시스템 설계 및 구현)

  • Oh, Sang-Gi;Choi, Kyong-Ung;Kim, Goung-Gi;Shin, Bum-Ju;Kim, Chang-Su;Park, Soon-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.653-656
    • /
    • 2002
  • 본 연구는 데이터웨어하우징/의사결정시스템, 그리고 업무 처리 자동화 소류션등 새로운 애플리케이션 개발로 이하여 발생하는 엄청난 양의 데이터를 효율적으로 관리하기 위한 백업 서장 시스템을 SAN 환경을 지원하는 SANtopia 파일시스템에서 동작하도록 설계 구현하였다. 지금까지 데이터 저장시스템은 하나의 서버에 접속되어 있어서 네트워크 상의 다른 컴퓨터가 직접 활용하는 것을 허용하지 않기 때문에 기존의 네트웍을 기반으로 하는 파일서버 형태로는 이러한 대용량의 자료를 저장하고 관리하는데 한계가 있다. 이러한 문제를 해결할 수 있는 방법으로 Fibre Channel과 LAN 네트워크 모델을 결합하여 대역폭(Bandwidth)의 병목 현상을 크게 완화할 수 있는 SCSI 명령어를 이용하여 SANtopia 파일 시스템에서 파티션별 Full backup과 Restore 할 수 있는 시스템을 리눅스 기반에서 구현하였다.

  • PDF

Design and Simulation for Out-of-Order Execution Processor of a Fully Pipelined Scheme (완전한 파이프라인 방식의 비순차실행 프로세서의 설계 및 모의실행)

  • Lee, Jongbok
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.20 no.5
    • /
    • pp.143-149
    • /
    • 2020
  • Currently, a multi-core processor is mainly used as a central processing unit of a computer system, and a high-performance out-of-order processor is adopted as each core to maximize system performance. The early out-of-order execution processor with Tomasulo algorithm aimed at floating-point instructions, and it took several cycles to execute by the use of complex structures such as reorder buffer and reservation station. However, in order for the processor to properly utilize out-of-order execution and increase the throughput of instructions, it must operate in a fully pipelined manner. In this paper, a fully pipelined out-of-order processor with speculative execution is designed with VHDL and verified with GHDL. As a result of the simulation, a program composed of ARM instructions is successfully performed.

Tag Anti-Collision Algorithms in Passive and Semi-passive RFID Systems -Part I : Adjustable Framed Q Algorithm and Grouping Method by using QueryAdjust Command- (수동형/반능동형 RFID 시스템의 태그 충돌 방지 알고리즘 -Part I : QueryAdjust 명령어를 이용한 AFQ 알고리즘과 Grouping에 의한 성능개선-)

  • Song, In-Chan;Fan, Xiao;Chang, Kyung-Hi;Shin, Dong-Beom;Lee, Heyung-Sub
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.33 no.8A
    • /
    • pp.794-804
    • /
    • 2008
  • In this paper, we analyze the performance of probabilistic slotted anti-collision algorithm used in EPCglobal Class-1 Generation-2 (Gen2). To increase throughput and system efficiency, and to decrease tag identification time and collision ratio, we propose new tag anti-collision algorithms, which are FAFQ (fired adjustable flamed Q) algorithm and AAFQ (adaptive adjustable framed Q) algorithm, by using QueryAdjust command. We also propose grouping method based on Gen2 to improve the efficiency of tag identification. The simulation results show that all the proposed algorithms outperform Q algorithm, and AAFQ algorithm performs the best. That is, AAFQ has an increment of 5% of system efficiency and a decrement of 4.5% of collision ratio. For FAFQ and AAFQ algorithm, the performance of grouping method is similar to that of ungrouping method. However, for Q algorithm in Gen2, grouping method can increase throughput and system efficiency, and decrease tag identification time and collision ratio compared with ungrouping method.

Mathematica 소개

  • 민경원
    • Computational Structural Engineering
    • /
    • v.5 no.3
    • /
    • pp.52-55
    • /
    • 1992
  • 이 글에서는 Mathematica의 고유한 특징과 많은 기능 중의 일부분만을 예를 들어 설명을 하였다. 그러나 Mathematica의 피할 수 없는 단점은 많은 수학적 기능이 포함되어 있기 때문에 처리속도가 늦다는 점이다. 예를 들면 많은 량의 반복작업이나 차수가 큰 매트릭스의 연산작업은 다소 속도가 늦어 PC기종에서는 곤란을 겪을 때가 많다. 따라서 PC대신 workstation 같은 상위기종의 컴퓨터를 이용한다면 처리속도가 빨라져 진행에 문제점이 없다. 한 예로 workstation에서는 차수가 30개인 고유치 해석도 내장함수인 명령어만으로 단지 몇초만에 할 수 있는 데 비하여 PC에서는 기종에 따라 몇배, 몇백배의 시간이 요구되는 것이다. 그리고 또 하나의 단점으로는 방대한 프로그램을 운용하기 위한 비용(ram)이 많이 든다는 점이다. 한 예로 PC에서는 기본적으로 Mathematica를 작동하기 위해 최소한 4 mega ram이 필요하며 여러 수학적 기능을 충분히 이용하기 위해 많은 량의 ram이 필요하다는 점이다. 그러나 위의 단점은 Mathematica가 지니고 있는 고유한 장점을 생각한다면 매우 미미한 것이라 여겨진다. 수학의 대부분의 기능을 포함하고 있으며 기호처리가 가능하고 프로그래밍 기법이 다양하기 때문에 수학을 이용하여 연구를 하는 사람에게는 훌륭한 도구가 생긴 것이라 할 수 있다.

  • PDF

Real-time Monitoring System for Distributed Moving Object Databases (분산 이동 객체 데이터베이스를 위한 실시간 모니터링 시스템)

  • Kim Sang-Woo;Jeon Se-Gil;Nah Yun-Mook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.55-58
    • /
    • 2006
  • 최근의 위치 측위 기술과 무선 통신 기술의 발전에 따라 위치 기반 서비스에 대한 관심이 크게 증가하고 있다. 휴대폰 사용자와 같은 대용량의 객체를 처리하기 위해서 기존의 단일 노드 기반 시스템으로는 어려움이 있어, 클러스터 기반 분산 컴퓨팅 구조로 GALIS 아키텍처가 제안되었다. 본 논문에서 제안하는 실시간 모니터링 시스템은 클러스터 기반 분산 컴퓨팅 구조로 제안된 GALIS 구현에 있어 기존 명령어 인터페이스를 GUI 로 개선하여 질의 처리 과정에 대한 직관성을 높이고, 각 노드의 부하를 모니터링 함으로써 각 노드의 역할을 동적으로 조정할 수 있게 각 노드별 이동 객체 처리 상황을 관리한다.

  • PDF

Development of Win32 API Message Authorization System for Windows based Application Provision Service (윈도우 기반 응용프로그램 제공 서비스를 위한 Win32 API 메시지 인가 시스템의 개발)

  • Kim, Young-Ho;Jung, Mi-Na;Won, Yong-Gwan
    • The KIPS Transactions:PartC
    • /
    • v.11C no.1
    • /
    • pp.47-54
    • /
    • 2004
  • The growth of computer resource and network speed has increased requests for the use of remotely located computer systems by connecting through computer networks. This phenomenon has hoisted research activities for application service provision that uses server-based remote computing paradigm. The server-based remote computing paradigm has been developed as the ASP (Application Service Provision) model, which provides remote users through application sharing protocol to application programs. Security requirement such as confidentiality, availability, integrity should be satisfied to provide ASP service using centralized computing system. Existing Telnet or FTP service for a remote computing systems have satisfied security requirement by a simple access control to files and/or data. But windows-based centralized computing system is vulnerable to confidentiality, availability, integrity where many users use the same application program installed in the same computer. In other words, the computing system needs detailed security level for each user different from others, such that only authorized user or group of users can run some specific functional commands for the program. In this paper, we propose windows based centralized computing system that sets security policies for each user for the use of instructions of the application programs, and performs access control to the instructions based on the security policies. The system monitors all user messages which are executed through graphical user interface by the users connecting to the system. Ail Instructions, i.e. messages, for the application program are now passed to authorization process that decides if an Instruction is delivered to the application program based on the pre-defined security polices. This system can be used as security clearance for each user for the shared computing resource as well as shared application programs.

Deep Neural Network Optimization for Embedded Speech Recognition (내장형 음성 인식 시스템을 위한 심층 신경망 최적화 방법)

  • Chung, Hoon;Choi, Woo-Yong;Park, Jeon-Gue
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.231-233
    • /
    • 2015
  • 본 논문에서는 심층 신경망 기반의 내장형 음성 인식 시스템에서 음성 인식 속도를 개선하기 위한 최적화 방법에 대해 논한다. 심층 신경망 기반의 음성 인식은 기존의 Gaussian Mixture Model (GMM) 기반에 비해 좋은 인식 성능을 보이지만 높은 연산량으로 인해 리소스가 제약된 내장형 단말기에 적용하기에는 어려움이 따른다. 따라서, 본 연구에서는 심층 신경망의 계산량 문제를 해결하고자 ARM 코어에 내장된 병렬 명령어를 사용한 최적화 기법과 특이값 분해를 통해 심층 신경망 매트릭스 연산량 감소 방안에 대해 제안한다.

  • PDF