• 제목/요약/키워드: 고성능컴퓨팅

검색결과 164건 처리시간 0.024초

CUDA를 활용한 스케일링 필터 및 트랜스코더의 성능향상 (Performance Enhancement of Scaling Filter and Transcoder using CUDA)

  • 한재근;고영섭;서성한;하순회
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.507-511
    • /
    • 2010
  • 본 논문은 GPGPU가속을 이용한 스케일링 필터(scaling filter) 및 트랜스코딩(Transcoding)의 성능 향상 방법을 제안한다. 트랜스코딩 기술은 다양한 요구조건을 지닌 멀티미디어 기기에 적합하게 동영상을 가공하는 기술로, 오늘날 여러 분야에서 활용되는 중요한 기술이다. 그러나 트랜스코딩에는 대량의 연산이 필요하기 때문에 기존 트랜스코더(Transcoder) 사용자들은 오랜 처리시간을 감내 해야만 했는데, 이는 CPU만을 이용한 트랜스코딩이 충분히 효율적이지 못하기 때문이다. 본 연구에서는 고성능의 연산이 가능한 GPGPU기술을 활용하여, 트랜스코더의 스케일링 필터를 GPU 상에서 높은 병렬성을 가지고 동작하도록 개선함으로써 트랜스코더의 전체적인 성능을 향상시켰다. 개선된 트랜스코더는 다양한 크기의 동영상과 여러 종류의 스케일링 필터 옵션들에 대해 잘 동작함이 검증되었으며, 기본 옵션에서 36%, 최대 101%의 성능향상을 보였다.

LHMM기반 영어 형태소 품사 태거의 도메인 적응 방법 (Domain Adaptation Method for LHMM-based English Part-of-Speech Tagger)

  • 권오욱;김영길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1000-1004
    • /
    • 2010
  • 형태소 품사 태거는 언어처리 시스템의 전처리기로 많이 활용되고 있다. 형태소 품사 태거의 성능 향상은 언어처리 시스템의 전체 성능 향상에 크게 기여할 수 있다. 자동번역과 같이 복잡도가 놓은 언어처리 시스템은 최근 특정 도메인에서 좋은 성능을 나타내는 시스템을 개발하고자 한다. 본 논문에서는 기존 일반도메인에서 학습된 LHMM이나 HMM 기반의 영어 형태소 품사 태거를 특정 도메인에 적응하여 높은 성능을 나타내는 방법을 제안한다. 제안하는 방법은 특정도메인에 대한 원시코퍼스를 이용하여 HMM이나 LHMM의 기학습된 전이확률과 출력확률을 도메인에 적합하게 반자동으로 변경하는 도메인 적응 방법이다. 특허도메인에 적응하는 실험을 통하여 단어단위 태깅 정확률 98.87%와 문장단위 태깅 정확률 78.5%의 성능을 보였으며, 도메인 적응하지 않은 형태소 태거보다 단어단위 태깅 정확률 2.24% 향상(ERR: 6.4%)고 문장단위 태깅 정확률 41.0% 향상(ERR: 65.6%)을 보였다.

MEC 시스템에서 태스크 파티셔닝 기법의 성능 비교 (Performance Comparison of Task Partitioning Methods in MEC System)

  • 문성원;임유진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권5호
    • /
    • pp.139-146
    • /
    • 2022
  • 최근 사물 인터넷의 발전과 함께 차량과 IT 기술의 융합되어 자율주행과 같은 고성능의 어플리케이션들이 등장하면서 멀티 액세스 엣지 컴퓨팅(MEC)이 차세대 기술로 부상하였다. 이런 계산 집약적인 태스크들을 낮은 지연시간 안에 제공하기 위해, 여러 MEC 서버(MECS)들이 협력하여 해당 태스크를 수행할 수 있도록 태스크를 파티셔닝하는 기법들이 많이 제안되고 있다. 태스크 파티셔닝과 관련된 연구들은 모바일 디바이스에서 태스크를 파티셔닝하여 여러 MECS들에게 오프로딩을 하는 기법과 디바이스에서 MECS로 오프로딩한 후 해당 MECS에서 파티셔닝하여 다른 MECS들에게 마이그레이션하는 기법으로 나누어볼 수 있다. 본 논문에서는 오프로딩과 마이그레이션을 이용한 파티셔닝 기법들을 파티셔닝 대상 선정 방법 및 파티셔닝 개수 변화에 따른 서비스 지연시간, 거절률 그리고 차량의 에너지 소비량 측면에서의 성능을 분석하였다. 파티셔닝 개수가 증가할수록 지연시간의 성능은 향상하나, 거절률과 에너지 소모량의 성능은 감소한다.

Myrinet 상에서 VMMC를 기반으로 하는 효율적인 MPI 구현 (An Efficient Implementation of MPI over VMMC for Myrinet)

  • 김호중;맹승렬
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.539-547
    • /
    • 2001
  • 클러스터 시스템의 성능을 향상시키기 위해서는 Myrinet과 같은 고성능 통신망 인터페이스가 필수적이다. 그러나 Myrinet에서 동작하는 저수준 통신 계층들은 각기 고유한 통신 방식을 사용하므로 호환성이 떨어진다. 따라서 MPI와 같은 통신 프로그래밍 표준을 효율적으로 구현하여 응용프로그램 수준에서 고성능과 호환성을 동시에 제공하여야 한다. 본 논문에서는 VMMC 통신 계층을 기반으로 MPI를 구현하였다. VMMC의 직접 저장 방식은 MPI의 Send/Recv 방식을 지원하기에 적합하지 않지만 본 논문에서는 두 가지 통신 방식을 변화하기 위한 송수신 큐 구조를 설계하고 늦은 위치 갱신, 선택적 무복사 전송 등의 최적화 기법을 적용함으로써 높은 전송성능을 얻는다. MPI-VMMC의 최대 전송 대역폭은 90.7Mbytes/sec이며 이는 VMMC 통신 계층의 최대 전송 성능의 95%에 달한다.

  • PDF

고정밀 동기 모션 제어 응용을 위한 Xenomai 기반 임베디드 제어기 (Xenomai-based Embedded Controller for High-Precision, Synchronized Motion Applications)

  • 김채린;김익환;김태현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권3호
    • /
    • pp.173-182
    • /
    • 2015
  • 다양한 산업 자동화 분야에 활용되고 있는 모션 제어 시스템의 핵심 요소인 모션 제어기는 모션 명령의 전송의 주기성과 각 모터 드라이브 간 동작시점의 편차 최소화 등 실시간 성능 요구사항을 가진다. 이러한 요구사항을 만족시키기 위해 모션 제어기는 전통적으로 하드웨어 중심의 전용기 형태로 구현되어 왔으나 시스템 간 호환성과 확장성의 한계로 소프트웨어 중심의 범용 모션 제어기로 대체되는 추세이다. 한편 최근에는 저비용, 고성능의 범용 임베디드 플랫폼을 이용한 모션 제어기에 대한 관심도 커지고 있다. 본 논문에서는 고정밀 모션 제어 응용을 위해 ARM 기반 범용 임베디드 보드 상에서 Xenomai 기반 임베디드 제어기를 오픈소스 소프트웨어로 구현한 결과를 제시한다. 구현된 임베디드 제어기의 성능 평가를 위해 실제 응용 상황에서 측정 실험을 수행하였으며, 실험 결과 구현된 제어기는 드라이브 3개를 2 ms 제어주기로 동시 구동하는 환경에서도 안정적인 성능을 보임을 알 수 있었다.

공유 디스크 클러스터에서 실시간 트랜잭션 처리의 성능 평가 (Performance Evaluation of Real-Time Transaction Processing in a Shared Disk Cluster)

  • 이상호;온경오;조행래
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.142-150
    • /
    • 2005
  • 공유 디스크(Shared Disks: SD) 클러스터는 다수 개의 처리 노드를 연동하는 방식으로, 각 노드는 디스크 계층에서 데이타베이스를 공유한다. 고성능의 트랜잭션 처리를 위한 SD 클러스터의 효율성은 기존의 연구들을 통해서 입증되었으나, SD 클러스터 기반의 실시간 처리에 대한 연구는 지금까지 이루어지지 않았다. 실시간 트랜잭션의 경우 전통적인 트랜잭션의 ACID 속성 외에 시간 제약성을 추가로 가진다. 클러스터 기술을 실시간 트랜잭션 처리에 도입함으로써 높은 가용성과 노드들 사이의 병렬성에 따른 성능 향상을 기대할 수 있다. 이런 관점에서 본 논문에서는 먼저 SD 클러스터 기반 실시간 데이터베이스 시스템의 실험 모형을 개발한다. 그리고 개발한 모형을 기반으로 실시간 트랜잭션 처리를 위한 SD 클러스터의 적합성 여부를 평가한다. 뿐만 아니라 실시간 트랜잭션 처리 알고리즘과 SD 클러스터 알고리즘들 간의 상호 영향에 대해 다양한 실험을 통하여 평가한다.

YAFFS 플래시 파일시스템의 성능과 안정성 향상 (Improving the Reliability and Performance of the YAFFS Flash File System)

  • 손익준;김유미;백승재;최종무
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권9호
    • /
    • pp.898-903
    • /
    • 2010
  • Google의 Android phone이나 Apple의 iPhone과 같은 스마트폰들이 대중화됨에 따라, 플래시 메모리용 고성능 고신뢰 파일시스템에 대한 필요성이 증가되고 있다. 본 논문에서는 YAFFS(Yet Another Flash File System)의 성능 개선 및 신뢰성 향상을 위한 기법을 제안한다. 구체적으로, 파일시스템의 마운트 시간 단축 및 성능 향상을 위해 메타데이터와 유저 데이터의 분리 할당 기법을 도입하였으며, 유저 데이터의 인덱싱 정보를 메타데이터에 추가하였다. 또한 신뢰도 향상을 위해 메타 데이터 블록과 유저 데이터 블록에 대한 마모도 평준화 기법을 도입하였다. 제안된 기법은 1GB의 NAND 플래시 메모리를 가지는 시스템에서 실제 구현되었다. 실험을 통해 제안된 기법이 기존 YAFFS에 비해 6배의 마운트 시간감소와 약 4배의 벤치마크 성능 향상 그리고, 평균 14%의 삭제 횟수 감소 및 마모도 평준화의 효과가 있음을 보인다.

스마트폰을 위한 베이지안 네트워크 기반 지능형 에이전트 (Intelligent Agent based on Bayesian Network for Smartphone)

  • 한상준;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권1호
    • /
    • pp.81-91
    • /
    • 2005
  • 최근 이동전화가 사람 사이의 커뮤니케이션에 있어서 필수적인 수단으로 자리 잡고 있다. 사용사가 논어간에 따라 이동전화망을 이용한 각종 부가 서비스들이 개발되고 고성능의 단말기들이 등장하고 있다. 또한 유비쿼터스 컴퓨팅 개념의 발전과 더불어 스마트폰에서 여러 가지 새롭고 편리한 서비스를 제공하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 스마트폰에서의 개인화된 지능형 서비스를 위하여 베이지안 네트워크를 이용한 사용사 모델링과 규칙기반 서비스 선택기능을 갖춘 지능형 에이전트를 제안한다. 이 에이전트는 베이지안 네트워크를 사용하여 개인정보와 통신기록 자료로부터 사용사의 감정, 바쁨의 정도, 상대방과의 친밀도를 추론한 후 얻어진 정보를 사용하여 적절한 행동을 제시한다. 몇 가지 상황에 적용하여 제안한 지능형 에이전트의 유용성을 보인다

구조물 응답측정을 위한 라즈베리파이를 이용한 엣지 컴퓨팅 시스템 설계 (Design of an Edge Computing System using a Raspberry Pi Module for Structural Response Measurement)

  • 신윤수;김준희;민경원
    • 한국전산구조공학회논문집
    • /
    • 제32권6호
    • /
    • pp.375-381
    • /
    • 2019
  • 구조물의 상태를 조기에 파악하기 위한 구조물 건전도 모니터링 연구와 건물의 정보를 수집하여 에너지를 효율적으로 관리해 주는 건물에너지관리시스템에 관한 연구가 활발히 진행 중이다. 본 연구에서는 기존 모니터링 시스템 연구가 건설, 센싱, ICT 기술이 융합된 첨단 기술임에도 불구하고 고가의 센서와 전문적인 기술력이 요구되어 적용 범위가 제한된다는 한계를 극복하기 위하여 싱글보드컴퓨터 중 가장 널리 쓰이는 라즈베리파이와 저전력으로 장거리의 통신이 가능한 로라 모듈, 고성능의 보급형 가속도계를 활용하여 장기간으로 건물의 모니터링이 가능한 무선 엣지 컴퓨팅 시스템을 구축하였다. 또한 라즈베리파이에 분산처리 알고리즘을 탑재함으로써 실시간으로 취득되는 방대한 양의 가속도 데이터 중 의미있는 데이터만을 취득하였으며 와이파이 통신으로 취득한 전체의 로우데이터와 비교함으로써 본 시스템으로부터 취득된 데이터의 정밀성을 검증하였다.

XOR연산 기반의 데이터 재구성 기법을 활용한 컨볼루셔널 뉴럴 네트워크 성능 향상 기법 (Techniques for Performance Improvement of Convolutional Neural Networks using XOR-based Data Reconstruction Operation)

  • 김영웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.193-198
    • /
    • 2020
  • 컨볼루셔널 뉴럴 네트워크 기술의 다양한 활용은 컴퓨팅 분야의 발전을 가속화하고 있으나, 이에 대한 반대급부로 심각한 하드웨어 성능 부족을 초래하고 있다. 그 대응책으로 뉴럴 네트워크 가속기, 차세대 메모리 소자 기술, 그리고 고대역폭 메모리 구조 등이 제안되었으나, 이들은 각각 범용성, 기술 성숙도, 그리고 높은 비용의 문제를 야기하여 적극적으로 도입되기 어려운 실정이다. 따라서 현재의 하드웨어 범용성을 그대로 유지하면서도 컨볼루셔널 뉴럴 네트워크 기술의 성능을 증대시킬 수 있는 방안이 필요하다. 본 연구는 메인메모리 내부에서 리프레쉬 동작이 수행되는 상황에서도 미리 저장된 XOR 비트 값을 사용하여 리프레쉬 동작의 종료 시점까지 대기하지 않아도 읽기 동작을 완료할 수 있는 DRAM 기반 메인메모리 기술을 제안한다. 실험 결과 제안 기법은 5.8%의 수행 속도 향상 및 1.2%의 에너지 절감, 그리고 10.6%의 EDP 향상을 보여주었다.