• 제목/요약/키워드: 병렬 알고리즘

검색결과 1,324건 처리시간 0.032초

H.264/AVC를 위한 CAVLC 엔트로피 부/복호화기의 VLSI 설계 (VLSI architecture design of CAVLC entropy encoder/decoder for H.264/AVC)

  • 이대준;정용진
    • 한국통신학회논문지
    • /
    • 제30권5C호
    • /
    • pp.371-381
    • /
    • 2005
  • 본 논문에서는 동영상의 실시간 부/복호화를 위한 하드웨어 기반의 CAVLC 엔트로피 부/복호화기 구조를 제안한다. H.264/AVC의 무손실 압축 기법인 내용기반 가변길이 부호화(Context-based Adaptive Variable Length Coding)는 이전 표준의 기법과 다른 알고리즘을 채용하여 높은 부호화 효율과 복잡도를 가지고 있다. 이를 하드웨어 구조로 설계하기 위하여 메모리 재사용 기법을 적용하여 리소스를 최적화 하였으며, 지금까지 제시된 여러 엔트로피 부/복호화 구조 중 휴대용 기기에 적합한 성능 대비 리소스를 가지는 구조를 선택하고 이를 병렬 처리 구조로 설계하여 부호화 성능을 향상시켰다. 구현된 전체 모듈은 Altera사의 Excalibur 디바이스를 이용하여 검증하고 삼성 STD130 0.18um CMOS Cell Library를 이용하여 합성 및 검증하였다. 이를 ASIC으로 구현할 경우 부호화기는 150Mhz 동작주파수에서 CIF 크기의 동영상을 초당 300프레임 이상 처리하며 복호화기는 140Mhz 동작주파수에서 CIF 크기의 동영상을 초당 250 이상 처리할 수 있다. 본 결과는 하드웨어 기반의 H.264/AVC 실시간 부호화기와 복호화기를 설계하기에 적합한 하드웨어 구조임을 보여준다.

Acoustic Echo Canceller 설계 및 구현 (Design and Implementation of Acoustic Echo Canceller)

  • 장수안;문대철
    • 한국통신학회논문지
    • /
    • 제29권2C호
    • /
    • pp.291-297
    • /
    • 2004
  • 본 논문에서는 이동통신에서 발생할 수 있는 반향 성분을 제거하기 위한 반향제거기의 새로운 구조를 제안하였다. 제안한 구조는 블록 데이터 흐름구조로서 고성능, 고효율, high throughput, 연산속도가 거의 선형적으로 증가시킬 수 있는 병렬구조이다. 이 구조를 TMS320C6711에 적용해 실시간 구현함으로써 반향 제거기의 성능을 개선하였다. 제안한 반향제거기는 firmware 형태로 구현이 가능하기 때문에 단말기 내부에 적용하여 이동통신 시스템에서 발생할 수 있는 여러 형태의 반향을 제거할 수가 있다. TMS320C6711 보드에서 적응 알고리즘을 이용한 필터링 작업을 한 후 연산 후에 나온 오차신호를 PC에서 모니터링하여 ERLE 연산을 통해 반향제거기의 성능을 확인할 수 있도록 하였다. 시뮬레이션 결과 500 샘플링 데이터에서 반향신호가 수렴되었고 ERLE값은 100dB가 넘는 우수한 특성을 보였다.

적응적 중복 객체 알고리즘을 이용한 객체 복제본 관리 연구 (The Study of the Object Replication Management using Adaptive Duplication Object Algorithm)

  • 박종선;장용철;오수열
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권1호
    • /
    • pp.51-59
    • /
    • 2003
  • 분산 객체 복제 시스템에서 노드들이 공유하는 객체는 동일 내용을 복수 노드에 위치시키는 것이 효율적이다. 노드들은 시스템에 접근시 접근 정보를 자신의 지역 캐시에 저장해 두었다가 필요시에 인출해서 사용한다. 그러나 시간이 지나감에 따라 다른 노드들에 의해서 데이터의 갱신이 이루어지기 때문에 일관성 문제가 발생한다. 따라서 시스템의 일관성 유지를 통해 성능 및 가용성을 높이기 위해서는 객체를 효율적으로 관리하는 메커니즘이 필요하다. 본 논문에서는 공유 메모리 환경에서 일관성 유지를 위해 객체 관리시 기존의 중복 기법에서 사용하는 일관성 비용 외에 부가 비용이 없이도 제한적으로 병렬 수행의 효과를 얻으며, 또한 중복 기법에서 가장 큰 오버헤드로 알려진 일관성 유지비용을 최소화시키기 위하여 이 비용을 결정하는 가장 핵심적인 요소인 객체 복제본의 수와 위치 그리고 각 객체 사이의 상관도를 고려하여 객체를 효율적으로 관리하고, 전체 수행 시간을 개선시키는 적응적 중복 객체 관리 메커니즘을 연구한다.

  • PDF

실시간 2차원 디지털 IIR 필터의 구현 (Single Board Realtime 2-D IIR Filtering System)

  • 정재길
    • 공학논문집
    • /
    • 제2권1호
    • /
    • pp.39-47
    • /
    • 1997
  • 실시간 2차원 디지털 IIR 필터링 알고리즘의 구현을 가능하게 하는 디지털 신호처리시스템의 효율적인 구조를 제안하였다. 제안된 구조는 시스템 레벨과 프로세서 레벨에서의 병렬처리를 통하여 높은 시스템 성능을 가능하게 하였다. 프로세서간의 데이터 통신의 양을 크게 줄였으며 시스템이 초기화된 이후에는 다른 오버헤드 없이 계산을 수행할 수 있도록 설계하여 전체 시스템의 효율을 극대화하였다. 기능 레벨의 시뮬레이션을 수행하였으며, 그 결과 1 사이클당 1개의 데이터를 처리할 수 있음을 확인하였다. 이는 단지 10MHz의 시스템 클럭을 사용하는 경우 2차원 4차 IIR필터를 실시간 비디오데이터에 적용할 수 있음을 의미하며, 시스템 클럭의 주파수를 올릴 경우 고선명 TV (HDTV) 등의 전후 처리 필터로 사용가능 할 것이다.

  • PDF

모바일 컴퓨팅 데이터베이스 환경에서의 낙관적 제어기법을 이용한 동시성제어기법 (A Concurrency Control Method using Optimistic Control in Mobile Computing DB Environment)

  • 조성제
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.131-143
    • /
    • 2006
  • 무선통신 기술의 급속한 발전으로 무선 인터넷 서비스가 점차 확대되고 있고 그 중 모바일 실시간 처리가 큰 비중을 차지하고 있다. 모바일 트랜잭션 처리는 낮은 대역폭과 핸드오버, 응답시간 지연 등으로 그것의 활성화를 저해하는 여러 가지 문제점을 지니고 있음에도 불구하고 모바일 컴퓨팅 분야에 다양하게 응용되고 있다. 그래서 모바일 컴퓨팅 환경에서 제한된 대역폭을 효율적으로 사용하고, 병목현상을 개선한 새로운 동시성 제어 기법이 요구된다. 본 논문에서는 모바일 컴퓨팅 환경에서의 동시성 제어 문제를 효과적으로 해결하고 동시에 여러 트랜잭션을 처리하여 병렬성을 증진시키는 낙관적 동시성 기법을 제안하였다. 기존기법과 달리, 제안하는 기법은 같은 세그먼트 내에 다른 데이터를 접근하는 트랜잭션에게 세그먼트를 허용함으로써 불필요한 대기시간을 최소화 할 수 있도록 하여 시스템 처리율을 향상시켰다. 그리고 제안된 동시성 제어 기법의 알고리즘을 제안하였다.

  • PDF

다중 DSP 보드를 이용한 프로그램 가능한 도플러 처리기 (A Programmable Doppler Processor Using a Multiple-DSP Board)

  • 신현익;김환우
    • 전자공학회논문지SC
    • /
    • 제40권5호
    • /
    • pp.333-340
    • /
    • 2003
  • 도플러 처리(Doppler processing) 기능은 잔류(residue) 클러터(clutter)의 제거뿐만 아니라 위상정합누적(coherent integration)을 수행하므로, 펄스 도플러 레이더에 있어서 가장 핵심적인 역할을 수행한다. 디지털 신호처리기(DSP : digital signal processor)의 성능향상과 더불어 DSP를 이용한 구현이 점점 일반화 되어가고 있다. 도플러 처리기가 입력신호를 실시간으로 처리하기 위해서는, 다중 DSP를 이용한 병렬처리 개념이 일반적으로 사용되어야 한다. 본 논문에서는 아날로그 디바이스사의 ADSP21060 8개를 탑재한 Morocco-2 보드를 사용하여 MTI(moving target indicator)필터, 도플러 필터뱅크(DFB : Doppler filter bank) 및 제곱검출기(square-law detector) 등으로 구성된 프로그램 가능한 구조의 도플러 처리기를 구성하였다. 위상정합처리구간(CPI : coherent processing interval) 동안 수신된 입력데이터의 분배(distribution)시간, 출력데이터의 전송(transfer)시간 및 알고리즘 수행에 소요되는 연산시간 등을 수식으로 표현하여, 전체 처리시간과 도플러 처리기 구현에 소요되는 DSP의 수를 예측하였다. 또한 레이더 운용에 필요한 각종 타이밍신호 및 모의 표적신호를 발생할 수 있는 TSG(timing signal generator)를 이용하여 도플러 처리기의 실시간 연산기능을 확인하였다.

실시간 스테레오 비젼 시스템을 위한 SAD 정합연산기 설계 (Development of a SAD Correlater for Real-time Stereo Vision)

  • 이정수;양승구;김준성
    • 전자공학회논문지CI
    • /
    • 제45권1호
    • /
    • pp.55-61
    • /
    • 2008
  • 실시간 삼차원 영상은 충돌 방지를 위한 수동 시스템을 포함하는 다양한 응용 분야에 활용될 수 있으며, 기존 능동 시스템에 대한 훌륭한 대안으로서 잡음이 많은 복잡한 환경에서 외부의 영향을 최소화 할 수 있는 장점이 있다. 본 논문에서는 하드웨어 자원 사용량에 주목하여 실시간 삼차원 영상을 위한 스테레오 비전 시스템의 최적화에 관한 연구를 진행하였다. SAD 알고리즘은 규칙적인 구조, 선형적인 데이터 흐름과 풍부한 병렬성을 가지므로 재구성 가능한 하드웨어에서 구현하기 위한 좋은 조건을 가지고 있다. HDL을 이용하여 SAD 정합연산기를 설계하고 하드웨어 자원 사용량과 성능을 확인하기 위해서 Xilinx를 사용하여 합성하였다. 실험을 통하여, 초당 30프레임을 실시간으로 처리할 수 있는 충분한 처리 속도를 가지고 있으며, 적은 자원은 사용하면서 높은 정합율을 보이는 SAD 정합연산기를 설계하였음을 확인하였다.

로우엔드 클러스터 센서 네트워크에서 위치 측정을 위한 지지 벡터 머신 (Constructing a Support Vector Machine for Localization on a Low-End Cluster Sensor Network)

  • 문상국
    • 한국정보통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.2885-2890
    • /
    • 2014
  • 최근 기계학습 방법을 도입하여 센서 노드에 대한 위치를 파악하는 방법이 관심을 받고 있다. 많은 기계학습 알고리즘 중, 지지벡터머신은 프로그래밍 언어로 구현하기 간편하고, 병렬로 수행이 가능하다. 라즈베리파이는 작고 기능이 많아 센서 노드로 사용 시 인터넷 프로토콜을 사용하는 하둡 네트워크 클러스터 구성이 가능하다. 본 논문에서는 파이썬 프로그래밍 언어로 지지벡터머신을 구현하고, 5대의 라즈베리파이를 사용하여 실험적인 하둡 센서 네트워크와 5개의 노드를 가진 맵리듀스 하둡 소프트웨어 프레임워크를 구성하였다. 실험에서 우리는 다양한 파라미터를 변경해가면서 센서 네트워크를 구성하여 효율성, 자원분배, 처리속도를 비교하였다. 라즈베리파이의 컴퓨팅 파워와 메모리 용량은 부족했지만, 센서 클러스터의 노드 멤버의 역할을 충분히 수행하였고, 지지벡터머신 기계학습을 사용하여 센서 노드의 위치측정을 성공적으로 수행하였다.

CUDA를 이용한 Convolutional Neural Network의 구현 및 속도 비교 (Development and Speed Comparison of Convolutional Neural Network Using CUDA)

  • 기철민;조태훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.335-338
    • /
    • 2017
  • 현재 인공지능과 딥 러닝이 사회적인 이슈로 떠오르고 있는 추세이며, 다양한 분야에 이 기술들을 응용하고 있다. 인공지능 분야의 여러 알고리즘들 중에서 각광받는 방법 중 하나는 Convolutional Neural Network이다. Convolutional Neural Network는 일반적인 Neural Network 방법에 Convolution 연산을 하여 Feature를 추출하는 Convolution Layer를 추가한 형태이다. Convolutional Neural Network를 적은 양의 데이터에서 이용하거나, Layer의 구조가 복잡하지 않은 경우에는 학습시간이 길지 않아 속도에 크게 신경 쓰지 않아도 되지만, 학습 데이터의 크기가 크고, Layer의 구조가 복잡할수록 학습 시간이 상당히 오래 걸린다. 이로 인해 GPU를 이용하여 병렬처리를 하는 방법을 많이 사용하는데, 본 논문에서는 CUDA를 이용한 Convolutional Neural Network를 구현하였으며, CPU를 이용한 방법보다 학습 속도가 빨라지고 큰 데이터를 학습 시키는데 더욱 효율적으로 진행하도록 한다.

  • PDF

K-Band용 Semi-MMIC Hair-pin 공진 발진기 (A Semi-MMIC Hair-pin Resonator Oscillator for K-Band Application)

  • 이현태;이종철;김종헌;김남영;김복기;홍의석
    • 한국통신학회논문지
    • /
    • 제25권8B호
    • /
    • pp.1493-1498
    • /
    • 2000
  • 본 논문에서는 DS-CDMA 환경의 다중 사용자 검출에서 문제시되는 다중 접속 간섭을 제거시켜주기 위해 사용되어지는 간섭 제거기에 대하여 소개한다 기존의 간섭제거 기술 중 병렬형 간섭제거기는 장치적으로 복잡하고 순차적 간섭 제거기는 지연 시간이 길다는 단점을 가지고 잇다 그리고 적응형 간섭 제거기는 반복 알고리즘을 적용시킨 적응형 필터를 사용하여 원하는 BER(Bit Error Rate) 성능을 얻기 위해 많은 반복수가 필요하다. 이러한 간섭제거기들의 성능을 개선시키기 위해서 제안된 간섭 제거기는 기존의 적응형 간섭 제거기에 전체 수신 신호를 입력시키지 않고 순차적 간섭 제거기의 정렬(sorting) 기법을 이용한 간섭 제거 기법을 적용 시켜 MAI(Multiple Access Interference)를 사전에 제거시킨 신호를 입력시킴으로써 BER 성능을 향상시키는 것과 동시에 기존의 적응형 간섭제거기에 비해 수렴을 위한 반복수를 줄여준다. 또한 적응형 필터를 사용하여 기존의 비선형 간섭 제거기에 비해 하드웨어적인 복잡도를 줄일수 있는 효과가 있다.

  • PDF