• 제목/요약/키워드: 병렬회로

검색결과 1,180건 처리시간 0.021초

공연로봇을 위한 인간자세 추정방법 개선에 관한 연구 (A Study on Improvement of the Human Posture Estimation Method for Performing Robots)

  • 박천유;박재훈;한재권
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.750-757
    • /
    • 2020
  • 공연에 사용하는 로봇이 인간과의 상호작용하기 위한 기본 성능 중 하나는 인간의 행동을 빠르고 정확하게 파악하는 것이다. 따라서 로봇이 인간의 자세를 추정할 때 자세 인식의 정확도를 높임과 동시에 가능한 빠른 속도로 인식할 수 있어야 한다. 그러나 현재 인공지능 기술의 대표적인 방식인 딥 러닝을 사용하여 인간의 자세를 추정할 경우, 인식의 정확도와 속도라는 두 가지 성능을 동시에 만족하지 못하고 있다. 따라서 사용 목적에 따라 추론정확도가 높은 하향식 자세추정과 처리속도가 빠른 상향식 자세추정 중 하나를 선택해서 사용하는 것이 일반적이다. 본 논문에서는 앞서 언급한 두 가지 방식이 가진 장점을 모두 포함하면서 단점을 보완한 두 가지 방식을 제안한다. 첫 번째는 다중 그래픽 처리 장치를 활용해 상향식 자세추정과 물체검출을 병렬로 사용하는 방식이고, 두 번째는 상향식 자세추정과 단항분류를 융합하는 방식이다. 실험을 통해 두 가지 방식 모두 속도가 개선됨을 증명했다. 공연로봇에 이 두 가지 방식 중 하나를 사용한다면, 관객과 신뢰도 높으며 보다 빠른 상호작용을 수행할 수 있을 것으로 기대된다.

ML-AHB 버스 매트릭스 구현 방법의 개선 (An Improvement of Implementation Method for Multi-Layer AHB BusMatrix)

  • 황수연;장경선
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.629-638
    • /
    • 2005
  • 시스템 온 칩 설계에서 온 칩 버스는 전체 시스템의 성능을 결정하는 중요한 요소이다. 특히 프로세서, DSP 및 멀티미디어 IP와 같이 보다 높은 버스 대역폭을 요구하는 IP가 사용될 경우 온 칩 버스의 대역폭 문제는 더욱 심각해진다. 이에 따라 최근 ARM 사에서는 고성능 온 칩 버스 구조인 ML-AHB 버스 매트릭스를 제안하였다. ML-AHB 버스 매트릭스는 시스템 내의 다중 마스터와 다중 슬레이브간의 병렬적인 접근 경로를 제공하여 전체 버스 대역폭을 증가시켜주고, 최근 많은 프로세서 요소들을 사용하는 휴대형 기기 및 통신 기기 등에 적합한 고성능 온 칩 버스 구조이다. 하지만 내부 컴포넌트인 입력 스테이지와 무어 타입으로 구현된 중재 방식으로 인해 마스터가 새로운 전송을 수행할 때 또는 슬레이브 레이어를 변경할 때 마다 항상 1 클럭 사이클 지연 현상이 발생된다. 본 논문에서는 이러한 문제점을 해결하기 위해 기존 ML-AHB 버스 매트릭스 구조를 개선하였다. 기존 버스 매트릭스 구조에서 입력 스테이지를 제거하고, 개선된 구조에 적합하도록 중재 방식을 변경하여 1 클럭 사이클 지연 문제를 해결하였다. 개선된 결과 4-beat incrementing 버스트 타입으로 다수의 트랜잭션을 수행할 경우, 기존 ML-AHB 버스 매트릭스에 비해 전체 버스 트랜잭션 종료 시간 및 평균 지연 시간이 각각 약 $20\%,\;24\%$ 정도 짧아졌다. 또한 FPGA의 슬라이스 수는 기존의 ML-AHB 버스 매트릭스보다 약 $22\%$ 정도 감소하였고, 클럭 주기도 약 $29\%$ 정도 짧아졌다.

다중 해시 조인의 파이프라인 처리에서 분할 조율을 통한 부하 균형 유지 방법 (A Load Balancing Method using Partition Tuning for Pipelined Multi-way Hash Join)

  • 문진규;진성일;조성현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.180-192
    • /
    • 2002
  • Shared nothing 다중 프로세서 환경에서 조인 어트리뷰트의 자료 불균형(data skew)이 파이프라인 해시 조인 연산의 성능에 주는 영향을 연구하고, 자료 불균형을 대비하여 적재부하를 Round-robin 방식으로 정적 분할하는 방법과 자료분포도를 이용하여 동적 분할하는 두 가지 파이프라인 해시 조인 알고리즘을 제안한다. 해시 기반 조인을 사용하면 여러 개의 조인을 파이프라인 방식으로 처리할 수 있다. 다중 조인은 파이프라인 방식 처리는 조인 중간 결과를 디스크를 통하지 않고 다른 프로세서에게 직접 전달하므로 효율적이다. Shared nothing 다중 프로세서 구조는 대용량 데이타베이스를 처리하는데 확장성은 좋으나 자료 불균형 분포에 매우 민감하다. 파이프라인 해시 조인 알고리즘이 동적 부하 균형 유지 메커니즘을 갖고 있지 않다면 자료 불균형은 성능에 매우 심각한 영향을 줄 수 있다. 본 논문은 자료 불균형의 영향과 제안된 두 가지 기법을 비교하기 위하여 파이프라인 세그먼트의 실행 모형, 비용 모형, 그리고 시뮬레이터를 개발한다. 다양한 파라미터로 모의 실험을 한 결과에 의하면 자료 불균형은 조인 선택도와 릴레이션 크기에 비례하여 시스템 성능을 떨어뜨림을 보여준다. 그러나 제안된 파이프라인 해시 조인 알고리즘은 다수의 버켓 사용과 분할의 조율을 통해 자료 불균형도가 심한 경우에도 좋은 성능을 갖게 한다.

송수신 분리형 TCP/IP Offload Engine을 위한 소프트웨어 및 하드웨어 모듈의 설계 (Design of Software and Hardware Modules for a TCP/IP Offload Engine with Separated Transmission and Reception Paths)

  • 장한국;정상화;최영인
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권9호
    • /
    • pp.691-698
    • /
    • 2006
  • TCP/IP Offload Engine(TOE)는 TCP/IP 프로토콜을 네트워크 어댑터 상에서 처리함으로써 호스트 CPU의 프로토콜 처리 부하를 줄이는 기술이다. TOE의 구현 방안으로는 임베디드 프로세서를 사용한 소프트웨어 TOE, ASIC 기반의 하드웨어 TOE, 그리고 하드웨어와 소프트웨어 구현의 장점을 결합한 하이브리드 TOE 등이 제안되어 왔다. 본 논문에서는 하이브리드 방식의 TOE 구현을 위해 두 개의 프로세서 코어를 내장한 FPGA를 기반으로 임베디드 리눅스 기반의 소프트웨어 모듈 및 데이타 송수신에 필요한 하드웨어 모듈들을 설계하였다. 두 개의 프로세서 코어를 사용하여 송신 경로와 수신 경로를 분담하여 관리함으로써 리눅스 프로세스들 사이의 작업 전환 오버헤드를 줄일 수 있고, 송신과 수신 과정의 병렬 처리를 통해 단일 임베디드 프로세서의 성능 한계를 극복할 수 있다. 하드웨어 모듈은 패킷 헤더의 생성 및 처리, DMA를 사용한 데이타 수집 및 저장 등을 담당하여 송수신 성능을 향상시킨다. 본 논문에서는 프로세서 코어 내장형 FPGA가 장착된 TOE 네트워크 어댑터를 사용하여 송수신 분리형 TOE의 성능을 검증하였다.

리눅스 클러스터 시스템에서 단일 디스크 입출력 공간을 지원하는 효율적 디스크 공유 기법 (An Efficient Disk Sharing Technique supporting Single Disk I/O Space in Linux Cluster Systems)

  • 김태호;이종우;이재원;김성동;채진석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권6호
    • /
    • pp.635-645
    • /
    • 2003
  • 가격 대 성능비가 좋다는 장점으로 인해 많이 사용되고 있는 클러스터 병렬 컴퓨터 시스템에서는 여러 노드에 산재해 있는 자원들을 사용자들이 투명하게 사용할 수 있도록 지원하는 것이 필수적이다. 본 논문에서는 클러스터 시스템에서 단일 디스크 입출력 공간을 지원하는 효율적인 디스크 공유 기법을 제안한다. 응용 수준이 아닌 운영 체제 내의 블록 장치 드라이버 수준에서 디스크 공유를 지원함으로써 사용자들은 로컬 및 원격 디스크를 구분할 필요 없이 클러스터 시스템 내의 모든 디스크들을 마치 로컬 디스크 인 것처럼 투명하게 사용할 수 있다. 기반 운영체제로는 리눅스를 사용하였으며, 실험 결과 단일 디스크 입출력 공간을 성공적으로 지원함과 동시에 비교적 단순한 전역 캐쉬 일관성 정책을 사용했음에도 성능 면에서 NFS에 비해 읽기 성능은 유사, 쓰기 성능은 월등히 향상됨을 확인할 수 있었다. 본 논문이 기여하는 바는 블록 장치 드라이버 수준에서 단일 디스크 입출력 공간을 지원하는 기법을 제안함으로써 블록 장치 드라이버에 비해 비교적 구현이 쉬운 기타 입출력 장치 드라이버에 대해서도 유사한 방식으로 단일 입출력 공간을 지원할 수 있도록 도움을 줄 수 있다는 점이다.

멀티 터널링을 이용한 고속 차량에서 QoS 보장 IP 이동성 관리 방법 (QoS-Guaranteed IP Mobility Management For Fast Moving Vehicles Using Multiple Tunnels)

  • 천승만;나재욱;박종태
    • 대한전자공학회논문지TC
    • /
    • 제48권11호
    • /
    • pp.44-52
    • /
    • 2011
  • 본 논문에서는 다중 무선 네트워크 인터페이스를 가진 고속 차량의 인터넷 서비스에 대한 QoS (Quality of Service) 보장하는 IP 이동성 관리 방법을 제시한다. 제안된 방법은 크게 두 부분으로 나눌 수 있다. 하나는 차량에 탑재된 이동 게이트웨이의 측정 데이터 전송 속도가 사용자가 정의해 놓은 요구 데이터 전송 속도 (Data Transfer Rate) 이하로 떨어지게 되면 이용 가능한 무선 채널을 이용하여 새로운 무선 연결을 생성하는 것이고, 다른 하나는 이동 게이트웨이가 움직이는 동안에 요구 데이터 전송 속도를 보장하기 위해 다중 무선 네트워크 인터페이스를 사용하여 이동 게이트웨이와 무선 접속 라우터 간에 동적으로 병렬 분산 패킷 터널을 생성하는 것이다. 이와 같은 방법을 통해, 핸드오버 동작 중에 유발될 수 있는 지연시간 및 패킷 손실을 줄이는 동시에 사용자의 요구 데이터 전송 속도를 유지함으로써 QoS를 보장 할 수 있게 된다. 제안된 구조를 실현하기 위해 IETF 표준인 Hierarchical Mobile IPv6 (HMIPv6)의 구조를 확장하였고, HMIPv6의 확장을 위한 상세한 알고리즘을 설계하였다. 마지막으로, 성능분석을 위해 시뮬레이션을 수행하였고, 제안된 메커니즘은 핸드오버 하는 동안에 핸드오버 지연시간, 패킷 손실, 패킷 처리율에 대해 QoS를 보장함을 증명하였다.

SSE 명령어를 이용한 영상의 고속 전처리 알고리즘 (Fast Image Pre-processing Algorithms Using SSE Instructions)

  • 박은수;최학남;김준철;임유청;김학일
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.65-77
    • /
    • 2009
  • 본 논문에서는 SSE (Streaming SIMD Extensions) 명령어를 이용한 고속 영상처리 알고리즘을 제안한다. SSE 명령어를 지원하는 CPU는 128비트 크기의 XMM 레지스터를 보유하고 있으며 이에 속한 데이터는 SIMD(Single Instruction Multiple Data) 방식으로 한 번에 병렬로 처리 될 수 있다. 영상처리에서 폭넓게 활용되는 평균 필터, 소벨 수평방향 외곽선 검출, 이진 침식 알고리즘을 SIMD 방식으로 효과적으로 처리 할 수 있는 알고리즘을 제시하였고, 수행 시간을 측정하였다. 보다 객관적인 수행 속도 평가를 위해 현재 많이 사용되고 있는 영상처리 라이브러리와의 수행 속도를 비교하였다. 비교에 사용된 라이브러리는 SISD(Single Instruction Single Data)방식으로 동작하는 OpenCV 1.0, SIMD 방식을 지원하는 고속 영상처리 라이브러리인 IPP 5.2와 MIL 8.0에서 각각 수행 시간을 측정하고 제안하는 알고리즘의 처리 속도와 비교하였다. 실험결과 제안하는 알고리즘은 SISD방식의 영상처리 라이브러리에 비해 평균 8배의 성능향상을 보였으며, SIMD 방식의 고속 영상처리 라이브러리와 비교 하였을 때 평균 1.4배의 성능향상을 보였다. 따라서 제안하는 알고리즘은 고가의 영상처리 라이브러리와 추가적인 하드웨어의 구입 없이도 고속으로 동작해야 하는 실제 영상 처리 어플리케이션에 효과적으로 적용될 수 있음을 보였다.

DSP용 코드 생성에서 주소 포인터 할당 성능 향상 기법 (Improvement of Address Pointer Assignment in DSP Code Generation)

  • 이희진;이종열
    • 전자공학회논문지CI
    • /
    • 제45권1호
    • /
    • pp.37-47
    • /
    • 2008
  • DSP에서 제공되는 주소 생성 유닛은 데이터 패스와 병렬적으로 주소 연산을 수행할 수 있게 해 줌으로써, DSP 코드 생성에 중요한 역할을 한다. 프로그램 변수들의 메모리 레이아웃을 결정하는 문제는 주소 생성 유닛의 기능을 이용하여 주소 연산용 명령어를 줄이는 최적화이다. 메모리 레이아웃 생성 단계와 주소 포인터 할당 단계로 구분 되는 이 최적화에서 본 논문은 주소 연산 코드의 수가 최소가 되도록 DSP용 코드 생성의 효과적인 주소 포인터 할당 문제를 다룬다. 제안하는 알고리즘은 고정된 메모리 레이아웃을 가질 때 주소 포인터 할당을 수행하는 기존의 알고리즘의 시간 복잡도를 줄이는 기법이다. 메모리 크기와 수행 시간을 줄이기 위해 알고리즘을 수행할 때 핵심적인 요소들만을 고려하도록 강한 가지치기 방법을 사용하였다. 또한 주소 포인터 할당 문제는 메모리 레이아웃에 영향을 크게 받는 문제이기 때문에 본 논문은 주어진 메모리 레이아웃을 갱신하여 반복적으로 성능을 개선하는 방법을 제안한다. 약 3,000여개의 실제 프로그램으로부터 얻은 변수 접근 시퀀스를 제공하는 OffsetStone 벤치마크를 이용한 실험결과를 통해 본 논문에서 제안한 기법과 알고리즘을 테스트 했다. 제안한 방법은 전통적인 방법보다 평균 25.9%의 적은 주소 코드를 생성해 냄을 보인다.

제주지역 무에서 벼룩잎벌레와 무잎벌의 색트랩과 집합페로몬에 대한 반응과 연중 발생특성 (Responses of Phyllotreta striolata and Athalia rosae ruficornis to Colored-sticky Traps and Aggregation Pheromone and Seasonal Fluctuations in Radish Fields on Jeju Island)

  • 송정흡;양영택;양철준;최병렬;좌창숙
    • 한국응용곤충학회지
    • /
    • 제54권4호
    • /
    • pp.289-294
    • /
    • 2015
  • 벼룩잎벌레(Phyllotreta striolata)와 무잎벌(Athalia rosae ruficornis)는 제주지역 무에서 돌발적으로 발생하여 피해를 주는 해충이다. 본 연구는 벼룩잎벌레와 무잎벌 성충의 트랩 색(황색과 청색)과 벼룩잎벌레 집합페로몬(+)-(6R,7S)-himachala-9,11-diene과 기주식물 휘발성 물질인 allyl isothiocyanate의 혼합물을 이용 두 해충의 발생을 간편하게 예찰하는 방법을 개발하기 위하여 수행하였다. 벼룩잎벌레는 트랩 색에 관계없이 집합페로몬이 부착된 점착트랩에 더 많은 성충이 유인되었으며, 무잎벌은 황색점착트랩이 청색트랩보다 더 많이 유인되었고 벼룩잎벌레 집합페로몬은 유인량에 관계가 없었다. 따라서 벼룩잎벌레 집합페로몬을 부착한 황색점착트랩을 이용하면 벼룩잎벌레와 무잎벌 성충 발생을 효율적으로 예찰할 수 있었다. 점착트랩의 높이는 기주식물에 가까울수록 두 해충의 유인수가 많아 기주식물 상단 10 cm 높이로 설치하는 것이 좋을 것으로 판단되었다. 벼룩잎벌레와 무잎벌의 연간 발생피크는 각각 3회와 5회정도 나타났으며, 두 해충의 첫 주발생시기는 벼룩잎벌레는 3월중하순, 무잎벌은 4월 중하순이었다. 벼룩잎벌레와 무잎벌 성충의 연간 발생특성을 이용하면 두 해충의 무에서의 피해를 최소화하는데 중요한 정보로 활용될 것으로 기대된다.

다중 카메라 기반 대영역 고해상도 영상획득 시스템과 실시간 영상 정합 알고리즘 (Multiple Camera Based Imaging System with Wide-view and High Resolution and Real-time Image Registration Algorithm)

  • 이승현;김민영
    • 전자공학회논문지SC
    • /
    • 제49권4호
    • /
    • pp.10-16
    • /
    • 2012
  • 영상 기반 반도체 검사 장비의 검사 고속화와 검사 정확도를 위해, 넓은 FOV와 고해상도를 동시에 가지는 2차원 영상을 획득하는 것은 검사 장비에 필수적이다. 본 논문에서는 정밀도와 FOV 측면에서 양질의 영상 획득을 위한 새로운 영상획득 시스템을 제안하였다. 제안시스템은 하나의 렌즈와 광분할기, 두 개의 카메라 센서, 스테레오 영상획득 보드로 구성되며, 하나의 렌즈를 통해 입력되는 영상을 두 개의 카메라 센서를 통해 동시에 영상 획득한다. 획득된 영상의 정합을 위해, 첫 번째로 Zhang의 카메라 교정 방법을 적용시켜 각각의 카메라를 교정한다. 두 번째로 다른 카메라에서 획득한 두 영상들 사이의 수학적인 정합 함수를 찾기 위해 각 영상의 호모그래피(homography)를 이용하여, 양측 카메라간의 정합 행렬을 계산한다. 영상 호모그래피를 통해서, 획득된 두 영상은 하나의 최종 검사 영상으로의 통합을 위해 최종적으로 정합될 수 있다. 다중 카메라로부터 입력되는 다중 영상들을 활용하는 제안 검사 시스템은 실시간 영상 정합을 위해 매우 빠른 프로세스 유닛의 도움이 필요하다. 이를 위해 CUDA (Compute Unified Device Architecture)기반 병렬 프로세싱 하드웨어 및 소프트웨어를 활용한다. 두 개의 분할된 영상으로부터 실시간으로 정합된 영상을 얻을 수 있었으며, 마지막으로 연속된 실험을 통해 획득한 호모그래피의 정확도를 확인할 수 있다. 실험으로 얻은 결과들은 제안된 시스템과 방법이 대영역 고해상도 검사영상 획득을 위해 효과적임을 보인다.