• 제목/요약/키워드: 다중 프레임

검색결과 556건 처리시간 0.028초

AR환경에서 정확하고 효율적인 장애물 인지를 위한 DB기반의 특징점 매칭 (DB-based Feature Point Matching for Accurate and Efficient Obstacle Recognition in AR Environment)

  • 박정우;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.377-380
    • /
    • 2022
  • 본 논문에서는 모바일 기반 AR 환경에서 RGB카메라로부터 얻은 영상 분석과 DB 기반의 특징점(Feature point) 매칭을 통하여 보다 정확하게 위험 상황을 알려줄 수 있는 프레임워크를 제안한다. 본 논문에서는 RANSAC(Random sample consensus)기반의 다중 평면 방식을 이용한 특징점을 추출하고 분석하여 영상에 존재하는 장애물을 감지한다. RGB카메라로 얻은 영상을 기반으로 장애물을 검출하는 접근법은 영상에 의존하기 때문에 조명에 따른 특징점 검출이 부정확하고, 조명이나 자연광 또는 날씨에 영향을 많이 받기 때문에 어둡거나 흐린 날씨에서는 장애물 검출이 어려워진다. 이 문제를 완화하기 위해 본 논문에서는 DB기반의 특징점 매칭을 통해 조명에 관계없이 장애물을 효율적이고 정확하게 감지한다. 특징점 매칭을 이용하려면 우선 영상에서 특징점이 안정적으로 추출될 수 있는 환경인, 조명이나 자연광이 충분한 환경에서 감지된 장애물 정보를 데이터베이스화 하여 저장한다. 조명이 충분하지 않은 환경에서 사용자가 사전에 저장된 지역에 근접할 경우 특징점 분석이 아닌 DB 기반 특징점 매칭을 통해 위험 요소를 감지한다. 우리의 방법은 조명의 여부의 관계없이 효과적으로 위험을 감지할 수 있기 때문에 다양한 분야에 활용될 수 있다.

  • PDF

유전 알고리즘을 이용한 클라우드 환경의 인공지능 워크로드 스케줄링 (Scheduling of Artificial Intelligence Workloads in Could Environments Using Genetic Algorithms)

  • 권석민;반효경
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권3호
    • /
    • pp.63-67
    • /
    • 2024
  • 최근 스마트 물류, 핀테크, 엔터테인먼트 등 다양한 산업 분야의 인공지능 워크로드들이 클라우드 상에서 실행되고 있다. 본 논문은 이기종 GPU 클러스터로 구성된 다중 테넌트 클라우드 시스템에서 다양한 인공지능 워크로드가 실행될 때 발생하는 스케줄링 문제를 다룬다. 전통적인 스케줄링은 이러한 환경에서 GPU 이용률을 크게 저하시켜 시스템의 성능을 떨어뜨린다. 이러한 문제를 해결하기 위해, 본 논문에서는 유전 알고리즘 기반의 최적화 기법을 사용하는 새로운 스케줄링 접근 방식을 제안하고, 이를 프로세스 기반 이벤트 시뮬레이션 프레임워크에 구현하였다. 알리바바의 MLaaS 클러스터에서 수집한 광범위한 인공지능 작업들의 트레이스를 재현하는 실험을 통해 제안하는 스케줄링이 기존 스케줄링에 비해 GPU 이용률을 크게 개선함을 확인하였다.

큰 병변에 대한 다단계 감마나이프 방사선수술의 전략 (Strategy of Multistage Gamma Knife Radiosurgery for Large Lesions)

  • 허병익
    • 한국방사선학회논문지
    • /
    • 제13권5호
    • /
    • pp.801-809
    • /
    • 2019
  • 큰 병변에 대한 기존 감마나이프 방사선수술은 종종 체적 또는 선량 분할 단계들로 수행된다. 체적 분할의 경우, 병변은 처방된 선량 하에서 하루 또는 이틀, 3 ~ 6개월로 분할된 다중 세션에서 조사되는 하위 체적들로 분할되곤 한다. 치료의 전체 과정 동안, 이전 단계의 치료 정보는 세션 사이의 좌표 변환을 통해 새로 장착된 정위 프레임 상의 후속 세션에 반영될 필요가 있다. 그러나 동일한 정위 공간을 제외하고 기존 감마나이프 시스템으로는 이전 선량 분포를 구현하는 것은 실제로 어렵다. 최신 감마나이프 플랫폼을 사용하여 다단계 치료를 수행할 수 있기 때문에 치료 영역이 확장되고 있다. 이 연구의 목적은 정위적 공간에 기초한 영상 정합과 새로운 감마나이프 플랫폼을 사용하여 각 단계에서 처방 선량 결정과 같은 다단계 감마나이프 방사선수술 전략을 소개하는 것이다. 일반적으로 영상 정합에서 수술적으로 내장된 기준점 또는 내부 해부학적 랜드마크들이 변환 관계를 결정하는데 사용된다. 저자는 내부 해부학적 랜드마크들을 사용하는 예로서 4개 또는 6개의 해부학적 랜드마크를 사용하는 다중 세션 간의 좌표 변환 정확도를 비교하였다. 측정된 좌표들과 계산된 좌표들 사이의 불일치를 최소화하기 위해서 PseudoInverse 또는 Singular Value Decomposition을 사용하여 두 정위 공간 사이의 변환 행렬이 결정되었다. 변환 정확도를 평가하기 위해 측정된 좌표와 변환된 좌표들 사이의 차이, 즉 ${\Delta}r$이 10개의 랜드마크들을 사용하여 계산되었다. 10개의 랜드마크들 중 4개 또는 6개의 점들을 사용하여 좌표 변환을 결정하고 나머지는 접근 방법을 평가하는데 사용되었다. 두 가지 접근 방법에서 각각의 ${\Delta}r$ 값은 0.6 ~ 2.4 mm, 0.17 ~ 0.57 mm 범위이었다. 게다가 병변 분할의 경우 한 번에 전체 병변의 치료와 동일한 효과를 제공하는 처방 선량을 결정하는 방법이 제안되었다. 동일한 정위 공간에서의 다단계 치료 전략은 전체 병변에 대한 치료를 먼저 디자인하는 것이며, 전체 치료 디자인 샷들은 각 단계 치료의 샷들로 나누어 각 단계별 샷들을 구성하고 각 단계에서 적절한 처방 선량을 결정한다. 결론적으로 저자는 다단계 치료 전략으로서 처방 선량 결정의 정확성을 확인하였고, 다중 세션 간의 좌표 변환을 결정하기 위해 적은 랜드마크들을 사용하는 것보다 가능한 많은 내부 랜드마크들을 사용하는 것이 더 나은 결과를 산출함을 보았다. 향후 제안된 다단계 치료 전략은 여러 감마나이프 센터들의 틀 없는 분할 치료에 크게 기여할 것이라 사료된다.

실시간 LWIR 밴드 영상 처리를 위한 병렬 클러스터링 기술 (Parallel clustering technology for real-time LWIR band image processing)

  • 조용진;이규승;홍성하;오종우;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.158-158
    • /
    • 2017
  • 비닐포장 하부에 위치한 콩의 생장 초기에 발생한 초엽을 인식하기 위한 연구를 수행중이다. 선행 연구에서 비닐포장에 접촉한 콩 초엽으로 인해 비닐포장 상부 표면의 열 반응 분포에 변화가 있음을 발견하였다. 현장에서 주행 중에 콩 초엽의 위치를 실시간으로 인식하고 연동된 선형 또는 회전형 엑츄에이터를 제어하여 정확한 위치에 천공을 수행하기 위해서는 계측 시스템과 제어 시스템간의 시간적 차이를 최소할 수 있는 실시간 신호 처리 기술이 필수적이다. 선행 연구에서 사용한 다중 IR 센서의 분해능은 $16{\times}4pixel$이며 주파수는 3 Hz로, 폭이 30cm 내외인 비닐포장 상부의 정밀 분석에 한계가 있음을 발견하였다. 이를 해결하기 위하여 분해능과 계측 주기를 개선할 수 있는 초소형 ($1cm{\times}1cm{\times}1cm$) 열화상 센서를 이용하였다. LWIR(Longwave infrared)영역에 해당하는 $8{\mu}m{\sim}14{\mu}m$의 영역에서 $0.05^{\circ}C$의 분해능을 보이는 $ Lepton^{TM}$ (500-0690-00, FLIR, Goleta, CA)모델을 사용하였다. 프레임당 $80{\times}60$ 픽셀의 정보가 2 Byte의 단위로 계측이 되며 9 Hz의 주파수로 대상면의 열 분포를 측정할 수 있다. 이론적으로 초당 정보 전송량은 86,400 Byte ($80{\times}60{\times}2{\times}9$)이며, 1 m를 진행하는 주행형 천공기에 적용할 경우 1 프레임당 10cm 정도의 면적을 측정하므로, 최대 위치 판정 분해능은 약 10 cm / 60 pixel = 0.17 cm/pixel로 상대적으로 정밀한 위치 판별이 가능하다. $80{\times}60{\times}2Byet$의 정보를 0.1초 이내에 분석해야 하는 기술적 과제를 해결하기 위하여 천공 작업기에 적합한 상용 SBC(Single board computer)의 클럭 속도(1 Ghz)로 처리 가능한 공간 분포 분석 알고리즘을 개발하였다. 전체 이미지 도메인을 한 번에 분석하는데 소요되는 시간을 최소화하기 위하여 공간정보 행렬을 균등히 배분하고 별도의 프로세서에서 Feature를 분석한 후 개별 프로세서의 결과를 경합식으로 판정하는 기술을 연구하였다. 오픈 소스인 MPICH(www.mpich.org) 라이브러리를 이용하여 개발한 신호 분석 프로그램을 클러스터링으로 연동된 개별 코어에 설치/수행 하였다. 2D 행렬인 열분포 정보를 공간적으로 균등 분배하여 개별 코어에서 행렬의 Spatial domain analysis를 수행하였다. $20{\times}20$의 클러스터링 단위를 이용할 경우 총 12개의 코어가 필요하였으며, 초당 10회의 연산이 가능함을 확인하였다. 병렬 클러스터링 기술을 이용하여 1m/s 내외의 주행 속도에 대응이 가능한 비닐포장 상부 열 분포 분석 시스템을 구현하였다.

  • PDF

다중 레이어를 이용한 모션캡쳐 수정에 관한 연구 (The Revision of Motion Capture Data using Multiple Layers)

  • 김기홍;최철영;채일진
    • 한국멀티미디어학회논문지
    • /
    • 제12권7호
    • /
    • pp.903-912
    • /
    • 2009
  • 모션캡쳐 데이터의 떨림 현상 수정이나 변형을 위한 기술 개발이나 애니메이션 타이밍 시트에 맞게 모션 캡쳐 데이터를 수정하는 것은 어려운 문제가 산적해 있다. 기존의 모션캡쳐 데이터 수정 방식은 능숙한 애니메이터의 키프레임 애니메이팅 작업과 같은 시간이 소요거나 혹은 더 많은 수정 시간이 걸리는 문제점이 있었다. 이런 문제점은 키 애니메이션 데이터 노드와 직접적인 블렌드 레이어와 대치 레이어 노드 생성을 통해 보다 효과적인 해결 방식을 만들 수 있다. 본 논문에서는 애니메이션 노드에 직접적인 연결을 위한 새로운 애니메이션 레이어 노드 생성으로 진행된 애니메이션 데이터 수정 없이 비선형 방식으로 애니메이션 데이터의 수정을 가능케 하는 방식으로 제시한다. 기술의 구현은 'Haya' API를 활용할 것이고 연구범위는 영화 VFX와 애니메이션 제작에 사용되는 'Maya' 3D 소프트웨어로 제한하였다. 본 연구 결과물은 기존의 비선형 방식보다 직관적이며, 애니메이션 클립을 만들 선행 작업이 필요 없고, 떨림 수정과 키프레임 추출이 가능하며, 특히 타 프로그램과의 호환이 직접적인 레이어 노드를 생성하여 모션캡쳐 데이터의 수정을 가능하게 한다. 마지막으로 기존의 애니메이션 수정방식들을 살펴보고 비교, 분석해 본다.

  • PDF

실시간 멀티미디어 서비스를 위한 ATM/Internet 게이트웨이 시스템의 구현 (Implementation of ATM/Internet Gateway System for Real Time Multimedia Service)

  • 한태만;정유현;김동원
    • 정보처리학회논문지C
    • /
    • 제11C권6호
    • /
    • pp.799-806
    • /
    • 2004
  • 근래에 인터넷 등의 네트워크를 통해 어떤 정보에 접근할 수 있는 다양한 클라이언트 장치들이 널리 보급되고 있다. 하지만 통신능력이나 처리 및 저장능력, 화면표시 능력 등 여러 가지 제약을 가진 클라이언트 장치들로서는 방대한 양의 멀티미디어 콘텐츠를 쉽게 처리할 수 없는 문제가 있다. 또한 네트워크 측면에서도 음성, 데이터 및 비디오의 통합 서비스는 네트워크 기술의 목표를 수정하게 되어 네트워크가 다양한 서비스의 종합 제공 능력과 각 서비스에 필요한 QoS를 제공할 수 있는 능력을 가져야 하게 되었다. 이러한 이유로 ATM망과 인터넷 사이에 중단없는 멀티미디어 서비스를 제공할 수 있는 EAGIS(Efficient ATM Gateway for real time Internet Service)를 개발하게 되었다. EAGIS는 연동장치, 콘텐츠 서버, 트랜스코딩 서버, 서비스 브로커로 구성된다. 본 논문에서는 EAGIS의 구조 설계와 트랜스코딩 서비스 제공 방식을 설계하였다. RTP(Real Time Protocol)를 이용한 양방향 통신은 RTCP(Real Time Control Protocol)의 시각-소인(time-stamp)에 의하여 트랜스코딩 시간을 설정하며, HTTP를 이용한 단방향 통신은 셀프타이며(self-timer)를 이용한다. 이러한 기준 시간을 이용함으로써 네트워크 트래픽 부하와 프레임 전송률에 의한 표준화된 트랜스코딩 방법을 적용할 수 있었다. 또한 다중 사용자 유효 대역폭 확보 알고리즘을 통한 서비스의 품질을 보장할 수 있었다.

ATM 기반 광 가입자망에서 멀티클래스 트래픽의 효율적인 전송을 위한 윈도우 기반 허락 분배 기법 (A Window-Based Permit Distribution Scheme to Support Multi-Class Traffic in ATM Passive Optical Networks)

  • 이호숙;은지숙;노선식;김영천
    • 대한전자공학회논문지TC
    • /
    • 제37권1호
    • /
    • pp.12-22
    • /
    • 2000
  • 본 논문에서는 트리 구조의 가입자 전달망인 APON(ATM passive optical network)에서 멀티클래스트래픽의 효율적인 전송을 위한 윈도우 기반 허락 분배 기법을 제안하였다. 제안된 기법은 상향 셀들의 다중화를 위한 허락 분배 과정에서 ATM 트래픽 클래스별 전송 특성을 고려함을써 각 트래픽 유형별 QoS를 보장할 수 있도록 설계되었다. 이를 위하여 상향 프레임의 주기적 요구 블록 (RAU)에 트래픽 유형별 요구 필드를 두고, 윈도우 기반 허락 분배 알고리즘을 수행하여 각 트래픽의 특성을 고려한 전송 허락이 이루어지도록 한다. 엄격한 전송 지연 성능을 요구하는 CBR/VBR 트래픽에 대해서는 Running-window 개념을 사용한 최소화할 수 있도록 하고, ABR 트래픽에 대해서는 CBR/VBR 허락 분배 후 여분 대역을 우선적으로 할당함으로써 전송 지연을 줄인다. 또한 대역 할당 후 남은 대역은 UBR 트래픽에게도 예약이 가능하도록 함으로써 망 자원의 이용률을 높일 수 있도록 하였다. 시뮬레이션을 통해 제안된 기법의 성능이 기존 프로토콜에 비해 우수함을 보였다.

  • PDF

3차원 추적영역 제한 기법을 이용한 손 동작 인식 시스템 (A Hand Gesture Recognition System using 3D Tracking Volume Restriction Technique)

  • 김경호;정다운;이석한;최종수
    • 전자공학회논문지
    • /
    • 제50권6호
    • /
    • pp.201-211
    • /
    • 2013
  • 본 논문에서는 손 추적과 제스처 인식 시스템을 제안한다. 제안한 시스템은 사용자 손의 3차원 기하학적 정보를 취득하기 위해 별도의 장비를 사용한다. 특히, 기존의 물체 검출 및 추적 시스템들에서 제기 되었던 추적 과정에서의 문제점을 피하기 위해 능동적인 타원체 영역을 만들고 손 추적을 위한 영역을 타원체 영역의 안으로 제한했다. 제안된 시스템은 미리 정의된 기간 동안에 손 위치의 이동평균을 계산한다. 그리고 추적영역은 3차원 공간에 편성된 공분산에 기반한 사용자 손 움직임의 불확실성을 추정하여 통계적인 데이터에 따라 능동적으로 제어하였다. 또한 손 위치가 획득되었을 때, 손 제스처를 인식하기 위해 펼쳐진 손가락을 검출한다. 사용자 인터페이스 체제 기반의 시스템을 구현하여 복잡한 환경에서 다중의 대상들이 동시에 존재하는 경우이거나 일시적인 가려짐이 발생하는 경우에도 정확성을 보여 매우 안정적으로 동작할 수 있음을 보여주며, 약 24-30fps의 프레임 비율로 사용할 수 있는 가능성을 보여주었다.

회전변화에 무관한 실시간 다중 얼굴 검출 엔진 개발 (Development of Rotation Invariant Real-Time Multiple Face-Detection Engine)

  • 한동일;최종호;유성준;오세창;조재일
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.116-128
    • /
    • 2011
  • 본 논문에서는 기존의 방법에 비해서 사용되는 메모리의 증가가 없이, 혹은 메모리의 증가를 최소화하는 영상 메모리의 회전 변환 기법을 개발하여 얼굴 회전 변화에 강인한 고성능 실시간 얼굴 검출 엔진 구조를 제안하였으며 FPGA 구현을 통하여 제안 구조의 타당성을 검증하였다. 고성능 얼굴 검출을 위해 기존에 사용하던 조명 변화에 강인한 MCT(Modified Census Transform) 변환 기법과 최적화된 학습데이터 생성을 위한 Adaboost 학습 기법 이외에 얼굴 회전 변환에 강인함을 위한 영상 회전 기법을 이용하였다. 제안한 하드웨어 구조는 색좌표 변환부, 잡음 제거부, 메모리 인터페이스부, 영상 회전부, 크기 조정부, MCT 생성부, 얼굴 후보 검출부/ 신뢰도 비교부, 좌표 재조정부, 데이터 검증부, 검출 결과 표시부/컬러 기반 검출 결과 표시부로 구성되어있다. 구현 및 검증을 위해 Virtex5 LX330 FPGA 보드와 QVGA급 CMOS 카메라, LCD Display를 이용하였으며, 다양한 실생활 환경 및 얼굴 검출 표준 데이터베이스에 대해서 뛰어난 성능을 나타냄을 검증하였다. 결과적으로 실생활 환경에서 초당 60프레임 이상의 속도로 실시간 처리가 가능하며, 조명 변화 및 얼굴 회전 변화에 강인하고, 동시에 32개의 다양한 크기의 얼굴 검출이 가능한 고성능 실시간 얼굴 검출 엔진을 개발하였다.

케이브 기반 자동차 시제품 평가 (Evaluation of Car Prototype using CAVE-like Systems)

  • 고희동;안희갑;김진욱;김종국;송재복;어홍준;윤명환;우인수;박연동
    • 감성과학
    • /
    • 제5권4호
    • /
    • pp.77-84
    • /
    • 2002
  • 범용 가상환경 프레임워크 NAVER를 제안하고, 이를 케이브기반 가상현실환경에 적용하여 자동차 시제품 평가 실험에 활용한 사례를 소개한다. NAVER는 다양한 가상현실 어플리케이션을 구현하기 위한 가상환경 프레임워크로, 확장성이 뛰어나고 재구성이 가능하다 NAVER는 Render Server, Control Server, 그리고 Device Server로 구성되어 있으며, 각 서버는 네트워크로 상호 통신하여 각각의 기능을 수행한다. NAVER는 XML 기반 스크립팅 언어를 지원하여 사용자가 자유롭게 가상환경의 여러 가지 객체와 인터랙션을 정의할 수 있도록 설계되었다. NAVER를 케이브 기반 가상현실환경에 적용하여 자동자 시제품평가 실험에 활용하였다. KIST의 케이브 기반 가상현실 환경은 4면의 정방형 스테레오 디스플레이 장치, 햅틱 암마스터 장비, 3차원 음향장비 등으로 구성되어 있어, 사용자에서 시각적인 측면에서 뿐만 아니라 촉각, 청각과 같은 여러 가지 측면에서 다중현실감을 제시할 수 있다. 자동차 시제품 평가 실험을 통하여 사용자가 실제 자동차가 아닌 가상의 자동차 시제품을 관찰하고, 만져보고, 주행해 봄으로써 더욱 높은 몰입감과 현실감으로 자동차 조작장치의 조작성을 평가할 수 있음을 입증하였다.

  • PDF