• 제목/요약/키워드: 미디어파이프

검색결과 105건 처리시간 0.025초

인공지능 기반 손 체스처 인식 정보를 활용한 지능형 인터페이스 (Intelligent interface using hand gestures recognition based on artificial intelligence)

  • 조항준;유준우;김은수;이영재
    • Journal of Platform Technology
    • /
    • 제11권1호
    • /
    • pp.38-51
    • /
    • 2023
  • 인공지능에 기반한 손 제스처 인식 정보를 활용한 지능형 인터페이스 알고리즘을 제안한다. 이 방법은 기능적으로 사용자 손 제스처의 추적 및 인식을 미디어파이프와 KNN, LSTM, CNN의 인공지능 기법을 사용해 다양한 동작을 빠르고 지능적으로 인식되는 인터페이스이다. 제안한 알고리즘 성능 평가를 위해 자체 제작한 2D 탑뷰 레이싱 게임과 로봇제어에 적용한다. 알고리즘 적용 결과 게임의 가상 객체의 다양한 움직임을 세밀하고 강건하게 제어할 수 있었으며, 실세계의 로봇 제어에 적용한 결과 이동과 정지, 좌회전, 우회전 등의 제어가 가능하였다. 또한 게임의 메인 캐릭터와 실세계 로봇을 동시에 제어하여 가상과 현실의 공존공간 상황 제어를 위한 지능형 인터페이스로 최적화된 동작도 구현하였다. 제안한 알고리즘은 신체를 활용한 자연스럽고 직관적 특성과 손가락의 미세한 움직임 인식에 따른 정교한 제어가 가능하며, 빠른 기간 내에 숙련되는 장점이 있어 지능형 사용자 인터페이스 개발을 위한 기본자료로 활용될 수 있다.

  • PDF

계층화 모션 추정법과 병렬처리를 이용한 차량 움직임 측정 알고리즘 개발 및 구현 (Design and Implementation of Algorithms for the Motion Detection of Vehicles using Hierarchical Motion Estimation and Parallel Processing)

  • 강경훈;정성태;이상설;남궁문
    • 한국멀티미디어학회논문지
    • /
    • 제6권7호
    • /
    • pp.1189-1199
    • /
    • 2003
  • 본 논문에서는 계층화 모션 추정법과 병렬 처리를 이용한 차량의 움직임 측정 알고리즘을 제안한다. 본 시스템에서는 CMOS 센서를 통하여 도로 영상을 캡쳐한다. 그 다음에 영상을 작은 블록들로 나누고 블록매칭을 이용하여 각 블록의 움직임을 계산한다. 그리고 움직임이 비슷한 블록들을 클러스터링하여 차량의 움직임을 측정한다. 본 논문에서는 실시간 동작을 위하여 계층화 모션 추정법과 병렬 처리에 의거한 블록매칭 알고리즘을 제안한다. 병렬처리를 위해서는 파이프라인과 데이터 플로우 기법을 도입하였다. 본 논문에서 제안된 시스템은 기존의 내장형 시스템을 이용하여 구현되었다. 제안된 블록매칭 알고리즘은 PLD(Programmable Logic Device)를 이용하여 구현하였고 클러스터링 알고리즘은 ARM 프로세서를 이용하여 구현하였다. 실험 결과에 의하면 본 논문에서 구현된 시스템은 차량의 움직임을 실시간으로 추출할 수 있었다.

  • PDF

GIS상에서 TDR을 사용한 누수감지관과 모니터링 시스템에 관한 연구 (A Study on a Leakage Sensing Pipe and Monitoring System Using TDR in GIS)

  • 강병모;홍인식
    • 한국멀티미디어학회논문지
    • /
    • 제7권4호
    • /
    • pp.567-578
    • /
    • 2004
  • GIS 기술은 공간데이터 조작능력을 향상시켰으며, 다양한 분석을 통하여 지리정보 서비스를 제공하고 있다. 이런 상황에서 인구증가와 도시 집중화 현상에 따른 물의 사용량이 증가하였다. 그러나 물 부족현상, 누수 및 수질악화 문제로 물의 지속적인 확보가 어려워지고 있다. 누수로 인한 막대한 손실을 줄이고자 GIS를 이용하여 누수를 판단하고 누수위치를 검색할 수 있는 시스템이 필요하다. 본 논문에서는 GIS상에서 TDR기술을 이용하여 누수 감지시스템을 제안하고 유효성을 입증하기 위해 GIS 데이터베이스와 파이로트 시스템을 구축하여 시뮬레이션 하였다.

  • PDF

UHD TV 영상신호처리를 위한 프로그래머블 멀티미디어 플랫폼 (Programmable Multimedia Platform for Video Processing of UHD TV)

  • 김재현;박구만
    • 방송공학회논문지
    • /
    • 제20권5호
    • /
    • pp.774-777
    • /
    • 2015
  • 본 논문에서는 8K(7680x4320) UHD(Ultra High Definition) TV에서의 화질 향상을 위한 영상신호 처리용 프로그래머블 비디오 프로세싱 플랫폼을 세계 최초로 제안하였다. 8K 영상을 초당 60 프레임으로 처리하기 위해서는 고성능 컴퓨팅 능력과 대용량의 메모리 대역폭이 지원되어야 한다. 제안한 아키텍처에서는 입력 영상의 병렬처리를 위한 멀티 클러스터 구조, 클러스터 간이 데이터 파이프라이닝을 위한 링 데이터 패스 구조 및 필터링 연산을 위한 하드웨어 가속기로 구성되었다. 재구성형 프로세서(Reconfigurable Processor) 기반의 제안된 플랫폼은 다양한 화질향상 알고리즘을 구동할 수 있으며, UHD 방송 표준 및 디스플레이 패널 변동성에 알고리즘의 업데이트만으로 대응이 가능한 큰 장점을 갖고 있다.

DMGL: OpenGL ES 기반 모바일 3D 렌더링 라이브러리 (DMGL: An OpenGL ES Based Mobile 3D Rendering Libraries)

  • 황규현;박상훈
    • 한국멀티미디어학회논문지
    • /
    • 제11권8호
    • /
    • pp.1160-1168
    • /
    • 2008
  • 모바일 하드웨어 기술의 비약적인 발전으로 과거에는 실시간으로 렌더링 될 수 없었던 다양한 3D 렌더링 효과들을 모바일 기기 상에서 실시간으로 처리할 수 있게 되었으며, 이를 이용하여 보다 사실적인 모바일 3D 응용 프로그램을 제작할 수 있게 되었다. 본 논문에서는 모바일 환경에서 고화질로 실시간 3D 렌더링을 지원하는 DMGL이라 불리는 플랫폼에 독립적인 OpenGL ES 기반 실시간 모바일 렌더링 라이브러리에 관해 설명한다. 모바일 그래픽스 소프트웨어 개발자들은 이 라이브러리를 이용하여 다양한 고급 실시간 3D 그래픽스 효과들을 간단히 구현할 수 있다. 또한 GPGPU 기반의 라이브러리들은 연기나 불과 같은 자연현상 시뮬레이션을 위한 복잡한 방정식들을 풀고, 그 결과를 실시간 렌더링 할 수 있는 기능을 제공한다.

  • PDF

SoC를 위한 JPEG2000 IP 설계 및 구현 (JPEG2000 IP Design and Implementation for SoC Design)

  • 정재형;한상균;홍성훈;김영철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.63-68
    • /
    • 2002
  • JPEG2000은 기존의 정지영상압축부호화 방식에 비해 우수한 비트율-왜곡(Rate-Distortion)특성과 향상된 주관적 화질을 제공하며 인터넷, 디지털 영상카메라, 이동단말기, 의학영상 등 다양한 분야에서 적용될 수 있는 새로운 정지영상압축 표준이다. 본 논문에서는 SoC(System on a Chip)설계를 고려한 JPEG2000 인코더의 구조를 제안하고 IP(Intellectual Property)를 설계 및 검증하였다. 구현된 JPEG2000 IP는 DWT(Discrete Wavelet Transform)블록, 스칼라양자화블록, EBCOT(Embedded Block Coding with Optimized Truncation)블록으로 구성되어 있다. IP는 모의실험을 통해 구현 구조에 대한 타당성을 검증하였고, 반도체설계자산연구센터에서 제시한 'RTL Coding Guideline'에 따라 HDL을 설계하였다. 특히, DWT블록은 구현시 많은 연산과 메모리 용량이 필요하므로 영상을 저장할 외부 메모리를 사용하였고, 빠른 곱셈과 덧셈연산을 위한 3단 파이프라인 부스곱셈기(3-state pipeline booth multiplier)와 캐리예측 덧셈기(carry lookahead adder)를 사용하였다. 설계된 JPEG2000 IP들은 삼성 0.35$\mu\textrm{m}$ 라이브러리를 이용하여 Synopsys사 Design Analyzer 틀을 통해 논리 합성하였으며, Xillinx 100만 게이트 FPGA칩에 구현하여 그 동작을 검증하였다. 또한, Hard IP 설계를 위해 Avanti사의 Apollo툴을 이용하여 Layout을 수행하였다.

  • PDF

무선 멀티미디어 통신망의 성능 향상을 위한 OFDM FFT 설계에 관한 연구 (A Study on OFDM FFT Design for Peformance of Wireless Multimedia Network)

  • 강정용;이선근
    • 한국통신학회논문지
    • /
    • 제30권1A호
    • /
    • pp.70-75
    • /
    • 2005
  • 이동 멀티미디어 서비스를 위한 통신 시스템에서 고속으로 데이터를 송신하고 수신함에 따라 발생하는 인접 심벌간의 간섭(Inter Symbol Interference : ISI) 왜곡을 줄이기 위한 방식으로 직교 주파수 분할 다중화(Orthogonal Frequency Division Multiplexing : OFDM) 방식에 대한 연구가 활발하게 진행되고 있다. 고속 무선 LAN이 표준방식으로 채택한 OFDM 방식이 부 반송파의 수가 많아짐에 따라 변복조부를 실제 시스템으로 구현하기가 어려운 단점이 있었다. 그러므로 본 논문에서는 파이프라인 방식을 이용해서 변복조부를 설계하여 많은 수의 버터플라이(Butterfly) 연산자를 감소시켰다. 또한 고속의 처리속도를 만족시키기 위해서 64 포인트를 처리하는 버터플라이 구조를 각각 32 포인트씩 병렬처리 하도록 구성하였다.

낙상사고 감지 시스템 구현 (Implementation of Fall Accident Detection System)

  • 주은수;임효경;이상민;박성익;전찬호;정영석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.461-462
    • /
    • 2022
  • 최근 지속적인 출산율의 감소와 평균수명의 증가로 인하여, 대한민국의 초고령 사회는 예상보다 훨씬 빠르게 증가하고 있다. 핵가족 형태가 보편화되며 1인 가구도 함께 늘고 있어서 홀로 사는 노인의 수 역시 증가하는 추세이다. 주거 공간에서 낙상사고와 같은 고령화 안전사고가 많이 발생하고 있다. 혼자 사는 독거노인들의 경우 사고 발생 즉시 대처가 가능한 보호자가 없다는 문제점이 있다. 본 논문에서는 MediaPipe를 이용한 낙상사고 감지 시스템을 개발한다. 먼저, 이 시스템은 MediaPipe를 이용해서 카메라를 통해 실시간으로 수신된 영상에서 사람을 인식하고, 자세 유형 분석을 통해 낙상사고 발생 여부를 판별하여 애플리케이션을 통해 보호자에게 현장 상황을 알려주는 시스템이다. 낙상사고가 발생했다면 보호자용 애플리케이션을 통해 사고 발생 알림 및 현장 사진을 보여준다. 이와 같은 기술을 활용하여 응급상황에 처한 노인을 빠르게 구조하며 독거노인의 생활안전사고 문제를 해결하는 데에 기여하고자 한다.

  • PDF

딥러닝 영상인식을 이용한 수화-텍스트 번역 시스템 설계 (A Design of Sign Language-Text Translation System Using Deep Learning Vedio Recognition)

  • 이종명;김강규;유서연;이승건;천승현;백정윤;하옥균
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.475-476
    • /
    • 2022
  • 본 논문에서는 청각장애인의 사회참여성 증진 및 사회적 차별감소를 목적으로 딥러닝 영상인식 기반으로 MediaPipe 기술을 활용한 수화-텍스트 번역시스템을 설계한다. 제시하는 시스템은 실시간으로 수집된 수화 사용자의 영상정보를 통해 동작과 표정을 인식하여 텍스트로 번역함으로써 장애인과 비장애인의 원활한 의사소통 서비스를 제공하는 것을 주 목적으로한다. 향후 개선된 수화 인식 및 문장 조합을 통해 일상에서 청각장애인과 일반인의 자유로운 커뮤니케이션을 제공하는 서비스로 확장하고자한다.

  • PDF

실시간 재생을 위한 TMIV 디코더의 GPU 구현 (GPU Implementation of TMIV Decoder for Real-time Playback)

  • 이상호;신홍창;이광순;서정일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.122-125
    • /
    • 2022
  • TMIV 레퍼런스 모델에는 VWS(View Weighting Synthesizer), AS(Additive Synthesizer), MPIS(Multiplane Image Synthesizer)의 세 가지 방식의 렌더러 구현이 제시되어 있는데 본 논문에서는 VWS 에 포커스를 맞추어 GPU 로 구현하여 디코딩 성능을 개선한 결과를 소개하고자 한다. AS, MPIS 등에 대해서는 GPU 에 의한 구현이 아직 진행 중이며 본 구현이 적용된 TMIV 레퍼런스 모델의 버전은 8.0.1 이어서 최신 버전인 11 또는 12 에 바로 적용하기에는 다소 거리가 있겠으나, 본 구현에서 적용된 세부 구현 기술과 서브 모듈 등은 충분한 재활용성을 가지고 있어 다른 방식의 렌더러나 상위 버전의 고속화 구현에도 적용이 가능할 것이다. TMIV 8.0.1 의 디코더에서 1920×4640 크기를 가지는 두 개의 아틀라스를 기준으로 프레임 렌더링의 경우 싱글 프레임 당 약 4 초에서 평균 25ms 이하 로 실행 시간이 단축되어 약 150 배 이상의 성능 향상을 획득하였으며 렌더링 파이프라인의 추가 등에 의해 통상적으로 실시간이라고 여기는 30fps 의 속도로 재생이 가능한 성능에 도달한 결과를 소개하였다.

  • PDF