• Title/Summary/Keyword: 비전 기반 기술

Search Result 542, Processing Time 0.033 seconds

MPEG-21 : 유비쿼터스 환경에서의 멀티미디어 프레임워크 표준기술 개요 및 동향 (MPEG-21 : Multimedia Framework Standardization Technology toward Ubiqutous Computing Environment)

  • 남제호;김형중;홍진우;김진웅
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1455-1458
    • /
    • 2003
  • ISO/IEC 21000 (MPEG-21) 표준은 멀티미디어 컨텐츠 운용의 가치사슬(value chain) 전 과정 - 생성, 제작, 전달, 소비, 보호, 관리 및 유통 둥을 위한 하부 기반구조(infrastructure)들이 총체적으로 통합 관리, 체계화 될 수 있는 '멀티미디어 프레임워크'를 정의하는 국제 표준기술이다. MPEG-21 표준기술의 비전은 궁극적으로 사용자가 단말장치 및 컴퓨터 네트워크를 의식하지 않는 상태에서 시간과 장소에 구애받지 않고, 언제 어디서나 자유롭게 네트워크에 접속할 수 있는 환경, 즉 '유비쿼터스(Ubiquitous)' 서비스 환경에서의 원활하고 투명한 멀티미디어 컨텐츠 사용 환경 구축을 지향하고 있다. 본 논문에서는 현재까지 표준화 작업이 진행된 MPEG-21 표준기술의 개요 및 최신 표준화 동향 및 향후 진행방향에 대해서 서술한다.

  • PDF

지능형 무인 모형자동차 개발 및 평가 (Intelligent unmanned vehicle development and evaluation)

  • 김호겸;신재훈;정진현;최경식;한문수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.105-106
    • /
    • 2015
  • 무인 자율 자동차는 사람이 차량 제어에 개입할 수 있는 일반적인 '무인 자동차'와는 달리 센서, 메라와 같은 '장애물 인식장치'와 GPS모듈 과 같은 '자동 항법 장치'를 기반으로 조향, 변속, 가속, 브레이크를 도로환경에 맞춰 스스로 제어해 목적지까지 주행할 수 있는 차량을 의미한다. 따라서 무인 자율 주행 자동차에는 차량제어기술, 차선인식기술, 충돌 회피 기술 등이 필요 하며 이를 위해 각종 센서뿐만 아니라 센서 네트워크, 컴퓨터비전, 인공지능 등의 다양한 기술들이 접목되어야 한다. 본 논문은 소형 무인자동차의 제작을 통한 알고리즘과 그 평가에 대해서 나타낼 것이다.

  • PDF

LiDAR 기반 포인트 클라우드 획득 및 전처리

  • 이옥규;심재영
    • 방송과미디어
    • /
    • 제26권2호
    • /
    • pp.9-17
    • /
    • 2021
  • LiDAR는 조사된 빛이 피사체에 반사되어 돌아오는 시간을 측정하여 거리를 측정하는 장비로서, 넓은 영역과 긴 거리에 걸쳐 실세계의 정밀한 3차원 정보를 포인트 클라우드 데이터로 제공해 준다. 이러한 대용량 포인트 클라우드 데이터는 자율주행 자동차, 로봇, 3차원 지도 제작 등 컴퓨터 비전 기술을 이용하는 다양한 분야에 널리 활용될 수 있다. 그러나 유리 구조물을 포함하는 피사체를 LiDAR로 촬영하는 경우, 유리면에서 빛의 반사로 인한 가상의 포인트가 생성되어 실제 3차원 정보를 왜곡하는 문제가 있다. 포인트 클라우드의 후속 처리를 효율적으로 수행하기 위하여, 이러한 왜곡을 제거하는 전처리 기술이 필요하다. 본 고에서는 LiDAR의 취득 원리와 3차원 포인트 클라우드의 특성을 고찰하고, 유리 반사로 인한 왜곡된 가상의 포인트를 자동으로 검출하고 제거하는 새로운 연구 주제를 소개한다.

AI 개발을 위한 노 코드 플랫폼의 개발 방향 (The direction of development of the no code platform for AI model development)

  • 신유진;양희진;장다영;장현준;고석주;한동희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.172-175
    • /
    • 2021
  • 4차 산업혁명이 시작된 이래로 다양한 산업 분야에서 AI가 활용되고 있고, 그 중에서도 컴퓨터 비전 분야에서 딥러닝 기술이 각광받고 있다. 하지만 딥러닝 기술은 높은 전문 지식이 요구되어 관련 지식이 없는 일반인들은 활용하기 어렵다. 본 논문에서는 AI 관련 배경지식이 없는 사용자들도 UI를 통해 쉽게 이미지 분류 모델을 학습시킬 수 있는 노 코드 플랫폼에 관하여 기술하고, django 프레임워크를 이용해 웹 개발과 딥러닝 모델 학습을 통합 개발을 위한 아키텍처와 방향성을 제시하고자 한다. 사용자가 웹서버에 업로드한 이미지들을 웹 인터페이스를 통해 라벨링 하여 학습 데이터를 생성한 후, 이 데이터를 사용하여 모델을 학습시킨다. CNN 모델에 데이터를 학습시키는 과정과 생성된 모델 기반으로 이미지 예측하는 모듈을 통해 전문지식이 없는 사용자가 딥러닝 기술에 대해 쉽게 이해하고 이용하는 것을 기대할 수 있다.

  • PDF

컴퓨터 비전 기술 기반 건설장비 객체 추출 모델 적용 분석 연구 (A Study on the Construction Equipment Object Extraction Model Based on Computer Vision Technology)

  • 강성원;유위성;신윤석
    • 한국재난정보학회 논문집
    • /
    • 제19권4호
    • /
    • pp.916-923
    • /
    • 2023
  • 연구목적: 2022년 산업재해 현황 부가통계에서 건설업 사망사고자 현황을 보면 건설업 전체 사망사고자의 27.8%가 건설장비로 인해 발생하고 있다. 현장 대형화, 고층화 등으로 발생하는 순회 및 점검의 한계를 극복하기 위해 컴퓨터 비전 기술을 활용해 건설장비를 추출할 수 있는 모델을 구축하고 해당 모델의 정확도 및 현장 적용성에 대해 분석하고자 한다. 연구방법:본 연구에서는 건설장비 중 굴착기, 덤프트럭, 이동식 크레인의 이미지 데이터를 딥러닝 학습시킨 뒤 학습 결과를 평가 및 분석하고 건설현장에 적용하여 분석한다. 연구결과: 'A' 현장에서는 굴착기 및 덤프트럭의 객체를 추출하였으며, 평균 추출 정확도는 굴착기 81.42%, 덤프트럭 78.23%를 나타냈다. 'B' 현장의 이동식 크레인은 78.14%의 평균 정확도를 보여줬다. 결론: 현장 안전관리의 효율성이 증가할 수 있고, 재해발생 위험요인을 최소화 할 수 있을것이라 본다. 또한, 본 연구를 기반으로 건설현장에 스마트 건설기술 도입에 관한 기초적인 자료로 활용이 가능하다.

AWS Lambda Serverless Computing 기술을 활용한 효율적인 딥러닝 기반 이미지 인식 서비스 시스템 (An Efficient Deep Learning Based Image Recognition Service System Using AWS Lambda Serverless Computing Technology)

  • 이현철;이성민;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권6호
    • /
    • pp.177-186
    • /
    • 2020
  • 최근 딥러닝(Deep Learning) 기술의 발전에 따라 컴퓨터 비전(Computer Vision) 분야의 이미지 인식 성능이 향상되고 있으며, 또한 Serverless Computing이 이벤트 기반의 클라우드 애플리케이션 개발 및 서비스를 위한 차세대 클라우드 컴퓨팅 기술로 각광받고 있어 딥러닝과 Serverless Computing 기술을 접목하여 실생활에 이미지 인식 서비스를 사용하고자 하는 시도가 증가하고 있다. 따라서 본 논문에서는 Serverless Computing 기술을 활용하여 효율적인 딥러닝 기반 이미지 인식 서비스 시스템 개발 방법을 기술한다. 제안하는 시스템은 Serverless Computing 기반 AWS Lambda Server를 이용하여 적은 비용으로 대형 신경망 모델을 사용자에게 서비스할 수 있는 방법을 제안한다. 또한 AWS Lambda Server의 단점인 Cold Start Time 문제와 용량제한 문제를 해결하여 효과적으로 대형 신경망 모델을 사용하는 Serverless Computing 시스템을 구축할 수 있음을 보인다. 실험을 통해 AWS Lambda Serverless Computing 기술을 활용하여 본 논문에서 제안한 시스템이 비용 절감뿐만 아니라 처리 시간 및 용량제한 문제를 해결하여 대형 신경망 모델을 서비스하기에 효율적인 성능을 보임을 확인하였다.

VR HMD에서의 비전 테라피 활용을 위한 기술 요소 연구 (A Study on Technical Elements for Vision Therapy based on VR HMD)

  • 최상미;김정호;권순철;이승현
    • 전자공학회논문지
    • /
    • 제53권12호
    • /
    • pp.161-168
    • /
    • 2016
  • 최근 스마트폰의 대중화 및 저가형 헤드 마운트 디스플레이(head mounted display, HMD) 보급으로 가상현실(virtual reality, VR)이 다양한 분야에 응용되고 있다. VR HMD는 시각, 청각 등 인간의 감각기관을 통해 실제와 같은 체험을 가능케하는 인터페이스 기기이다. 양안 디스플레이, 360도 콘텐츠 구현, 깊이 정보에 의해 구현됨에 따라 인간의 여러 감각기능 중 시각과 관련이 있다. 기존의 연구는 주로 멀미, 시각피로와 같은 유해성 측면에 대한 감소 방안 연구가 주로 이루어졌으며, 시각 치료 등에 대한 연구는 부족한 실정이다. 따라서 본 논문은 VR HMD 에서의 비전 테라피 활용을 위한 기술 요소 도출 및 활용 가능 분야를 알아본다. 이를 위해 기존 사례연구 및 기술 요소를 분석하여 비전 테라피 16 분야를 도출하였고, VR HMD 시표 활용을 위한 광학적 파라미터를 도출하였다. 본 연구 결과는 VR HMD 기반을 둔 비전 테라피 시표 개발에 활용 될 것으로 기대된다.

YOLO 기반의 광학 음악 인식 기술 및 가상현실 콘텐츠 제작 방법 (YOLO based Optical Music Recognition and Virtual Reality Content Creation Method)

  • 오경민;홍요섭;백건영;전찬준
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.80-90
    • /
    • 2021
  • 딥러닝에 기반한 광학 음악 인식 기술(Optical Music Recognition, OMR)을 사용하여 도출된 결과를 가상현실 (Virtual Reality, VR) 게임에 적용시킨 것을 제안한다. 딥러닝 모델은 YOLO v5를 사용했으며 검출되지 않은 객체를 검출하기 위해 Hough transform 사용, 보표 크기 수정 등을 수행한다. 출력된 결과 파일을 사용하여 VR 게임에서 BPM, 최대 콤보 수, 음정과 박자를 분석하여 사용하고 리소스 관리를 위한 Object Pooling 기술을 통해 노트가 밀리는 현상을 방지한다. 광학 음악 인식 기술을 통해 나온 음악 요소로 VR 게임을 제작하여 VR 콘텐츠 제공과 함께 광학 음악 인식의 활용성을 넓히는 것을 확인하였다.

보행자의 검출 및 추적을 기반으로 한 실시간 이상행위 분석 시스템 (Real-time Abnormal Behavior Analysis System Based on Pedestrian Detection and Tracking)

  • 김도훈;박상현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.25-27
    • /
    • 2021
  • 최근 딥러닝 기술의 발전으로 CCTV 카메라를 통해 획득한 영상 정보에서 객체의 이상행동을 분석하기 위한 컴퓨터 비전 기반 AI 기술들이 연구되었다. 위험 지역이나 보안 지역에는 범죄 예방 및 경계 감시를 위해 감시카메라가 설치되어 있는 경우가 다수 존재한다. 이러한 이유로 기업들에서는 감시카메라 환경에서 침입, 배회, 낙상, 폭행 같은 주요한 상황을 판단하기 위한 연구들이 진행되고 있다. 본 논문에서는 객체 검출 및 추적 방법을 사용한 실시간 이상 행위 분석 알고리즘을 제안한다.

  • PDF

자연스러운 손 추출 및 추적 (Natural Hand Detection and Tracking)

  • 김혜진;곽근창;김도형;배경숙;윤호섭;지수영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.148-153
    • /
    • 2006
  • 인간-컴퓨터 상호작용(HCI) 기술은 과거 컴퓨터란 어렵고 소수의 숙련자만이 다루는 것이라는 인식을 바꾸어 놓았다. HCI 는 컴퓨터 사용자인 인간에게 거부감 없이 수용되기 위해 인간과 컴퓨터가 조화를 이루는데 많은 성과를 거두어왔다. 컴퓨터 비전에 기반을 두고 인간과 컴퓨터의 상호작용을 위하여 사용자 의도 및 행위 인식 연구들이 많이 행해져 왔다. 특히 손을 이용한 제스처는 인간과 인간, 인간과 컴퓨터 그리고 최근에 각광받고 있는 인간과 로봇의 상호작용에 중요한 역할을 해오고 있다. 본 논문에서 제안하는 손 추출 및 추적 알고리즘은 비전에 기반한 호출자 인식과 손 추적 알고리즘을 병행한 자연스러운 손 추출 및 추적 알고리즘이다. 인간과 인간 사이의 상호간의 주의집중 방식인 호출 제스처를 인식하여 기반하여 사용자가 인간과 의사소통 하는 것과 마찬가지로 컴퓨터/로봇의 주의집중을 끌도록 하였다. 또한 호출 제스처에 의해서 추출된 손동작을 추적하는 알고리즘을 개발하였다. 호출 제스처는 카메라 앞에 존재할 때 컴퓨터/로봇의 사용자가 자신에게 주의를 끌 수 있는 자연스러운 행동이다. 호출 제스처 인식을 통해 복수의 사람이 존재하는 상황 하에서 또한 원거리에서도 사용자는 자신의 의사를 전달하고자 함을 컴퓨터/로봇에게 알릴 수 있다. 호출 제스처를 이용한 손 추출 방식은 자연스러운 손 추출을 할 수 있도록 한다. 현재까지 알려진 손 추출 방식은 피부색을 이용하고 일정 범위 안에 손이 존재한다는 가정하에 이루어져왔다. 이는 사용자가 제스처를 하기 위해서는 특정 자세로 고정되어 있어야 함을 의미한다. 그러나 호출 제스처를 통해 손을 추출하게 될 경우 서거나 앉거나 심지어 누워있는 상태 등 자연스러운 자세에서 손을 추출할 수 있게 되어 사용자의 불편함을 해소 할 수 있다. 손 추적 알고리즘은 자연스러운 상황에서 획득된 손의 위치 정보를 추적하도록 고안되었다. 제안한 알고리즘은 색깔정보와 모션 정보를 융합하여 손의 위치를 검출한다. 손의 피부색 정보는 신경망으로 다양한 피부색 그룹과 피부색이 아닌 그룹을 학습시켜 얻었다. 손의 모션 정보는 연속 영상에서 프레임간에 일정 수준 이상의 차이를 보이는 영역을 추출하였다. 피부색정보와 모션정보로 융합된 영상에서 블랍 분석을 하고 이를 민쉬프트로 추적하여 손을 추적하였다. 제안된 손 추출 및 추적 방법은 컴퓨터/로봇의 사용자가 인간과 마주하듯 컴퓨터/로봇의 서비스를 받을 수 있도록 하는데 주목적을 두고 있다.

  • PDF