• Title/Summary/Keyword: 비전 기반 기술

Search Result 542, Processing Time 0.032 seconds

MPEG-21 : Multimedia Framework Standardization Technology toward Ubiqutous Computing Environment (MPEG-21 : 유비쿼터스 환경에서의 멀티미디어 프레임워크 표준기술 개요 및 동향)

  • 남제호;김형중;홍진우;김진웅
    • Proceedings of the IEEK Conference
    • /
    • 2003.07d
    • /
    • pp.1455-1458
    • /
    • 2003
  • ISO/IEC 21000 (MPEG-21) 표준은 멀티미디어 컨텐츠 운용의 가치사슬(value chain) 전 과정 - 생성, 제작, 전달, 소비, 보호, 관리 및 유통 둥을 위한 하부 기반구조(infrastructure)들이 총체적으로 통합 관리, 체계화 될 수 있는 '멀티미디어 프레임워크'를 정의하는 국제 표준기술이다. MPEG-21 표준기술의 비전은 궁극적으로 사용자가 단말장치 및 컴퓨터 네트워크를 의식하지 않는 상태에서 시간과 장소에 구애받지 않고, 언제 어디서나 자유롭게 네트워크에 접속할 수 있는 환경, 즉 '유비쿼터스(Ubiquitous)' 서비스 환경에서의 원활하고 투명한 멀티미디어 컨텐츠 사용 환경 구축을 지향하고 있다. 본 논문에서는 현재까지 표준화 작업이 진행된 MPEG-21 표준기술의 개요 및 최신 표준화 동향 및 향후 진행방향에 대해서 서술한다.

  • PDF

Intelligent unmanned vehicle development and evaluation (지능형 무인 모형자동차 개발 및 평가)

  • Kim, Ho-Geum;Sin, Jae-Hoon;Jung, Jin-Hyun;Che, Geoung-Sik;Han, Moon-Su
    • Proceedings of the KIEE Conference
    • /
    • 2015.07a
    • /
    • pp.105-106
    • /
    • 2015
  • 무인 자율 자동차는 사람이 차량 제어에 개입할 수 있는 일반적인 '무인 자동차'와는 달리 센서, 메라와 같은 '장애물 인식장치'와 GPS모듈 과 같은 '자동 항법 장치'를 기반으로 조향, 변속, 가속, 브레이크를 도로환경에 맞춰 스스로 제어해 목적지까지 주행할 수 있는 차량을 의미한다. 따라서 무인 자율 주행 자동차에는 차량제어기술, 차선인식기술, 충돌 회피 기술 등이 필요 하며 이를 위해 각종 센서뿐만 아니라 센서 네트워크, 컴퓨터비전, 인공지능 등의 다양한 기술들이 접목되어야 한다. 본 논문은 소형 무인자동차의 제작을 통한 알고리즘과 그 평가에 대해서 나타낼 것이다.

  • PDF

LiDAR 기반 포인트 클라우드 획득 및 전처리

  • Lee, Ok-Gyu;Sim, Jae-Yeong
    • Broadcasting and Media Magazine
    • /
    • v.26 no.2
    • /
    • pp.9-17
    • /
    • 2021
  • LiDAR는 조사된 빛이 피사체에 반사되어 돌아오는 시간을 측정하여 거리를 측정하는 장비로서, 넓은 영역과 긴 거리에 걸쳐 실세계의 정밀한 3차원 정보를 포인트 클라우드 데이터로 제공해 준다. 이러한 대용량 포인트 클라우드 데이터는 자율주행 자동차, 로봇, 3차원 지도 제작 등 컴퓨터 비전 기술을 이용하는 다양한 분야에 널리 활용될 수 있다. 그러나 유리 구조물을 포함하는 피사체를 LiDAR로 촬영하는 경우, 유리면에서 빛의 반사로 인한 가상의 포인트가 생성되어 실제 3차원 정보를 왜곡하는 문제가 있다. 포인트 클라우드의 후속 처리를 효율적으로 수행하기 위하여, 이러한 왜곡을 제거하는 전처리 기술이 필요하다. 본 고에서는 LiDAR의 취득 원리와 3차원 포인트 클라우드의 특성을 고찰하고, 유리 반사로 인한 왜곡된 가상의 포인트를 자동으로 검출하고 제거하는 새로운 연구 주제를 소개한다.

The direction of development of the no code platform for AI model development (AI 개발을 위한 노 코드 플랫폼의 개발 방향)

  • Shin, Yujin;Yang, Huijin;Jang, Dayoung;Jang, Hyeonjun;Koh, Seokju;Han, Donghee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.172-175
    • /
    • 2021
  • 4차 산업혁명이 시작된 이래로 다양한 산업 분야에서 AI가 활용되고 있고, 그 중에서도 컴퓨터 비전 분야에서 딥러닝 기술이 각광받고 있다. 하지만 딥러닝 기술은 높은 전문 지식이 요구되어 관련 지식이 없는 일반인들은 활용하기 어렵다. 본 논문에서는 AI 관련 배경지식이 없는 사용자들도 UI를 통해 쉽게 이미지 분류 모델을 학습시킬 수 있는 노 코드 플랫폼에 관하여 기술하고, django 프레임워크를 이용해 웹 개발과 딥러닝 모델 학습을 통합 개발을 위한 아키텍처와 방향성을 제시하고자 한다. 사용자가 웹서버에 업로드한 이미지들을 웹 인터페이스를 통해 라벨링 하여 학습 데이터를 생성한 후, 이 데이터를 사용하여 모델을 학습시킨다. CNN 모델에 데이터를 학습시키는 과정과 생성된 모델 기반으로 이미지 예측하는 모듈을 통해 전문지식이 없는 사용자가 딥러닝 기술에 대해 쉽게 이해하고 이용하는 것을 기대할 수 있다.

  • PDF

A Study on the Construction Equipment Object Extraction Model Based on Computer Vision Technology (컴퓨터 비전 기술 기반 건설장비 객체 추출 모델 적용 분석 연구)

  • Sungwon Kang;Wisung Yoo;Yoonseok Shin
    • Journal of the Society of Disaster Information
    • /
    • v.19 no.4
    • /
    • pp.916-923
    • /
    • 2023
  • Purpose: Looking at the status of fatal accidents in the construction industry in the 2022 Industrial Accident Status Supplementary Statistics, 27.8% of all fatal accidents in the construction industry are caused by construction equipment. In order to overcome the limitations of tours and inspections caused by the enlargement of sites and high-rise buildings, we plan to build a model that can extract construction equipment using computer vision technology and analyze the model's accuracy and field applicability. Method: In this study, deep learning is used to learn image data from excavators, dump trucks, and mobile cranes among construction equipment, and then the learning results are evaluated and analyzed and applied to construction sites. Result: At site 'A', objects of excavators and dump trucks were extracted, and the average extraction accuracy was 81.42% for excavators and 78.23% for dump trucks. The mobile crane at site 'B' showed an average accuracy of 78.14%. Conclusion: It is believed that the efficiency of on-site safety management can be increased and the risk factors for disaster occurrence can be minimized. In addition, based on this study, it can be used as basic data on the introduction of smart construction technology at construction sites.

An Efficient Deep Learning Based Image Recognition Service System Using AWS Lambda Serverless Computing Technology (AWS Lambda Serverless Computing 기술을 활용한 효율적인 딥러닝 기반 이미지 인식 서비스 시스템)

  • Lee, Hyunchul;Lee, Sungmin;Kim, Kangseok
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.6
    • /
    • pp.177-186
    • /
    • 2020
  • Recent advances in deep learning technology have improved image recognition performance in the field of computer vision, and serverless computing is emerging as the next generation cloud computing technology for event-based cloud application development and services. Attempts to use deep learning and serverless computing technology to increase the number of real-world image recognition services are increasing. Therefore, this paper describes how to develop an efficient deep learning based image recognition service system using serverless computing technology. The proposed system suggests a method that can serve large neural network model to users at low cost by using AWS Lambda Server based on serverless computing. We also show that we can effectively build a serverless computing system that uses a large neural network model by addressing the shortcomings of AWS Lambda Server, cold start time and capacity limitation. Through experiments, we confirmed that the proposed system, using AWS Lambda Serverless Computing technology, is efficient for servicing large neural network models by solving processing time and capacity limitations as well as cost reduction.

A Study on Technical Elements for Vision Therapy based on VR HMD (VR HMD에서의 비전 테라피 활용을 위한 기술 요소 연구)

  • Choi, Sangmi;Kim, Jungho;Kwon, Soonchul;Lee, Seunghyun
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.53 no.12
    • /
    • pp.161-168
    • /
    • 2016
  • Thanks to mass production and provision of smartphones and the HMD (head mounted display), VR (virtual reality) is now being applied to various areas. The VR HMD is the interface equipment which allows users to have realistic experiences through human sensory organs such as vision and auditory sense. Since the majority of VR equipment is operated by the display for both eyes, 360-degree video content and the depth information, the VR mechanism is closely related to human senses, especially vision. Previous studies have focused on how to minimize negative impact such as motion sickness or visual fatigue. Little attention has been paid on research about the visual treatment. Therefore, the focus of this study is to develop technical elements for utilization of vision therapy with the VR HMD and explore possible areas to apply it. To this end, we analyzed the past case studies and technical elements to identify 16 areas for vision therapy. We also developed the optical parameters for utilization of the VR HMD visual targets. The result of this study is expected to be utilized for development of visual targets for vision therapy based on the VR HMD.

YOLO based Optical Music Recognition and Virtual Reality Content Creation Method (YOLO 기반의 광학 음악 인식 기술 및 가상현실 콘텐츠 제작 방법)

  • Oh, Kyeongmin;Hong, Yoseop;Baek, Geonyeong;Chun, Chanjun
    • Smart Media Journal
    • /
    • v.10 no.4
    • /
    • pp.80-90
    • /
    • 2021
  • Using optical music recognition technology based on deep learning, we propose to apply the results derived to VR games. To detect the music objects in the music sheet, the deep learning model used YOLO v5, and Hough transform was employed to detect undetected objects, modifying the size of the staff. It analyzes and uses BPM, maximum number of combos, and musical notes in VR games using output result files, and prevents the backlog of notes through Object Pooling technology for resource management. In this paper, VR games can be produced with music elements derived from optical music recognition technology to expand the utilization of optical music recognition along with providing VR contents.

Real-time Abnormal Behavior Analysis System Based on Pedestrian Detection and Tracking (보행자의 검출 및 추적을 기반으로 한 실시간 이상행위 분석 시스템)

  • Kim, Dohun;Park, Sanghyun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.25-27
    • /
    • 2021
  • With the recent development of deep learning technology, computer vision-based AI technologies have been studied to analyze the abnormal behavior of objects in image information acquired through CCTV cameras. There are many cases where surveillance cameras are installed in dangerous areas or security areas for crime prevention and surveillance. For this reason, companies are conducting studies to determine major situations such as intrusion, roaming, falls, and assault in the surveillance camera environment. In this paper, we propose a real-time abnormal behavior analysis algorithm using object detection and tracking method.

  • PDF

Natural Hand Detection and Tracking (자연스러운 손 추출 및 추적)

  • Kim, Hye-Jin;Kwak, Keun-Chang;Kim, Do-Hyung;Bae, Kyung-Sook;Yoon, Ho-Sub;Chi, Su-Young
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.148-153
    • /
    • 2006
  • 인간-컴퓨터 상호작용(HCI) 기술은 과거 컴퓨터란 어렵고 소수의 숙련자만이 다루는 것이라는 인식을 바꾸어 놓았다. HCI 는 컴퓨터 사용자인 인간에게 거부감 없이 수용되기 위해 인간과 컴퓨터가 조화를 이루는데 많은 성과를 거두어왔다. 컴퓨터 비전에 기반을 두고 인간과 컴퓨터의 상호작용을 위하여 사용자 의도 및 행위 인식 연구들이 많이 행해져 왔다. 특히 손을 이용한 제스처는 인간과 인간, 인간과 컴퓨터 그리고 최근에 각광받고 있는 인간과 로봇의 상호작용에 중요한 역할을 해오고 있다. 본 논문에서 제안하는 손 추출 및 추적 알고리즘은 비전에 기반한 호출자 인식과 손 추적 알고리즘을 병행한 자연스러운 손 추출 및 추적 알고리즘이다. 인간과 인간 사이의 상호간의 주의집중 방식인 호출 제스처를 인식하여 기반하여 사용자가 인간과 의사소통 하는 것과 마찬가지로 컴퓨터/로봇의 주의집중을 끌도록 하였다. 또한 호출 제스처에 의해서 추출된 손동작을 추적하는 알고리즘을 개발하였다. 호출 제스처는 카메라 앞에 존재할 때 컴퓨터/로봇의 사용자가 자신에게 주의를 끌 수 있는 자연스러운 행동이다. 호출 제스처 인식을 통해 복수의 사람이 존재하는 상황 하에서 또한 원거리에서도 사용자는 자신의 의사를 전달하고자 함을 컴퓨터/로봇에게 알릴 수 있다. 호출 제스처를 이용한 손 추출 방식은 자연스러운 손 추출을 할 수 있도록 한다. 현재까지 알려진 손 추출 방식은 피부색을 이용하고 일정 범위 안에 손이 존재한다는 가정하에 이루어져왔다. 이는 사용자가 제스처를 하기 위해서는 특정 자세로 고정되어 있어야 함을 의미한다. 그러나 호출 제스처를 통해 손을 추출하게 될 경우 서거나 앉거나 심지어 누워있는 상태 등 자연스러운 자세에서 손을 추출할 수 있게 되어 사용자의 불편함을 해소 할 수 있다. 손 추적 알고리즘은 자연스러운 상황에서 획득된 손의 위치 정보를 추적하도록 고안되었다. 제안한 알고리즘은 색깔정보와 모션 정보를 융합하여 손의 위치를 검출한다. 손의 피부색 정보는 신경망으로 다양한 피부색 그룹과 피부색이 아닌 그룹을 학습시켜 얻었다. 손의 모션 정보는 연속 영상에서 프레임간에 일정 수준 이상의 차이를 보이는 영역을 추출하였다. 피부색정보와 모션정보로 융합된 영상에서 블랍 분석을 하고 이를 민쉬프트로 추적하여 손을 추적하였다. 제안된 손 추출 및 추적 방법은 컴퓨터/로봇의 사용자가 인간과 마주하듯 컴퓨터/로봇의 서비스를 받을 수 있도록 하는데 주목적을 두고 있다.

  • PDF