• 제목/요약/키워드: AI Video

검색결과 162건 처리시간 0.025초

한국어 립리딩: 데이터 구축 및 문장수준 립리딩 (Korean Lip-Reading: Data Construction and Sentence-Level Lip-Reading)

  • 조선영;윤수성
    • 한국군사과학기술학회지
    • /
    • 제27권2호
    • /
    • pp.167-176
    • /
    • 2024
  • Lip-reading is the task of inferring the speaker's utterance from silent video based on learning of lip movements. It is very challenging due to the inherent ambiguities present in the lip movement such as different characters that produce the same lip appearances. Recent advances in deep learning models such as Transformer and Temporal Convolutional Network have led to improve the performance of lip-reading. However, most previous works deal with English lip-reading which has limitations in directly applying to Korean lip-reading, and moreover, there is no a large scale Korean lip-reading dataset. In this paper, we introduce the first large-scale Korean lip-reading dataset with more than 120 k utterances collected from TV broadcasts containing news, documentary and drama. We also present a preprocessing method which uniformly extracts a facial region of interest and propose a transformer-based model based on grapheme unit for sentence-level Korean lip-reading. We demonstrate that our dataset and model are appropriate for Korean lip-reading through statistics of the dataset and experimental results.

현장 조사와 ICT 동향 분석을 통한 스몸비 현황과 개선 방안 연구 (A Study on the Current Situation and Improved Method for the Smombie through Field Survey and ICT Trend Analysis)

  • 이동훈;오혜수;장재민;정종운;양상운
    • 한국안전학회지
    • /
    • 제35권5호
    • /
    • pp.74-85
    • /
    • 2020
  • Smart phone zombie or Smombie means pedestrians who walk without attention to their surroundings because they are focused upon their smart phone. Because the traffic accidents and injuries caused by Smombie have been increased rapidly in recent years, the social attention and policies are needed to prevent it. This study was conducted to analyze Smombie's current status and some solutions used before and to propose new improved method through the latest ICT trend. In this study, we did the field survey to check Smombies at several places in Seoul through people counting, and found that a lot of pedestrians still use the smart phone while walking. And we analyzed many case studies about some solutions to prevent Smombies previously. The case studies include legal regulations, government policies, smart phone app services and facilities that are used before. We studied them through internet searches and reference studies and we also checked the current operating situation as visiting several places that the solutions actually has been operated. Therefore, we found there are some limitations in previous solutions in terms of effectiveness and management. To consider new solution that can be expected to overcome the limitations, we analyzed the latest ICT trends focused on features to utilize the Smombie prevention, especially video recognition and digital signage. In these days, video recognition has been developed rapidly with assistance of AI technology and it can recognize the specific pedestrian's characteristics such as holding smart phone as well as hair style, clothes, backpack and etc. On the other hands, the digital signage is the convergence device that includes big display, network connection and various IoT sensors. It can be used as public media in many places for public services as well as advertising. Through these analysis results, we show the requirements and the user scenario for the improved method to prevent Smombie. Finally, we propose to develop R&D technology to recognize Smombie exactly as pedestrian attributes and to spread creative contents to increase pedestrian's interest and engagement for Smombie prevention through digital signage.

Computer Vision-based Continuous Large-scale Site Monitoring System through Edge Computing and Small-Object Detection

  • Kim, Yeonjoo;Kim, Siyeon;Hwang, Sungjoo;Hong, Seok Hwan
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.1243-1244
    • /
    • 2022
  • In recent years, the growing interest in off-site construction has led to factories scaling up their manufacturing and production processes in the construction sector. Consequently, continuous large-scale site monitoring in low-variability environments, such as prefabricated components production plants (precast concrete production), has gained increasing importance. Although many studies on computer vision-based site monitoring have been conducted, challenges for deploying this technology for large-scale field applications still remain. One of the issues is collecting and transmitting vast amounts of video data. Continuous site monitoring systems are based on real-time video data collection and analysis, which requires excessive computational resources and network traffic. In addition, it is difficult to integrate various object information with different sizes and scales into a single scene. Various sizes and types of objects (e.g., workers, heavy equipment, and materials) exist in a plant production environment, and these objects should be detected simultaneously for effective site monitoring. However, with the existing object detection algorithms, it is difficult to simultaneously detect objects with significant differences in size because collecting and training massive amounts of object image data with various scales is necessary. This study thus developed a large-scale site monitoring system using edge computing and a small-object detection system to solve these problems. Edge computing is a distributed information technology architecture wherein the image or video data is processed near the originating source, not on a centralized server or cloud. By inferring information from the AI computing module equipped with CCTVs and communicating only the processed information with the server, it is possible to reduce excessive network traffic. Small-object detection is an innovative method to detect different-sized objects by cropping the raw image and setting the appropriate number of rows and columns for image splitting based on the target object size. This enables the detection of small objects from cropped and magnified images. The detected small objects can then be expressed in the original image. In the inference process, this study used the YOLO-v5 algorithm, known for its fast processing speed and widely used for real-time object detection. This method could effectively detect large and even small objects that were difficult to detect with the existing object detection algorithms. When the large-scale site monitoring system was tested, it performed well in detecting small objects, such as workers in a large-scale view of construction sites, which were inaccurately detected by the existing algorithms. Our next goal is to incorporate various safety monitoring and risk analysis algorithms into this system, such as collision risk estimation, based on the time-to-collision concept, enabling the optimization of safety routes by accumulating workers' paths and inferring the risky areas based on workers' trajectory patterns. Through such developments, this continuous large-scale site monitoring system can guide a construction plant's safety management system more effectively.

  • PDF

분산 멀티미디어 스트리밍 시스템 설계 및 구현 (Design and Implementation of a Distribute Multimedia System)

  • 김상국;신화종;김세영;신동규;신동일
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.66-69
    • /
    • 2000
  • 웹이 등장하면서 지금까지 인터넷 상에서 텍스트와 이미지를 이용하여 정보를 표현하고 전달하는 방법이 가장 많이 사용되어왔다. 그러나 웹 관련 기술의 비약적인 발달과 네트워크 속도의 증가 및 인터넷의 급속한 보급으로 단순한 텍스트와 이미지 중심의 HTML 문서를 이용한 정보의 전달이 아닌 멀티미디어 데이터를 이용한 정보의 표현과 전달이 점차 증대되고 있다. 이에 따라 멀티미디어 데이터를 전송하기 위한 스트리밍 프로토콜도 등장하였다. 최근에는 컴퓨터의 성능 증가 및 네트워크 속도의 증가(초고속 통신 서비스의 보급)에 의해 멀티미디어 데이터의 전송이 가능하게 됨으로써 기존의 공중파나 CATV 방송국의 형태 지니고 인터넷 상에서 실시간 생방송 서비스와 VOD(Video On Demand) 서비스를 제공하는 인터넷 방송국이 급속하게 생겨나고 있다. (11) 인터넷 방송은 동영상과 오디오의 실시간 전달을 가능하게 하는 멀티미디어 스트리밍 기술과 멀티미디어를 실시 간으로 전송할 수 있는 실시간 전송 프로토콜을 기반으로 발전하고 있다. 인터넷 상에서 멀티미디어 스트리밍 서비스를 하는 대부분의 인터넷 방송은 스트리밍 서버로서 RealNetworks사의 RealSystem과 Microsoft사의 WMT(Windows Media Technologies)를 사용하고 있다. 본 논문은 Real Server와 WMT의 비교 분석을 통해 실시간 전송 프로토콜을 지원하고, 멀티미디어 스트리밍 기술을 지원하는 자바를 기반으로 한 분산 서버 구조의 스트리밍 서버, 서버간의 부하를 제어하는 미들웨어, 멀티미디어 스트림을 재생할 수 있는 클라이언트를 설계하고 구현한다.있다.구현한다. 이렇게 구현된 시스템은 전자 상거래, 가상 쇼핑몰, 가상 전시화, 또는 3차원 게임이나 가상교육 시스템과 같은 웹기반 응용프로그램에 사용될 수 있다.물을 보존·관리하는 것이 필요하다. 이는 도서관의 기능만으로는 감당하기 어렵기 때문에 대학정보화의 센터로서의 도서관과 공공기록물 전문 담당자로서의 대학아카이브즈가 함께 하여 대학의 공식적인 직무 관련 업무를 원활하게 지원하고, 그럼으로써 양 기관의 위상을 높이는 상승효과를 낼 수 있다.하여는, 인쇄된 일차적 정보자료의 검색방법등을 개선하고, 나아가서는 법령과 판례정보를 위한 효율적인 시스템을 구축하며, 뿐만 아니라 이용자의 요구에 충분히 대처할 수 잇는 도서관으로 변화되는 것이다. 이와 함께 가장 중요한 것은 법과대학과 사법연수원에서 법학 연구방법에 관한 강좌를 개설하여 각종 법률정보원의 활용 내지 도서관 이용방법에 관하여 교육하는 것이다.글을 연구하고, 그 결과에 의존하여서 우리의 실제의 생활에 사용하는 $\boxDr$한국어사전$\boxUl$등을 만드는 과정에서, 어떤 의미에서 실험되었다고 말할 수가 있는 언어과학의 연구의 결과에 의존하여서 수행되는 철학적인 작업이다. 여기에서는 하나의 철학적인 연구의 시작으로 받아들여지는 이 의미분석의 문제를 반성하여 본다. 것이 필요하다고 사료된다.크기에 의존하며, 또한 이러한 영향은 $(Ti_{1-x}AI_{x})N$ 피막에 존재하는 AI의 함량이 높고, 초기에 증착된 막의 업자 크기가 작을 수록 클 것으로 여겨진다. 그리고 환경의 의미의 차이에 따라 경관의 미학적 평가가 달라진 것으로

  • PDF

CCTV 영상을 활용한 동적 객체의 위치 추적 및 시각화 방안 (Location Tracking and Visualization of Dynamic Objects using CCTV Images)

  • 박상진;조국;임준혁;김민찬
    • 지적과 국토정보
    • /
    • 제51권1호
    • /
    • pp.53-65
    • /
    • 2021
  • 국내·외적으로 수행되고 있는 다양한 C-ITS 관련 도로 인프라 구축 사업들은 다양한 센서 기술들을 융합적으로 활용하고 있으며, 도로 인프라의 효율성과 신뢰성을 높이기 위해 센서 관련 기술 향상에 많은 노력을 하고 있다. 최근에는 인공지능 기술의 발전으로 영상정보를 수집하는 CCTV의 역할은 더욱 중요해지고 있다. CCTV는 현재 도로 상태 및 상황, 보안 등의 이유로 많은 양이 구축되어 운영되고 있으나, 단순한 영상 모니터링에 주로 활용되고 있어 자율주행 측면에서 센서들에 비해 활용도가 부족한 실정이다. 본 연구에서는 기구축된 CCTV영상에서 이동체(차량·사람 등)들을 식별·추적하고, 이들의 정보를 다양한 환경에서 활용할 수 있도록 분석·제공하는 방안을 제안한다. 이를 위해 Yolov4와 Deep sort 알고리즘을 활용한 이동체 식별·추적과 Kafka 기반의 실시간 다중 사용자 지원 서버 구축, 영상과 공간 좌표계 간의 변환 행렬 정의, 그리고 정밀도로지도, 항공맵 등을 활용한 맵기반 이동체 시각화를 진행하였으며, 유용성을 확인하기 위한 위치 정합도 평가를 수행하였다. 제안된 방안을 통해 CCTV가 단순한 모니터링 역할을 넘어 도로 인프라 측면에서 도로 상황을 실시간으로 분석하여 관련 정보를 제공할 수 있는 중요한 센서로써의 역할을 할 수 있음을 확인하였다.

엔트리를 활용한 초등 데이터 과학 교육 사례 연구 (A Study on Elementary Education Examples for Data Science using Entry)

  • 허경
    • 정보교육학회논문지
    • /
    • 제24권5호
    • /
    • pp.473-481
    • /
    • 2020
  • 데이터과학은 스몰데이터 분석에서 출발하여, 빅데이터 분석을 위한 머신러닝, 딥러닝까지 포함하고 있다. 데이터과학은 인공지능 기술의 핵심 영역이고, 학교 교육과정에 체계적으로 반영해야 할 내용이다. 데이터과학 교육을 위해, 엔트리에서도 초등교육용 데이터 분석 도구를 제공하고 있다. 빅데이터 분석에서는 데이터 표본을 추출하여, 통계학적인 추측과 판단을 통해 분석결과를 해석한다. 본 논문에서는 통계학적인 지식을 필요로 하는 빅데이터 분석 영역을 초등영역에서 제외하기로 하고, 초등영역에 초점을 맞춘 데이터과학 교육 사례를 제안하였다. 이를 위해서, 일반적인 데이터과학 교육 단계를 먼저 설명하고, 초등 데이터과학 교육 단계를 새롭게 제안하였다. 그리고 엔트리에서 제공하는 공공 스몰 데이터를 사용한 데이터 변수 값 비교 사례와 데이터 변수 간 상관관계 분석 사례를 초등 데이터과학 교육 단계에 따라 제안하였다. 본 논문에서 제안된 엔트리 데이터분석 사례들을 활용하면, 여러 교과에서 발생하는 데이터를 사용한 초등 데이터과학 융합 교육이 가능하다. 또한, 엔트리를 사용하여 텍스트, 음성 및 영상인식 AI 도구와 결합한 데이터과학 교육 자료도 개발 가능하다.

대학생 대상 비대면 온라인 수업에서의 강의 콘텐츠 운영 실태 연구 (A Study on the Operating Conditions of Lecture Contents in Contactless Online Classes for University Students)

  • 이종문
    • 한국비블리아학회지
    • /
    • 제32권4호
    • /
    • pp.5-24
    • /
    • 2021
  • 본 연구의 목적은 대학생을 대상으로 비대면 온라인 수업에서의 강의 콘텐츠 운영 실태를 조사 분석하기 위해 수행되었다. 93명의 응답지를 분석한 결과, 첫째 응답자의 93.3%가 실시간 화상 강의(47.7%) 또는 녹화 강의(45.6%)의 형태의 온라인 강의를 수강한 것으로 나타났다. 둘째 교재로 사용한 콘텐츠를 분석한 결과, 교양(47.3%)과 전공(39.8%) 모두에서 전자책(자료)과 종이 책(자료)을 혼용하거나 전자 책 또는 자료(각각 36.6%, 37.6%)를 사용한 것으로 나타났다. 교재 이외에 외부자료는 전공과 교양 모두 웹자료(각각 47.6%, 40.5%)와 유튜브 자료(각각 33.3%, 48.0%) 활용이 높은 것으로 나타났다. 셋째 강의 내용 공유를 위한 콘텐츠는 교양 전공 모두에서 교수자가 정리, 저술한 PT 또는 텍스트 형태의 전자파일(각각 62.9%, 58.1%), 인터넷 자료(각각 16.7%, 19%), 종이 책 또는 자료(각각 10.4%, 12.3%) 순으로 나타났다. 전공과목에서는 93.5%가, 교양과목에서는 90.2%가 화면 현시 강의 콘텐츠에 만족하는 것으로 나타났다. 분석결과를 토대로, 첫째 멀티미디어 기반의 강의 콘텐츠를 개발할 것과 실시간 시험 감독 등이 가능한 평가 솔루션을 개발할 것을 제언하였다. 둘째 과제물에 대한 AI 기반의 표절검색, 과제지도, 과제평가 등이 가능한 과제물관리시스템을 개발할 것을 제언하였다. 셋째 유비쿼터스 개념에서 수업이 가능하도록 강의 교재 전자화를 위한 저작권문제 해결 방안을 제도화할 것을 제언하였다.

무장 선택을 위한 딥러닝 기반의 비행체 식별 기법 연구 (A Study on Deep Learning based Aerial Vehicle Classification for Armament Selection)

  • 차은영;김정창
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.936-939
    • /
    • 2022
  • 최근 공중 전투체계 기술들이 발전함에 따라 대공방어 시스템의 발전이 요구되고 있다. 대공 방어 시스템의 운용개념에 있어, 표적에 적합한 무장을 선택하는 것은 제한된 대공 전력을 사용하여 위협체에 대해 효율적으로 대응한다는 측면에서 체계에 요구되는 능력 중 하나이다. 비행 위협체의 식별에 있어 많은 부분이 운용자의 육안 식별에 의존하는데 고속으로 기동하고 원거리에 위치한 비행체를 육안으로 판별하는 것은 많은 한계가 있다. 뿐만 아니라, 현대 전장에서 무인화 및 지능화된 무기체계의 수요가 증가함에 따라 운용자의 육안 식별 대신 체계가 자동으로 비행체를 식별하고 분류하는 기술의 개발이 필수적이다. 영상자료를 수집해 딥러닝 기반의 모델을 이용하여 무기체계를 식별한 사례로는 전차와 함정 등이 있지만 비행체의 식별에 대한 연구는 아직 많이 부족한 상황이다. 따라서 본 논문에서는 합성곱 신경망 모델을 이용하여 전투기, 헬기, 드론을 분류하는 모델을 제시하고 제시하는 모델의 성능을 분석한다. 본 논문에서 제시하는 모델은 시험세트에 대해 95% 이상의 정확도를 보이고, precision 0.9579, recall 0.9558, F1-socre 0.9568의 값을 나타내는 것을 확인할 수 있다.

AI를 이용한 홈CCTV 영상의 반려묘 행동 패턴 분석 및 질병 예측 시스템 연구 (Cat Behavior Pattern Analysis and Disease Prediction System of Home CCTV Images using AI)

  • 한수연;박대우
    • 한국정보통신학회논문지
    • /
    • 제26권9호
    • /
    • pp.1266-1271
    • /
    • 2022
  • 반려동물 중 반려묘의 비중이 2012년 이후 연평균 25.4%의 증가율을 보이며 증가하는 추세이다. 고양이는 강아지에 비해 야생성이 강하게 남아있기 때문에 질병이 생기면 잘 숨기는 특성이 있다. 보호자가 반려묘가 질병이 있음을 알게 되었을 때는 병이 이미 악화되어진 상태일 수 있다. 반려묘의 식욕부진(식사회피), 구토, 설사, 다음, 다뇨 등과 같은 현상은 당뇨, 갑상선기능항진증, 신부전증, 범백혈구감소증 등 고양이 질병 시 나타나는 증상 중 일부이다. 반려묘의 다뇨(소변 양이 많음), 다음(물 많이 마심), 빈뇨(소변을 자주 봄) 현상을 보호자가 보다 빨리 알아차릴 수 있다면 반려묘의 질병 치료에 크게 도움이 될 것이다. 본 논문에서는 인공지능 디바이스에서 작동하는 1) 자세 예측 DeepLabCut의 Efficient 버전, 2) 객체 검출 YOLO v4, 3) 행동 예측 LSTM 4) 객체 추적은 BoT-SORT를 사용한다. 인공지능 기술을 이용하여 홈 CCTV의 영상에서 반려묘의 행동 패턴 분석과 물그릇의 무게 센서를 통해 반려묘의 다음, 다뇨 및 빈뇨를 예측한다. 그리고, 반려묘 행동 패턴 분석을 통해, 질병 예측 및 이상행동 결과를 보호자에게 리포트 하는, 메인 서버시스템과 보호자의 모바일로 전달하는 애플리케이션을 제안한다.

AI를 이용한 홈CCTV 영상의 반려묘 행동 패턴 분석 및 질병 예측 시스템 연구 (Cat Behavior Pattern Analysis and Disease Prediction System of Home CCTV Images using AI)

  • 한수연;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.165-167
    • /
    • 2022
  • 반려동물 중 반려묘의 비중이 2012년 이후 연평균 25.4%의 증가율을 보이며 증가하는 추세이다. 고양이는 강아지에 비해 야생성이 강하게 남아있기 때문에 질병이 생기면 잘 숨기는 특성이 있다. 보호자가 반려묘가 질병이 있음을 알게 되었을 때는 병이 이미 악화되어진 상태일 수 있다. 반료묘의 식욕부진(식사회피), 구토, 설사, 다음, 다뇨 등과 같은 현상은 당뇨, 갑상선기능항진증, 신부전증, 범백혈구감소증 등 고양이 질병 시 나타나는 증상 중 일부이다. 반려묘의 다음(물 많이 마심), 다뇨(소변의 양이 많음), 빈뇨(소변을 자주 봄) 현상을 보호자가 보다 빨리 알아차릴 수 있다면 반려묘의 질병 치료에 크게 도움이 될 것이다. 본 논문에서는 인공지능 서버에서 작동하는 1) 자세 예측 DeepLabCut의 Efficient버전, 2) 객체 검출 yolov4, 3) 행동 예측은 LSTM을 사용한다. 인공지능 기술을 이용하여 홈 CCTV의 영상에서 반려묘의 행동 패턴 분석과 물그릇의 무게 센서를 통해 반려묘의 다음, 다뇨 및 빈뇨를 예측한다. 그리고, 반려묘 행동 패턴 분석을 통해, 질병 예측 및 이상행동 결과를 보호자에게 리포트 하는, 메인 서버시스템과 보호자의 모바일로 전달하는 애플리케이션을 제안한다.

  • PDF