• 제목/요약/키워드: AI Video

검색결과 165건 처리시간 0.025초

A Study on the Predictive Analytics Powered by the Artificial Intelligence in the Movie Industry

  • Song, Minzheong
    • International journal of advanced smart convergence
    • /
    • 제10권4호
    • /
    • pp.72-83
    • /
    • 2021
  • The use of the predictive analytics (PA) powered by the artificial intelligence (AI) is more important in the movie sector during the COVID-19 pandemic, because Hollywood witnessed the impact of the 'Netflix Effect' and began to invest in data and AI. Our purpose is to discover a few cases of the AI centered PA in the movie industry value chain based on five objectives of PA: Compete, grow, enforce, improve, and satisfy. Even if movie companies' interest is to predict future success for competing with over-the-tops (OTTs) at a first glance, it is observed, once they start to use the PA with the AI, they try to utilize the enhanced PA platforms for remaining four objectives. As a result, ScriptBook, Vault, Pilot, Cinelytic and Merlin Video (Merlin) are use cases for the objective 'compete.' Movio of Vista Group International and Datorama of Salesforce are use cases for the objective 'grow.' Industrial Light & Magic (ILM) and Geena Davis Institute on Gender in Media (GDI) with Disney are use cases for the objective 'enforce.' Watson, Benjamin, and Greenlight Essential are use cases for the objective 'improve.' Disney Research (DR) with Simon Fraser University and California Institute of Technology is the use case for the objective 'satisfy.'

A Study of Video-Based Abnormal Behavior Recognition Model Using Deep Learning

  • Lee, Jiyoo;Shin, Seung-Jung
    • International journal of advanced smart convergence
    • /
    • 제9권4호
    • /
    • pp.115-119
    • /
    • 2020
  • Recently, CCTV installations are rapidly increasing in the public and private sectors to prevent various crimes. In accordance with the increasing number of CCTVs, video-based abnormal behavior detection in control systems is one of the key technologies for safety. This is because it is difficult for the surveillance personnel who control multiple CCTVs to manually monitor all abnormal behaviors in the video. In order to solve this problem, research to recognize abnormal behavior using deep learning is being actively conducted. In this paper, we propose a model for detecting abnormal behavior based on the deep learning model that is currently widely used. Based on the abnormal behavior video data provided by AI Hub, we performed a comparative experiment to detect anomalous behavior through violence learning and fainting in videos using 2D CNN-LSTM, 3D CNN, and I3D models. We hope that the experimental results of this abnormal behavior learning model will be helpful in developing intelligent CCTV.

VVC 의 다중 변환 선택을 고려한 신경망 기반 화면내 예측 (Neural Network-Based Intra Prediction Considering Multiple Transform Selection in Versatile Video Coding )

  • 박도현;문기화;임성창;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.8-9
    • /
    • 2022
  • 최근 VVC(Versatile Video Coding) 표준 완료 이후 JVET(Joint Video Experts Team)에서는 NNVC(Neural Network-based Video Coding) EE(Exploration Experiment)를 통하여 화면내 예측을 포함한 신경망 기반의 부호화 기술들을 탐색하고 검증하고 있다. 본 논문에서는 VVC 에 채택되어 있는 다중 변환 선택(MTS: Multiple Transform Selection)에 따라서 적절한 예측 블록을 선택할 수 있는 TDIP(Transform-Dependent Intra Prediction) 모델을 제안한다. 실험결과 제안기법은 VVC 의 AI(All Intra) 부호화 환경에서 VTM(VVC Test Model) 대비 Y, U, V 에 각각 0.87%, 0.87%, 0.99%의 BD-rate 절감의 비디오 부호화 성능 향상을 보였다.

  • PDF

차세대 비디오 코덱(JEM)의 고속 QTBT 분할 깊이 결정 기법 (A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM)

  • 윤용욱;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.541-547
    • /
    • 2017
  • 차세대 비디오 부호화 표준 기술 탐색을 진행하고 있는 JVET(Joint Video Exploration Team)의 참조 SW 코덱인 JEM(Joint Exploration Model)은 재귀적 QTBT(Quadtree plus Binary Tree) 분할 구조의 부호화단위(CU)를 제공한다. QTBT를 통하여 새로운 블록 형태를 추가하여 부호화 효율 이득을 얻을 수 있는 반면, 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 JEM 부호화기의 복잡도 감소를 위해 상위 분할 깊이(depth)와 현재 분할 깊이의 율-왜곡(Rate-Distortion: RD) 비용을 사용하는 고속 블록 분할 깊이 결정 기법을 제안한다. 실험결과 JEM 5.0 대비 AI(All Intra) 부호화 구조에서 0.7%의 BD-rate 증가에 21.6%의 부호화 시간 감소를 보였고, RA(Random Access)에서는 1.2%의 BD-rate 증가에 11.0%의 시간 감소 효과를 얻을 수 있었다.

VVC의 화면 내 예측에서 적응적 TBC를 사용하는 방법 (Adaptive TBC in Intra Prediction on Versatile Video Coding)

  • 이원준;박광훈
    • 방송공학회논문지
    • /
    • 제25권1호
    • /
    • pp.109-112
    • /
    • 2020
  • VVC는 화면 내 예측에서 67가지의 모드를 사용한다. 이때 화면 내 예측 모드 표현을 위한 데이터를 감소시키기 위하여 MPM(Most Probable Mode)을 사용한다. 시그널링 되는 모드가 MPM 후보 내에 존재하는 경우 MPM 리스트의 해당 index를 송신하는 방법을 사용하고 MPM 후보 내에 존재하지 않는 경우에는 TBC 부호화를 적용한다. 화면 내 예측에서 TBC가 적용될 때 MPM 후보를 제외하고 낮은 번호의 모드 순서대로 3가지가 선택되어 5비트로 부호화되고 나머지 모드는 6비트로 부호화된다. 본 논문에서는 VVC의 화면 내 예측에서 사용하는 TBC 기술의 한계점을 알아보고 화면 내 예측에서 TBC를 사용할 때 기존의 방법보다 효율적으로 부호화 할 수 있는 적응적인 방법을 제안한다. 그 결과 기존의 부호화 방법과 비교해서 overall 부호화 성능이 AI와 RA에서 각각 0.01%, 0.04%의 부호화 효율이 증대되었다.

ChatGPT는 우리에게 어떤 우려를 초래하는가?: 유튜브 영상 뉴스 댓글의 CTM(Correlated Topic Modeling) 분석을 중심으로 (What Concerns Does ChatGPT Raise for Us?: An Analysis Centered on CTM (Correlated Topic Modeling) of YouTube Video News Comments)

  • 송민호;이수범
    • 정보화정책
    • /
    • 제31권1호
    • /
    • pp.3-31
    • /
    • 2024
  • 본 연구는 ChatGPT로부터 촉박된 생성형 인공지능에 대해 국내의 특수성을 고려한 대중의 우려를 살펴보고자 하였다. 이를 위해 유튜브에서 102개의 윤리 관련 뉴스 영상에 포함된 댓글을 파이썬 스크래퍼를 개발하여 수집하였으며, 텍스톰을 통해 형태소 분석 및 전처리를 통해 15,735개 댓글을 대상으로 상관토픽모델(CTM)을 통해 분석하였다. 분석 결과, 뉴스 영상에 포함된 댓글의 주요 토픽은 '법적 및 윤리적 고려 사항', '지적 재산권 및 기술', '기술 발전과 인류 미래, 정보 처리에서 인공지능의 잠재력', 'AI에서의 감정 지능 및 윤리적 규제', '인간모방' 등 6개로 확인되었다. 또한 6개의 토픽을 10% 이상의 상관계수 값을 보이는 관계로 구조화한 결과 '법적 및 윤리적 고려 사항', 'ChatGPT의 데이터 생성 관련 이슈(지적 재산권 및 기술, 정보 처리에서의 인공지능의 잠재력, 인간모방', '인류 미래에 대한 두려움(기술 발전과 인류 미래, AI에서의 감정 지능 및 윤리적 규제)' 등 3개로 구조화할 수 있었다. 이를 바탕으로 ChatGPT로 인해 촉발된 생성형 인공지능에 관한 관심과 더불어 다양한 우려가 공존하고 있는 것을 확인하였고, 국내의 역사적 및 사회적 맥락을 반영한 특수성을 가진 우려도 존재하고 있음을 확인하였다. 이러한 결과를 통해 데이터 공정성에 대한 국가 주도의 노력이 필요함을 제안하였다.

동영상 시맨틱 이해를 위한 시각 동사 도출 및 액션넷 데이터베이스 구축 (Visual Verb and ActionNet Database for Semantic Visual Understanding)

  • 배창석;김보경
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.19-30
    • /
    • 2018
  • 영상 데이터에 대한 시맨틱 정보를 정확하게 이해하는 것은 인공지능 및 기계학습 분야에서 가장 어려운 도전과제의 하나로 알려져 있다. 본 논문에서는 동영상 시맨틱 이해를 위한 시각 동사 도출과 이를 바탕으로 하는 동영상 데이터베이스인 액션넷 데이터베이스 구축에 관해 제안하고 있다. 오늘날 인공지능 기술의 눈부신 발달에는 인공지능 알고리즘의 발전이 크게 기여하였지만 알고리즘의 학습과 성능 평가를 위한 방대한 데이터베이스의 제공도 기여한 바가 매우 크다고 할 수 있다. 인공지능이 도전하기 어려운 분야였던 시각 정보 처리에 있어서도 정지 영상 내의 객체인식에 있어서는 인간의 수준을 능가하기 시작하면서 점차 동영상에서의 내용에 대한 시맨틱 이해 기술 개발로 발전하고 있다. 본 논문에서는 이러한 동영상 이해를 위한 학습 및 테스트 데이터베이스로서 액션넷 구축에 요구되는 시각 동사의 후보를 도출한다. 이를 위해 언어학 기반의 동사 분류체계를 살펴보고, 영상에서의 시각 정보를 명세한 데이터 및 언어학에서의 시각 동사 빈도 등으로부터 시각 동사의 후보를 도출한다. 시각 동사 분류체계와 시각 동사후보를 바탕으로 액션넷 데이터베이스 스키마를 정의하고 구축한다. 본 논문에서 제안하는 시각 동사 및 스키마와 이를 바탕으로 하는 액션넷 데이터베이스를 개방형 환경에서 확장하고 활용성을 제고함으로써 동영상 이해 기술 발전에 기여할 수 있을 것으로 기대한다.

CompressAI 를 활용한 객체 검출 네트워크 피쳐 맵 압축 (Object Detection Network Feature Map Compression using CompressAI)

  • 도지훈;이주영;김연희;최진수;정세윤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.7-9
    • /
    • 2021
  • 본 논문은 Detectron2 [1]에서 지원하는 객체 검출 임무 수행 네트워크의 과정 중에서 추출한 피쳐 맵을 신경망 기반으로 압축하는 방법을 제안한다. 이를 위해, 신경 망 기반 영상 압축을 지원하는 공개 소프트웨어인 CompressAI [2] 모델 중 하나인 bmshj2018-hyperprior 의 압축 네트워크를 활용하여 임무 수행 네트워크의 과정 중 스탬 레이어(stem layer)에서 추출된 피쳐 맵을 압축하도록 학습시켰다. 또한, 압축 네트워크의 입력 피쳐 맵의 너비와 높이 크기가 64 의 배수가 되도록 객체 검출 네트워크의 입력 영상 보간 값을 조정하는 방법도 제안한다. 제안하는 신경망 기반 피쳐 맵 압축 방법은 피쳐 맵을 최근 표준이 완료된 차세대 압축 표준 방법인 VVC(Versatile Video Coding, [3])로 압축한 결과에 비해 큰 성능 향상을 보이고, VCM 앵커와 유사한 성능을 보인다.

  • PDF

열영상과 IoT를 이용한 AI 바이러스 차단을 위한 딥러닝 알고리즘 비교에 대한 연구 (A Study on Deep learning algorithm comparison for Block AI virus using thermal video and IoT)

  • 노승현;서호준;김혜인;김정민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1097-1100
    • /
    • 2021
  • 열영상과 IoT를 이용한 AI 바이러스 차단 시스템 개발에 필요한 열화상 체온 측정기의 열 측정 정확도 향상과 얼굴 인식 시간 단축을 위해 열화상에 사용되는 딥러닝 알고리즘을 비교하며 효율적인 알고리즘 발굴 및 열영상을 이용한 바이러스 차단 시스템에 적합한 열영상 알고리즘 보완 방법을 찾는 연구이다.

인공지능기반의 자동 창작 영상에 관한 논구 (A Discussion on AI-based Automated Picture Creations)

  • 김정회;윤준성
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.723-730
    • /
    • 2024
  • 본 연구는 자동 창작 영상에 관한 개념과 이해의 변화를 추적하기 위하여, 기존의 영상분야를 대표하는 사진과 영화의 창작 방식을 인공지능 기반의 영상 창작 방법과 '자동'이라는 측면에서 유비적으로 탐구하고, 새로운 자동영상창작에 관한 이해와 가능성을 논구 한다. 사진과 영화의 발명 시기에는, 회화를 비롯한 전통예술 장르와 비견하여, 이들에게 '자동 창작'이라는 영역을 설정한 바 있다. 최근 인공지능이 영상 제작에도 적용되면서 '자동 창작'에 관한 개념도 확장되어, 기존의 문학, 미술, 사진, 영화의 경계를 자유롭게 넘나드는 실험적 창작이 활발하다. 인공지능의 자동 창작은 머신 러닝과 딥 러닝과 같은 기술을 활용하여, 인공지능이 독립적으로 창작 과정을 수행하게 한다. 인공지능을 활용한 자동 창작은 효율성을 크게 향상시킬 수 있지만, 동시에 예술창작과정의 주관적인 판단의 문제에 직면하게 된다. 자동 창작으로 몰렸던 사진과 영화의 창작과정과 인공지능의 창작과정을 비교하면, 자동 창작 영상의 입면은 작가의 문제로 귀착될 수 있다. 그러나 다원적이 예술분야가 소통할 수 있는 기회로 작동된다면, 인공지능기반의 자동 창작 영상은 장르를 넘나드는 방법론이 될 수 있을 것이다.