• Title/Summary/Keyword: 영상기반AI

Search Result 237, Processing Time 0.045 seconds

Noise Robust Baseball Event Detection with Multimodal Information (멀티모달 정보를 이용한 잡음에 강인한 야구 이벤트 시점 검출 방법)

  • Young-Ik Kim;Hyun Jo Jung;Minsoo Na;Younghyun Lee;Joonsoo Lee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.136-138
    • /
    • 2022
  • 스포츠 방송/미디어 데이터에서 특정 이벤트 시점을 효율적으로 검출하는 방법은 정보 검색이나 하이라이트, 요약 등을 위해 중요한 기술이다. 이 논문에서는, 야구 중계 방송 데이터에서 투구에 대한 타격 및 포구 이벤트 시점을 강인하게 검출하는 방법으로, 음향 및 영상 정보를 융합하는 방법에 대해 제안한다. 음향 정보에 기반한 이벤트 검출 방법은 계산이 용이하고 정확도가 높은 반면, 영상 정보의 도움 없이는 모호성을 해결하기 힘든 경우가 많이 발생한다. 특히 야구 중계 데이터의 경우, 투수의 투구 시점에 대한 영상 정보를 활용하여 타격 및 포구 이벤트 검출의 정확도를 보다 향상시킬 수 있다. 이 논문에서는 음향 기반의 딥러닝 이벤트 시점 검출 모델과 영상 기반의 보정 방법을 제안하고, 실제 KBO 야구 중계 방송 데이터에 적용한 사례와 실험 결과에 대해 기술한다.

  • PDF

AI Announcer : Information Transfer Software Using Artificial Intelligence Technology (AI 아나운서 : 인공지능 기술을 이용한 정보 전달 소프트웨어)

  • Kim, Hye-Won;Lee, Young-Eun;Lee, Hong-Chang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.937-940
    • /
    • 2020
  • 본 논문은 AI 기술을 기반으로 텍스트 스크립트를 자동으로 인식하고 영상 합성 기술을 응용하여 텍스트 정보를 시각화하는 AI 아나운서 소프트웨어 연구에 대하여 기술한다. 기존의 AI 기반 영상 정보 전달 서비스인 AI 앵커는 텍스트를 인식하여 영상을 합성하는데 오랜 시간이 필요하였으며, 특정 인물 이미지로만 영상 합성이 가능했기 때문에 그 용도가 제한적이었다. 본 연구에서 제안하는 방법은 Tacotron 으로 새로운 음성을 학습 및 합성하여, LRW 데이터셋으로 학습된 모델을 사용하여 자연스러운 영상 합성 체계를 구축한다. 단순한 얼굴 이미지의 합성을 개선하고 다채로운 이미지 제작을 위한 과정을 간략화하여 다양한 비대면 영상 정보 제공 환경을 구성할 수 있을 것으로 기대된다.

A Realization of FPGA-based Image Recognition System (FPGA기반 영상인식 시스템 구현)

  • Young Yun
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.11a
    • /
    • pp.349-350
    • /
    • 2022
  • Recently, AI (Artificial Intelligence) has been applied to various technologies such as automatic driving, robot and smart communication. Currently, AI system is developed by software-based method using tensor flow, and GPU (Graphic Processing Unit) is employed for processing unit. In this work, we developed an FPGA-based (Field Programmable Gate Array) AI system , and report on image recognition system to realize the AI system.

  • PDF

Diagnosis of Calcification of Lung Nodules on the Chest X-ray Images using Gray-Level based Analysis (흉부 X-ray 영상 내 폐 결절의 석회화 여부 진단을 위한 화소 밝기 분석 기법)

  • Hyeon-Jin Choi;Dong-Yeon Yoo;Joo-Sung Sun;Jung-Won Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.681-683
    • /
    • 2023
  • 폐암은 전 세계적으로 사망률이 가장 높은 암 질환으로, 조기 발견 및 신속한 치료를 위해서는 흉부 X-ray 영상 내 악성 결절을 놓치지 않는 것이 중요하다. 그러나 흉부 X-ray 영상은 정밀도의 한계로 진단 결과에 대한 신뢰도가 낮아, 이를 보조하는 도구의 개발이 요구된다. 기존의 폐암 진단 보조 도구는 학습 기반의 기법으로, 진단 결과에 대한 설명성(explainability)이 없다는 위험성을 갖는다. 이에 본 논문에서는 통계 분석에 기반한 결절의 석회화 여부 진단 기법을 제안한다. 제안하는 기법은 결절과 해부학적 구조물의 밝기 차 분포로부터 석회화 여부를 판단하며, 그 결과 민감도 65.22%, 특이도 88.48%, 정확도 83.41%의 성능을 보였다.

An Efficiency Analysis of an Artificial Intelligence Medical Image Analysis Software System : Focusing on the Time Behavior of ISO/IEC 25023 Software Quality Requirements (인공지능 기술 기반의 의료영상 판독 보조 시스템의 효율성 분석 : ISO/IEC 25023 소프트웨어 품질 요구사항의 Time Behavior를 중심으로)

  • Chang-Hwa Han;Young-Hwang Jeon;Jae-Bok Han;Jong-Nam Song
    • Journal of the Korean Society of Radiology
    • /
    • v.17 no.6
    • /
    • pp.939-945
    • /
    • 2023
  • This study analyzes the 'performance efficiency' of AI-based reading assistance systems in the field of radiology by measuring their 'time behavior' properties. Due to the increase in medical images and the limited number of radiologists, the adoption of AI-based solutions is escalating, stimulating a multitude of studies in this area. Contrary to the majority of past research which centered on AI's diagnostic precision, this study underlines the significance of time behavior. Using 50 chest X-ray PA images, the system processed images in an average of 15.24 seconds, demonstrating high consistency and reliability, which is on par with leading global AI platforms, suggesting the potential for significant improvements in radiology workflow efficiency. We expect AI technology to play a large role in the field of radiology and help improve overall healthcare quality and efficiency.

A Discussion on AI-based Automated Picture Creations (인공지능기반의 자동 창작 영상에 관한 논구)

  • Junghoe Kim;Joonsung Yoon
    • The Journal of the Convergence on Culture Technology
    • /
    • v.10 no.3
    • /
    • pp.723-730
    • /
    • 2024
  • In order to trace the changes in the concept and understanding of automatically generated images, this study analogously explores the creative methods of photography and cinema, which represent the existing image fields, in terms of AI-based image creation methods and 'automaticity', and discusses the understanding and possibilities of new automatic image creation. At the time of the invention of photography and cinema, the field of 'automatic creation' was established for them in comparison to traditional art genres such as painting. Recently, as AI has been applied to video production, the concept of 'automatic creation' has been expanded, and experimental creations that freely cross the boundaries of literature, art, photography, and film are active. By utilizing technologies such as machine learning and deep learning, AI automated creation allows AI to perform the creative process independently. Automated creation using AI can greatly improve efficiency, but it also risks compromising the personal and subjective nature of art. The problem stems from the fact that AI cannot completely replace human creativity.

JPEG AI의 부호화 프레임워크들의 분석 및 활용 사례에 대한 소개

  • 한승진;김영섭
    • Broadcasting and Media Magazine
    • /
    • v.28 no.1
    • /
    • pp.13-28
    • /
    • 2023
  • 이미지 압축은 이미지 및 영상처리에서 주요한 역할을 하며, 자율주행, 클라우드, 영상 송출 등의 분야에서 빅데이터를 처리해야 하는 수요가 늘어남에 따라 지속적인 연구가 진행 중이다. 그 중심에는 딥러닝(deep learning)의 발전이 자리잡고 있으며, 심층 신경망(deep neural network)을 효과적으로 학습하는 알고리즘들을 적용한 논문들은 기존 압축 포맷인 JPEG, JPEG 2000, MPEG 등의 압축 성능을 뛰어넘는 결과를 보여 주고 있다. 이에 따라 JPEG AI는 딥러닝 기반 학습 이미지 압축의 표준을 제정하는 일을 진행 중이다. 본 기고에서는 JPEG AI가 표준화하고자 하는 기술과 JPEG AI에 제안한 압축 프레임워크들을 분석하고, 활용 사례들을 소개하여 JPEG AI 기반 학습 이미지 압축 모델의 동향에 대해 알아보고자 한다.

  • PDF

A Study on the Application Model of AI Convergence Services Using CCTV Video for the Advancement of Retail Marketing (리테일 마케팅 고도화를 위한 CCTV 영상 데이터 기반의 AI 융합 응용 서비스 활용 모델 연구)

  • Kim, Jong-Yul;Kim, Hyuk-Jung
    • Journal of Digital Convergence
    • /
    • v.19 no.5
    • /
    • pp.197-205
    • /
    • 2021
  • Recently, the retail industry has been increasingly demanding information technology convergence and utilization to respond to various external environmental threats such as COVID-19 and to be competitive using AI technologies, but there is a very lack of research and application services. This study is a CCTV video data-driven AI application case study, using CCTV image data collection in retail space, object detection and tracking AI model, time series database to store real-time tracked objects and tracking data, heatmap to analyze congestion and interest in retail space, social access zone.We present the orientation and verify its usability in the direction designed through practical implementation.

Development of AI based Autonomous Driving System for Outdoor Cleaning Robot (실외 청소 로봇를 위한 인공지능기반 자율 주행 시스템 개발에 관한 연구)

  • KO, Kuk Won;LEE, Ji Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.526-528
    • /
    • 2022
  • 실외 자율주행 청소 로봇을 위한 인공지능기반 자율주행 시스템을 개발하였다. 개발된 시스템은 ROS(Robot Operationg System) 기반으로 이루어졌으며, 3D 라이다와, 초음파 센서를 활용하여 주변의 장애물을 감지하고 GPS와 영상을 활용하여 로봇의 위치 인식을 하여 자율 주행을 진행하였다. 자율주행 실험결과 영상과 RTK-GPS를 사용하여 정해진 경로를 ±20cm이내의 오차를 가지고 추종하면서 청소를 진행하였다.

Quality Evaluation of Chest X-ray Images using Region Segmentation based on 3D Histogram (3D 히스토그램 기반 영역분할을 이용한 흉부 X선 영상 품질 평가)

  • Choi, Hyeon-Jin;Bea, Su-Bin;Park, Ye-Seul;Lee, Jung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.903-906
    • /
    • 2021
  • 인공지능 기술 발전으로, 의료영상 분야에서도 딥러닝 기반 질병 진단 연구가 활발히 진행되고 있다. 딥러닝 모델 개발 시, 학습 데이터 품질은 모델의 성능과 신뢰성에 매우 큰 영향을 미친다. 그러나 의료 분야의 경우 도메인 지식에 대한 진입 장벽이 높아 개발자가 학습에 사용되는 의료영상 데이터의 품질을 평가하기 어렵다. 이로 인해, 많은 의료영상 분야에서는 각 분야의 특성(질병의 종류, 관찰 아나토미 등)에 따른 영상 품질 평가 방법을 제시해왔다. 그러나 기존의 방법은 특정 질병에 초점이 맞춰져, 일반화된 품질 평가 기준을 제시하고 있지 않다. 따라서 본 논문에서는 대부분의 흉부 질환을 진단하기 위한 흉부 X선 영상의 품질을 평가할 수 있는 기준을 제안한다. 우선, 흉부 X선 영상을 대상으로 관찰된 영역인 심장, 횡격막, 견갑골, 폐 등을 분할하여, 3D 히스토그램을 기반으로 각 영역별 통계적인 정밀 품질 평가 기준을 제안한다. 본 연구에서는 JSRT, Chest 14의 오픈 데이터셋을 활용하여 적용 실험을 수행하였으며, 민감도는 97.6%, 특이도는 92.8%의 우수한 성능을 확인하였다.