• 제목/요약/키워드: 미디어 AI

검색결과 343건 처리시간 0.026초

Jetson Nano와 3D프린터를 이용한 인공지능 교육용 키트 제작 (Manufacture artificial intelligence education kit using Jetson Nano and 3D printer)

  • 박성주;김남호
    • 스마트미디어저널
    • /
    • 제11권11호
    • /
    • pp.40-48
    • /
    • 2022
  • 본 논문에서는 인공지능교육의 어려움을 해결하기 위하여 인공지능 교육에 활용이 가능한 교육용 키트를 개발하였다. 이를 통하여 이론 중심에서 실무 위주의 경험을 학습하기 위한 CNN과 OpenCV를 이용하여 컴퓨터 비전 기술을 이용한 사람 인식(Object Detection and Person Detection in Computer Vision)과 특정 오브젝트를 학습시키고 인식시키는 사용자 이미지인식(Your Own Image Recognition), 사용자 객체 분류(Segmentation) 및 세분화(Classification Datasets), 학습된 타켓을 공격하는 IoT하드웨어 제어와 인공지능보드인 Jetson Nano GPIO를 제어함으로써 효과적인 인공지능 학습에 도움이 되는 교재를 개발하여 활용할 수 있도록 하였다.

인과적 인공지능 기반 데이터 분석 기법의 심층 분석을 통한 인과적 AI 기술의 현황 분석 (Deep Analysis of Causal AI-Based Data Analysis Techniques for the Status Evaluation of Casual AI Technology)

  • 차주호;류민우
    • 디지털산업정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.45-52
    • /
    • 2023
  • With the advent of deep learning, Artificial Intelligence (AI) technology has experienced rapid advancements, extending its application across various industrial sectors. However, the focus has shifted from the independent use of AI technology to its dispersion and proliferation through the open AI ecosystem. This shift signifies the transition from a phase of research and development to an era where AI technology is becoming widely accessible to the general public. However, as this dispersion continues, there is an increasing demand for the verification of outcomes derived from AI technologies. Causal AI applies the traditional concept of causal inference to AI, allowing not only the analysis of data correlations but also the derivation of the causes of the results, thereby obtaining the optimal output values. Causal AI technology addresses these limitations by applying the theory of causal inference to machine learning and deep learning to derive the basis of the analysis results. This paper analyzes recent cases of causal AI technology and presents the major tasks and directions of causal AI, extracting patterns between data using the correlation between them and presenting the results of the analysis.

증강현실을 이용한 인지훈련 프로토콜 설계 및 시스템 구현 (Cognitive Training Protocol Design and System Implementation using AR)

  • 이철승;김국세
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1207-1212
    • /
    • 2022
  • 4차 산업혁명 시대의 차세대 미디어 기술인 실감미디어는 사용자 경험을 최적화 하는 환경을 통해 체험하는 기술로 이슈화 되고 있고, 보건·헬스케어 융·복합분야로 빠르게 발전하고 있다. 노년층의 인구 증가로 만성질환의 증가, 인지훈련 및 재활분야의 인프라와 전문인력의 부족으로 이를 해결하기 위해 실감미디어 기술과 서비스를 채택하고 있다. 이에 본 연구는 인지 재활이 필요한 경도인지장애 MCI(: Mild cognitive impairment) 대상자를 대상으로 인지능력과 일상생활 활동능력을 향상시키는 목적으로 인지 훈련 시스템을 설계하고 구현하였다. 향후 AI와 BigData 기반의 지능형 인지재활 통합 플랫폼으로 쌍방향 컴뮤니케이션과 즉각적인 피드백이 존재하는 통합 서비스 플랫폼을 연구과제로 남긴다.

인공지능기반의 자동 창작 영상에 관한 논구 (A Discussion on AI-based Automated Picture Creations)

  • 김정회;윤준성
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.723-730
    • /
    • 2024
  • 본 연구는 자동 창작 영상에 관한 개념과 이해의 변화를 추적하기 위하여, 기존의 영상분야를 대표하는 사진과 영화의 창작 방식을 인공지능 기반의 영상 창작 방법과 '자동'이라는 측면에서 유비적으로 탐구하고, 새로운 자동영상창작에 관한 이해와 가능성을 논구 한다. 사진과 영화의 발명 시기에는, 회화를 비롯한 전통예술 장르와 비견하여, 이들에게 '자동 창작'이라는 영역을 설정한 바 있다. 최근 인공지능이 영상 제작에도 적용되면서 '자동 창작'에 관한 개념도 확장되어, 기존의 문학, 미술, 사진, 영화의 경계를 자유롭게 넘나드는 실험적 창작이 활발하다. 인공지능의 자동 창작은 머신 러닝과 딥 러닝과 같은 기술을 활용하여, 인공지능이 독립적으로 창작 과정을 수행하게 한다. 인공지능을 활용한 자동 창작은 효율성을 크게 향상시킬 수 있지만, 동시에 예술창작과정의 주관적인 판단의 문제에 직면하게 된다. 자동 창작으로 몰렸던 사진과 영화의 창작과정과 인공지능의 창작과정을 비교하면, 자동 창작 영상의 입면은 작가의 문제로 귀착될 수 있다. 그러나 다원적이 예술분야가 소통할 수 있는 기회로 작동된다면, 인공지능기반의 자동 창작 영상은 장르를 넘나드는 방법론이 될 수 있을 것이다.

웹 브라우징을 위한 음성 인터페이스 설계 및 구현 (Design & Implementation of Voice-Interface for Web-Browsing)

  • 이승호;육상조;권영미;이극
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.106-109
    • /
    • 1998
  • WWW은 무한한 확장 가능성을 지닌 HTTP(Hyper-Text Transfer Protocol)와 편리한 웹 브라우져를 통해 질적, 양적 성장 계속해 왔으며 특히 GUI(Graphic User Interface) 환경에서 동작하는 웹 브라우져는 WWW이 수많은 이용자를 확보하는데 일익을 담당했다. 본 논문에서는 이 웹 브라우져에 음성인식 기술을 접목하여 WWW의 이용자가 자신의 음성으로 편리하게 웹 브라우징을 할 수 있도록 하는 음성 인터페이스를 설계, 구현 한다. 본 음성 인터페이스는 계속적으로 입력되는 음성 정보 중 화자의 발성음을 추출하여 음성 인식기에 전달하는 음성 입력기와 화자의 발성을 인식하는 음성 인식기 그리고 인식결과를 웹 브라우져에게 처리 하도록 하는 결과 처리기로 구성되어 있다.

  • PDF

Application of Deep Recurrent Q Network with Dueling Architecture for Optimal Sepsis Treatment Policy

  • Do, Thanh-Cong;Yang, Hyung Jeong;Ho, Ngoc-Huynh
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.48-54
    • /
    • 2021
  • Sepsis is one of the leading causes of mortality globally, and it costs billions of dollars annually. However, treating septic patients is currently highly challenging, and more research is needed into a general treatment method for sepsis. Therefore, in this work, we propose a reinforcement learning method for learning the optimal treatment strategies for septic patients. We model the patient physiological time series data as the input for a deep recurrent Q-network that learns reliable treatment policies. We evaluate our model using an off-policy evaluation method, and the experimental results indicate that it outperforms the physicians' policy, reducing patient mortality up to 3.04%. Thus, our model can be used as a tool to reduce patient mortality by supporting clinicians in making dynamic decisions.

RGB 비디오 데이터를 이용한 Slowfast 모델 기반 이상 행동 인식 최적화 (Optimization of Action Recognition based on Slowfast Deep Learning Model using RGB Video Data)

  • 정재혁;김민석
    • 한국멀티미디어학회논문지
    • /
    • 제25권8호
    • /
    • pp.1049-1058
    • /
    • 2022
  • HAR(Human Action Recognition) such as anomaly and object detection has become a trend in research field(s) that focus on utilizing Artificial Intelligence (AI) methods to analyze patterns of human action in crime-ridden area(s), media services, and industrial facilities. Especially, in real-time system(s) using video streaming data, HAR has become a more important AI-based research field in application development and many different research fields using HAR have currently been developed and improved. In this paper, we propose and analyze a deep-learning-based HAR that provides more efficient scheme(s) using an intelligent AI models, such system can be applied to media services using RGB video streaming data usage without feature extraction pre-processing. For the method, we adopt Slowfast based on the Deep Neural Network(DNN) model under an open dataset(HMDB-51 or UCF101) for improvement in prediction accuracy.

CompressAI 를 활용한 객체 검출 네트워크 피쳐 맵 압축 (Object Detection Network Feature Map Compression using CompressAI)

  • 도지훈;이주영;김연희;최진수;정세윤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.7-9
    • /
    • 2021
  • 본 논문은 Detectron2 [1]에서 지원하는 객체 검출 임무 수행 네트워크의 과정 중에서 추출한 피쳐 맵을 신경망 기반으로 압축하는 방법을 제안한다. 이를 위해, 신경 망 기반 영상 압축을 지원하는 공개 소프트웨어인 CompressAI [2] 모델 중 하나인 bmshj2018-hyperprior 의 압축 네트워크를 활용하여 임무 수행 네트워크의 과정 중 스탬 레이어(stem layer)에서 추출된 피쳐 맵을 압축하도록 학습시켰다. 또한, 압축 네트워크의 입력 피쳐 맵의 너비와 높이 크기가 64 의 배수가 되도록 객체 검출 네트워크의 입력 영상 보간 값을 조정하는 방법도 제안한다. 제안하는 신경망 기반 피쳐 맵 압축 방법은 피쳐 맵을 최근 표준이 완료된 차세대 압축 표준 방법인 VVC(Versatile Video Coding, [3])로 압축한 결과에 비해 큰 성능 향상을 보이고, VCM 앵커와 유사한 성능을 보인다.

  • PDF

농구 게임에서 상태 정규화 및 Dense 보상 기반 강화 학습 기법 (State Normalization and Dense Reward Based Reinforcement Learning Method in Basketball Game.)

  • 최태혁;조경은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.475-477
    • /
    • 2022
  • 최근 강화 학습을 적용한 게임 AI 에 대한 연구가 활발히 진행되고 있다. 하지만 대부분 상용게임은 유한 상태 머신(Finite State Machine, FSM)을 이용한 스크립트 기반 AI 를 사용하기 때문에 복잡한 환경의 게임에서 불안정한 상태로 인해 적절한 강화 학습의 수행이 어렵다. 따라서 본 논문에서는 상용 게임 강화 학습 적용을 위하여 상태 정규화 및 Dense 보상 기반 강화 학습 기법을 제안한다. 제안한 기법을 상용 농구 게임에 적용하고 학습된 모델의 성능을 기존 FSM 기반 AI 와 비교를 통해 성능이 약 80% 증가한 결과를 확인하였다.