• Title/Summary/Keyword: Video Learning

검색결과 1,087건 처리시간 0.03초

복잡한 예측문제에 대한 이차학습방법 : Video-On-Demand에 대한 사례연구 (Second-Order Learning for Complex Forecasting Tasks: Case Study of Video-On-Demand)

  • 김형관;주종형
    • 지능정보연구
    • /
    • 제3권1호
    • /
    • pp.31-45
    • /
    • 1997
  • To date, research on data mining has focused primarily on individual techniques to su, pp.rt knowledge discovery. However, the integration of elementary learning techniques offers a promising strategy for challenging a, pp.ications such as forecasting nonlinear processes. This paper explores the utility of an integrated a, pp.oach which utilizes a second-order learning process. The a, pp.oach is compared against individual techniques relating to a neural network, case based reasoning, and induction. In the interest of concreteness, the concepts are presented through a case study involving the prediction of network traffic for video-on-demand.

  • PDF

Deep Learning Network를 이용한 Video Codec에서 휘도성분 노이즈 제거 (Luma Noise Reduction using Deep Learning Network in Video Codec)

  • 김양우;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.272-273
    • /
    • 2019
  • VVC(Versatile Video Coding)는 YUV 입력 영상에 대하여 Luma 성분과 Chroma 성분에 대하여 각각 다른 최적의 방법으로 블록분할 후 해당 블록에 대해서 화면 내 예측 또는 화면 간 예측을 수행하고, 예측영상과 원본영상의 차이를 변환, 양자화하여 압축한다. 이 과정에서 복원영상에는 블록화 노이즈, 링잉 노이즈, 블러링 노이즈 발생한다. 본 논문에서는 인코더에서 원본영상과 복원영상의 잔차신호에 대한 MAE(Mean Absolute Error)를 추가정보로 전송하여 이 추가정보와 복원영상을 이용하여 Deep Learning 기반의 신경망 네트워크로 영상의 품질을 높이는 방법을 제안한다. 복원영상의 노이즈를 감소시키기 위하여 영상을 $32{\times}32$블록의 임의로 분할하고, DenseNet기반의 UNet 구조로 네트워크를 구성하였다.

  • PDF

A study on real-time internet comment system through sentiment analysis and deep learning application

  • Hae-Jong Joo;Ho-Bin Song
    • Journal of Platform Technology
    • /
    • 제11권2호
    • /
    • pp.3-14
    • /
    • 2023
  • This paper proposes a big data sentiment analysis method and deep learning implementation method to provide a webtoon comment analysis web page for convenient comment confirmation and feedback of webtoon writers for the development of the cartoon industry in the video animation field. In order to solve the difficulty of automatic analysis due to the nature of Internet comments and provide various sentiment analysis information, LSTM(Long Short-Term Memory) algorithm, ranking algorithm, and word2vec algorithm are applied in parallel, and actual popular works are used to verify the validity. If the analysis method of this paper is used, it is easy to expand to other domestic and overseas platforms, and it is expected that it can be used in various video animation content fields, not limited to the webtoon field

  • PDF

실 화상 기반의 지능형 G-러닝 가상 학습 플랫폼 개발 (Development of An Intelligent G-Learning Virtual Learning Platform Based on Real Video)

  • 박재연;박성준
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.79-86
    • /
    • 2024
  • 본 논문에서는 기존의 내용 전달 위주의 학습 메타버스 플랫폼이 아닌 실제 수업 활동에서 이루어지는 다양한 학습 상호작용에 기반한 가상 학습 플랫폼을 제안한다. 본 연구에서는 AI와 가상환경을 융합한 학습 환경을 제공하여 실시간 AI와 대화하며 문제를 풀어가는 방식을 활용하고 있다. 또한, 수업의 몰입도를 향상하기 위해 G-러닝 기법을 적용하였다. 본 연구를 통해 개발한 VirtualEdu 플랫폼은 자기주도적 학습, 게임을 통한 흥미 유발, 그리고 PBL 수업 방식을 조합하여 효과적인 학습 경험을 제공하고 있다. 이를 기반으로 학생들의 참여도와 학습 효과를 향상 시키는 새로운 교육 방식을 제안하고 있다. 실험으로는 50명 이상의 학습자가 실시간 화상 학습 활동 기반의 다양한 학습 활동애 대해 성능 실험을 하였고, 결과로서 안정하게 원활한 수업이 진행됨을 얻을 수 있었다.

잡음 제거 기술 기반의 비디오 인페인팅 성능 연구 (A Study on the Video Inpainting Performance using Denoising Technique)

  • 서정윤;백한결;박상효
    • 대한임베디드공학회논문지
    • /
    • 제17권6호
    • /
    • pp.329-335
    • /
    • 2022
  • In this paper, we study the effect of noise on video inpainting, a technique that fills missing regions of video. Since the video may contain noise, the quality of the video may be affected when applying the video inpainting technique. Therefore, in this paper, we compare the inpainting performance in video with and without denoising techniqueDAVIS dataset. For that, we conducted two experiments: 1) applying inpainting technique after denoising the noisy video and 2) applying the inpainting technique to the video and denoising the video. Through the experiment, we observe the effect of denoising technique on the quality of video inpainting and conclude that video inpainting after denoising would improve the quality of the video subjectively and objectively.

Method of extracting context from media data by using video sharing site

  • Kondoh, Satoshi;Ogawa, Takeshi
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.709-713
    • /
    • 2009
  • Recently, a lot of research that applies data acquired from devices such as cameras and RFIDs to context aware services is being performed in the field on Life-Log and the sensor network. A variety of analytical techniques has been proposed to recognize various information from the raw data because video and audio data include a larger volume of information than other sensor data. However, manually watching a huge amount of media data again has been necessary to create supervised data for the update of a class or the addition of a new class because these techniques generally use supervised learning. Therefore, the problem was that applications were able to use only recognition function based on fixed supervised data in most cases. Then, we proposed a method of acquiring supervised data from a video sharing site where users give comments on any video scene because those sites are remarkably popular and, therefore, many comments are generated. In the first step of this method, words with a high utility value are extracted by filtering the comment about the video. Second, the set of feature data in the time series is calculated by applying functions, which extract various feature data, to media data. Finally, our learning system calculates the correlation coefficient by using the above-mentioned two kinds of data, and the correlation coefficient is stored in the DB of the system. Various other applications contain a recognition function that is used to generate collective intelligence based on Web comments, by applying this correlation coefficient to new media data. In addition, flexible recognition that adjusts to a new object becomes possible by regularly acquiring and learning both media data and comments from a video sharing site while reducing work by manual operation. As a result, recognition of not only the name of the seen object but also indirect information, e.g. the impression or the action toward the object, was enabled.

  • PDF

Multimodal Biometrics Recognition from Facial Video with Missing Modalities Using Deep Learning

  • Maity, Sayan;Abdel-Mottaleb, Mohamed;Asfour, Shihab S.
    • Journal of Information Processing Systems
    • /
    • 제16권1호
    • /
    • pp.6-29
    • /
    • 2020
  • Biometrics identification using multiple modalities has attracted the attention of many researchers as it produces more robust and trustworthy results than single modality biometrics. In this paper, we present a novel multimodal recognition system that trains a deep learning network to automatically learn features after extracting multiple biometric modalities from a single data source, i.e., facial video clips. Utilizing different modalities, i.e., left ear, left profile face, frontal face, right profile face, and right ear, present in the facial video clips, we train supervised denoising auto-encoders to automatically extract robust and non-redundant features. The automatically learned features are then used to train modality specific sparse classifiers to perform the multimodal recognition. Moreover, the proposed technique has proven robust when some of the above modalities were missing during the testing. The proposed system has three main components that are responsible for detection, which consists of modality specific detectors to automatically detect images of different modalities present in facial video clips; feature selection, which uses supervised denoising sparse auto-encoders network to capture discriminative representations that are robust to the illumination and pose variations; and classification, which consists of a set of modality specific sparse representation classifiers for unimodal recognition, followed by score level fusion of the recognition results of the available modalities. Experiments conducted on the constrained facial video dataset (WVU) and the unconstrained facial video dataset (HONDA/UCSD), resulted in a 99.17% and 97.14% Rank-1 recognition rates, respectively. The multimodal recognition accuracy demonstrates the superiority and robustness of the proposed approach irrespective of the illumination, non-planar movement, and pose variations present in the video clips even in the situation of missing modalities.

Frontal Face Video Analysis for Detecting Fatigue States

  • Cha, Simyeong;Ha, Jongwoo;Yoon, Soungwoong;Ahn, Chang-Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.43-52
    • /
    • 2022
  • 사람이 느끼는 피로는 다양한 생체신호로부터 측정이 가능한 것으로 알려져 있으며, 기존 연구는 질병과 관련된 심각한 피로수준을 산정하는데 주된 목적을 두고 있다. 본 연구에서는 피실험자의 영상을 이용하여 딥러닝 기반의 영상 분석 기술을 적용, 피로 여부를 판단하기 위한 모델을 제안한다. 특히 화상 분석에서 통상적으로 사용되는 객체 인식, 요소 추출과 함께 영상 데이터의 시계열적 특성을 고려하여 방법론을 교차한 3개 분석모델을 제시했다. 다양한 피로상황에서 수집된 정면 얼굴 영상 데이터를 이용하여 제시된 모델을 실험하였으며, CNN 모델의 경우 0.67의 정확도로 피로 상태를 분류할 수 있어 영상 분석 기반의 피로 상태 분류가 유의미하다고 판단된다. 또한 모델별 학습 및 검증 절차 분석을 통해 영상 데이터 특성에 따른 모델 적용방안을 제시했다.

화상통신기술을 활용한 문제중심학습 시스템 설계 및 구현 (Design and Implementation of Problem-Based Learning System Based on Video Communication Technology)

  • 김범식;안성훈;김동호
    • 정보교육학회논문지
    • /
    • 제8권2호
    • /
    • pp.167-176
    • /
    • 2004
  • 정보통신기술의 발달로 교육환경에서도 많은 변화가 일어나 ICT 활용 교육을 통한 다양한 형태의 교수 학습 유형이 논의되고 있으며 최근에 급격히 발달하고 있는 인터넷을 활용한 원격교육이 급격히 확산되고 있는 실정이다. 하지만 교사가 일방적으로 과제를 제시하고 학생들은 인터넷 사이트를 활용하여 정보를 수집하여 가공하는 보여주기식에 그쳐 학생간 교사간의 상호작용이 부족하여 인터넷 활용 학습의 장점을 살리지 못하고 있다. 이에 본 연구에서는 웹과의 통합적 또는 보완적 차원에서 가장 적합하다고 여겨지는 구성주의의 문제중 심학습 이론을 기반으로 하여 화상통신기술을 활용한 문제중심학습 환경을 구현하고 초등학교 현장에 적용하여 그 결과를 분석하였다. 그 결과 교사와 학습자간 학습자 동료 집단간의 상호작용에 효과가 있었으며 학습자의 수업에 대한 참여 태도 및 흥미, 집중력에 긍정적인 효과를 가져왔다. 또한 면대면 학습에서 부족했던 부분을 사이버 학습을 통해 보완할 수 있었으며 문제중심 학습모형의 장점을 살릴 수 있었다.

  • PDF

딥러닝 기반 컨텐츠 적응적 영상 압축 기술 동향 (Survey on Deep learning-based Content-adaptive Video Compression Techniques)

  • 한창우;김홍일;강현구;권형진;임성창;정승원
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.527-537
    • /
    • 2022
  • 멀티미디어 컨텐츠의 수요와 공급이 증가함에 따라 전 세계의 인터넷 트래픽이 증가하는 가운데 이를 완화하기 위해 여러 표준화 그룹에서는 더 효율적인 압축 표준을 제정하는데 노력을 기울이고 있다. 이러한 노력 중 압축 표준에 딥러닝 기술을 도입하고자 하는 연구들이 활발히 진행되고 있다. 그러나 딥러닝 기반 압축 기술은 학습 데이터와 특성이 다른 영상을 압축할 때 압축 효율이 저하되는 문제를 갖는다. 이를 해결하기 위해 컨텐츠에 적응적으로 딥러닝 기술을 도입하는 시도들이 있었다. 본 논문에서는 이들을 크게 코덱 정보 사용, 모델 선택, 추가 정보 전송의 세 가지로 나누어 살펴보고자 한다.