• Title/Summary/Keyword: 학습영상

Search Result 2,574, Processing Time 0.037 seconds

Deep Learning based x4 and x8 Super-Resolution for Cultural Property Images (딥러닝 기반 문화재 영상에 대한 4 배 및 8 배 초해상화)

  • Son, Chaeyeon;Kim, Soo Ye;Kim, Juyoung;Kim, Munchurl
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.118-122
    • /
    • 2020
  • 문화재 영상 데이터는 방대한 양으로 인해 고해상도로 모두 저장이 어렵거나 시간이 지나 상대적으로 화질이 낮은 영상들이 다수 존재하기에 초해상화가 필요한 상황이 많다. 따라서 본 논문에서 처음으로 문화재 영상에 특화된 4 배 및 8 배 딥러닝 기반 초해상화 방식을 제안한다. 문화재 영상 데이터는 배경이 단조롭고 물체가 영상 중간에 위치한다는 특징이 있어 이를 고려해 중간 부분에서만 패치를 추출하는 방식을 적용하여 의미 있는 패치로 학습이 되도록 한다. 또 자연 영상 데이터 셋인 DIV2K 를 사용해 학습하는 방식과 직접 구성한 문화재 데이터 셋을 이용해 학습하는 방식, 그 둘을 적절히 함께 사용하여 학습하는 전이 학습 방법까지 세 가지로 학습하여 초해상화의 성능을 향상시키는 방법을 제안한다. 그 결과, 쌍삼차 보간법(Bicubic interpolation)보다 4 배 초해상화에서는 약 1.25dB, 8 배 초해상화에서는 약 1.26dB 의 성능 개선을 확인하였으며, 단순 DIV2K 로 학습한 방식보다는 4 배에서는 0.06dB, 8 배에서는 0.17dB 의 성능 개선을 확인하였다.

  • PDF

Effects of Lecturer Appearance and Speech Rate on Learning Flow and Teaching Presence in Video Learning (동영상 학습에서 교수자 출연여부와 발화속도가 학습몰입과 교수실재감에 미치는 효과)

  • Tai, Xiao-Xia;Zhu, Hui-Qin;Kim, Bo-Kyeong
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.22 no.1
    • /
    • pp.267-274
    • /
    • 2021
  • The purpose of this study is to investigate differences in learning flow and teaching presence according to the lecturer's appearance and the lecturer's speech rate. For this experiment, 183 freshman students from Xingtai University in China were selected as subjects of the experiment, and a total of four types of lecture videos were developed to test the lecturer's appearance and their speech rates. Data was analyzed through multivariate analysis of variance. According to the results of the analysis, first, learning flow and teaching presence of groups who experienced the presence of the lecturer appeared were significantly higher than the groups who learned without the appearance of the lecturer. Second, the groups who learned from videos with a fast speech rate showed higher learning flow and teaching presence than the group who learned at a slow speech rate. Third, there were no significant differences in both learning flow and teaching presence according to the lecturer's appearance and speech rate. This result provides a theoretical and practical basis for developing customized videos according to learners' characteristics.

Normal Profile Self Learning and Anomaly Detection Based on CCTV videos (교통 CCTV 영상 로그 분석을 통한 정상 프로파일 자기 학습 및 실시간 이상 징후 판별)

  • Kim, Dhan-Hee;Yoon, Kyoung-Ho;Lee, Won-Suk
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.159-160
    • /
    • 2019
  • 본 연구에서는 영상 내 도로의 형태와 영상 내 객체들의 속성을 실시간으로 자기 학습하고 영상 전체에서 나타난 객체와 각 도로 차선을 지나는 객체들의 이상 징후를 판별하기 위해 교통 CCTV 영상을 활용한다. 각 도로 구간을 촬영한 교통 영상에서 추출한 이동 객체 로그에서 영상 내 도로 형태와 영상 내 객체들의 속성을 통해 감시 공간을 학습하고 학습된 정상 프로파일 대비 각 차선을 지나는 객체들과 영상 내 객체들의 이상 상황을 실시간에 판별한다.

  • PDF

A Study on the Effectiveness of e-learning video class using the online learning judgement system : Focused on the social studies classes in Elementary school (온라인 학습판단 시스템을 활용한 e-러닝 동영상 수업의 효과연구 : 초등학교 사회과 수업을 중심으로)

  • Kim, Jihyun;Jung, Jaebum;Jo, Jaechoon;Lim, Heuiseok
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.2
    • /
    • pp.141-148
    • /
    • 2019
  • The purpose of this study is to analyze and compare the effectiveness of elementary in e-Learning video lessons. In an elementary school where the educational videos are frequently used, the learning about video materials is important but it is difficult to judge all students by a teacher in a classroom. In order to solve the problems of the field, In the fifth-grade elementary school social studies class, learning using video material was conducted by using the online learning judgment system for the experimental group, and learning using video material was conducted by the traditional method for the controlled group. As a result of the experiment, the class using the online learning judgment system was effective in enhancing the learner 's academic achievement. It also positively influenced learners' learning satisfaction. Teachers' satisfaction was not statistically significant because of the small number of teachers. However, The mean value of the teachers' satisfaction in the experimental group was high and the deviation was small.

이미지 복원을 위한 네트워크 파라미터의 동적 업데이트를 위한 기법

  • Kim, Tae-Hyeon
    • Broadcasting and Media Magazine
    • /
    • v.25 no.2
    • /
    • pp.27-35
    • /
    • 2020
  • 최근 많은 연구 결과물에서 빅데이터를 이용하여 학습된 뉴럴 네트워크가 영상 내 노이즈를 제거하는데 매우 효과적임이 입증되었다. 여기에서 한 걸음 더 나아가, 입력으로 주어진 노이즈가 있는 영상의 특징을 분석하여, 사전에 학습된 네트워크의 파라미터를 테스트 타임에 동적으로 업데이트함으로써 주어진 입력 영상을 더욱 잘 처리할 수 있도록 하는 연구들이 시도되고 있다. 본 원고에서는 이와 같이 테스트 타임에 주어지는 입력 영상을 네트워크 학습에 사용하는(self-supervision) 이미지 복원 기법들을 소개한다. 다음으로, 기존의 self-supervision을 이용하는 기법들 대비 학습 효율성과 정확도를 더욱 향상시킬 수 있는 새로운 형태의 네트워크 파라미터 업데이트 기법을 설명하고, 제안하는 기법의 우수성을 다양한 실험 결과를 통해 분석 및 입증한다.

Compressed-Sensing Cardiac CINE MRI using Neural Network with Transfer Learning (전이학습을 수행한 신경망을 사용한 압축센싱 심장 자기공명영상)

  • Park, Seong-Jae;Yoon, Jong-Hyun;Ahn, Chang-Beom
    • Journal of IKEEE
    • /
    • v.23 no.4
    • /
    • pp.1408-1414
    • /
    • 2019
  • Deep artificial neural network with transfer learning is applied to compressed sensing cardiovascular MRI. Transfer learning is a method that utilizes structure, filter kernels, and weights of the network used in prior learning for current learning or application. The transfer learning is useful in accelerating learning speed, and in generalization of the neural network when learning data is limited. From a cardiac MRI experiment, with 8 healthy volunteers, the neural network with transfer learning was able to reduce learning time by a factor of more than five compared to that with standalone learning. Using test data set, reconstructed images with transfer learning showed lower normalized mean square error and better image quality compared to those without transfer learning.

Mapping Wavelet Feature Space to KANSEI Space in Image Using Neural Networks (신경망을 이용한 영상의 웨이블렛 특징공간과 감성공간의 매핑)

  • 정윤경;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.532-534
    • /
    • 2000
  • 복합적인 감성기반 영상 검색 시스템을 구축하기 위해서는 감성속성으로 영상을 찾는 검색은 물론이고, 주어진 영상의 감성특성을 알아내는 과정이 필요하다. 본 논문에서는 영상의 특성으로부터 감성을 매핑하는 신경망을 구축하고 다양한 실험으로 그 가능성을 보인다. 여기에서 영상특징으로 웨이블렛계수와 위치정보를 사용했고, 감성공간으로는 SD법으로부터 14개의 형용사쌍을 추출했다. 이 두 공간의 매핑에 사용된 신경망의 입력으로 영상에서 얻은 RGB 색상당 36개의 총 108개의 웨이블렛 개수를 사용했고, 출력은 14개의 감속속성당 7등급으로 총 98개로 구성했다. 총 6명이 영상을 보고 평가한 감성평가데이터중에서 2명이 각각 평가한 데이터로 신경망을 학습시키고 나머지 10개로 테스트한 경우는 90%이상의 인식률을 보였다. 4명이 각각 90개씩 평가한 데이터로 신경망을 학습시키고 나머지 10개로 테스트한 경우는 90%의 인식률을 보였다. 또한 공통된 감성을 신경망을 통해 인식할 수 있는지 판단하기 위해 600개씩 2명으로부터 얻은 1200개의 데이터에 대해서 1000개를 학습시키고 200개를 테스트하고, 100개씩 4명으로부터 데이터에 대해서 360개를 학습시키고 40개를 테스트해 본 결과, 전자의 경우 오류율 8, 후자의 경우 0.7~0.8 범위였다.

  • PDF

VL-KE-T5: A contrastive learning-based pre-trained model using image-language parallel data composed of Korean and English (VL-KE-T5: 한국어와 영어로 구성된 영상-언어 병렬 데이터를 이용한 대조학습 기반 사전학습모델 구축)

  • San Kim;Saim, Shin
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.337-342
    • /
    • 2022
  • 본 논문은 한국어-영어 기반 영상-언어 모델인 VL-KE-T5를 소개한다. VL-KE-T5는 영상-텍스트 쌍으로 구성된 한국어와 영어 데이터 약 2천 3백만개를 이용하여 영상-언어 모델의 임베딩 벡터들을 정렬시킨 사전학습모델이며, 미세조정을 통하여 여러 영상-언어 작업에 활용할 할 수 있다. VL-KE-T5는 텍스트 기반 영상 검색 작업에서 높은 성능을 보였으나, 세세한 속성을 가진 여러 객체들의 나열이나 객체 간 관계를 포함한 텍스트 기반 영상 검색에서는 비교적 낮은 성능을 보였다.

  • PDF

A Design of Automatic Words Generation Model for Wandering of Online Learner Judgement System (온라인 학습자의 주의집중 판단 시스템을 위한 단어 자동생성 모델 설계)

  • Jo, Jaechoon;Lim, Heuiseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.966-968
    • /
    • 2015
  • 온라인 교육이 지속적으로 발전하면서 학습자 수도 빠르게 증가하고 있다. 동영상 콘텐츠기반의 단방향적인 지직전달 방식인 온라인 학습에서는 학습자의 주의집중 여부가 학습 효과 및 학습 전략에 있어서 중요한 요인이다. 하지만 이에 대한 연구는 미비한 실정이다. 본 논문은 온라인 교육에서 학습자의 주의집중을 판단할 수 있는 시스템의 주의집중 판단 단어 자동생성 모델을 설계하고 제안하였다. 학습자가 동영상 콘텐츠를 시청하면 시청중인 콘텐츠의 단어와 기존에 학습했던 모든 콘텐츠의 단어를 호출하여 단어별 가중치 값을 계산하고 상위 단어들을 주의집중 판단 단어 셋으로 자동 생성한다. 생성된 주의집중 판단 단어 셋은 주의집중 판단 시스템에서 적용되어 학습자들이 동영상 콘텐츠에 단어가 노출되었는지 아닌지를 판단함으로써 학습자의 주의집중 여부를 빠르게 판단할 수 있다.

Artifact Reduction in Sparse-view Computed Tomography Image using Residual Learning Combined with Wavelet Transformation (Wavelet 변환과 결합한 잔차 학습을 이용한 희박뷰 전산화단층영상의 인공물 감소)

  • Lee, Seungwan
    • Journal of the Korean Society of Radiology
    • /
    • v.16 no.3
    • /
    • pp.295-302
    • /
    • 2022
  • Sparse-view computed tomography (CT) imaging technique is able to reduce radiation dose, ensure the uniformity of image characteristics among projections and suppress noise. However, the reconstructed images obtained by the sparse-view CT imaging technique suffer from severe artifacts, resulting in the distortion of image quality and internal structures. In this study, we proposed a convolutional neural network (CNN) with wavelet transformation and residual learning for reducing artifacts in sparse-view CT image, and the performance of the trained model was quantitatively analyzed. The CNN consisted of wavelet transformation, convolutional and inverse wavelet transformation layers, and input and output images were configured as sparse-view CT images and residual images, respectively. For training the CNN, the loss function was calculated by using mean squared error (MSE), and the Adam function was used as an optimizer. Result images were obtained by subtracting the residual images, which were predicted by the trained model, from sparse-view CT images. The quantitative accuracy of the result images were measured in terms of peak signal-to-noise ratio (PSNR) and structural similarity (SSIM). The results showed that the trained model is able to improve the spatial resolution of the result images as well as reduce artifacts in sparse-view CT images effectively. Also, the trained model increased the PSNR and SSIM by 8.18% and 19.71% in comparison to the imaging model trained without wavelet transformation and residual learning, respectively. Therefore, the imaging model proposed in this study can restore the image quality of sparse-view CT image by reducing artifacts, improving spatial resolution and quantitative accuracy.