• 제목/요약/키워드: Learning media

검색결과 1,571건 처리시간 0.026초

단안 비디오로부터의 5차원 라이트필드 비디오 합성 (5D Light Field Synthesis from a Monocular Video)

  • 배규호;안드레 이반;박인규
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.755-764
    • /
    • 2019
  • 현재 사용 가능한 상용 라이트필드 카메라는 정지 영상만을 취득하거나 가격이 매우 높은 단점으로 인하여 5차원 라이트필드 비디오 취득에 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 단안 비디오로부터 라이트필드 비디오를 합성하기 위한 딥러닝 기반 기법을 제안한다. 라이트필드 비디오 학습 데이터를 취득하기 어려운 문제를 해결하기 위하여 UnrealCV를 활용하여 3차원 그래픽 장면의 사실적 렌더링에 의한 합성 라이트필드 데이터를 취득하고 이를 학습에 사용한다. 제안하는 딥러닝 프레임워크는 입력 단안 비디오에서 $9{\times}9$의 각 SAI(sub-aperture image)를 갖는 라이트필드 비디오를 합성한다. 제안하는 네트워크는 밝기 영상으로 변환된 입력 영상으로부터 appearance flow를 추정하는 네트워크, appearance flow로부터 얻어진 인접한 라이트필드 비디오 프레임간의 optical flow를 추정하는 네트워크로 구성되어 있다.

유아 언어 교육을 위한 모바일 증강현실 어플리케이션 (Mobile Augmented Reality Application for Early Childhood Language Education)

  • 강상훈;신민우;김민지;박한훈
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.914-924
    • /
    • 2018
  • 본 논문에서는 마커기반의 증강현실을 이용한 유아 언어교육 안드로이드 응용프로그램을 구현하고자 한다. 동물을 나타내는 단어(명사) 마커, 크기/색상을 나타내는 단어(형용사) 마커, 동작을 나타내는 단어(동사) 마커를 퍼즐 형태로 조합하여 간단한 문장을 완성하면, 문장의 내용과 관련된 가상 콘텐츠를 보여준다. /예를 들어, 동물 마커를 카메라에 비추었을 때 해당하는 동물의 모습이 나타나고 부가적으로 동작 마커를 조합할 경우 동물의 모습이 해당하는 동작을 하는 애니메이션으로 변화한다. 사용자가 스마트폰 화면에 나타난 마커를 눌렀을 때 해당하는 단어의 소리를 출력하게 하여 청각적 효과를 더 했고 모델의 회전기능을 더해 애니메이션을 방향에 관계없이 볼 수 있게 하였다. 시각적, 청각적 자극을 통해 유아 스스로 언어 학습에 적극 참여 할 수 있게 유도함으로써 언어학습의 흥미를 높이고 단어의 의미 및 간단한 문장구조에 대한 교육효과를 증대시키는 것을 목표로 한다.

딥러닝 기반의 무기 소지자 탐지 (Armed person detection using Deep Learning)

  • 김건욱;이민훈;허유진;황기수;오승준
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.780-789
    • /
    • 2018
  • 전 세계적으로 총기 사고는 인적이 드문 장소뿐만 아니라 사람들이 많이 모여 있는 공공장소에서도 빈번하게 일어난다. 특히, 권총과 같은 소형 총기 사고의 빈도수가 매우 높다. 그러므로 사람에 비해 상대적으로 매우 작은 크기의 객체인 권총을 가진 사람을 탐지하는 것은 사고의 피해를 최소화하는데 핵심적이다. '권총 든 사람'을 탐지하는 연구가 수행되고 있지만, 사람보다 권총은 상대적으로 크기가 작기 때문에 단일 객체만을 탐지하는 기존 객체 탐지 방법으로 '권총 든 사람'을 탐지하면 오류 발생 빈도수가 매우 높다. 이러한 문제점을 해결하기 위하여 권총으로 무장한 사람을 탐지하는 방법으로 APDA(Armed Person Detection Algorithm)를 제안한다. APDA는 입력 영상에서 합성곱신경망(Convolutional Neural Network, CNN) 기반의 인체 특징점 탐지 모델과 객체 탐지 모델을 병행하여 획득한 양 손목과 권총의 위치를 후처리 작업에서 이용하여 '권총 든 사람'을 탐지한다. APDA는 기존 방식보다 객관적 평가에서 재현율이 46.3% 향상되었고, 정밀도는 14.04% 향상되었다.

문서 유사도를 통한 관련 문서 분류 시스템 연구 (Related Documents Classification System by Similarity between Documents)

  • 정지수;지민규;고명현;김학동;임헌영;이유림;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.77-86
    • /
    • 2019
  • 본 논문은 머신 러닝 기술을 이용하여 과거의 수집된 문서를 분석하고 이를 바탕으로 문서를 분류하는 방법을 제안한다. 특정 도메인과 관련된 키워드를 기반으로 데이터를 수집하고, 특수문자와 같은 불용어를 제거한다. 그리고 한글 형태소 분석기를 사용하여 수집한 문서의 각 단어에 명사, 동사, 형용사와 같은 품사를 태깅한다. 문서를 벡터로 변환하는 Doc2Vec 모델을 이용해 문서를 임베딩한다. 임베딩 모델을 통하여 문서 간 유사도를 측정하고 머신 러닝 기술을 이용하여 문서 분류기를 학습한다. 학습한 분류 모델 간 성능을 비교하였다. 실험 결과, 서포트 벡터 머신의 성능이 가장 우수했으며 F1 점수는 0.83이 도출되었다.

딥 러닝 기반의 SIFT 이미지 특징 추출 (SIFT Image Feature Extraction based on Deep Learning)

  • 이재은;문원준;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.234-242
    • /
    • 2019
  • 본 논문에서는 일정 크기로 자른 영상의 가운데 픽셀이 SIFT 특징점인지를 판별함으로써 SIFT 특징점을 추출하는 딥 뉴럴 네트워크(Deep Neural Network)를 제안한다. 이 네트워크의 데이터 세트는 DIV2K 데이터 세트를 $33{\times}33$ 크기로 잘라서 구성하고, 흑백 영상으로 판별하는 SIFT와는 달리 RGB 영상을 사용한다. 그라운드 트루스(ground truth)는 옥타브(scale, octave)를 0, 시그마(sigma)는 1.6, 간격(intervals)은 3으로 설정하여 추출한 RobHess SIFT 특징들로 구성한다. VGG-16을 기반으로 컨볼루션 층을 13개에서 23개와 33개로 점점 깊은 네트워크를 구성하고, 영상의 스케일을 증가시키는 방법을 바꿔가며 실험을 수행한다. 출력 층의 활성화 함수로 시그모이드(sigmoid) 함수를 사용한 결과와 소프트맥스(softmax) 함수를 사용한 결과를 비교하여 분석한다. 실험결과 제안한 네트워크가 99% 이상의 추출 정확도를 가질 뿐 아니라 왜곡된 영상에 대해서도 높은 추출 반복성을 가진다는 것을 보인다.

초고해상도 복원에서 성능 향상을 위한 다양한 Attention 연구 (A Study on Various Attention for Improving Performance in Single Image Super Resolution)

  • 문환복;윤상민
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.898-910
    • /
    • 2020
  • 컴퓨터 비전에서 단일 영상 기반의 초고해상도 영상 복원의 중요성과 확장성으로 관련 분야에서 많은 연구가 진행되어 왔으며, 최근 딥러닝에 대한 관심이 증가하면서 딥러닝을 활용한 단안 영상 기반 초고해상도 연구가 활발히 진행되고 있다. 대부분의 딥러닝을 기반으로 하는 단안 영상 기반 초고해상도 복원 연구는 복원 성능을 향상시키기 위해 네트워크의 구조, 손실 함수, 학습 방법에 초점이 맞추어 연구가 진행되었다. 한편, 딥러닝 네트워크를 깊게 쌓지 않고 초고해상도 영상 복원 성능을 향상시키기 위해 추출된 특징 맵을 강조하는 Attention Module에 대한 연구가 다양한 분야에 적용되어 왔다. Attention Module은 다양한 관점에서 네트워크의 목적에 맞는 특징 정보를 강조 및 스케일링 한다. 본 논문에서는 초고해상도 복원 네트워크를 기반으로 다양한 구조의 Channel Attention과 Spatial Attention을 설계하고, 다양한 관점에서 특징 맵을 강조하기 위해 다중 Attention Module 구조를 설계하여 성능을 분석 및 비교한다.

문맥적응적 화면내 예측 모델 학습 및 부호화 성능분석 (Context-Adaptive Intra Prediction Model Training and Its Coding Performance Analysis)

  • 문기화;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.332-340
    • /
    • 2022
  • 최근 딥러닝을 적용하는 비디오 압축에 대한 연구가 활발히 진행되고 있다. 특히, 화면내 예측 부호화의 성능 한계를 극복할 수 있는 방안으로 딥러닝 기반의 화면내 예측 부호화 기술이 연구되고 있다. 본 논문은 신경망 기반 문맥적응적 화면내 예측 모델의 학습기법과 그 부호화 성능분석을 제시한다. 즉, 본 논문에서는 주변 참조샘플의 문맥정보를 입력하여 현재블록을 예측하는 기존의 합성곱 신경망(CNN: Convolutional Neural network) 기반의 화면내 예측 모델을 학습한다. 학습된 화면내 예측 모델을 HEVC(High Efficiency Video Coding)의 참조 소프트웨어인 HM16.19에 추가적인 화면내 예측모드로 구현하고 그 부호화 성능을 분석하였다. 실험결과 학습한 예측 모델은 HEVC 대비 AI(All Intra) 모드에서 0.28% BD-rate 부호화 성능 향상을 보였다. 또한 비디오 부호화 블록분할 구조를 고려하여 학습한 경우의 성능도 확인하였다.

크라우드 소싱 기반의 지역 교통 이벤트 검출 기법 (Crowdsourcing based Local Traffic Event Detection Scheme)

  • 김윤아;최도진;임종태;김상혁;김종훈;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.83-93
    • /
    • 2022
  • 운전자가 모바일기기를 사용하여 직접 교통 정보를 제공하는 크라우드 소싱을 활용하여 교통 문제를 해결하려는 연구들이 진행 중이다. 크라우드 소싱을 통해 수집된 데이터를 교통 이벤트 검출에 사용한다면 관련된 데이터를 수집하는 작업이 줄어들어 시간 비용이 낮아지고 정확도는 높아지는 장점이 있다. 본 논문에서는 크라우드 소싱을 활용하여 교통과 관련된 데이터를 수집하고, 이를 통해 교통에 영향을 미치는 이벤트를 검출하는 기법을 제안한다. 제안하는 기법은 대용량 데이터 처리를 위해 기계 학습 알고리즘을 사용하여 수집된 데이터의 이벤트 유형을 판별한다. 또한, 이벤트가 발생된 위치를 추출하기 위하여 수집된 데이터에서 위치를 나타내는 키워드를 추출하고 키워드의 행정구역을 반환한다. 이를 통해 기존 제공되는 위치 정보에서 광범위하게 정의된 위치나 잘못된 위치 정보를 해결할 수 있다. 제안하는 기법의 타당성을 입증하기 위해 다양한 성능 평가를 수행한다.

학습자를 위한 웹듀이의 사용성 증진 방안 연구 (A Study on Improving Usability of Webdewey for Learners)

  • 백지원
    • 한국비블리아학회지
    • /
    • 제33권2호
    • /
    • pp.75-95
    • /
    • 2022
  • 본 연구는 분류 학습의 기본 도구가 된 웹듀이의 발전 및 기능 변화를 분석하고, 이를 학습자를 위한 사용성의 측면에서 분석하여, 웹듀이의 사용성 증진을 위한 구체적인 방안을 제안하는 목적을 가지고 수행되었다. 이러한 연구 목적을 달성하기 위하여 먼저 UI와 사용성의 개념과 원칙을 정리하고, 웹듀이의 구성 및 주요 기능을 분석하였다. 또한, 웹듀이의 매체 변화 및 시기별 기능 변화를 고찰하였다. 이후 웹듀이를 학습 과정에서 사용한 학습자들을 대상으로 웹듀이 사용성에 관한 의견 조사를 수행하고, 여기서 도출된 시사점과 개선 방향성을 바탕으로 웹듀이의 사용성 증진 방안을 제안하였다. 사용성 증진 방안은 UI의 측면과 합성 기능의 측면으로 나누어 제안되었다. UI의 측면에서는 디스플레이 방식, 시각화 장치, 인쇄본의 장점 도입, 한국어 버전 개발 등의 제안이 이루어졌다. 번호 자동 합성 기능의 측면에서는 기본 번호 선택, 합성 경로 안내 및 오류 메시지 제공, 참고 주기 및 경로 신설, 화면과 버튼 설계, 합성 내역 안내 등의 측면에서 사용성 증진 제안이 이루어졌다.

초등학교에서의 엔트리를 활용한 인공지능 융합 교육 사례 (A Case Study of Artificial Intelligence Convergence Education using Entry in Elementary School)

  • 한규정;안형준
    • 창의정보문화연구
    • /
    • 제7권4호
    • /
    • pp.197-206
    • /
    • 2021
  • 본 연구는 초등학교에서 엔트리의 인공지능 모델을 활용한 융합교육 사례이다. 교과는 영어이며 그림을 그리는 미술과와의 융합 활동과 엔트리의 인공지능모델중 이미지 학습 모델을 기반으로 수업을 진행하였다. 영어과의 말하기 및 쓰기 교육의 학습목표에 효과적으로 달성하기 위해 미술과와 SW를 융합하여 수업을 설계하였다. 학생들은 인공지능을 활용한 의사소통을 경험하고 자신감이 향상되었으며, 듣고 말하는 표현뿐만 아니라 그림이나 사진 등 다양한 매체로 표현하며 창의성과 의사소통 능력을 증진할 수 있었다. 또한 수업의 효과성을 알아보기 위해 학생들에게 설문을 진행하여 그 결과를 분석하였다. 분석 결과 학생들의 수업 참여율, 수업이후 인공지능에 대한 이해 정도, 인공지능에 대한 관심, 인공지능 수업 만족도 등에 긍정적 영향을 주었음을 알 수 있었다.