• 제목/요약/키워드: Learning media

검색결과 1,590건 처리시간 0.033초

초고해상도 복원에서 성능 향상을 위한 다양한 Attention 연구 (A Study on Various Attention for Improving Performance in Single Image Super Resolution)

  • 문환복;윤상민
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.898-910
    • /
    • 2020
  • 컴퓨터 비전에서 단일 영상 기반의 초고해상도 영상 복원의 중요성과 확장성으로 관련 분야에서 많은 연구가 진행되어 왔으며, 최근 딥러닝에 대한 관심이 증가하면서 딥러닝을 활용한 단안 영상 기반 초고해상도 연구가 활발히 진행되고 있다. 대부분의 딥러닝을 기반으로 하는 단안 영상 기반 초고해상도 복원 연구는 복원 성능을 향상시키기 위해 네트워크의 구조, 손실 함수, 학습 방법에 초점이 맞추어 연구가 진행되었다. 한편, 딥러닝 네트워크를 깊게 쌓지 않고 초고해상도 영상 복원 성능을 향상시키기 위해 추출된 특징 맵을 강조하는 Attention Module에 대한 연구가 다양한 분야에 적용되어 왔다. Attention Module은 다양한 관점에서 네트워크의 목적에 맞는 특징 정보를 강조 및 스케일링 한다. 본 논문에서는 초고해상도 복원 네트워크를 기반으로 다양한 구조의 Channel Attention과 Spatial Attention을 설계하고, 다양한 관점에서 특징 맵을 강조하기 위해 다중 Attention Module 구조를 설계하여 성능을 분석 및 비교한다.

문맥적응적 화면내 예측 모델 학습 및 부호화 성능분석 (Context-Adaptive Intra Prediction Model Training and Its Coding Performance Analysis)

  • 문기화;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.332-340
    • /
    • 2022
  • 최근 딥러닝을 적용하는 비디오 압축에 대한 연구가 활발히 진행되고 있다. 특히, 화면내 예측 부호화의 성능 한계를 극복할 수 있는 방안으로 딥러닝 기반의 화면내 예측 부호화 기술이 연구되고 있다. 본 논문은 신경망 기반 문맥적응적 화면내 예측 모델의 학습기법과 그 부호화 성능분석을 제시한다. 즉, 본 논문에서는 주변 참조샘플의 문맥정보를 입력하여 현재블록을 예측하는 기존의 합성곱 신경망(CNN: Convolutional Neural network) 기반의 화면내 예측 모델을 학습한다. 학습된 화면내 예측 모델을 HEVC(High Efficiency Video Coding)의 참조 소프트웨어인 HM16.19에 추가적인 화면내 예측모드로 구현하고 그 부호화 성능을 분석하였다. 실험결과 학습한 예측 모델은 HEVC 대비 AI(All Intra) 모드에서 0.28% BD-rate 부호화 성능 향상을 보였다. 또한 비디오 부호화 블록분할 구조를 고려하여 학습한 경우의 성능도 확인하였다.

크라우드 소싱 기반의 지역 교통 이벤트 검출 기법 (Crowdsourcing based Local Traffic Event Detection Scheme)

  • 김윤아;최도진;임종태;김상혁;김종훈;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.83-93
    • /
    • 2022
  • 운전자가 모바일기기를 사용하여 직접 교통 정보를 제공하는 크라우드 소싱을 활용하여 교통 문제를 해결하려는 연구들이 진행 중이다. 크라우드 소싱을 통해 수집된 데이터를 교통 이벤트 검출에 사용한다면 관련된 데이터를 수집하는 작업이 줄어들어 시간 비용이 낮아지고 정확도는 높아지는 장점이 있다. 본 논문에서는 크라우드 소싱을 활용하여 교통과 관련된 데이터를 수집하고, 이를 통해 교통에 영향을 미치는 이벤트를 검출하는 기법을 제안한다. 제안하는 기법은 대용량 데이터 처리를 위해 기계 학습 알고리즘을 사용하여 수집된 데이터의 이벤트 유형을 판별한다. 또한, 이벤트가 발생된 위치를 추출하기 위하여 수집된 데이터에서 위치를 나타내는 키워드를 추출하고 키워드의 행정구역을 반환한다. 이를 통해 기존 제공되는 위치 정보에서 광범위하게 정의된 위치나 잘못된 위치 정보를 해결할 수 있다. 제안하는 기법의 타당성을 입증하기 위해 다양한 성능 평가를 수행한다.

학습자를 위한 웹듀이의 사용성 증진 방안 연구 (A Study on Improving Usability of Webdewey for Learners)

  • 백지원
    • 한국비블리아학회지
    • /
    • 제33권2호
    • /
    • pp.75-95
    • /
    • 2022
  • 본 연구는 분류 학습의 기본 도구가 된 웹듀이의 발전 및 기능 변화를 분석하고, 이를 학습자를 위한 사용성의 측면에서 분석하여, 웹듀이의 사용성 증진을 위한 구체적인 방안을 제안하는 목적을 가지고 수행되었다. 이러한 연구 목적을 달성하기 위하여 먼저 UI와 사용성의 개념과 원칙을 정리하고, 웹듀이의 구성 및 주요 기능을 분석하였다. 또한, 웹듀이의 매체 변화 및 시기별 기능 변화를 고찰하였다. 이후 웹듀이를 학습 과정에서 사용한 학습자들을 대상으로 웹듀이 사용성에 관한 의견 조사를 수행하고, 여기서 도출된 시사점과 개선 방향성을 바탕으로 웹듀이의 사용성 증진 방안을 제안하였다. 사용성 증진 방안은 UI의 측면과 합성 기능의 측면으로 나누어 제안되었다. UI의 측면에서는 디스플레이 방식, 시각화 장치, 인쇄본의 장점 도입, 한국어 버전 개발 등의 제안이 이루어졌다. 번호 자동 합성 기능의 측면에서는 기본 번호 선택, 합성 경로 안내 및 오류 메시지 제공, 참고 주기 및 경로 신설, 화면과 버튼 설계, 합성 내역 안내 등의 측면에서 사용성 증진 제안이 이루어졌다.

초등학교에서의 엔트리를 활용한 인공지능 융합 교육 사례 (A Case Study of Artificial Intelligence Convergence Education using Entry in Elementary School)

  • 한규정;안형준
    • 창의정보문화연구
    • /
    • 제7권4호
    • /
    • pp.197-206
    • /
    • 2021
  • 본 연구는 초등학교에서 엔트리의 인공지능 모델을 활용한 융합교육 사례이다. 교과는 영어이며 그림을 그리는 미술과와의 융합 활동과 엔트리의 인공지능모델중 이미지 학습 모델을 기반으로 수업을 진행하였다. 영어과의 말하기 및 쓰기 교육의 학습목표에 효과적으로 달성하기 위해 미술과와 SW를 융합하여 수업을 설계하였다. 학생들은 인공지능을 활용한 의사소통을 경험하고 자신감이 향상되었으며, 듣고 말하는 표현뿐만 아니라 그림이나 사진 등 다양한 매체로 표현하며 창의성과 의사소통 능력을 증진할 수 있었다. 또한 수업의 효과성을 알아보기 위해 학생들에게 설문을 진행하여 그 결과를 분석하였다. 분석 결과 학생들의 수업 참여율, 수업이후 인공지능에 대한 이해 정도, 인공지능에 대한 관심, 인공지능 수업 만족도 등에 긍정적 영향을 주었음을 알 수 있었다.

사용자 관점에서의 음식 레시피 분류 모델에 관한 연구 (Food Recipe Clustering Model from the User's Perspective)

  • 이우행;최수연
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1441-1446
    • /
    • 2022
  • 현대인들은 음식 레시피에 대한 다양한 정보들을 인터넷이나 소셜 미디어 등에서 매우 쉽게 접할 수 있게 되었다. 음식 레시피를 제공하는 공급량이 많아지면서 범람하는 정보 안에서 사용자들이 각자에 맞는 레시피를 찾기에는 수고로움이 따르게 된다. 이처럼 사용자들의 요구사항을 반영하여 정보를 제공할 필요성이 높아졌고, 음식 레시피와 요리 추천에 관련 연구가 활발해지고 있다. 또한, 이를 활용한 인터넷, 영상 및 어플리케이션 시장 역시 급속도로 활성화되고 있다. 본 연구에서는 음식 레시피 사용자들의 관점에서 레시피를 분류하기 위하여 사용자의 리뷰 데이터를 비지도학습인 K-평균 군집화 기법을 적용하였으며, 이를 통해 "음식 레시피 분류 모델"을 도출하였다. 그 결과 특정 목적, 조리 단계 등 많은 사용자들이 필요한 정보를 포함한 총 25개의 군집으로 분류하였다.

머신 비전을 위한 열 적외선 영상의 객체 기반 압축 기법 (Object-based Compression of Thermal Infrared Images for Machine Vision)

  • 이예지;김신;임한신;추현곤;정원식;서정일;윤경로
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.738-747
    • /
    • 2021
  • 오늘날 딥러닝 기술의 향상으로 영상 분류, 객체 탐지, 객체 분할, 객체 추적 등 컴퓨터 비전 분야 또한 큰 발전을 이루고 있다. 지능적 감시, 로봇, 사물 인터넷, 자율주행 자동차 등 딥러닝 기술이 결합된 다양한 응용 기술들은 실제 산업에 적용되고 있으며, 이에 따라 사람의 소비를 위한 영상 데이터 뿐만 아니라 머신 비전을 위한 영상 데이터의 효율적인 압축 방식에 대한 필요성이 대두되고 있다. 본 논문에서는 머신 비전을 위한 열 적외선 영상의 객체 기반 압축 기법을 제안한다. 효율적인 영상 압축과 신경망의 좋은 성능을 유지하기 위해 본 논문에서는 신경망의 객체 탐지 결과와 객체 크기에 따라 입력 영상을 객체 부분과 배경 부분으로 나누어 서로 다른 압축률로 부호화를 수행하는 방법을 제안한다. 제안하는 방법은 VVC로 영상 전체를 압축하는 방식보다 BD-rate 값이 최대 -19.83%로 압축 효율이 뛰어나다는 것을 확인할 수 있다.

딥 러닝 기반의 눈 랜드마크 위치 검출이 통합된 시선 방향 벡터 추정 네트워크 (Deep Learning-based Gaze Direction Vector Estimation Network Integrated with Eye Landmark Localization)

  • 주희영;고민수;송혁
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.748-757
    • /
    • 2021
  • 본 논문은 눈 랜드마크 위치 검출과 시선 방향 벡터 추정이 하나의 딥러닝 네트워크로 통합된 시선 추정 네트워크를 제안한다. 제안하는 네트워크는 Stacked Hourglass Network를 백본(Backbone) 구조로 이용하며, 크게 랜드마크 검출기, 특징 맵 추출기, 시선 방향 추정기라는 세 개의 부분(Part)으로 구성되어 있다. 랜드마크 검출기에서는 눈 랜드마크 50개 포인트의 좌표를 추정하며, 특징 맵 추출기에서는 시선 방향 추정을 위한 눈 이미지의 특징 맵을 생성한다. 그리고 시선 방향 추정기에서는 각 출력 결과를 조합하여 최종 시선 방향 벡터를 추정한다. 제안하는 네트워크는 UnityEyes 데이터셋을 통해 생성된 가상의 합성 눈 이미지와 랜드마크 좌표 데이터를 이용하여 학습하였으며, 성능 평가는 실제 사람의 눈 이미지로 구성된 MPIIGaze 데이터셋을 이용하였다. 실험을 통해 시선 추정 오차는 3.9°의 성능을 보였으며, 네트워크의 추정 속도는 42 FPS(Frame per second)로 측정되었다.

윈도우 주의 모듈 기반 트랜스포머를 활용한 이미지 분류 방법 (Window Attention Module Based Transformer for Image Classification)

  • 김상훈;김원준
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.538-547
    • /
    • 2022
  • 최근 소개된 트랜스포머(Transformer)를 이용한 이미지 분류 방법들은 기존 합성곱 신경망 기반 방법 대비 괄목할 만한 성능 향상을 보여주고 있다. 지역적 특성을 효과적으로 고려하기 위해 이미지 영역을 복수의 윈도우 영역으로 나누어 트랜스포머를 적용하는 방법에 대한 연구가 활발히 진행되어 왔으나, 윈도우 간 관계 및 중요도에 대한 학습은 여전히 부족한 상황이다. 본 논문에서는 이러한 문제점을 극복하기 위해 각 윈도우의 중요도를 학습에 반영할 수 있는 트랜스포머 구조를 제안한다. 제안하는 방법은 각 윈도우 영역에 대한 자기주의(Self-attention) 연산을 기반으로 압축과 완전 연결 계층(Fully Connected Layer)을 통해 각 윈도우 영역의 중요도를 계산한다. 계산된 중요도는 윈도우 영역들 간의 관계를 학습한 가중치로써 각 윈도우 영역에 곱해져 특징 값을 재조정 한다. 실험 결과를 통해 제안하는 방법이 기존 트랜스포머 기반 방법의 성능을 효과적으로 향상 시킬 수 있음을 보인다.

특징 분해를 이용한 얼굴 나이 분류 및 합성 (Facial Age Classification and Synthesis using Feature Decomposition)

  • 김찬호;박인규
    • 방송공학회논문지
    • /
    • 제28권2호
    • /
    • pp.238-241
    • /
    • 2023
  • 최근 인공지능 모델을 이용한 얼굴인식, 얼굴 수정 등 다양한 얼굴 작업들이 실생활에도 광범위하게 사용되고 있다. 그러나 모델의 학습에 사용되는 대부분의 얼굴 데이터셋은 사회활동이 활발한 특정 나이에 편중되고, 어린아이나 노인의 데이터가 적은 경향이 있다. 이와 같은 데이터셋 불균형 문제는 모델의 학습에도 좋지 않은 영향을 끼쳐, 아이나 노인같이 데이터가 적은 나이의 사람이 인공지능 모델을 사용할 때 사회활동이 활발한 나이의 사람이 사용할 때보다 성능이 떨어질 수 있고, 이들의 인공지능 모델 사용을 어렵게 할 가능성이 높다. 이를 개선하기 위해 본 논문은 특징 분해를 활용하여 얼굴 영상으로부터 나이를 분류하고 목표 나이로 합성하는 기법을 제안한다. 제안하는 기법은 FFHQ-Aging 데이터셋을 이용한 정량적, 정성적 평가를 통해 기존의 방법보다 더 나은 성능을 보인다.