• 제목/요약/키워드: Multi-media learning

검색결과 133건 처리시간 0.026초

다중 스케일 얼굴 영역 딕셔너리의 적대적 증류를 이용한 얼굴 초해상화 (Face Super-Resolution using Adversarial Distillation of Multi-Scale Facial Region Dictionary)

  • 조병호;박인규;홍성은
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.608-620
    • /
    • 2021
  • 최근 딥러닝 기반의 얼굴 초해상화 연구는 일반적인 영상에 대한 초해상화 연구와 달리 인간의 얼굴이 가지는 구조적 혹은 의미론적인 특성을 반영한 안면 랜드마크 정보, 주요 영역 딕셔너리와 같은 사전 및 참조 정보를 사용하여 우수한 초해상화 결과를 보였다. 그러나 얼굴에 특화된 사전 정보를 사용할 시 추가적인 처리 소요 시간과 메모리를 요구하는 단점이 존재한다. 본 논문은 앞서 언급한 한계점을 극복하고자 지식 증류 기법을 활용한 효율적인 초해상화 모델을 제안한다. 주요 얼굴 영역 기반의 딕셔너리 정보를 사용하는 선생 모델에 지식 증류 기법을 적용하여 추론 시 랜드마크 정보와 부가적인 딕셔너리 사용이 필요 없는 학생 모델을 구축하였다. 제안하는 학생 모델은 특징맵 기반의 적대적 지식 증류를 통해 얼굴 주요 영역 딕셔너리를 가지고 있는 선생 모델로부터 학습을 진행하였다. 본 논문은 제안하는 학생 모델의 실험 결과를 통해 정량 및 정성적으로 우수함을 보이며 선생 모델의 연산량에 비해 90% 이상 절감되는 효율성을 증명한다.

소리 데이터를 이용한 불량 모터 분류에 관한 연구 (A Study on the Classification of Fault Motors using Sound Data)

  • 장일식;박구만
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.885-896
    • /
    • 2022
  • 제조에서의 모터 불량은 향후 A/S 및 신뢰성에 중요한 역활을 한다. 모터의 불량 구분은 소리, 전류, 진동등의 측정을 통해 검출한다. 본 논문에서 사용한 데이터는 자동차 사이드미러 모터 기어박스의 소리를 사용하였다. 모터 소리는 3가지의 클래스로 구성되어 있다. 소리 데이터는 멜스펙트로그램을 통한 변환 과정을 거쳐 네트워크 모델에 입력된다. 본 논문에서는 불량 모터 구분 성능을 올리기 위한 데이터 증강, 클래스 불균형에 따는 다양한 데이터 재샘플링, 재가중치 조절, 손실함수의 변경, 표현 학습과 클래스 구분의 두 단계 분리 방법 등 다양한 방법을 적용하였으며, 추가적으로 커리큘럼 러닝 방법, 자기 스페이스 학습 방법 등을 Bidirectional LSTM Attention, Convolutional Recurrent Neural Network, Multi-Head Attention, Bidirectional Temporal Convolution Network, Convolution Neural Network 등 총 5가지 네트워크 모델을 통하여 비교하고, 모터 소리 구분에 최적의 구성을 찾을 수 있었다.

Novel Intent based Dimension Reduction and Visual Features Semi-Supervised Learning for Automatic Visual Media Retrieval

  • kunisetti, Subramanyam;Ravichandran, Suban
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.230-240
    • /
    • 2022
  • Sharing of online videos via internet is an emerging and important concept in different types of applications like surveillance and video mobile search in different web related applications. So there is need to manage personalized web video retrieval system necessary to explore relevant videos and it helps to peoples who are searching for efficient video relates to specific big data content. To evaluate this process, attributes/features with reduction of dimensionality are computed from videos to explore discriminative aspects of scene in video based on shape, histogram, and texture, annotation of object, co-ordination, color and contour data. Dimensionality reduction is mainly depends on extraction of feature and selection of feature in multi labeled data retrieval from multimedia related data. Many of the researchers are implemented different techniques/approaches to reduce dimensionality based on visual features of video data. But all the techniques have disadvantages and advantages in reduction of dimensionality with advanced features in video retrieval. In this research, we present a Novel Intent based Dimension Reduction Semi-Supervised Learning Approach (NIDRSLA) that examine the reduction of dimensionality with explore exact and fast video retrieval based on different visual features. For dimensionality reduction, NIDRSLA learns the matrix of projection by increasing the dependence between enlarged data and projected space features. Proposed approach also addressed the aforementioned issue (i.e. Segmentation of video with frame selection using low level features and high level features) with efficient object annotation for video representation. Experiments performed on synthetic data set, it demonstrate the efficiency of proposed approach with traditional state-of-the-art video retrieval methodologies.

네이버 영화 리뷰 데이터를 이용한 의미 분석(semantic analysis) (Semantic analysis via application of deep learning using Naver movie review data)

  • 김소진;송종우
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.19-33
    • /
    • 2022
  • SNS의 등장으로 인터넷 이용자들이 온라인에 남기는 텍스트의 양이 방대해지고 그 중요성이 강조되고있다. 특히 네이버의 영화 탭에서 볼 수 있는 영화 평점이나 리뷰는 실제로 관객들이 영화를 보기 전 해당 영화를 볼 것인지 결정하는 데 주요 요인이 되기도 한다. 본 연구는 실제 네이버 영화 리뷰 데이터를 가지고 평점을 예측하는 분석을 수행했다. 영화 리뷰 데이터를 분석하기 위해 평점의 분포를 통해 데이터 특성을 살펴보았고, 텍스트의 의미를 분석하기 위해 형태소 분석을 통한 한국어 자연어처리를 수행했다. 또한 평점 예측에 활용할 모델 선택을 위해 2-Class와 multi-Class 문제들에 대해 머신러닝과 딥러닝, 회귀와 분류 분석을 비교했으며, 오분류의 원인을 영화 리뷰 데이터 특성과 연관시켜 서술했다.

다층 선형 매핑 기반 단일영상 초해상화 기법 (Single Image Super-Resolution Using Multi-Layer Linear Mappings)

  • 최재석;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.9-11
    • /
    • 2016
  • 최근 UHDTV(ultra high definition television) 등의 고해상도 디스플레이가 시장에 등장하면서, 기존의 저해상도 FHD(full high definition) 영상을 고해상도 영상으로 변환할 수 있는 초해상화(super-resolution, SR) 기법들이 각광을 받고 있다. 그 중, 선형 매핑(linear mapping)을 사용하여 저해상도 패치(patch)로부터 고해상도 패치를 복원하는 초해상화 기법은 상대적으로 낮은 복잡도로 좋은 품질의 고해상도 영상을 생성한다. 그러나 이러한 기법은 단순한 선형 매핑을 기반으로 하기 때문에 복잡한 비선형적(nonlinear) 저해상도-고해상도 관계를 예측하기 힘든 단점이 있다. 최근 각광받는 딥러닝(deep learning) 기술은 다층(multi-layer) 네트워크를 쌓아 입력과 출력 간의 복잡한 비선형 관계를 훈련시켜 좋은 성능을 보이는데, 이를 바탕으로 본 논문에서는 다중의 레이어로 구성된 다층 선형 매핑(multi-layer linear mappings, MLLM)을 기반으로 하는 초해상화 기법을 새롭게 제안한다. 제안하는 다층 선형 매핑은 기존 선형 매핑보다 비선형적 관계를 더 잘 예측하여 높은 품질의 고해상도 영상을 생성할 수 있게 한다. 제안된 초해상화 기법은 딥러닝 기반 초해상화 기법과 필적하는 품질의 고해상도 영상을 생성하면서도 더 낮은 복잡도를 지니는 것을 확인하였다.

  • PDF

제7차 중학교 ‘환경’ 교육과정과 청소년 환경교육 (Middle School Environmental Education of the 7th National Curriculum and Application to Teen-agers Practice of Environmental Education)

  • 이민부;박승규
    • 한국환경교육학회지:환경교육
    • /
    • 제11권2호
    • /
    • pp.14-25
    • /
    • 1998
  • The Quality of human living depends on the environmental quality of the region sustaining the life. The environmental deterioration of the modern society is due to mechanical environmentalism. For the better quality of the life, The changes of recognition and attitude on the environments are required. These changes of mind are also important in environmental education for teenagers. The 7th national curriculum, officially anounced December 1998, focuses on the change of attitude to environments and practical behavior in real life for “Environments”, the environmental education curriculum in middle school. Basic elements of the curriculum are cultivation of the pro-environmental thinking, multi-levelling of teaching materials and methods, and encouraging of student participating activity. Actually, the curriculum construction is composed of stepped-levelling of teaching and learning, reasonable contents volume, encouraging of student practice, and suggesting of evaluation standards of textbook writing. Three main subjects of environmental education for middle school consist of (1) man and environment, (2) recognition of environmental problem, and (3) protection activity for environment. Methodology of environmental education can include multi-disciplinary approaches, variable teaching methods, and continuing evaluation of student practice and participation attitude. Environmental education for teenagers relating to the 7th national curriculum focuses on recognition of the environmental problems and practice activity in daily life. The recognition includes considering relationship of human life to environment, solving environmental problems in regional context, and development of comprehensive understanding concept of the environments. For the practice education, variable teaching methods, such as field survey and application of multi-media, are needed.

  • PDF

ADAS용 다중화각 카메라를 이용한 객체 인식 향상 (Improved Object Recognition using Multi-view Camera for ADAS)

  • 박동훈;김학일
    • 방송공학회논문지
    • /
    • 제24권4호
    • /
    • pp.573-579
    • /
    • 2019
  • 완전한 자율 주행에 이르기 위해서는 주변 환경을 인지하는 인지 능력이 사람보다 뛰어나야 한다. 자율 주행에서 주로 사용되는 $60^{\circ}$ 협각, $120^{\circ}$ 광각 카메라는 시야각에 따른 각각의 단점이 존재한다. 본 논문의 목적은 광각, 협각 카메라가 가진 각각의 단점을 극복하기 위하여, 다중화각 차량 전방 카메라 시스템을 이용하여 더 넓은 영역의 전방을 대상으로 더 정확히 객체를 인식할 수 있는 심층신경망 알고리즘을 개발하는 것이다. 광각, 협각 카메라로 취득된 데이터의 종횡비를 분석해 SSD(Single Shot Detector) 알고리즘을 수정하였고, 취득된 데이터를 학습하여 단안 카메라만을 사용할 때 보다 높은 성능을 달성하였다.

다 시점 영상 콘텐츠 특성에 따른 딥러닝 기반 깊이 추정 방법론 (Deep learning-based Multi-view Depth Estimation Methodology of Contents' Characteristics)

  • 손호성;신민정;김준수;윤국진;정원식;이현우;강석주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.4-7
    • /
    • 2022
  • 최근 다 시점 영상 콘텐츠 기반 3차원 공간(장면) 복원을 위한 다 시점 깊이 추정 딥러닝 네트워크 방법론이 널리 연구되고 있다. 다 시점 영상 콘텐츠는 촬영 구도, 촬영 환경 및 세팅에 따라 다양한 특성을 가지며, 고품질의 3차원 복원을 위해서는 이러한 특성을 이해하고, 적절한 깊이 추정 네트워크 기법들을 적용하는 것이 중요하다. 다 시점 영상 촬영 구도로는 수렴형, 발산형이 존재하며, 촬영 세팅에는 카메라 시점 간 물리적 거리인 baseline이 있다. 본 연구는 이와 같은 다 시점 영상 콘텐츠의 종류와 각 특징에 기반하여 콘텐츠(데이터 셋)의 특성에 따른 적절한 깊이 추정 네트워크 방법론을 다룬다. 실험 결과로부터, 기존의 다 시점 깊이 추정 네트워크를 발산형 또는 large baseline 특성을 가지는 데이터 셋에 곧바로 적용하는데 한계점이 존재함을 확인하였다. 따라서, 각 영상 환경에 적합한 '참조 시점 개수' 및 적절한 '참조 시점 선택 알고리즘'의 필요성을 검증하였다. 결론적으로, 3차원 공간(장면) 복원을 위한 딥러닝 기반 깊이 추정 네트워크 구현 시, 본 연구 결과가 다 시점 영상 콘텐츠 기반 깊이 추정 기법 선택에 있어 가이드라인으로 활용될 수 있음을 확인하였다.

  • PDF

초등학교 음악 감상 학습 시스템 개발 및 적용 (Implementation and application of music appreciation instruction system in elementary schools)

  • 김동일;박선주
    • 정보교육학회논문지
    • /
    • 제6권1호
    • /
    • pp.42-52
    • /
    • 2002
  • 효과적인 음악 감상 학습을 위해서는 음악 수업 시간의 감상뿐만 아니라 시간과 공간의 제약 없이 반복적인 음악 감상이 가능해야하며, 음악 감상 요소에 따른 다양한 멀티미디어 감상 학습 자료를 필요로 한다. 그러나 단위 시간에 개별화되고 반복적인 감상 학습이 어려울 뿐만 아니라 개별화된 감상 학습 자료도 부족한 실정이다. 이러한 문제를 해결하기 위해서 초등학교 음악 감상 학습에 필요한 학습 자료를 공유하고 음악 감상 학습 요소를 포함하는 초등학교 음악 감상 학습 시스템이 필요하다. 그러므로 본 논문에서는 초등학교 음악 감상 학습 요소를 분석하여 자기 주도적이고 능동적인 음악 감상학습이 가능하며, 또한, 온라인 상에서 학생이 올린 감상문을 교사가 평가함으로써 성취감과 자신감을 갖게 하여 즐거운 음악 활동을 경험할 수 있도록 초등학교 음악 감상 학습 시스템을 설계 및 개발하였다. 그리고 이를 초등학교에 적용해 보고 그 결과를 분석하였다.

  • PDF

호주 국가교육과정 예술과목 'Media Art' 에 나타난 미디어 리터러시 교육 (Media Literacy Education in the Australian Curriculum: Media Art)

  • 박유신
    • 만화애니메이션 연구
    • /
    • 통권48호
    • /
    • pp.271-310
    • /
    • 2017
  • 이 논문은 호주의 국가교육과정 ACARA의 예술교육과정인 미디어 아트 과목의 구성 및 그 내용을 살펴보고, 한국의 교육과정에 주는 시사점을 논의한다. 미디어 아트과목에서 다루는 미디어는 TV, 영화, 비디오, 신문, 라디오, 비디오 게임, 인터넷 및 모바일 미디어 등을 포괄하는 복합 양식적 미디어 전반과 그 콘텐츠이다. ACARA에 나타난 미디어 아트 교육과정의 목표는 일반적으로 다양한 목적과 청중을 대상으로 한 의사소통기술의 창조적 사용, 지식, 이해, 기술을 발전시키는 데에 있다. 미디어 아트 과목을 통해 학생 개인과 공동체는 자신들을 둘러싼 풍부한 문화와 실제적 의사소통에 참여하고, 이를 실험하면서 언어, 기술, 제도, 청중, 재현의 5개 핵심개념에 대한 지식과 이해를 발전시키게 된다. 본 연구의 시사점은 다음과 같다. ACARA의 미디어 아트 교육과정은 독립적 예술교육과정으로 개발되어 호주 교육과정 내에서 특별히 중요성을 지니고 있음을 알 수 있다. ACARA의 미디어 아트 교육과정은 독립적인 교과로 구성되어 있으나, 그 실행에 있어서 다른 과목들과 긴밀하게 연계되어 지도되도록 교육과정상에서 제안되고 있다. 교육과정 구성상의 체계성과 정교함은 교사 차원의 교수 학습 설계 및 평가 측면에 있어서 매우 효과적으로 구성되어 있다. ACARA의 미디어 아트 교육과정은 미디어 리터러시 교육을 국가 및 주 차원에서 선도적으로 실행해 온 호주의 사례라는 점에서 한국 미디어 리터러시 교육과정 구성에 있어서 향후 많은 도움이 될 것으로 생각된다.