• 제목/요약/키워드: Learning media

검색결과 1,601건 처리시간 0.021초

딥러닝을 활용한 나만의 손글씨 글꼴 생성 및 분석 (Making and Analyzing My Handwriting Font Using Deep Learning)

  • 조권영;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.225-227
    • /
    • 2022
  • 다양한 분야에서 전자기기들을 사용함으로 인해 문서를 작성할 때 디지털 글꼴을 통해 작성하게 되는데, 이로 인해 글꼴을 종류가 여러 형태로 증가하면서 다양한 글꼴들을 사용하고 있다. 하지만, 글꼴마다 저작권을 가지고 있어서 마음에 든다고 해서 함부로 사용할 수도 없는 것이 문제점이다. 또한, 한글은 다른 언어에 비해 글자 조합방식이 많아서 폰트로 제작하기엔 많은 시간과 비용이 든다는 문제도 있다. 이러한 문제들을 해결하기 위해서 딥러닝을 통해 글꼴을 제작하게 된다면 적은 글자를 입력해 많은 글자의 결과를 도출함으로써, 시간과 비용을 절감해 효율적으로 만들고자 하였다. 이에 본 논문은 GAN을 기반으로 한 손글씨 폰트 제작을 하는 가운데 글꼴을 만들기 위해 입력에 어떤 글자들이 필요한 지에 대해 연구하였다. 다양한 분석적 요소를 갖고 실험을 하여 입력에 따라 결과가 어떻게 달라지는지를 알아보았고 이를 바탕으로 글꼴을 생성하였다.

  • PDF

도메인 판별기의 적대적 학습을 이용한 객체 검출 방법 (Object Detection Method Using Adversarial Learning on Domain Discriminator)

  • 김현석;이의진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.91-94
    • /
    • 2022
  • 자율주행 자동차 개발 연구가 활발히 진행됨에 따라 객체 검출기의 성능이 중요하게 되었다. 딥러닝 기술의 발전하면서 객체 검출기의 성능도 큰 발전을 이루었다. 그에 따라 도로 위 차량 검출기의 성능도 발전하고 있으나 평상시 낮 도로상황에서 잘 동작하던 모델은 안개가 끼거나 밤 상황이 되면 제대로 동작하지 못하는 문제를 가지고 있다. 이유는 딥러닝 모델이 학습할 때 사용한 데이터셋의 정보에 따라 특정 도메인에 편향된 특성을 학습하기 때문이다. 따라서, 본 논문에서는 객체 검출 신경망에 도메인 판별기를 적용하여 이와 같은 도메인 이동 문제를 극복하는 모델을 제안한다. 모델의 성능을 Cityscapes 데이터셋과 Foggy Cityscapes 데이터셋을 사용하여 평가한 결과, 기존의 특정 도메인에서 학습한 모델보다 제안하는 모델의 검출 성능이 개선된다는 것을 확인하였다.

  • PDF

블록체인 기반 연합학습을 위한 레퍼런스 아키텍처 (A Reference Architecture for Blockchain-based Federated Learning)

  • 고은수;문종현;이광기;손채봉
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.119-122
    • /
    • 2022
  • 연합학습은, 데이터 샘플을 보유하는 다수의 분산 에지 디바이스 또는 서버들이 원본 데이터를 공유하지 않고 기계학습 문제를 해결하기 위해 협력하는 기술로서, 각 클라이언트는 소유한 원본 데이터를 로컬모델 학습에만 사용함으로써, 데이터 소유자의 프라이버시를 보호하고, 데이터 소유 및 활용의 파편화 문제를 해결할 수 있다. 연합학습을 위해서는 통계적 이질성 및 시스템적 이질성 문제 해결이 필수적이며, 인공지능 모델 정확도와 시스템 성능을 향상하기 위한 다양한 연구가 진행되고 있다. 최근, 중앙서버 의존형 연합학습의 문제점을 극복하고, 데이터 무결성 및 추적성과 데이터 소유자 및 연합학습 참여자에게 보상을 효과적으로 제공하기 위한, 블록체인 융합 연합학습기술이 주목받고 있다. 본 연구에서는 이더리움 기반 블록체인 인프라와 호환되는 연합학습 레퍼런스 아키텍처를 정의 및 구현하고, 해당 아키텍처의 실용성과 확장성을 검증하기 위하여 대표적인 연합학습 알고리즘과 데이터셋에 대한 실험을 수행하였다.

  • PDF

딥러닝 네트워크를 통한 택배 상자 파손 분류 (Classification for the Breakage of the Package Boxes using a Deep Learning Network)

  • 김은강;김성하;신혜선;김소연;이범식
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.250-253
    • /
    • 2022
  • 본 설계에서는 택배의 현재 상태를 확인 후 택배 상자의 파손 유무를 분류하고 사진으로 제공하는 기술을 제안하였다. 본 설계에서는 딥러닝 네트워크를 통해 훈련된 인공지능을 통해 일반 상자와 파손 상자를 분류하고, 파손 상태일 시 소비자와 택배사에 알람으로 보고하는 것을 주 기능으로 하고 있다. 딥러닝 네트워크 훈련을 위해 약 1,000장의 데이터셋을 직접 구성하고 학습하였다. 본 설계에서 사용된 택배 상자 파손 여부 분류기의 분류 정확도는 93.33%이고, 이 분류 성능은 택배 상자의 상태를 분류하는 데 있고, 정확도의 분류 성능이라고 할 수 있다.

  • PDF

준지도학습의 이상행동감지에서의 이상행동종류별 균형의 중요성 분석 (Analyzing the Importance of Balanced Action Classes in Weakly Supervised Video Anomaly Detection)

  • 박태경;박현정;홍제형
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.145-148
    • /
    • 2022
  • 준지도학습 기반의 동영상 이상행동감지는 구하기 어려운 프레임 단위 레이블이 필요하지 않아 더 많은 동영상을 학습에 활용 가능한 장점이 있어 관련 연구가 활발히 진행되고 있다. 최근 제안된 기법들은 주로 UCF-Crime 이라는 실제 CCTV 동영상 데이터셋을 활용하고 있는데, 본 데이터셋은 학습 영상과 테스트 영상에서 이상행동 클래스 별 분포도가 균등하지 않다. 본 연구에서는 해당 불균형으로 인해 학습 모델이 특정 행동 클래스에 과적합될 수 있음을 보이며, 이러한 불균형을 해결하기 위해 Class-Balanced Multiple Instance Learning Loss 를 제안한다. 이를 통해 기존에 특정 클래스에 편중되었던 모델이 이상행동 종류에 좀 더 균등한 성능을 낼 수 있음을 보여준다. 특히 단순히 클래스별 정확도가 제로섬(zero sum)으로 증감하는 것이 아니라 전체적인 이상행동 판별 정확도 또한 향상됨을 실험 결과를 통해 확인할 수 있다.

  • PDF

블록 기반 특징맵 크기 조정을 이용한 DNN 특징맵 압축 (Neural Feature Compression with Block-based Feature Resizing)

  • 윤규리;정혜원;김영웅;김연희;정세윤;김휘용
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1203-1206
    • /
    • 2022
  • 자율주행, IoT 등 많은 양의 영상 정보를 실시간으로 처리해야 하는 기술과 mobile device 등의 기기에서 Machine Learning 연산을 하는 소프트웨어들이 등장함에 따라 사람을 위한 영상을 출력하는 영상 부호화 기술 대신 기계의 vision task 성능을 위해 특화된 영상 부호화 기술의 필요성이 대두됐다. 본 연구에서는 영상에서 추출한 특징맵을 Neural-Net based Video Coding 모델을 이용해 압축률과 기계의 vision task 성능을 동시에 최적화한다. 또한, 하드웨어 친화적인 block-based 처리와 이로 인한 성능 저하를 최소화하기 위해 적응적 resizing 방식을 제안한다.

  • PDF

딥러닝 기반 특징점 추출 및 매칭 기술을 활용한 밝기 적응형 영상 스티칭 (Luminance-adaptive Image Stitching by Using Deep learning based Feature Detection and Matching)

  • 김민영;김건호;이민석;이성배;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.847-850
    • /
    • 2022
  • 최근 가상 현실(Virtual Reality), 파노라마(Panorama) 영상 등에 관한 관심과 수요가 증가함에 따라 고해상도 영상을 얻기 위한 영상 스티칭(Image Stitching)에 관한 연구가 활발하게 진행되고 있다. 영상 스티칭은 다수의 영상을 하나의 영상으로 합성해 카메라의 좁은 시야각 문제를 해결함으로써 사용자에게 몰입감과 현장감을 제공할 수 있는 기술이다. 영상 스티칭에 있어 특징점 추출 및 매칭 과정의 정확도는 스티칭 영상의 품질을 결정짓는 핵심적인 요소이지만, 기존의 특징점 추출 및 매칭 방법은 밝기가 어둡고 선명도가 낮은 영상의 스티칭에서 정확도가 저하될 수 있고 생성된 스티칭 영상의 품질 또한 저하될 수 있다는 제한 사항이 있다. 이에 본 논문에서는 앞선 제한적 영상에 대하여 특징점 추출 및 매칭의 정확도를 높여 스티칭 영상의 품질을 높이기 위하여 SuperPoint와 SuperGLUE를 활용한 입력 영상의 밝기 적응형 영상 스티칭 방법을 제안하고자 한다.

  • PDF

딥러닝 기반 마스크 착용자 및 미착용자 검출 (Mask and Maskless Wearers Detection based on Deep Learning)

  • 김태현;우승희;김정미;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.325-327
    • /
    • 2021
  • 코로나19 전염병 예방을 위한 공공장소에서의 마스크 착용이 의무화되고 있다. 그러나 사람들이 다양한 이유로 마스크를 제대로 착용하지 않아 감염에 노출되는 위험이 발생하고 있다. 이러한 방역 문제를 해결하고 본 논문은 영상을 인식하여 마스크를 쓴 얼굴과 쓰지 않은 얼굴을 검출하는 방식을 제안한다. 제안 방법은 마스크 착용자와 비착용자 얼굴 영상을 딥러닝 기반의 YOLO 네트워크로 학습하여, 마스크 착용 유무를 판별한다. 동일 YOLO 네트워크에 대해 여러가지 조건으로 학습을 수행하고, 학습에 사용되지 않은 검증 데이터를 이용해 정확도가 가장 높은 네트워크의 가중치를 선택하였다. 실험결과, 마스크 착용자는 67.2%, 미착용자는 39.8%의 판별 정확도를 보였다. 미착용자에 대해 낮은 정확도를 보인 이유는 학습 데이터의 부족으로 판단되며, 이를 보완하기 위하여 더 많은 학습데이터를 제작하여 성능을 개선시키고자 한다.

  • PDF

딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발 (Development of integrated data augmentation automation tools for deep learning)

  • 장찬호;이서영;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

딥러닝 기반 한국어 랩 작사 소프트웨어 (Software for Korean Rap Songwriting based on Deep Learning)

  • 최광희;박서진;권태국;구명완
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.287-289
    • /
    • 2021
  • 해당 소프트웨어는 딥러닝 기반의 언어 모델을 이용하여 한국어 랩을 더 효과적으로 작성할 수 있도록 돕는다. 이 소프트웨어는 단순히 가사를 생성하는 데에 그치지 않고, 라임을 맞추고자 하는 대상 단어와 앞뒤 문맥이 주어졌을 때, 라임과 맥락에 맞는 단어 목록을 추천한다. 작사가는 사용자 친화적인 문서 편집 인터페이스를 통하여 언어 모델과 적극적으로 상호작용을 해 나가며 효율적으로 가사를 만들어나갈 수 있다.

  • PDF