• Title/Summary/Keyword: 학습용 데이터

Search Result 482, Processing Time 0.027 seconds

A Study on the Construction of Image Datasets for Object Detection of Painting Cultural Heritage (회화문화재 객체검출을 위한 학습용 이미지 데이터셋 구축 방안 연구)

  • Kwon, Do-Hyung;Yu, Jeong-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.853-855
    • /
    • 2021
  • 본 연구는 회화문화재 속에 표현된 다양한 종류의 객체를 검출할 수 있는 딥러닝 모델생성을 위해 필요한 학습용 이미지 데이터셋 구축방안을 제안한다. 먼저 기존 동양화 기반의 회화문화재 이미지 데이터 및 객체 특징 분석을 진행하였고, 이를 바탕으로 Natural image에 Pose transfer 및 Style transfer를 적용한 새로운 방식의 회화문화재 이미지 데이터 생성 방법을 제안한다. 제안한 프레임워크를 통해 기존 문화재 분야에서 가지고 있던 제한된 데이터 구축문제를 극복하고, 검출모델 생성을 위한 대용량의 학습데이터 구축 가능성을 제시하였다.

Big Data Platform for Learning in Cloud Computing Environment (클라우드 컴퓨팅 환경에서의 학습용 빅 데이터 플랫폼 설계)

  • Kim, Jun Heon
    • Proceedings of The KACE
    • /
    • 2017.08a
    • /
    • pp.63-64
    • /
    • 2017
  • 정보 기술의 끊임없는 발전에 따라 광범위한 분야에서 방대한 양의 데이터가 발생하게 되면서 이를 처리하기 위한 빅 데이터에 대한 연구 및 교육이 활발히 진행되고 있다. 이를 위하여 데이터 분석 및 처리를 위한 고성능의 서버 및 분산 처리를 위한 다수의 컴퓨터가 필요하며 이는, 개인 혹은 저사양의 수업 환경에서 빅 데이터를 학습하는 데에 어려움을 겪게 한다. 때문에 가상 환경에서 원활한 빅 데이터 학습을 위한 클라우드 기반의 시스템이 필요하다. 이에 본 논문에서는, 빅 데이터 처리 기술의 하나인 Spark를 이용한 빅 데이터 플랫폼 구축에 대하여 기술한다.

  • PDF

교육기술과 전자출판 기술의 융합 - EDUPUB 추진 현황과 발전 가능성 연구

  • Kim, Hyeon-Yeong;Jo, Yong-Sang;Im, Sun-Beom
    • Information and Communications Magazine
    • /
    • v.31 no.12
    • /
    • pp.97-105
    • /
    • 2014
  • 단행본, 소설, 잡지, 만화 등 다양한 형태의 전자출판물에 공통적으로 적용 가능한 표현 기술과 콘텐츠 유통을 위한 패키징 기술로 구성된 표준인EPUB3가 국제표준기구인 ISO/IEC에서 국제표준으로 채택됨에 따라 시장 표준이 공적 표준으로 통합되는 현상이 전자출판 분야에서도 뚜렷이 나타나고 있다. 본고에서는 전자출판 표준인 EPUB3을 교과서 등 교육용 교재, 참고서, 학습서 등 교육 분야에 확대 적용하기 위하여 온라인 평가 서비스, 학습용 소프트웨어 연계, 교육용 메타데이터 활용 등 이질적인 기술 들 간의 융합이 어떻게 이루어져야 하는지에 대한 방향을 제시한다. 이러한 노력은 지난 2013년부터 국제 표준화 단체인 IDPF(International Digital Publishing Forum), IMS Global Learning Consortium, World Wide Web Consortium이 구성한 EDUPUB Alliance를 통해 구체화되고 있다. 따라서 향후 어떠한 구체적인 주제의 논의가 국내에서도 필요한지 알아본다. 또한 디지털 교과서와 학습 교재는 모바일 및 온라인 학습환경에서 다양하게 활용될 수 있으며, 학습자가 생성하는 학습 데이터를 체계적으로 수집하고 분석한다면 학습결과를 향상시키는데 큰 기여를 할 수 있을 것으로 기대한다.

Data Augmentation using a Kernel Density Estimation for Motion Recognition Applications (움직임 인식응용을 위한 커널 밀도 추정 기반 학습용 데이터 증폭 기법)

  • Jung, Woosoon;Lee, Hyung Gyu
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.27 no.4
    • /
    • pp.19-27
    • /
    • 2022
  • In general, the performance of ML(Machine Learning) application is determined by various factors such as the type of ML model, the size of model (number of parameters), hyperparameters setting during the training, and training data. In particular, the recognition accuracy of ML may be deteriorated or experienced overfitting problem if the amount of dada used for training is insufficient. Existing studies focusing on image recognition have widely used open datasets for training and evaluating the proposed ML models. However, for specific applications where the sensor used, the target of recognition, and the recognition situation are different, it is necessary to build the dataset manually. In this case, the performance of ML largely depends on the quantity and quality of the data. In this paper, training data used for motion recognition application is augmented using the kernel density estimation algorithm which is a type of non-parametric estimation method. We then compare and analyze the recognition accuracy of a ML application by varying the number of original data, kernel types and augmentation rate used for data augmentation. Finally experimental results show that the recognition accuracy is improved by up to 14.31% when using the narrow bandwidth Tophat kernel.

Development of Preprocessing module for Korean online handwriting recognition (한글 온라인 필기 인식을 위한 전처리 모듈 개발)

  • Jeong, Min Jin;Jeong, Dabin;Lee, Kang Eun;Kim, Sungsuk;Yang, Sun Ok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.63-65
    • /
    • 2019
  • 본 논문은 개발하고자 하는 기계학습 기반 한글 필기 인식 시스템의 첫 연구 결과를 담고 있다. 즉, 기계학습을 위해서는 학습용 및 테스트용 필기 데이터가 아주 많이 필요하므로, 이를 수집하고 전처리하는 방법을 제안하였다. 한글의 한 글자는 자음과 모음을 결합하여 생성되는데, 실제 만 개 이상의 글자가 생성될 수 있다. 따라서 각각의 글자 데이터를 수집하는 대신, 수집한 글자 데이터로부터 초성, 중성, 종성을 구분하여 최종적으로 자음, 모음 데이터로 저장하고자 한다. 아직 초기 연구이므로, 다양한 경우에 대한 분석이나 실험 결과는 없지만, 이를 활용하여 온라인 필기 인식 모델에 적용하여 인식 성능을 높이기 위한 추후 연구의 기반으로 활용하고자 한다.

Recommendation of User Preferred Clothes using Support Vector Machine (Support Vector Machine을 이용한 개인 사용자 선호 의상 추천)

  • Kang, Han-Hoon;Yoo, Seong-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.240-245
    • /
    • 2006
  • 본 논문에서는 의상에 대한 사용자 선호도를 찾아내는 기법에 대하여 기술한다. 의상에 대한 사용자 선호도를 찾기 위해서 의상 데이터에 대해 데이터 모델을 새롭게 제안한다. 이 데이터 모델을 기반으로 사용자의 의상관련 히스토리를 저장한다. 이렇게 저장된 히스토리 정보에 기계 학습 기법 중 최근 각광받고 있는 SVM 기법을 적용하여 사용자 선호도를 찾아내도록 하였다. 이 결과를 다른 학습 기법인 Naive Bayes 기법을 사용하여 의상에 대한 사용자 선호도를 검색한 성능과 비교하여 우리 모델이 더 좋다는 것을 확인하였다. 우리는 5명의 사용자에 대해서 동일한 취향을 갖는 사용자가 몇 명인지에 따라 A(모두 다름), B(2명), C(3명), D(4명), E(모두 같음) 형태별, 사용자별 1000건의 히스토리를 일정한 기준에 따라 생성했다. 그리고 이 중에서 900건을 학습용 데이터, 100건을 검증용 데이터로 선정하여 실험이 진행되었다.

  • PDF

A development of App to gather data for machine learning on Korean language writing recognition (한글 필기 인식을 위한 기계학습 용 데이터 수집 앱 개발)

  • Bae, Junwoo;Shim, Hyundo;Kim, Sungsuk;Sung, Mi-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.753-754
    • /
    • 2018
  • 최근 인공지능에 대한 관심이 증가하고 관련 연구가 활발히 진행됨에 따라, 기존 연구분야에도 이를 적용하고자 하는 시도가 증가하고 있다. 본 연구진도 한글 글씨를 인식하기 위해 기계학습을 적용하고자 하며, 그에 따라 본 연구에서는 초기 연구로서 사용자 필기 데이터를 수집하기 위한 안드로이드용 앱을 개발하였다. 최종 대상이 한글 공부를 시작하는 유아로 선정하였으므로, 그에 적절하게 학습 앱의 Activity를 구성하였다. 입력한 한글 데이터 분만 아니라 하나의 글자에 대한 초성, 중성, 종성별로 데이터를 별도로 수집하여 추후 활용할 수 있게 구성하였다. 즉, 학습과정에서 발생한 데이터는 이미지와 이벤트 두 가지 모두 저장하여 추후 최종 연구에 활용하고자 하였다.

Estimation of Distribution Algorithm for Continuous Function Optimization (연속 변수 함수 최적화를 위한 탐색점 분포 학습 알고리즘)

  • 신수용;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.51-53
    • /
    • 2000
  • 기존의 진화 연산의 한계를 극복하기 위해서 탐색점 분포 학습 알고리즘(Estimation of Distribution Algorithm)이 부각되고 있다. 탐색점 분포 학습 알고리즘은 데이터의 분포를 파악하고, 파악된 분포를 이용해서 새로운 학습 데이터를 생성하는 일련의 과정을 통하여 최적화 문제를 해결하는 방법이다. 그런데, 기존의 탐색점 분포 학습 알고리즘들은 대부분 이진 벡터값을 가지는 최적화 문제들만을 대상으로 하고 있다. 본 논문에서는 비감독 확률 신경망 모델인 헬름홀츠 머신을 이용해서 데이터의 분포를 학습하여 연속 함수 최적화 문제를 해결하는 방법을 개발하였다. 테스트 함수들에 대해서 실수 표현형을 사용한 유전자 알고리즘과 결과를 비교하여 제안하는 방법의 우수성을 검증하였다.

  • PDF

A Study on Creating a Dataset(G-Dataset) for Training Neural Networks for Self-diagnosis of Ocular Diseases (안구 질환 자가 검사용 인공 신경망 학습을 위한 데이터셋(G-Dataset) 구축 방법 연구)

  • Hyelim Lee;Jaechern Yoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.580-581
    • /
    • 2024
  • 고령화 사회에 접어들면서 황반 변성과 당뇨 망막 병증 등 시야결손을 동반하는 안구 질환의 발병률은 증가하지만 이러한 질환의 조기 발견에 인공지능을 접목시킨 연구는 부족한 실정이다. 본 논문은 안구 질환 자가 검사용 인공 신경망을 학습시키기 위한 데이터 베이스 구축 방법을 제안한다. MNIST와 CIFAR-10을 합성하여 중첩 이미지 데이터셋인 G-Dataset을 생성하였고, 7개의 인공신경망에 학습시켜 최종적으로 90% 이상의 정확도를 얻음으로 그 유효성을 입증하였다. G-Dataset을 안구 질환 자가 검사용 딥러닝 모델에 학습시켜 모바일 어플에 적용하면 사용자가 주기적인 검사를 통해 안구 질환을 조기에 진단하고 치료할 수 있을 것으로 기대된다.

Development of dataset amplification software (학습데이터 증폭 소프트웨어 개발)

  • Seo, Kyeong-Deok;Koh, Seok-Joo;Shin, Jae-Won;Park, Hyung-Seok;Joe, Seong-Yoon;Kim, Kyeong-Rae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.664-666
    • /
    • 2020
  • 데이터의 다양성은 학습에 따른 모델의 성능을 좌지우지하는 중요한 요소이다. 그렇기 때문에 많은 양의 데이터를 확보하는 것은 학습에 있어서 아주 중요하다. 하지만, 데이터를 수집하는 것은 시간과 비용이 많이 드는 단계 중 하나이다. 본 논문에서는 제한된 데이터를 가지고 이미지 처리를 거쳐 대량의 데이터로 증폭시켜 많은 양의 데이터를 확보하는 과정에 대해 제안한다. 가지고 있는 YOLOv4용 학습 데이터 셋을 활용하여 사용자로부터 입력받은 확대/축소 비율, 각도로 데이터를 변형하고, 이렇게 추가로 생성된 데이터 셋을 기존 학습 데이터 셋에 재포함시키는 소프트웨어를 개발하는 것을 목표로 한다. 구현된 소프트웨어로 증폭된 대량의 데이터 셋을 다시 원본 학습 데이터 셋에 추가하고, 같은 영상에 대해서 원본 데이터 셋만 학습시킨 경우의 객체 검출 결과와 증폭된 학습 데이터 셋이 포함된 데이터 셋의 경우의 객체 검출 결과를 비교하여 그 성능을 검증하고 분석하도록 한다.

  • PDF