• 제목/요약/키워드: Feature Augmentation

검색결과 47건 처리시간 0.021초

Design of Mobile Application for Learning Chemistry using Augmented Reality

  • Kim, Jin-Woong;Hur, Jee-Sic;Ha, Min Woo;Kim, Soo Kyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.139-147
    • /
    • 2022
  • 본 연구에서는 증강현실 기술을 이용하여, 화학에 입문하는 사람이 화학 학습에 필요한 지식을 쉽게 습득할 수 있도록 모바일 애플리케이션을 개발하는 것을 목표로 한다. 본 연구에서는 2차원 형태의 그림을 인식해 화학 구조를 3차원의 개체로 증강 시켜 사용자의 화면에 보여주고, 이와 관련된 다분야의 정보를 동시에 제공하는 서비스를 활용해 새로운 화학 학습 경험을 제공하는 점이 특징이다. 이를 위해 별도의 시스템과 콘텐츠를 구성하였고, 안전하고 실시간적인 데이터 관리를 위해 로그인 API와 실시간 데이터베이스 기술을 사용하였으며, 이미지 인식 및 3차원 개체 증강 서비스를 위해 이미지 트래킹 기술을 사용하였다. 본 연구를 통한 결과는 실험을 통해 유의미한 결과를 도출하였다. 향후 연구에서는 화학 구조 데이터 라이브러리를 사용하여 효율적으로 데이터를 불러오고 출력할 수 있도록 한다.

데이터 증강을 통한 기계학습 능력 개선 방법 연구 (Study on the Improvement of Machine Learning Ability through Data Augmentation)

  • 김태우;신광성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.346-347
    • /
    • 2021
  • 기계학습을 위한 패턴인식을 위해서는 학습데이터의 양이 많을수록 그 성능이 향상된다. 하지만 일상에서 검출해내야하는 패턴의 종류 및 정보가 항상 많은 양의 학습데이터를 확보할 수는 없다. 따라서 일반적인 기계학습을 위해 적은데이터셋을 의미있게 부풀릴 필요가 있다. 본 연구에서는 기계학습을 수행할 수 있도록 데이터를 증강시키는 기법에 관해 연구한다. 적은데이터셋을 이용하여 기계학습을 수행하는 대표적인 방법이 전이학습(transfer learning) 기법이다. 전이학습은 범용데이터셋으로 기본적인 학습을 수행한 후 목표데이터셋을 최종 단계에 대입함으로써 결과를 얻어내는 방법이다. 본 연구에서는 ImageNet과 같은 범용데이터셋으로 학습시킨 학습모델을 증강된 데이터를 이용하여 특징추출셋으로 사용하여 원하는 패턴에 대한 검출을 수행한다.

  • PDF

MLCNN-COV: A multilabel convolutional neural network-based framework to identify negative COVID medicine responses from the chemical three-dimensional conformer

  • Pranab Das;Dilwar Hussain Mazumder
    • ETRI Journal
    • /
    • 제46권2호
    • /
    • pp.290-306
    • /
    • 2024
  • To treat the novel COronaVIrus Disease (COVID), comparatively fewer medicines have been approved. Due to the global pandemic status of COVID, several medicines are being developed to treat patients. The modern COVID medicines development process has various challenges, including predicting and detecting hazardous COVID medicine responses. Moreover, correctly predicting harmful COVID medicine reactions is essential for health safety. Significant developments in computational models in medicine development can make it possible to identify adverse COVID medicine reactions. Since the beginning of the COVID pandemic, there has been significant demand for developing COVID medicines. Therefore, this paper presents the transferlearning methodology and a multilabel convolutional neural network for COVID (MLCNN-COV) medicines development model to identify negative responses of COVID medicines. For analysis, a framework is proposed with five multilabel transfer-learning models, namely, MobileNetv2, ResNet50, VGG19, DenseNet201, and Inceptionv3, and an MLCNN-COV model is designed with an image augmentation (IA) technique and validated through experiments on the image of three-dimensional chemical conformer of 17 number of COVID medicines. The RGB color channel is utilized to represent the feature of the image, and image features are extracted by employing the Convolution2D and MaxPooling2D layer. The findings of the current MLCNN-COV are promising, and it can identify individual adverse reactions of medicines, with the accuracy ranging from 88.24% to 100%, which outperformed the transfer-learning model's performance. It shows that three-dimensional conformers adequately identify negative COVID medicine responses.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

모바일 증강현실을 이용한 작업자 중심의 폐색된 건축물 시각화 시스템 개발 (Implementation of Constructor-Oriented Visualization System for Occluded Construction via Mobile Augmented-Reality)

  • 김태호;김경호;한윤상;이석한;최종수
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.55-68
    • /
    • 2014
  • 현대의 지하 시설물들은 보행자의 보행에 방해되지 않도록 지하에 매설 되어 있기 때문에 가시적인 확인이 어렵다. 이러한 폐색 시설물들을 다루는 건설현장에서는 시각적으로 위치를 정확히 추정하기 어렵기 때문에 작업자의 경험 또는 종이 도면 등에 의존하다 보니 침수나 붕괴의 위험에 노출되는 등 많은 문제점이 발생한다. 본 논문에서는 일반적인 건설 현장에서 폐색된 지하 시설물을 모바일을 이용한 작업자 중심의 시각화 시스템을 제안한다. 논문의 구성은 크게 3단계로 이루어 진다. 먼저, "맨홀 검출 및 특징점 추출 단계"에서는 폐색된 건축물의 기준점인 폐색되지 않는 맨홀을 검출 및 추출한다. 다음으로, "특징점 추적 단계" 에서는 이전단계에서 추출한 특징점을 추적한다. 마지막으로, "폐색 건축물 시각화 단계" 에서는 맨홀에 따라 서로 다른 지하시설물이 존재함으로 이전 단계에서 검출 및 추적된 맨홀의 위치에 모바일에 내장된 GPS 데이터를 분석하여 현장에 해당하는 폐색된 건축물인 3차원 객체를 정합 한다. 제안된 방법은 실내 환경에서 맨홀 검출과 특징점 추출 및 추적방법들의 비교 분석을 통해 최적의 방법을 적용하였으며, 실제 환경에서의 폐색된 상/하수도 배관 증강을 통해 가능성을 확인하였다. 또한, 폐색된 상하수도 등의 건축물의 증강된 3차원 결과들로부터 작업자 중심의 보다 유용한 건설 환경을 제공할 수 있다.

진동 데이터의 시간영역 특징 추출에 기반한 고장 분류 모델 (Fault Classification Model Based on Time Domain Feature Extraction of Vibration Data)

  • 김승일;노유정;강영진;박선화;안병하
    • 한국전산구조공학회논문집
    • /
    • 제34권1호
    • /
    • pp.25-33
    • /
    • 2021
  • 머신러닝 기법의 발달과 함께 기계에서 발생하는 다양한 종류(진동, 온도, 유량 등)의 데이터를 활용하여 기계의 상태를 진단하고 이상 탐지 및 비정상 분류 연구도 활발히 진행되고 있다. 특히 진동 데이터를 활용한 회전 기계의 상태 진단은 전통적인 기계 상태 모니터링 분야로 오랜 기간 동안 연구가 진행되었고, 연구 방법 또한 매우 다양하다. 본 연구에서는 가정용 에어컨에 사용되는 로터리 압축기에 가속도계를 직접 설치하여 진동 데이터를 수집하는 실험을 진행하였다. 데이터 부족 문제를 해결하기 위해 데이터 분할을 수행하였으며, 시간 영역에서의 진동 데이터로부터 통계적, 물리적 특징들을 추출한 후, Chi-square 검증을 통해 고장 분류 모델의 주요 특징을 추출하였다. SVM(Support Vector Machine) 모델은 압축기의 정상 혹은 이상 유무를 분류하기 위해 개발되었으며, 파라미터 최적화를 통해 분류 정확도를 개선하였다.

데이터 증가를 통한 선형 모델의 일반화 성능 개량 (중심극한정리를 기반으로) (Improvement of generalization of linear model through data augmentation based on Central Limit Theorem)

  • 황두환
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.19-31
    • /
    • 2022
  • 기계학습 모델 구축 간 트레이닝 데이터를 활용하며, 훈련 간 사용되지 않은 테스트 데이터를 활용하여 모델의 정확도와 일반화 성능을 판단한다. 일반화 성능이 낮은 모델의 경우 새롭게 받아들이게 되는 데이터에 대한 예측 정확도가 현저히 감소하게 되며 이러한 현상을 두고 모델이 과적합 되었다고 한다. 본 연구는 중심극한정리를 기반으로 데이터를 생성 및 기존의 훈련용 데이터와 결합하여 새로운 훈련용 데이터를 구성하고 데이터의 정규성을 증가시킴과 동시에 이를 활용하여 모델의 일반화 성능을 증가시키는 방법에 대한 것이다. 이를 위해 중심극한정리의 성질을 활용해 데이터의 각 특성별로 표본평균 및 표준편차를 활용하여 데이터를 생성하였고, 새로운 훈련용 데이터의 정규성 증가 정도를 파악하기 위하여 Kolmogorov-Smirnov 정규성 검정을 진행한 결과, 새로운 훈련용 데이터가 기존의 데이터에 비해 정규성이 증가하였음을 확인할 수 있었다. 일반화 성능은 훈련용 데이터와 테스트용 데이터에 대한 예측 정확도의 차이를 통해 측정하였다. 새롭게 생성된 데이터를 K-Nearest Neighbors(KNN), Logistic Regression, Linear Discriminant Analysis(LDA)에 적용하여 훈련시키고 일반화 성능 증가정도를 파악한 결과, 비모수(non-parametric) 기법인 KNN과 모델 구성 간 정규성을 가정으로 갖는 LDA의 경우에 대하여 일반화 성능이 향상되었음을 확인할 수 있었다.