• 제목/요약/키워드: Image Data Augmentation

검색결과 168건 처리시간 0.023초

생성적 적대 네트워크로 자동 생성한 감성 텍스트의 성능 평가 (Evaluation of Sentimental Texts Automatically Generated by a Generative Adversarial Network)

  • 박천용;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권6호
    • /
    • pp.257-264
    • /
    • 2019
  • 최근 자연언어처리 분야에서 딥러닝 모델이 좋은 성과를 보이고 있다. 이러한 딥러닝 모델의 성능을 향상시키기 위해서는 많은 양의 데이터가 필요하다. 하지만 많은 양의 데이터를 모으기 위해서는 많은 인력과 시간이 소요되기 때문에 데이터 확장을 통해 이와 같은 문제를 해소할 수 있다. 그러나 문장 데이터의 경우 이미지 데이터에 비해 데이터 변형이 어렵기 때문에 다양한 문장을 생성할 수 있는 생성 모델을 통해 문장 데이터 자동 확장을 해보고자 한다. 본 연구에서는 최근 이미지 생성 모델에서 좋은 성능을 보이고 있는 생성적 적대 신경망 중 하나인 CS-GAN을 사용하여 학습 데이터로부터 새로운 문장들을 생성해 보고 유용성을 다양한 지표로 평가하였다. 평가 결과 CS-GAN이 기존의 언어 모델을 사용할 때보다 다양한 문장을 생성할 수 있었고 생성된 문장을 감성 분류기에 학습시켰을 때 감성 분류기의 성능이 향상됨을 보였다.

CNN을 이용한 Al 6061 압출재의 표면 결함 분류 연구 (Study on the Surface Defect Classification of Al 6061 Extruded Material By Using CNN-Based Algorithms)

  • 김수빈;이기안
    • 소성∙가공
    • /
    • 제31권4호
    • /
    • pp.229-239
    • /
    • 2022
  • Convolution Neural Network(CNN) is a class of deep learning algorithms and can be used for image analysis. In particular, it has excellent performance in finding the pattern of images. Therefore, CNN is commonly applied for recognizing, learning and classifying images. In this study, the surface defect classification performance of Al 6061 extruded material using CNN-based algorithms were compared and evaluated. First, the data collection criteria were suggested and a total of 2,024 datasets were prepared. And they were randomly classified into 1,417 learning data and 607 evaluation data. After that, the size and quality of the training data set were improved using data augmentation techniques to increase the performance of deep learning. The CNN-based algorithms used in this study were VGGNet-16, VGGNet-19, ResNet-50 and DenseNet-121. The evaluation of the defect classification performance was made by comparing the accuracy, loss, and learning speed using verification data. The DenseNet-121 algorithm showed better performance than other algorithms with an accuracy of 99.13% and a loss value of 0.037. This was due to the structural characteristics of the DenseNet model, and the information loss was reduced by acquiring information from all previous layers for image identification in this algorithm. Based on the above results, the possibility of machine vision application of CNN-based model for the surface defect classification of Al extruded materials was also discussed.

데이터 증강을 통한 딥러닝 기반 주가 패턴 예측 정확도 향상 방안 (Increasing Accuracy of Stock Price Pattern Prediction through Data Augmentation for Deep Learning)

  • 김영준;김여정;이인선;이홍주
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.1-12
    • /
    • 2019
  • 인공지능 기술이 발전하면서 이미지, 음성, 텍스트 등 다양한 분야에 적용되고 있으며, 데이터가 충분한 경우 기존 기법들에 비해 좋은 결과를 보인다. 주식시장은 경제, 정치와 같은 많은 변수에 의해 영향을 받기 때문에, 주식 가격의 움직임 예측은 어려운 과제로 알려져 있다. 다양한 기계학습 기법과 인공지능 기법을 이용하여 주가 패턴을 연구하여 주가의 등락을 예측하려는 시도가 있어왔다. 본 연구는 딥러닝 기법 중 컨볼루셔널 뉴럴 네트워크(CNN)를 기반으로 주가 패턴 예측률 향상을 위한 데이터 증강 방안을 제안한다. CNN은 컨볼루셔널 계층을 통해 이미지에서 특징을 추출하여 뉴럴 네트워크를 이용하여 이미지를 분류한다. 따라서, 본 연구는 주식 데이터를 캔들스틱 차트 이미지로 만들어 CNN을 통해 패턴을 예측하고 분류하고자 한다. 딥러닝은 다량의 데이터가 필요하기에, 주식 차트 이미지에 다양한 데이터 증강(Data Augmentation) 방안을 적용하여 분류 정확도를 향상 시키는 방법을 제안한다. 데이터 증강 방안으로는 차트를 랜덤하게 변경하는 방안과 차트에 가우시안 노이즈를 적용하여 추가 데이터를 생성하였으며, 추가 생성된 데이터를 활용하여 학습하고 테스트 집합에 대한 분류 정확도를 비교하였다. 랜덤하게 차트를 변경하여 데이터를 증강시킨 경우의 분류 정확도는 79.92%였고, 가우시안 노이즈를 적용하여 생성된 데이터를 가지고 학습한 경우의 분류 정확도는 80.98%이었다. 주가의 다음날 상승/하락으로 분류하는 경우에는 60분 단위 캔들 차트가 82.60%의 정확도를 기록하였다.

  • PDF

어텐션 모듈과 기하학적 데이터 증강을 통한 X-ray 영상 내 해부학적 랜드마크 검출 성능 향상 (Improved Anatomical Landmark Detection Using Attention Modules and Geometric Data Augmentation in X-ray Images)

  • 이효정;마세리;최장환
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권3호
    • /
    • pp.55-65
    • /
    • 2022
  • X-ray 두개골 영상에서 주요 해부학적 부위들 간의 거리를 계측하는 것은 진단과 치료 등 임상적 의미에서 매우 중요하다. 최근에는 딥러닝 기술의 발전을 바탕으로 랜드마크를 식별 및 검출하는 자동화 시스템들이 제시되고 있다. 이러한 딥러닝 기반 모델을 과적합 없이 학습 시키기 위해서는 대량의 영상과 라벨링 데이터가 필요하다. 기존에는 숙련된 판독의가 환자의 영상에서 랜드마크를 수동으로 식별하여 라벨링하는 방식으로 계측이 이루어져 왔다. 그러나 이러한 계측 방식은 많은 비용이 소요될 뿐만 아니라, 재현성이 떨어지기 때문에 자동화된 라벨링 방법에 대한 필요성이 제기되고 있다. 또한, X-ray 영상에는 광자가 통과하는 경로 상의 여러 인체조직들이 표시되기 때문에 랜드마크 식별이 일반 자연 이미지 또는 삼차원 모달리티 영상에 비해 어렵다. 본 연구에서는 X-ray 영상 내에 대량의 라벨링 데이터 생성을 가능하게 하는 기하학적 데이터 증강 기법을 제안하고 있다. 또한, 두개골 내 주요한 16개 랜드마크들의 검출 성능을 향상시키기 위해 다양한 어텐션 기법들의 구현 및 적용을 통해 랜드마크 검출을 위한 최적의 어텐션 메커니즘을 제시하였다. 마지막으로 주요 두개골 랜드마크들 중 안정적인 검출이 보장되는 마커들을 도출하였으며, 이러한 마커들은 임상적인 활용 가능성이 높을 것으로 기대된다.

드론 영상 분석과 자료 증가 방법을 통한 건설 자재 수량 측정 (Measurement of Construction Material Quantity through Analyzing Images Acquired by Drone And Data Augmentation)

  • 문지환;송누리;최재갑;박진호;김계영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권1호
    • /
    • pp.33-38
    • /
    • 2020
  • 본 논문에서는 드론에 의하여 획득된 영상을 분석하여 건축자재의 수량을 측정하는 기술을 제안한다. 제안하는 기술은 드론 및 카메라 정보가 담겨있는 드론 로그와 영상 내 건축자재더미 종류와 영역을 예측하는 RCNN, 실제적인 수량 계산을 위한 사진측량법을 사용한다. 기존 연구에선 학습 데이터의 부족으로, 자재 종류 및 건축자재더미 영역 예측 정확도의 오류 범위가 컸다. 논문에서는 이러한 오류 범위를 줄이고 예측 안정성을 높이기 위해 자료 증가 방법으로 학습 데이터를 증가시킨다. 자료 증가는 학습 모델의 과적합을 막기 위해 회전에 의한 증가 방법만 사용한다. 수량 계산 방법으로는 Yaw, FOV 등의 드론 및 카메라 정보가 담겨있는 드론 로그와 영상 내 건축자재더미 영역을 찾고, 종류를 예측해 줄 RCNN 모델을 사용하고, 이 모든 정보를 종합해 논문에서 제안하는 수식에 적용하여 자재더미의 실제적인 수량을 계산한다. 제안하는 방법의 우수성은 실험을 통하여 확인한다.

가슴 성형 경험자의 성형 동기와 성형 후 평가 -이상적 신체이미지 내면화를 통한 의복 소비행동의 변화- (Motives for Selecting Breast Augmentation and Post-Operative Evaluations of Korean Women who have Undergone Cosmetic Breast Surgery -Internalization of Ideal Body-Image Reflected on Clothing Consumption Behavior-)

  • 김수연;이혜영;고애란
    • 한국의류학회지
    • /
    • 제34권5호
    • /
    • pp.740-753
    • /
    • 2010
  • This study analyzes the motives of Korean women for choosing breast augmentation in a cultural and relational context; in addition, it investigates their evaluations after surgery. Data was collected through in-depth interviews with 10 Korean women in their 20s and 30s who have received cosmetic breast augmentation. Enlarged and made-up breasts are a form of clothing that symbolizes the socio-economic status of women. In the vertical and individualized Korean society, the desire of women for a fashionable body invigorated the appearance management market. Fashion consumers have passively internalized the ideal body trends as the concept of the ideal body-image, which has been constructed by the social structure, markets, and the media. The analysis was rooted in post-modern feminist perspectives on the female body. The ideal body-image internalization process through the social interactions of participants was the main cultural factor to choose breast surgery. The self-image and conformity/individuality of participant were categorized as relational factors for the motivation to undergo breast surgery. The result showed that after surgery the participants achieved positive feedback from their social relationships. They expressed or hid their socio-economic statuses through their purchased fashion bodies. They also showed higher self-esteem and feelings of satisfaction by pursuing individuality and conformity as a member of society. Moreover, they achieved wider fashion options and greater controls over their public/private/secret clothing choices for certain occasions. Cosmetic breast surgery positively empowered individual women while reinforcing the socially manipulated body ideals that oppress women at the same time. Participants internalized socially constructed values and justified their surgery choices.

데이터 증강기법을 이용한 음성 위조 공격 탐지모형의 성능 향상에 대한 연구 (Data augmentation in voice spoofing problem)

  • 최효정;곽일엽
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.449-460
    • /
    • 2021
  • 본 논문에서는 음성위조공격탐지(Voice spoofing detection) 문제에 데이터 증강을 적용한다. ASVspoof 2017은 리플레이 공격 탐지에 대해 다루며 진짜 사람의 음성과 환경이나 녹음·재생 장치의 조건들을 다르게 하여 위조한 가짜 음성을 분류하는 것을 목적으로 한다. 지금까지 이미지 데이터에 대한 데이터 증강 연구가 활발히 이루어졌으며 음성에도 데이터 증강을 시도하는 여러 연구가 진행되어왔다. 하지만 음성 리플레이 공격에 대한 데이터 증강시도는 이루어지지 않아 본 논문에서는 데이터 증강기법을 통한 오디오 변형이 리플레이 공격 탐지에 어떠한 영향을 미치는지에 대해 탐구해본다. 총 7가지의 데이터 증강기법을 적용해보았으며 그 중 DVC, Pitch 음성 증강기법이 성능향상에 도움되었다. DVC와 Pitch는 기본 모델 EER의 약 8% 개선을 보여주었으며, 특히 DVC는 57개의 환경변수 중 일부 환경에서 눈에 띄는 정확도 향상이 있었다. 가장 큰 폭으로 증가한 RC53의 경우 DVC가 기본 모델 정확도의 약 45% 향상을 이끌어내며 기존에 탐지하기 어려웠던 고사양의 녹음·재생 장치를 잘 구분해냈다. 본 연구를 토대로 기존에 증강기법의 효과에 대한 연구가 이루어지지 않았던 음성 위조 탐지 문제에서 DVC, Pitch 데이터 증강기법이 성능 향상에 도움이 된다는 것을 알아내었다.

K-겹 교차 검증과 서포트 벡터 머신을 이용한 고무 오링결함 검출 시스템 (Rubber O-ring defect detection system using K-fold cross validation and support vector machine)

  • 이용은;최낙준;변영후;김대원;김경천
    • 한국가시화정보학회지
    • /
    • 제19권1호
    • /
    • pp.68-73
    • /
    • 2021
  • In this study, the detection of rubber o-ring defects was carried out using k-fold cross validation and Support Vector Machine (SVM) algorithm. The data process was carried out in 3 steps. First, we proceeded with a frame alignment to eliminate unnecessary regions in the learning and secondly, we applied gray-scale changes for computational reduction. Finally, data processing was carried out using image augmentation to prevent data overfitting. After processing data, SVM algorithm was used to obtain normal and defect detection accuracy. In addition, we applied the SVM algorithm through the k-fold cross validation method to compare the classification accuracy. As a result, we obtain results that show better performance by applying the k-fold cross validation method.

CNN 기반의 인간형 로봇의 낙상 판별 모델 (CNN-based Fall Detection Model for Humanoid Robots)

  • 박신우;조현민
    • 센서학회지
    • /
    • 제33권1호
    • /
    • pp.18-23
    • /
    • 2024
  • Humanoid robots, designed to interact in human environments, require stable mobility to ensure safety. When a humanoid robot falls, it causes damage, breakdown, and potential harm to the robot. Therefore, fall detection is critical to preventing the robot from falling. Prevention of falling of a humanoid robot requires an operator controlling a crane. For efficient and safe walking control experiments, a system that can replace a crane operator is needed. To replace such a crane operator, it is essential to detect the falling conditions of humanoid robots. In this study, we propose falling detection methods using Convolution Neural Network (CNN) model. The image data of a humanoid robot are collected from various angles and environments. A large amount of data is collected by dividing video data into frames per second, and data augmentation techniques are used. The effectiveness of the proposed CNN model is verified by the experiments with the humanoid robot MAX-E1.

Vector and Thickness Based Learning Augmentation Method for Efficiently Collecting Concrete Crack Images

  • Jong-Hyun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.65-73
    • /
    • 2023
  • 본 논문에서는 콘크리트 균열 이미지 데이터셋을 효율적으로 얻기 위한 합성곱 신경망 네트워크 학습 기반의 데이터 증강기법을 제안한다. 실제 콘크리트 균열 이미지는 정형화된 형태가 없고 복잡한 패턴을 지니고 있어 얻기 어려울 뿐만 아니라, 데이터를 확보할 때 위험한 상황에 노출될 우려가 있다. 이러한 상황에 노출된 데이터셋 수집 문제를 본 논문에서는 벡터와 두께 기반의 데이터 증강 기법을 통해 비용과 시간적 측면에서 효율적으로 해결한다. 또한 제안한 방법을 효율성을 입증하고자 U-Net기반의 균열 검출을 통해 다양한 장면에서 실험을 진행했고, IoU 정확도로 측정했을 때 모든 장면에서 성능이 향상되었다. 콘크리트 균열 데이터를 증강하지 않았을 경우 잘못 예측된 경우의 비율이 약 25%였으나, 우리의 방법을 통해 데이터 증강을 했을 경우 잘못 예측된 비율이 3%까지 감소하였다.