• 제목/요약/키워드: Image Augmentation

검색결과 210건 처리시간 0.029초

최소자승법과 음향학적 모델링 기반의 적은 개수의 측정점에 대한 머리전달함수 보간 기법 (Interpolation method of head-related transfer function based on the least squares method and an acoustic modeling with a small number of measurement points)

  • 이석진
    • 한국음향학회지
    • /
    • 제36권5호
    • /
    • pp.338-344
    • /
    • 2017
  • 본 논문에서는 머리전달함수 보간 알고리즘을 제안하며, 특히 작은 크기의 측정 데이터를 다루는 경우를 고려한다. 제안하는 알고리즘은 머리전달함수의 음향학적 모델링에 기초하며, 모델링 계수를 추정함으로써 머리전달함수를 보간한다. 이 때 측정 위치의 개수가 부족할 경우 모델링 계수를 추정하는 것은 매우 어려우며, 따라서 본 알고리즘은 벡터-기반 크기 패닝 기법을 이용하여 데이터를 확장함으로써 이러한 문제를 해결하려고 한다. 본 알고리즘은 벡터-기반 크기 패닝 기법 기반의 데이터 확장 단계와, 최소자승법 기반의 모델링 계수 추정 단계의 두 단계로 이루어져 있다. 제안하는 알고리즘의 성능을 확인하기 위하여 CIPIC(Center for Image Processing and Integrated Computing) 머리전달함수 데이터베이스의 측정 데이터 중 일부를 이용한 시뮬레이션을 진행하였으며, 시뮬레이션 결과 약 1.5 dB ~ 4 dB의 최소 자승 오차가 감소됨을 확인할 수 있었다.

가상 데이터 생성을 통한 딥러닝 기반 문자인식 시스템 제안 (Proposal for Deep Learning based Character Recognition System by Virtual Data Generation)

  • 이승주;박구만
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.275-278
    • /
    • 2020
  • 본 논문에서는 가상 데이터 생성을 통한 딥러닝 기반 문자인식 시스템을 제안한다. 지도학습에서 가장 큰 비중을 차지하는 학습 데이터를 확보하기 위하여 가상 데이터를 생성하였다. 또한 가상 데이터를 생성 후 증강 파라미터를 이용하여, 실제 다양한 데이터에 대응하기 위해서 데이터 일반화를 하였다. 최종적으로 학습 데이터 구성은 증강 파라미터와 폰트 인자에 다양한 값을 대입하여 데이터를 생성하였다. 문자인식 성능을 측정하기 위한 테스트 데이터는 실제 촬영된 이미지 데이터에서 문자영역을 크롭하여 구성하였다. 테스트 데이터는 실제환경에서 발생할 수 있는 이미지 왜곡을 고려하여 데이터 증강하였다. 딥러닝 알고리즘은 실시간 검출에 용이한 YOLO v3를 사용하였으며, 추론결과는 후처리를 통하여 최종 검출결과를 출력한다.

폐 결절 검출을 위한 합성곱 신경망의 성능 개선 (Performance Improvement of Convolutional Neural Network for Pulmonary Nodule Detection)

  • 김한웅;김병남;이지은;장원석;유선국
    • 대한의용생체공학회:의공학회지
    • /
    • 제38권5호
    • /
    • pp.237-241
    • /
    • 2017
  • Early detection of the pulmonary nodule is important for diagnosis and treatment of lung cancer. Recently, CT has been used as a screening tool for lung nodule detection. And, it has been reported that computer aided detection(CAD) systems can improve the accuracy of the radiologist in detection nodules on CT scan. The previous study has been proposed a method using Convolutional Neural Network(CNN) in Lung CAD system. But the proposed model has a limitation in accuracy due to its sparse layer structure. Therefore, we propose a Deep Convolutional Neural Network to overcome this limitation. The model proposed in this work is consist of 14 layers including 8 convolutional layers and 4 fully connected layers. The CNN model is trained and tested with 61,404 regions-of-interest (ROIs) patches of lung image including 39,760 nodules and 21,644 non-nodules extracted from the Lung Image Database Consortium(LIDC) dataset. We could obtain the classification accuracy of 91.79% with the CNN model presented in this work. To prevent overfitting, we trained the model with Augmented Dataset and regularization term in the cost function. With L1, L2 regularization at Training process, we obtained 92.39%, 92.52% of accuracy respectively. And we obtained 93.52% with data augmentation. In conclusion, we could obtain the accuracy of 93.75% with L2 Regularization and Data Augmentation.

시각 동기화 오차가 SAR 영상에 미치는 영향 분석 및 보상 (Analysis and Compensation of Time Synchronization Error on SAR Image)

  • 이수정;박우정;박찬국;송종화;배창식
    • 한국항공우주학회지
    • /
    • 제48권4호
    • /
    • pp.285-293
    • /
    • 2020
  • 본 논문에서는 Synthetic Aperture Radar (SAR, 합성개구레이다) 영상 품질을 향상시키기 위해 EGI/IMU (Embedded GPS/INS, Inertial Measurement Unit) 통합 항법 시스템에서 발생하는 시각 동기화 오차의 영향을 분석하고 이를 보상하기 위해 상태변수증강 기법을 적용한다. SAR 요동 측정 알고리즘으로 항체의 위치를 추적하기 위한 EGI와 추가적으로 안테나에 장착된 IMU를 결합하는 EGI/IMU 통합 항법 시스템이 많이 이용된다. 이와 같은 EGI/IMU 통합 항법 시스템에서 센서간의 시계가 동기화되지 않을 경우 시각 동기화 오차가 발생한다. 시각 동기화 오차가 항법 및 SAR 영상에 미치는 영향 분석을 통해 시각 동기화 오차가 SAR 영상 품질을 악화시키는 것을 확인하였다. 이를 보상하기 위해 상태변수증강 기법을 적용하고, 적용한 결과 SAR 영상 품질이 저하되지 않음을 확인하였다. 또한 기동에 따른 시각 동기화 오차 추정 성능과 가관측성을 분석하여 시각 동기화 오차를 효과적으로 추정하기 위해서는 회전 기동과 같은 시간에 따라 변화하는 기동이 필요함을 보였다. 따라서, SAR 영상에 미치는 시각 동기화 오차의 영향을 줄이기 위해서는 SAR 구간 전에 회전 기동 등 시간에 따라 변화하는 기동을 수행하여 시각 동기화 오차를 보상해 주어야 한다.

딥러닝기반 건축폐기물 이미지 분류 시스템 비교 (A Comparison of Image Classification System for Building Waste Data based on Deep Learning)

  • 성재경;양민철;문경남;김용국
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.199-206
    • /
    • 2023
  • 본 연구는 건축시 발생되는 폐기물의 자동분류를 위해 딥러닝 알고리즘을 활용해 건출 폐기물 데이터를 각각 목재 폐기물, 플라스틱 폐기물, 콘크리트 폐기물로 분류하는 두 모델들을 통해서 성능 비교를 한다. 건축 폐기물의 분류를 위해 사용된 딥러닝 알고리즘은 합성곱 신경망 이미지 분류 알고리즘 VGG-16과 NLP를 기반으로 이미지를 시퀀스화 시킨ViT, Vision Transformer 모델을 사용했다. 건축 폐기물 데이터 수집을 위해 이미지 데이터를 전 세계 검색엔진에서 크롤링 하였고, 육안으로도 명확히 구분하기 어렵거나, 중복되는 등 실험에 방해되는 이미지는 전부 제외하여 각 분류당 1천장씩 총 3천장의 이미지를 확보했다. 또한, 데이터 학습시에 모델의 정확도 향상에 도움을 주기 위해 데이터 확대 작업을 진행해 총 3만장의 이미지로 실험을 진행 하였다. 수집된 이미 데이터가 정형화 되어있지 않은 데이터 임에도 불구하고 실험 결과는 정확도가 VGG-16는 91.5%, ViT 는 92.7%의 결과가 나타났다. 이는 실제 건축폐기물 데이터 관리 작업에 실전 활용 가능성을 제시한 것으로 보인다. 본 연구를 바탕으로 추후에 객체 탐지 기법이나 의미론적 분할 기법까지 활용한다면, 하나의 이미지 안에서도 여러 세밀한 분류가 가능해 더욱 완벽한 분류가 가능할 것이다.

루빅스 큐브를 활용한 다 종류 3차원 객체 증강 시스템 (A Multi 3D Objects Augmentation System Using Rubik's Cube)

  • 이상준;김수빈;황성수
    • 한국멀티미디어학회논문지
    • /
    • 제20권8호
    • /
    • pp.1224-1235
    • /
    • 2017
  • Recently, augmented reality technology has received much attention in many fields. This paper presents an augmented reality system using Rubiks' Cube which can augment various 3D objects depending on patterns of a Rubiks' cube. The system first detects a cube from an image using partitional clustering and strongly connected graph. Thereafter, the system detects the top side of the cube and finds a proper pattern to determine which object should be augmented. An object corresponding to the pattern is finally augmented according to the camera viewpoint. Experimental results show that the proposed system successfully augments various virtual objects in real time.

미소 픽셀을 갖는 비행 객체 인식을 위한 데이터베이스 구축 및 관리시스템 연구 (Database Generation and Management System for Small-pixelized Airborne Target Recognition)

  • 이호섭;신희민;심현철;조성욱
    • 항공우주시스템공학회지
    • /
    • 제16권5호
    • /
    • pp.70-77
    • /
    • 2022
  • 본 논문에서, 데이터베이스 생성 및 관리 시스템은 미소 픽셀 공중 표적 인식을 위해 제안된다. 제안된 시스템은 1)비행 테스트 비디오 프레임에 의한 직접 이미지 추출, 2) 자동 이미지 보관, 3) 이미지 데이터 레이블링 및 메타 데이터 주석, 4) 컬러 채널 변환, 5) HOG/LBP 기반 소화소 대상 증강 이미지 데이터 생성의 다섯가지 주요 기능으로 구성된다. 제안하는 프로그램은 파이썬 기반의 PyQt5와 OpenCV를 이용하여 구성하였고 공중 표적 인식을 위한 이미지 데이터셋은 제안한 시스템을 이용해 생성했으며 비행 실험으로 부터 수집된 영상을 입력영상으로 사용하였다.

밀리미터파의 손동작 인식 알고리즘에 관한 연구 (Study on Hand Gestures Recognition Algorithm of Millimeter Wave)

  • 남명우;홍순관
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.685-691
    • /
    • 2020
  • 본 논문에서는 77GHz를 사용하는 밀리미터파 레이더 센서의 반향 신호를 이용하여 손동작의 움직임을 추적한 후 얻어진 데이터로 0부터 9까지의 숫자들을 인식하는 알고리즘을 개발하였다. 손동작을 감지하여 레이더 센서로부터 얻어진 반향 신호들은 산란 단면적의 차이 등에 의해 불규칙한 점들의 군집형태를 보인다. 이들로부터 유효한 중심점을 얻기 위해 3차원 좌푯값들을 이용해 K-Means 알고리즘을 적용하였다. 그리고 얻어진 중심점들을 연결하여 숫자 형태의 이미지를 생성하였다. 얻어진 이미지와 스무딩 기법을 적용해 사람의 손글씨 형태와 유사하게 만든 이미지를 MNIST(Modified National Institute of Standards and Technology database)로 훈련된 CNN(Convolutional Neural Network) 모델에 입력하여 인식률을 비교하였다. 실험은 두 가지 방법으로 진행되었다. 먼저 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서는 각각 평균 77.0%와 81.0%의 인식률을 얻었다. 그리고 학습데이터를 확장(augmentation)한 CNN 모델의 실험에서는 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서 각각 평균 97.5%와 평균 99.0%의 인식률을 얻었다. 본 연구는 레이더 센서를 이용한 다양한 비접촉 인식기술에 응용이 가능할 것으로 판단된다.

암시야 현미경 영상에서 혈액 내 박테리아 검출 방법 (Detection of Bacteria in Blood in Darkfield Microscopy Image)

  • 박현준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.183-185
    • /
    • 2021
  • 혈액에서 박테리아를 검출하는 것은 의학 및 컴퓨터비전 영역에서 중요한 연구가 될 수 있다. 본 논문에서는 캐글에서 획득한 366장의 암시야 현미경 영상에서 혈액 내 박테리아를 검출하는 방법을 제안한다. 영상처리 기법을 이용한 전처리작업 및 데이터 증강을 통해 학습 데이터세트를 구축하고, 이를 학습하기 위한 딥러닝 모델을 정의한다. 실험 결과 제안된 딥러닝 모델은 암시야 현미경 영상에서 적혈구와 박테리아를 효과적으로 검출하는 것을 확인하였다. 본 논문에서는 비교적 간단한 모델을 사용하여 학습하였으나, 보다 깊은 모델을 활용하면 더 정확한 결과를 얻을 수 있을 것으로 보인다.

  • PDF

이미지 분석을 위한 퓨샷 학습의 최신 연구동향 (Recent advances in few-shot learning for image domain: a survey)

  • 석호식
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.537-547
    • /
    • 2023
  • 퓨삿학습(few-shot learning)은 사전에 확보한 관련 지식과 소규모의 학습데이터를 이용하여 학습데이터의 부족으로 인한 어려움을 해결할 수 있는 가능성을 제시해주어 최근 많은 주목을 받고 있다. 본 논문에서는 퓨삿학습의 개념과 주요 접근방법을 빠르게 파악할 수 있도록 데이터 증강, 임베딩과 측도학습, 메타학습의 세 관점에서 최신연구동향을 설명한다. 또한 퓨샷학습을 적용하려는 연구자들에게 도움을 제공할 수 있도록 주요 벤치마크 데이터셋에 대하여 간략하게 소개하였다. 퓨삿학습은 이미지 분석과 자연어 처리 등 다양한 분야에서 활용되고 있으나, 본 논문은 이미지 처리를 위한 퓨삿학습의 접근법에 집중하였다.