• 제목/요약/키워드: 이미지 데이터 셋

검색결과 283건 처리시간 0.024초

딥러닝 기반 CT 스캔 재구성을 통한 조영제 사용 및 신체 부위 분류 성능 향상 연구 (A Study on the Use of Contrast Agent and the Improvement of Body Part Classification Performance through Deep Learning-Based CT Scan Reconstruction)

  • 나성원;고유선;김경원
    • 방송공학회논문지
    • /
    • 제28권3호
    • /
    • pp.293-301
    • /
    • 2023
  • 표준화되지 않은 의료 데이터 수집 및 관리는 여전히 수동으로 진행되고 있어, 이 문제를 해결하기 위해 딥 러닝을 사용해 CT 데이터를 분류하는 연구들이 진행되고 있다. 하지만 대부분 연구에서는 기본적인 CT slice인 axial 평면만을 기반으로 모델을 개발하고 있다. CT 영상은 일반 이미지와 다르게 인체 구조만 묘사하기 때문에 CT scan을 재구성하는 것만으로도 더 풍부한 신체적 특징을 나타낼 수 있다. 이 연구는 axial 평면뿐만 아니라 CT 데이터를 2D로 변환하는 여러가지 방법들을 통해 보다 높은 성능을 달성할 수 있는 방법을 찾고자 한다. 훈련은 5가지 부위의 CT 스캔 1042개를 사용했고, 모델 평가를 위해 테스트셋 179개, 외부 데이터셋으로 448개를 수집했다. 딥러닝 모델 개발을 위해 ImageNet으로 사전 학습된 InceptionResNetV2를 백본으로 사용하였으며, 모델의 전체 레이어를 재 학습했다. 실험결과 신체 부위 분류에서는 재구성 데이터 모델이 99.33%를 달성하며 axial 모델보다 1.12% 더 높았고, 조영제 분류에서는 brain과 neck에서만 axial모델이 높았다. 결론적으로 axial slice로만 훈련했을 때 보다 해부학적 특징이 잘 나타나는 데이터로 학습했을 때 더 정확한 성능 달성이 가능했다.

사용자 필적 맞춤형 폰트 생성 서비스 (Custom Handwriting Font Creation Service)

  • 김예진;이수연;심규민;전경구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.946-949
    • /
    • 2019
  • 한 벌의 한글 글자체를 만드는데 일반적으로 많은 제작 비용과 시간이 소요된다. 따라서 폰트 제작의 어려움을 덜기 위해, 사용자가 대표 글자들을 입력하면 그 글자들의 디자인 특성을 딥러닝 기술을 이용하여 학습한 모델이 나머지 글자들을 자동 생성해주는 시스템 구축한다면 폰트 제작이 훨씬 용이해질 뿐만 아니라 저작권 문제로부터 자유로워질 것이다. 이와 관련된 선행연구를 실행하고 분석해 본 결과 데이터 전처리 과정에서 글자가 잘리거나 크기가 맞지 않아 제대로 된 데이터셋이 구축되지 않는 문제가 있음을 발견하였다. 본 논문에서는 이러한 문제를 해결하기 위해 템플릿에서 자동적으로 글자영역을 추출하고 이미지를 보정하는 전처리 과정과 함께 기존 모델에서 새로운 필터를 추가하여 학습 성능을 높이는 방법을 제안한다. 이를 통해 기존 연구에서 측정된 손실값을 낮춘 결과를 확인했으며 결과적으로 실제 글자체와 더욱 유사한 사용자 맞춤형 글자체를 제공할 수 있을 것이다.

문자인식을 위한 공간 및 주파수 도메인 영상의 비교 (Comparison of Spatial and Frequency Images for Character Recognition)

  • ;최현영;고재필
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.439-441
    • /
    • 2019
  • 딥러닝은 객체인식 분야에서에서 강력하고, 강건한 학습 알고리즘이다. 딥러닝에서 자주 활용되고, 객체인식 분야에서 최고의 성능을 보여주는 네트워크는 Convolutional Neural Network(CNN) 이다. 숫자 필기 인식을 위한 MNIST 데이터셋를 CNN으로 학습하면 성능이 매우 뛰어나다. 이는 MNIST 데이터 셋의 숫자들이 중앙에 잘 정렬되어 있기 때문이다. 하지만, 실제 데이터들은 중앙에 정렬이 잘 되어있지 않다. 이러한 경우에 CNN은 이전과 같이 우수한 성능을 보여주지 못한다. 이를 해결하기 위해, 우리는 FFT를 활용하여 이미지를 주파수 공간으로 변환하여 입력으로 주는 방법을 제안한다.

  • PDF

Self-Attention 딥러닝 모델 기반 산업 제품의 이상 영역 분할 성능 분석 (Performance Analysis of Anomaly Area Segmentation in Industrial Products Based on Self-Attention Deep Learning Model)

  • 박창준;김남중;박준휘;이재현;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.45-46
    • /
    • 2024
  • 본 논문에서는 Self-Attention 기반 딥러닝 기법인 Dense Prediction Transformer(DPT) 모델을 MVTec Anomaly Detection(MVTec AD) 데이터셋에 적용하여 실제 산업 제품 이미지 내 이상 부분을 분할하는 연구를 진행하였다. DPT 모델의 적용을 통해 기존 Convolutional Neural Network(CNN) 기반 이상 탐지기법의 한계점인 지역적 Feature 추출 및 고정된 수용영역으로 인한 문제를 개선하였으며, 실제 산업 제품 데이터에서의 이상 분할 시 기존 주력 기법인 U-Net의 구조를 적용한 최고 성능의 모델보다 1.14%만큼의 성능 향상을 보임에 따라 Self-Attention 기반 딥러닝 기법의 적용이 산업 제품 이상 분할에 효과적임을 입증하였다.

  • PDF

위성영상 기반 해양수산 양식장의 경계 데이터 추출 (A Study on Extracting Boundary Data of Marine Fish Farms Based on Satellite Images)

  • 정성훈
    • 한국항행학회논문지
    • /
    • 제27권6호
    • /
    • pp.877-883
    • /
    • 2023
  • 선박의 안전 운항과 해양수산 양식장 관리를 위해 해양수산 빅데이터 구축에 필요한 해양수산 양식장의 경계를 추출한 데이터 셋은 어장 허가 구역과의 일치 여부 조사를 통해 선박의 운항 경로에 불법 설치 시 장애물 정보를 미리 제공할 수 있다. 또한, 해양 사고 등에 의한 피해보상을 위해 필요한 양식장 조업 여부도 파악할 수 있으며, 해당 지자체에서는 어장도와의 중첩 비교를 통해 어장 관리 등에 사용할 수 있다. 선박의 안전 운항을 위한 전자해도에 물표 표시를 통해 운항 경로상의 장애물 파악에 필요한 기초 데이터로써 활용이 높다. 이 연구에서는 양식장의 경계 추출을 위해 충분한 공간해상도를 가지며 짧은 주기로 반복하여 촬영하는 유럽항공우주국 (ESA; europe space agency)의 Sentinel-2 위성영상 자료를 사용하였다. 영상 이미지에서 양식장의 주기별 현황 데이터의 생산을 위해 해상의 구역별 데이터를 부산권, 울산권, 거제·창원권, 고성·통영권, 남해·사천권의 5개 관리 구역으로 나누어 처리하였으며, 구역별 위성영상의 수집과 영상의 강조 처리 과정을 거쳐 양식장의 경계 데이터와 메타정보를 추출하였다.

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.

R-CNN 기법을 이용한 지중매설물 제원 정보 자동 추출 연구 (A Study on Automatically Information Collection of Underground Facility Using R-CNN Techniques)

  • 박현석;홍기만;조용성
    • 한국재난정보학회 논문집
    • /
    • 제19권3호
    • /
    • pp.689-697
    • /
    • 2023
  • 연구목적: 본 연구는 미니트렌칭 공법 적용 과정에서 범용 스마트폰을 이용하여 지중매설물의 정보를 자동 추출하는데 목적이 있다. 연구방법:이미지 학습을 위한 데이터 셋은 주야간, 높이, 각도 등의 다양한 조건에서 수집하였으며, 객체 검지알고리즘은 R-CNN 알고리즘을 이용하였다. 연구결과: 성능평가지표는 정확한 예측과 재현율의 평균을 동시에 고려할 수 있는 F1-Score를 적용하였으며, 학습결과 F1-Score는 0.76으로 나타났다. 결론: 본 연구의 결과는 스마트폰 기반의 지중매설물 정보 추출이 가능한 것으로 나타났으나, 학습데이터의 추가적인 확보와 현장 실증 등을 통해 알고리즘의 정밀성 및 정확성을 향상시킬 필요가 있을 것으로 판단된다.

딥러닝과 구체의 형태 변형 방법을 이용한 단일 이미지에서의 3D Mesh 재구축 기법 (3D Mesh Reconstruction Technique from Single Image using Deep Learning and Sphere Shape Transformation Method)

  • 김정윤;이승호
    • 전기전자학회논문지
    • /
    • 제26권2호
    • /
    • pp.160-168
    • /
    • 2022
  • 본 논문에서는 딥러닝과 구체의 형태 변형 방법을 이용한 단일 이미지에서의 3D mesh 재구축 기법을 제안한다. 제안한 기법은 기존의 방식과 다른 다음과 같은 독창성이 있다. 첫 번째, 기존의 근처의 가까운 점들을 연결하여 모서리 또는 면을 구축하는 방식과 다르게 딥러닝 네트워크을 통하여 구체의 꼭짓점의 위치를 사물의 3D 포인트 클라우드와 매우 유사하게 수정한다. 3D 포인트 클라우드를 이용하므로 메모리가 적게 필요하며 구체의 꼭짓점에 오프셋 값 사이에 덧셈 연산만을 수행하기 때문에 더 빠른 연산이 가능하다. 두 번째, 수정한 꼭짓점에 구체의 면 정보를 씌워 3D mesh를 재구축한다. 구체의 꼭짓점의 위치를 수정하여 생성한 3D 포인트 클라우드의 점들의 간격이 일정하지 않을 때에도 이미 점들 사이의 연결 여부를 나타내는 구체의 면 정보라는 3D mesh의 면 정보를 가지고 있어 표현의 단순화나 결손을 방지할 수 있다. 제안하는 기법의 객관적인 신뢰성을 평가하기 위해 공개된 표준 데이터셋인 ShapeNet 데이터셋을 이용하여 비교 논문들과 같은 방법으로 실험한 결과, 본 논문에서 제안하는 기법의 IoU 값이 0.581로, chamfer distance 값은 0.212로 산출되었다. IoU 값은 수치가 높을수록, chamfer distance 값은 수치가 낮을수록 우수한 결과를 나타내므로 다른 논문에서 발표한 기법들보다 3D mesh 재구축의 결과에서 성능의 효율성이 입증되었다.

정상 샘플 이미지의 기하학적 변환을 사용한 이상 징후 검출 (Anomaly Detection using Geometric Transformation of Normal Sample Images)

  • 권용완;강동중
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.157-163
    • /
    • 2022
  • 최근 산업 분야 자동화의 발전에 따라 이상 징후 검출에 대한 연구가 활발하게 진행 중이다. 공장 자동화에 사용되는 이상 징후 검출의 응용분야로 카메라를 사용한 결함 검사가 있다. 비전 카메라 검사는 공장 자동화에서 높은 성능과 효율성을 보이지만, 조명과 환경조건의 불안정성을 극복하기가 어렵다. 딥러닝을 이용한 카메라 검사가 훨씬 더 높은 성능을 보이면서 비전 카메라 검사의 문제를 해결할 수 있지만 학습을 위해 엄청난 양의 정상 데이터 및 비정상 데이터를 요구하기 때문에 실제 산업 분야에 적용하기가 어렵다. 따라서 본 연구는 정상 데이터만을 사용한 72개의 기하학적 변환 딥러닝 방법으로 비정상 데이터 수집 문제를 극복하고, 성능 개선을 위한 특이치 노출 방법을 추가한 네트워크를 제안한다. 이를 자동차 부품 데이터 및 이상치 검출용 데이터베이스인 MVTec 데이터 셋에 적용하고 검증함에 의해 실제 산업 현장에서 적용할 수 있음을 보인다.

딥러닝 스타일 전이 기반의 무대 탐방 콘텐츠 생성 기법 (Generation of Stage Tour Contents with Deep Learning Style Transfer)

  • 김동민;김현식;봉대현;최종윤;정진우
    • 한국정보통신학회논문지
    • /
    • 제24권11호
    • /
    • pp.1403-1410
    • /
    • 2020
  • 최근, 비대면 경험 및 서비스에 관한 관심이 증가하면서 스마트폰이나 태블릿과 같은 모바일 기기를 이용하여 손쉽게 이용할 수 있는 웹 동영상 콘텐츠에 대한 수요가 급격히 증가하고 있다. 이와 같은 요구사항에 대응하기 위하여, 본 논문에서는 애니메이션이나 영화에 등장하는 명소를 방문하는 무대 탐방 경험을 제공할 수 있는 영상 콘텐츠를 보다 효율적으로 제작하기 위한 기법을 제안한다. 이를 위하여, Google Maps와 Google Street View API를 이용하여 무대탐방 지역에 해당하는 이미지를 수집하여 이미지 데이터셋을 구축하였다. 그 후, 딥러닝 기반의 style transfer 기술을 접목시켜 애니메이션의 독특한 화풍을 실사 이미지에 적용한 후 동영상화하기 위한 방법을 제시하였다. 마지막으로, 다양한 실험을 통해 제안하는 기법을 이용하여 보다 재미있고 흥미로운 형태의 무대탐방 영상 콘텐츠를 생성할 수 있음을 보였다.