• 제목/요약/키워드: Deep learning segmentation

검색결과 385건 처리시간 0.032초

다목적실용위성 영상처리 및 활용 (KOMPSAT Image Processing and Application)

  • 이광재;김예슬;채성호;오관영;이선구
    • 대한원격탐사학회지
    • /
    • 제38권6_4호
    • /
    • pp.1871-1877
    • /
    • 2022
  • 과거 위성개발에는 막대한 예산과 시간이 소요됨에 따라 일부 선진국만 위성을 보유하였으나, 최근 초소형위성과 같은 저예산 위성이 등장함에 따라 전 세계 많은 국가들이 위성 개발에 참여하고 있다. 저궤도 및 정지궤도 위성은 환경 및 기상 감시, 정밀변화탐지, 재난 등 다양한 분야에서 활용되고 있으며, 최근에는 딥러닝 기반의 관심 객체탐지 등을 통한 모니터링에도 활발히 이용되고 있다. 우리나라는 지금까지 우주개발계획에 따라 국가 수요의 위성을 개발하여 왔으며, 이를 통해 획득한 위성영상은 공공 및 민간에서 다양한 목적으로 활용되고 있다. 국내에서 위성영상에 대한 관심은 지속적으로 증가하고 있으며, 각종 아이디어 발굴 및 기술개발 촉진을 위한 다양한 경진대회도 개최되고 있다. 본 특별호에서는 최근 개최된 2022 위성정보활용 경진대회에 참여한 주제와 다목적실용위성 영상자료 처리 및 활용 연구에 대해서 소개하고자 한다.

Improved STGAN for Facial Attribute Editing by Utilizing Mask Information

  • Yang, Hyeon Seok;Han, Jeong Hoon;Moon, Young Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.1-9
    • /
    • 2020
  • 본 논문에서는 머리카락과 모자 영역의 마스크 정보를 활용하여 더 자연스러운 얼굴 속성 편집(facial attribute editing)을 수행하는 모델을 제안한다. 최신 얼굴 속성 편집 연구인 STGAN은 다중 얼굴 속성을 자연스럽게 편집하는 성과를 보였다. 그러나 머리카락과 관련된 속성을 편집할 때 부자연스러운 결과를 생성할 수 있다. 제안하는 방법의 핵심 아이디어는 기존 모델에서 부족했던 얼굴 영역의 정보를 모델에 추가로 반영하는 것이다. 이를 위해 세 가지 아이디어를 적용한다. 첫째로 마스크를 통해 머리카락 면적 속성을 추가하여 머리카락 정보를 보완한다. 둘째로 순환 일관성 손실(cycle consistency loss)을 추가하여 영상의 불필요한 변화를 억제한다. 셋째로 모자 분할 신경망을 추가하여 모자 영역 왜곡을 방지한다. 정성적 평가를 통해 제안하는 방법 적용 여부에 따른 유효성을 평가 및 분석한다. 실험 결과에서 제안하는 방법이 머리카락 및 얼굴 영역을 더 자연스럽게 생성하고, 모자 영역의 왜곡을 성공적으로 방지했다.

인터랙티브 미디어 플랫폼 콕스에 제공될 4가지 얼굴 변형 기술의 비교분석 (Comparison Analysis of Four Face Swapping Models for Interactive Media Platform COX)

  • 전호범;고현관;이선경;송복득;김채규;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제22권5호
    • /
    • pp.535-546
    • /
    • 2019
  • Recently, there have been a lot of researches on the whole face replacement system, but it is not easy to obtain stable results due to various attitudes, angles and facial diversity. To produce a natural synthesis result when replacing the face shown in the video image, technologies such as face area detection, feature extraction, face alignment, face area segmentation, 3D attitude adjustment and facial transposition should all operate at a precise level. And each technology must be able to be interdependently combined. The results of our analysis show that the difficulty of implementing the technology and contribution to the system in facial replacement technology has increased in facial feature point extraction and facial alignment technology. On the other hand, the difficulty of the facial transposition technique and the three-dimensional posture adjustment technique were low, but showed the need for development. In this paper, we propose four facial replacement models such as 2-D Faceswap, OpenPose, Deekfake, and Cycle GAN, which are suitable for the Cox platform. These models have the following features; i.e. these models include a suitable model for front face pose image conversion, face pose image with active body movement, and face movement with right and left side by 15 degrees, Generative Adversarial Network.

객체 감지 데이터 셋 기반 인체 자세 인식시스템 연구 (Research on Human Posture Recognition System Based on The Object Detection Dataset)

  • 유암;리라이춘;루징쉬엔;쉬멍;정양권
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.111-118
    • /
    • 2022
  • 컴퓨터 비전 연구에서 2차원 인체 자세는 매우 광범위한 연구 방향으로 특히 자세 추적과 행동 인식에서 유의미한 분야다. 인체 자세 표적 획득은 이미지에서 인체 목표를 정확히 찾는 방법을 연구하는 것이 핵심이며 인체 자세 인식은 인공지능(AI)에 적용하는 한편 일상생활에 활용되고 있어서 매우 중요한 연구의의가 있다. 인체 자세 인식 효과의 우수성의 기준은 인식 과정의 성공률과 정확도에 의해 결정된다. 본 연구의 인체 자세 인식에서는 딥러닝 전용 데이터셋인 MS COCO를 기반하여 인체를 17개의 키 포인트로 구분하였다. 다음으로 주요 특징에 대한 세분화 마스크(segmentation mask) 방법을 사용하여 인식률을 개선하였다. 최종적으로 신경망 모델을 설계하고 간단한 단계별 학습부터 효율적인 학습에 이르기까지 많은 수의 표본을 학습시키는 알고리즘을 제안하여 정확도를 향상할 수 있었다.

적대적 학습 개념을 도입한 경계 강화 SAR 수체탐지 딥러닝 모델 (Boundary-enhanced SAR Water Segmentation using Adversarial Learning of Deep Neural Networks)

  • 김휘송;김덕진;김준우;이승우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.2-2
    • /
    • 2023
  • 기후변화가 가속화로 인해 수재해의 빈도와 강도 예측이 어려워짐에 따라 실시간 홍수 모니터링에 대한 수요가 증가하고 있다. 합성개구레이다는 광원과 날씨에 무관하게 촬영이 가능하여 수재해 발생시에도 영상을 확보할 수 있다. 합성개구레이다를 활용한 수체 탐지 알고리즘 개발이 활발히 연구되어 왔고, 딥러닝의 발달로 CNN을 활용하여 높은 정확도로 수체 탐지가 기능해졌다. 하지만, CNN 기반 수체 탐지 모델은 훈련시 높은 정량적 정확성 지표를 달성하여도 추론 후 정성적 평가시 경계와 소하천에 대한 탐지 정확성이 떨어진다. 홍수 모니터링에서 특히 중요한 정보인 경계와 좁은 하천에 대해서 정확성이 떨어짐에 따라 실생활 적용이 어렵다. 이에 경계를 강화한 적대적 학습 기반의 수체 탐지 모델을 개발하여 더 세밀하고 정확하게 탐지하고자 한다. 적대적 학습은 생성적 적대 신경망(GAN)의 두 개의 모델인 생성자와 판별자가 서로 관여하며 더 높은 정확도를 달성할 수 있도록 학습이다. 이러한 적대적 학습 개념을 수체 탐지 모델에 처음으로 도입하여, 생성자는 실제 라벨 데이터와 유사하게 수체 경계와 소하천까지 탐지하고자 학습한다. 반면 판별자는 경계 거리 변환 맵과 합성개구레이다 영상을 기반으로 라벨데이터와 수체 탐지 결과를 구분한다. 경계가 강화될 수 있도록, 면적과 경계를 모두 고려할 수 있는 손실함수 조합을 구성하였다. 제안 모델이 경계와 소하천을 정확히 탐지하는지 판단하기 위해, 정량적 지표로 F1-score를 사용하였으며, 육안 판독을 통해 정성적 평가도 진행하였다. 기존 U-Net 모델이 탐지하지 못하던 영역에 대해 제안한 경계 강화 적대적 수체 탐지 모델이 수체의 세밀한 부분까지 탐지할 수 있음을 증명하였다.

  • PDF

Vision Transformer를 이용한 UAV 영상의 벼 도복 영역 진단 (Diagnosis of the Rice Lodging for the UAV Image using Vision Transformer)

  • 명현정;김서정;최강인;김동훈;이광형;안형근;정성환;김병준
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.28-37
    • /
    • 2023
  • 쌀 수확량 감소에 크게 영향을 주는 것은 집중호우나 태풍에 의한 도복 피해이다. 도복 피해 면적 산정 방법은 직접 피해 지역을 방문하는 현장 조사를 기반으로 육안 검사 및 판단하여 객관적인 결과 획득이 어렵고 많은 시간과 비용이 요구된다. 본 논문에서는 무인 항공기로 촬영된 RGB 영상을 Vision Transformer 기반 Segformer을 활용한 벼 도복 영역 추정 및 진단을 제안한다. 제안된 방법은 도복, 정상, 그리고 배경 영역을 추정하고 종자관리요강 내 벼 포장 검사를 통해 도복률을 진단한다. 진단된 결과를 통해 벼 도복 피해 분포를 관찰할 수 있게 하며, 정부 보급종 포장 검사에 활용할 수 있다. 본 연구의 벼 도복 영역 추정 성능은 평균 정확도 98.33%와 mIoU 96.79%의 성능을 나타내었다.

MRI 신호획득과 영상재구성에서의 인공지능 적용 (Applications of Artificial Intelligence in MR Image Acquisition and Reconstruction)

  • 강정화;남윤호
    • 대한영상의학회지
    • /
    • 제83권6호
    • /
    • pp.1229-1239
    • /
    • 2022
  • 최근 인공지능기술은 자기공명영상(이하 MRI)의 폭넓은 분야에서 임상적 활용가치를 보여주고 있다. 특히, MRI에서 영상획득과정의 효율성 및 복원된 영상의 품질을 향상시키기 위한 목적으로 인공지능모델의 개발이 활발하다. 임상에서 활용되는 다양한 MRI 프로토콜에서 인공지능은 병렬영상기법과 같은 기존 가속화 방법 대비 추가적인 영상획득시간을 가능하게 해줄 수 것으로 기대된다. 또한, 펄스시퀀스 디자인, 영상의 인공물 감소, 자동화된 품질평가와 같은 영역에서도 인공지능모델은 도움을 줄 수 있는 연구 결과들이 소개되고 있다. 또한, 영상분석 과정에서 중요한 장비 및 프로토콜의 영향을 줄여줄 수 있는 방법으로도 인공지능 기반의 접근이 이루어지고 있다. 본 종설에서는 MRI 영상의 획득 과정에서 최근 인공지능기술들이 적용되고 있는 분야 및 해당 분야에서의 인공지능기술의 개발 및 적용과 관련된 현안들을 소개하고자 한다.

CT 기반 딥러닝을 이용한 만성 폐쇄성 폐질환의 체성분 정량화와 질병 중증도 (CT-Derived Deep Learning-Based Quantification of Body Composition Associated with Disease Severity in Chronic Obstructive Pulmonary Disease)

  • 송재은;박소현;임명남;이은주;차윤기;윤현정;김우진
    • 대한영상의학회지
    • /
    • 제84권5호
    • /
    • pp.1123-1133
    • /
    • 2023
  • 목적 만성폐쇄성폐질환의 CT에서 자동 정량 측정된 체성분과 폐기능 또는 정량적 변수들 사이의 연관성을 알아보고자 하였다. 대상과 방법 총 290명의 만성폐쇄성폐질환 환자를 대상으로 연구하였다. 흉부 CT에서 근육 및 피하지방 부피, T12 레벨에서 근육 및 피하지방 면적 및 골 감쇠를 딥러닝 기반 분할 알고리즘을 사용하여 획득하였다. Parametric response mapping-derived emphysema (이하 PRMemph), PRM-derived functional small airway disease (이하 PRMfSAD) 및 기도 벽 두께(airway wall thickness; 이하 AWT)-Pi10을 정량적으로 평가하였다. Pearson 상관 분석을 사용하여 체성분과 결과 간의 연관성을 평가하였다. 결과 근육과 피하지방의 부피와 면적은 PRMemph와 PRMfSAD와 음의 상관관계를 보였다(p < 0.05). T12에서의 골밀도는 PRMemph와 음의 상관관계를 보였다(r = -0.1828, p = 0.002). 피하지방의 부피와 면적과 T12에서의 골밀도는 AWT-Pi10과 양의 상관관계를 보였다(r = 0.1287, p = 0.030; r = 0.1668, p = 0.005; r = 0.1279, p = 0.031). 반면에 근육 부피는 AWT-Pi10과 음의 상관관계를 보였다(r = -0.1966, p = 0.001). 근육 부피는 폐기능과 의미 있는 연과성을 보였다(p < 0.001). 결론 흉부 CT에서 정량적으로 평가된 체성분은 만성폐쇄성폐질환의 표현형 또는 중증도와 연관성을 보인다.

항공 LiDAR 및 RGB 정사 영상을 이용한 딥러닝 기반의 도시녹지 분류 (Classification of Urban Green Space Using Airborne LiDAR and RGB Ortho Imagery Based on Deep Learning)

  • 손보경;이연수;임정호
    • 한국지리정보학회지
    • /
    • 제24권3호
    • /
    • pp.83-98
    • /
    • 2021
  • 도시녹지는 도시 생태계 건강성 증진을 위한 중요한 요소이며, 건강한 도시 생태계 유지 및 관리를 위해서는 도시녹지의 공간적인 현황 파악이 필요하다. 환경부에서는 2010년 이후부터 총 41개의 분류 항목을 갖는 1m 급 해상도의 세분류 토지피복지도를 제공해오고 있으나, 가로수와 같은 도시 내 고해상도 상세 녹지 정보는 기타 초지로 분류되거나 누락되어 오고 있다. 따라서, 본 연구에서는 수원시 지역을 대상으로 1m 이하 급의 고해상도 원격탐사 자료(항공 LiDAR 및 RGB 정사영상)를 이용하여, 기존 세분류 토지피복지도에서는 나타나지 않는 고해상도의 상세 도시 녹지(수목, 관목 및 초지) 정보를 분류하고자 하였다. 분류 기법으로는 딥러닝 기반의 이미지 분할방법인 U-Net 구조의 모델을 활용하였으며, 분류 항목의 수 및 사용하는 자료의 종류에 따라 총 3가지의 모델(LRGB10, LRGB5, 및 RGB5)을 제안하고 성능을 평가하였다. 검증 지역에 대한 세 모델의 평균 전체 정확도는 각 83.40%(LRGB10), 89.44%(LRGB5), 74.76%(RGB5)이며, 항공 LiDAR와 RGB 정사영상을 함께 사용하여 총 5개의 항목(수목, 관목, 초지, 건물, 및 그 외)을 분류하는 LRGB5 모델의 성능이 가장 높게 나타났다. 수원시의 수목, 관목 및 초지 기준의 전체 녹지 현황은 각 45.61%(LRGB10), 43.47%(LRGB5), 및 44.22%(RGB5)로 나타났으며, 세 모델 모두 기존 세분류 토지피복지도와 비교하여 평균 13.40%의 도시 수목 정보를 더 제공할 수 있는 것으로 나타났다. 더불어 이러한 도시녹지 분류 결과는 향후 중분류 토지피복지도와 같은 기존 GIS 정보와의 융합을 통해 가로수 녹지 비율 현황 등 추가적인 상세 녹지 현황 정보를 제공할 수 있어, 다양한 도시녹지 연구 및 정책의 기초 자료로 활용될 수 있을 것으로 기대된다.

Hellinger 거리 IoU와 Objectron 적용을 기반으로 하는 객체 감지 (Object Detection Based on Hellinger Distance IoU and Objectron Application)

  • 김용길;문경일
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.63-70
    • /
    • 2022
  • 2D 객체 감지 시스템은 최근 몇 년 동안 심층 신경망과 대규모 이미지 데이터세트의 사용으로 크게 개선되었지만, 아직도 범주 내에서 데이터 부족, 다양한 외관 및 객체 형상 때문에 자율 탐색 등과 같은 로봇 공학과 관련된 응용에서 2D 물체 감지 시스템은 적절하지 않다. 최근에 소개되고 있는 구글 Objectron 또한 증강 현실 세션 데이터를 사용하는 새로운 데이터 파이프라인이라는 점에서 도약이라 할 수 있지만, 3D 공간에서 2D 객체 이해라는 측면에서 마찬가지로 한계가 있다. 이에 본 연구에서는 더 성숙한 2D 물체 감지 방법을 Objectron에 도입하는 3D 물체 감지 시스템을 나타낸다. 대부분의 객체 감지 방법은 경계 상자를 사용하여 객체 모양과 위치를 인코딩한다. 본 작업에서는 가우스 분포를 사용하여 객체 영역의 확률적 표현을 탐색하는데, 일종의 확률적 IoU라 할 수 있는 Hellinger 거리를 기반으로 하는 가우스 분포에 대한 유사성 측도를 제시한다. 이러한 2D 표현은 모든 객체 감지기에 원활하게 통합할 수 있으며, 실험 결과 데이터 집합에서 주석이 달린 분할 영역에 더 가까워서 Objectron의 단점이라 할 수 있는 3D 감지 정확도를 높일 수 있다.