• 제목/요약/키워드: 영상기반 딥러닝

검색결과 720건 처리시간 0.024초

딥러닝 기반 영상 조작 및 검출 기술 동향

  • 오병태
    • 방송과미디어
    • /
    • 제27권2호
    • /
    • pp.62-69
    • /
    • 2022
  • 다양한 목적으로 영상을 조작하려는 시도는 디지털 영상이 보편화되기 시작할 때부터 지속적으로 존재해 왔던 문제이며, 이러한 영상 조작의 유무를 검출하려는 시도 또한 지난 수십 년 동안 끊임없이 연구되어 왔다. 최근 빠르게 발전하는 인공지능 기술, 그 중에서도 딥러닝 기술을 이용하여 영상 조작을 검출하는 기술이 다양하게 발전되고 있지만, 한편으로는 딥러닝 기술을 이용하여 조작을 보다 정교하게 진행하거나 검출을 회피하려는 기술 또한 빠르게 발전하고 있다. 본 고에서는 영상을 조작하고, 검출하고 회피하는 기술 동향에 대하여 종합적으로 소개하고, 특히 딥러닝 기반의 기술이 각각의 영역에서 어떻게 적용되고 발전하고 있는지에 대하여 면밀히 살펴보고자 한다.

딥러닝 기반 Super Resolution 기술의 현황 및 최신 동향

  • 서유림;강석주
    • 방송과미디어
    • /
    • 제25권2호
    • /
    • pp.7-16
    • /
    • 2020
  • 최근 Ultra-High Definition(UHD) 등의 고해상도 디스플레이가 시장에 등장하고 이에 따라 소비자의 요구가 커지면서 기존의 Full-High Definition(FHD)과 같은 저해상도(Low Resolution, LR) 영상을 고해상도(High Resolution, HR) 영상으로 변환할 수 있는 초해상화(Super-Resolution) 알고리즘에 대한 관심이 커지고 있다. 그러나 기존의 전통적인 초해상화 기법들은 고해상도 영상을 복원하는 과정에서 디테일한 부분의 화질 저화 및 열화가 존재하는 것을 확인할 수 있다. 본 논문에서는 이러한 문제를 해결하기 위해 최근 널리 연구되고 있는 딥러닝 기반의 초해상화 알고리즘 연구의 최신 기술 현황 및 동향을 소개하고자 한다. 딥러닝 기반의 초해상화 알고리즘은 기존의 전통적인 기법들에 비해 높은 성능을 보여주고 있으며 현재까지도 다양한 네트워크가 제안되며 활발히 연구되고 있다. 본 논문에서는 딥러닝 기반의 초해상화 알고리즘 중 대표적인 네트워크들을 분석하고 다양한 데이터 셋에 대한 해당 네트워크의 실험 결과를 통해 딥러닝 기반의 초해상화 알고리즘의 우수성을 확인하고자 한다.

딥러닝 기반의 몰입형 입체영상 압축

  • 최용호;이진영
    • 방송과미디어
    • /
    • 제28권1호
    • /
    • pp.53-60
    • /
    • 2023
  • 최근 영상처리 및 컴퓨터비전 등 많은 분야에서 딥러닝 기술이 빠르게 발전하면서 다양한 문제들을 높은 성능으로 해결하고 있다. 이에 MPEG (Moving Picture Experts Group) 표준에서도 딥러닝 기반의 미디어 기술이 활발히 제안 및 논의되고 있다. 특히, 몰입형 입체영상 압축을 위한 MPEG-I (MPEG Immersive) 표준은 메타버스 산업으로 크게 관심받고 있는 가상현실, 증강현실, 그리고 혼합현실 등에 대응하기 위해 현재 활발히 연구 중이다. 입체영상은 일반적으로 복수 시점의 컬러영상과 깊이영상으로 구성되어 있어 데이터의 양이 크기 때문에, MPEG-I 표준은 시점 간의 중복된 영역들을 제거하는 프루닝 과정을 통해 효율적인 압축을 수행한다. 하지만, 프루닝 과정에서 정반사 영역이 함께 제거되는 문제로 정확한 입체영상 복원에 한계가 있다. 본 학회지에서는 이러한 문제점을 해결하기 위하여 MPEG-I 표준에 기고된 딥러닝 기반의 정반사 영역 검출을 통한 몰입형 입체영상 압축에 대해 소개한다.

  • PDF

딥러닝 기반 특징점 필터링을 이용한 원격 탐사 영상 정합 고속화 연구 (A study high speed remote sensing image registration using deep learning-based keypoints filtering)

  • 이우주;심동규;오승준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.97-99
    • /
    • 2021
  • 본 논문에서는 딥러닝 기반 특징점 필터링 방법을 이용한 원격 탐사 영상에 대한 영상 정합 (Image Registration) 고속화 방법을 제안한다. 기존의 특징 기반 영상 정합 방법의 복잡도는 특징 매칭 (Feature Matching) 단계에서 발생한다. 이 복잡도를 줄이기 위하여 본 논문에서는 특징 매칭이 영상의 인공구조물에서 검출된 특징점으로 매칭되는 것을 확인하여 특징점 검출기에서 검출된 특징점 중에서 인공구조물에서 검출된 특징점만 필터링하는 방법을 제안한다. 딥러닝 기반 특징점 필터링은 영상 정합을 위하여 필수적인 특징점을 잃지 않으면서 그 수를 줄이기 위하여 인공구조물의 경계와 인접한 특징점을 보존하고, 축소한 영상을 사용하며, 영상 분할(Image Segmentation) 방법의 결과에서 생기는 영상 패치 경계의 잡음을 제거하기 위하여 영상 패치를 중복하여 잘라 냄으로써 정합 속도와 정확도를 향상시킨다. 영상 정합 고속화 방법을 의 성능을 검증하기 위하여 아리랑 3 호 위성 원격 탐사 영상을 사용하여 기존 특징점 추출 방법과 속도와 정확도를 비교하였다. 딥러닝 기반 영상 정합 방법을 기준으로 하여 비교하였을 때 특징점의 수를 약 82% 감소시키면서 속도를 약 9.17 배 향상시켰지만 정확도가 0.985 에서 0.855 으로 저하되었다.

  • PDF

RISC-V 가상플랫폼 기반 Yolov3-tiny 물체 탐지 딥러닝 모델 구현 (Implementation of Yolov3-tiny Object Detection Deep Learning Model over RISC-V Virtual Platform)

  • 김도영;설희관;임승호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.576-578
    • /
    • 2022
  • 딥러닝 기술의 발전으로 객체 인색, 영상 분석에 관한 성능이 비약적으로 발전하였다. 하지만 고성능 GPU 를 사용하는 컴퓨팅 환경이 아닌 제한적인 엣지 디바이스 환경에서의 영상 처리 및 딥러닝 모델의 적용을 위해서는 엣지 디바이스에서 딥러닝 모델 실행 환경 과 이에 대한 분석이 필요하다. 본 논문에서는 RISC-V ISA 를 구현한 RISC-V 가상 플랫폼에 yolov3-tiny 모델 기반 객체 인식 시스템을 소프트웨어 레벨에서 포팅하여 구현하고, 샘플 이미지에 대한 네트워크 딥러닝 연산 및 객체 인식 알고리즘을 적용하여 그 결과를 도출하여 보았다. 본 적용을 바탕으로 RISC-V 기반 임베디드 엣지 디바이스 플랫폼에서 딥러닝 네트워크 연산과 객체 인식 알고리즘의 수행에 대한 분석과 딥러닝 연산 최적화를 위한 알고리즘 연구에 활용할 수 있다.

사용자 행동예측을 위한 임베디드 인공지능 엔진 및 시스템 기술 개발 (Embedded artificial intelligence system development for action estimation on construction site)

  • 송혁;최인규;고민수;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.226-227
    • /
    • 2021
  • 딥러닝을 활용한 영상 분석 기술은 GPU 하드웨어의 발전으로 인하여 소프트웨어 기반 처리 기술이 급격히 발전하였고 기존 패턴 분석 기술 대비 높은 정확도를 보여주고 있다. PC나 특정 하드웨어에서 동작하는 소프트웨어 기반 영상분석기술은 적용분야의 한계가 발생하였다. 신경망 기술을 하드웨어로 구현한 NPU(Network processing unit)의 개발로 고가의 플랫폼이 아닌 임베디드 플랫폼에서의 딥러닝 구현이 가능해졌다. 반면에 하드웨어에서 활용 가능한 네트워크가 제한적임으로 인하여 구현 가능한 딥러닝 모델의 크기, 메모리 등의 한계가 있으며 시시각각 변하는 딥러닝 기술에 기반한 최신모델 또는 고성능 모델을 구동하기에는 한계가 발생하였다. 이를 해결하기 위하여 본 연구에서는 Distillation 기법을 적용한 임베디드 시스템을 개발하고 이에 기반한 딥러닝 모델의 구현 및 상황에 따른 가변적 딥러닝 모델의 적용이 가능한 시스템을 구현하였다.

  • PDF

영상기반 딥러닝 및 이미지 프로세싱 기법을 이용한 볼트풀림 손상 검출 (Bolt-Loosening Detection using Vision-Based Deep Learning Algorithm and Image Processing Method)

  • 이소영;현탄칸;박재형;김정태
    • 한국전산구조공학회논문집
    • /
    • 제32권4호
    • /
    • pp.265-272
    • /
    • 2019
  • 본 연구에서는 영상기반 딥러닝 및 이미지 프로세싱 기법을 이용한 볼트풀림 손상검출 기법을 제안하였다. 이를 위해 먼저, 딥러닝 및 이미지 프로세싱 기반 볼트풀림 검출 기법을 설계하였다. 영상기반 볼트풀림 검출 기법은 볼트 이미지 검출 과정 및 볼트풀림 각도 추정 과정으로 구성된다. 볼트 이미지의 검출을 위하여 RCNN기반 딥러닝 알고리즘을 이용하였다. 영상의 원근왜곡 교정을 위해 호모그래피 개념을 이용하였으며 볼트풀림 각도를 추정을 위하여 Hough 변환을 이용하였다. 다음으로 제안된 기법의 성능을 검증을 위하여 거더의 볼트 연결부 모형을 대상으로 볼트풀림 손상검출 실험을 수행하였다. 다양한 원근 왜곡 조건에 대하여 RCNN 기반 볼트 검출기와 Hough 변환 기반 볼트풀림 각도 추정기의 성능을 검토하였다.

실증 기반 딥러닝 영상분석 기술 제공을 위한 클라우드 기반 지능형 영상보안 플랫폼

  • 임경수;김건우
    • 정보보호학회지
    • /
    • 제29권3호
    • /
    • pp.37-43
    • /
    • 2019
  • 딥러닝을 비롯한 인공기능과 영상처리 분야의 접목은 기존 물리보안의 기술적 한계를 뛰어넘어 새로운 기회의 장을 마련하고 있다. 하지만 딥러닝 기반 영상분석 기술도 지능형 영상감시가 필요한 실제 현장에서는 다양한 환경의 제약사항으로 인해 성능이 저하될 가능성이 높다. 본 논문에서는 실제 CCTV 환경의 영상 데이터를 확보하여 신경망을 이용한 지속적인 학습을 통해 영상분석의 성능을 개선하는 클라우드 기반 지능형 영상보안 플랫폼을 소개한다. 클라우드 기반 지능형 영상보안 플랫폼은 지자체 통합관제센터에서 수집한 CCTV 영상을 학습 데이터로 활용하여, 현장에서 신뢰받을 수 있는 사람 검출, 사람/차량 재식별, 열악 차량번호판 탐지 등의 지능형 영상분석 서비스를 제공할 수 있다.

딥러닝 기반 흉부엑스레이 코로나 진단 알고리즘 (Deep Learning-Based Chest X-ray Corona Diagnostic Algorithm)

  • 김준겸;서진범;조영복
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.73-74
    • /
    • 2021
  • 코로나로 인해 X-ray, CT, MRI와 같은 의료영상 분야에서 딥러닝을 많이 접목시키고 있다. 간단히 접할 수 있는 X-ray 영상으로 코로나 진단을 위해 CNN, R-CNN 등과 같은 영상 딥러닝 분야에서 많은 연구가 진행되고 있다. 의료영상 기반 딥러닝 학습은 바이오마커를 정확히 찾아내고, 최소한의 손실률과 높은 정확도를 필요로한다, 따라서 본 논문에서는 높은 정확도를 위한 학습 모델을 선정하고 실험을 진행하였다.

  • PDF

경량화된 딥러닝 구조를 이용한 실시간 초고해상도 영상 생성 기술 (Deep Learning-based Real-Time Super-Resolution Architecture Design)

  • 안세현;강석주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.228-229
    • /
    • 2020
  • 최근 딥러닝 기술은 여러 컴퓨터 비전 응용 분야에서 많이 쓰이고 있다. 물체 인식, 분류 및 영상 생성 등을 예로 들 수 있다. 특히 초고해상도 변환 문제에서 최근 딥러닝을 사용하면서 큰 성능 개선을 얻고 있다. Fast super-resolution convolutional neural network (FSRCNN)은 딥러닝 기반 초고해상도 알고리즘으로 잘 알려져 있으며, 여러 개의 convolutional layer로 추출한 저 해상도의 입력 특징을 활용하여 deconvolutional layer에서 초고해상도의 영상을 출력하는 알고리즘이다. 본 논문에서는 병렬 연산 효율성을 고려한 FPGA 기반 convolutional neural networks 가속기를 제안한다. 특히 deconvolutional layer를 convolutional layer로 변환하는 방법을 통해서 에너지 효율적인 가속기를 설계했다. 또한 제안한 방법은 FPGA 리소스를 고려하여 FSRCNN의 구조를 변형한 Optimal-FSRCNN을 제안한다. 사용하는 곱셈기의 개수를 FSRCNN 대비 2.4 배 압축하였고, 초고해상도 변환 성능을 평가하는 지표인 PSNR은 FSRCNN과 비슷한 성능을 내고 있다. 이를 통해서 FPGA 에 최적화된 네트워크를 구현하여 FHD 입력 영상을 UHD 영상으로 출력하는 실시간 영상처리 기술을 개발했다.

  • PDF