• 제목/요약/키워드: 영상 학습

검색결과 2,552건 처리시간 0.061초

비지도 학습 기반 영상 노이즈 제거 기술을 위한 정규화 기법의 최적화 (Optimized Normalization for Unsupervised Learning-based Image Denoising)

  • 이강근;정원기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권5호
    • /
    • pp.45-54
    • /
    • 2021
  • 최근 노이즈 제거를 위한 심층 학습 모델에 대한 연구가 활발하게 진행되고 있다. 특히 블라인드 노이즈 제거 (blind denoising) 기술이 발전하면서 깨끗한 영상을 얻기가 불가능한 영상의 영역에서 노이즈 영상만으로 심층 학습 기반 노이즈 제거 모델의 학습이 가능해졌다. 우리는 관찰된 노이즈 영상으로부터 깨끗한 영상을 얻기 위해 더는 깨끗한 영상과 노이즈 영상의 짝을 이루는 데이터를 필요하지 않는다. 하지만 노이즈 영상과 깨끗한 영상 간의 차이가 큰 데이터라면 노이즈 영상만으로 학습된 노이즈 제거 모델은 우리가 원하는 품질의 깨끗한 영상을 복원하기 어려울 것이다. 이 문제를 해결하기 위해서 짝지어지지 않는 깨끗한 영상과 노이즈 영상으로 학습한 모델 기반 노이즈 제거 기술은 최근 연구되고 있다. 가장 최신 기술인 ISCL은 깨끗한 영상과 노이즈 영상의 쌍을 기반으로 한 지도학습 기반 모델의 성능과 거의 근접한 성능을 보여 주었다. 우리는 제안된 방법이 ISCL을 포함한 다른 최신 짝을 이루지 않는 영상 기반 노이즈 제거 기술보다 성능이 우수함을 보여준다.

심층강화학습을 이용한 Convolutional Network 기반 전산화단층영상 잡음 저감 기술 개발 (Development of Convolutional Network-based Denoising Technique using Deep Reinforcement Learning in Computed Tomography)

  • 조정효;임도빈;남기복;이다혜;이승완
    • 한국방사선학회논문지
    • /
    • 제14권7호
    • /
    • pp.991-1001
    • /
    • 2020
  • 전산화단층영상 품질 개선을 위해 사용되는 지도학습 기반의 딥러닝 기술은 사전 학습을 위해 많은 양의 데이터를 필요로 하는 단점이 있다. 또한 지도학습 기반의 딥러닝 기술은 학습에 사용된 영상의 특징과 학습된 모델에 입력된 영상의 특징이 다른 경우 영상 내부 구조적 왜곡이 유발되는 한계점이 있다. 본 연구에서는 기존 지도학습 기반 딥러닝 기술의 단점을 보완하고 전산화단층영상의 잡음을 감소시킬 수 있는 심층강화학습 기반 영상화 모델을 개발하였다. 심층강화학습 기반 영상화 모델은 shared, value 및 policy 네트워크로 구성하였으며, 영상 잡음 특징 추출 및 모델의 성능 향상을 위해 합성곱, rectified linear unit(ReLU) 활성화 함수, dilation factor 및 게이트순환유닛을 사용하였다. 또한 기존 지도학습 기반 딥러닝 기술을 통해 획득한 영상의 영상품질 비교를 통해 본 연구에서 개발한 영상화 모델의 성능을 평가하였다. 연구결과 기존 기술에 비해 본 연구에서 개발한 영상화 모델 적용 시 전산화단층영상의 정량적 정확도는 큰 폭으로 향상, 잡음은 큰 폭으로 감소함을 확인하였다. 또한 영상화 모델 학습 시 사용한 영상과 구조적 특징이 다른 영상에 대해서도 잡음 감소 효과를 확인하였다. 따라서 본 연구에서 개발한 심층강화학습 기반 영상화 모델을 통해 전산화단층영상의 구조적 특징을 보전함과 동시에 잡음을 감소시킬 수 있다.

자기 지도 학습을 통한 고해상도 얼굴 영상 복원 (Face Super Resolution using Self-Supervised Learning)

  • 조병호;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.724-726
    • /
    • 2020
  • 본 논문에서는 GAN 과 자기 지도 학습(self-supervised learning)을 통해 입력 얼굴 영상의 공간 해상도를 4 배 증가시키는 기법을 제안한다. 제안하는 기법은 변형된 StarGAN v2 구조의 생성자와 구분자를 사용하여 저해상도의 입력 영상만을 가지고 학습 과정을 거쳐 고해상도 영상을 복원하도록 자기 지도 학습을 수행한다. 제안하는 기법은 복원된 영상과 고해상도 영상 간의 손실을 줄이는 지도 학습이 가지고 있는 단점을 극복하고 입력 영상만을 가지고 영상 내부에 존재하는 특징을 학습하여 얼굴 영상에 대한 고해상도 영상을 복원한다. 제안하는 기법과 Bicubic 보간법과의 비교를 통해 우수성을 검증한다.

  • PDF

다층 신경회로망 학습에 의한 정지 영상의 벡터 (Vector Quantization Compression of the Still Image by Multilayer Perceptron)

  • 이상찬;최태완;김지홍
    • 한국정보처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.390-398
    • /
    • 1996
  • 본 논문에서는 다층 신경회로망의 일반화 특성을 이용한 새로운 영상 압축 알 고리즘을 제안한다. 제안 알고리즘은 벡터 양자화방식을 이용하여 영상을 몇 개의 클래스로 분류하고 이들을 다층 신경회로망으로 학습한다. 이렇게 학습된 다층신경회 로망은 일반화 특성에 의하여 무 학습의 영상에 대해서도 압축과 복원을 수행 한다. 아울러 벡터 양자화방식에 있어서 벡터 양자화 오차와 수신측에서의 메모리를 감소시 킨다. 본 논문에서는 Lena 영상을 학습 영상으로 하여 이를 16개의 클래스로 나누고 각 클래스를 1개의 다층 신경회로망으로 학습하였다. 그리고 학습에 사용된 Lean 영상 및 무 학습 영상들에 대하여 압축과 복원을 수행하여 우수한 화질의 영상이 복원 되어 짐이 보인다.

  • PDF

생성적 적대 신경망을 이용한 영상 잡음 제거 (Image denoising using Generative Adversarial Network)

  • 박구용;김윤식;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.213-216
    • /
    • 2019
  • 영상 잡음 제거 알고리즘은 잡음으로 오염된 영상으로부터 잡음이 제거된 깨끗한 영상을 추정하여 복원하는 연구이다. 기존의 모델 기반 방법의 영상 잡음 제거 알고리즘은 영상을 복원하는 과정에서 최적화 문제를 풀어야 한다는 단점과 매개변수를 직접 선택을 해주어야 한다는 단점을 가진다. 본 논문에서는 딥러닝을 이용한 학습기반 방법의 영상 잡음 제거 연구를 소개한다. 먼저, 신경망의 구축을 위하여 신경망의 구성 요소는 Instance Normalization 과 컨볼루션 신경망을 이용한 모델을 제안하였고, 여러 연구 분야에서 좋은 성능을 보이는 U-Net 구조를 전체적인 구조로 차용하였다. 신경망의 학습을 위하여 DnCNN 에서 제안한 잡음을 학습하는 잔여 학습 기법을 채택하였고, 기존의 영상 잡음 제거 알고리즘의 단점인 결과 영상이 흐릿해지는 현상을 보완하기 위하여 생성적 적대 신경망 학습 방법을 적용하였다. 본 논문에서 제안한 신경망을 이용한 잡음 제거 영상의 결과가 기존의 연구 방법들 보다 인지적인 측면에서 좋은 결과를 보임을 확인하였다.

  • PDF

영상 인식을 위한 제안된 자가 생성 지도 학습 알고리즘 (The Proposed Self-Generation Supervised Learning Algorithm for Image Recognition)

  • 이혜현;류재욱;조아현;김광백
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.226-230
    • /
    • 2001
  • 오류 역전파 알고리즘을 영상 인식에 적용한 경우 은닉층의 노드 수를 경험적으로 설정하여야 하는 문제점이 있다. 따라서 본 논문에서는 오류 역전파 알고리즘의 은닉층 노드 수를 동적으로 설정하는 문제를 해결하기 위해 ART1을 수정하여 지도 학습 방법과 결합한 자가 생성 지도 학습 알고리즘을 제안하였다. 제안된 학습 알고리즘의 성능을 평가하기 위해 콘테이너 영상의 문자 및 숫자 인식 문제에 적용하여 기존의 오류 역전파 알고리즘과 성능을 비교, 분석하였다. 실험 결과에서는 제안된 자가 생성 지도 학습알고리즘이 기존의 오류 역전과 알고리즘보다 지역 최소화에 빠질 가능성이 감소하였으며 학습 시간과 수렴성이 개선되었을 뿐만 아니라, 영상 인식에 적용할 수 있는 가능성도 제시하였다.

  • PDF

개선된 퍼지 연상 메모리를 이용한 영상 복원 (Image Restoration using Enhanced Fuzzy Associative Memory)

  • 조서영;민지희;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.133-135
    • /
    • 2004
  • 신경 회로망에서 연상 메모리(Associative Memory)는 주어진 자료에 대해 정보를 저장하고 복원하는 알고리즘이다. 본 논문에서는 학습된 영상의 정확한 분류와 왜곡된 영상의 복원 및 분류를 위해 기존의 퍼지 연상 메모리 알고리즘을 개선하였다. 기존의 퍼지 연상 메모리는 학습 데이터와 학습 원본과 같은 입력에 대해 우수한 복원 성능을 보이나 학습 데이터의 수가 증가할수록 그리고 왜곡된 입력에 대해 정확히 출력할 수 없고 복원 성능도 저하된다. 따라서 본 논문에서는 기존의 퍼지 연상 메모리 알고리즘을 개선하여 왜곡된 입력에 대해서도 원본 학습 데이터를 정확히 출력하고 복원하는 개선된 퍼지 연상 메모리 알고리즘을 제안하였다.

  • PDF

자연 영상에 대한 Naive Convolutional Auto Encoder의 특징 추출 성능에 관한 연구 (A Study on Feature Extraction Performance of Naive Convolutional Auto Encoder to Natural Images)

  • 이성주;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1286-1289
    • /
    • 2022
  • 최근 영상 군집화 분야는 딥러닝 모델에게 Self-supervision을 주거나 unlabeled 영상에 유사-레이블을 주는 방식으로 연구되고 있다. 또한, 고차원 컬러 자연 영상에 대해 잘 압축된 특징 벡터를 추출하는 것은 군집화에 있어 중요한 기준이 된다. 본 연구에서는 자연 영상에 대한 Convolutional Auto Encoder의 특징 추출 성능을 평가하기 위해 설계한 실험 방법을 소개한다. 특히 모델의 특징 추출 능력을 순수하게 확인하기 위하여 Self-supervision 및 유사-레이블을 제공하지 않은 채 Naive한 모델의 결과를 분석할 것이다. 먼저 실험을 위해 설계된 4가지 비지도학습 모델의 복원 결과를 통해 모델별 학습 정도를 확인한다. 그리고 비지도 모델이 다량의 unlabeled 영상으로 학습되어도 더 적은 labeled 데이터로 학습된 지도학습 모델의 특징 추출 성능에 못 미침을 특징 벡터의 군집화 및 분류 실험 결과를 통해 확인한다. 또한, 지도학습 모델에 데이터셋 간 교차 학습을 수행하여 출력된 특징 벡터의 군집화 및 분류 성능도 확인한다.

  • PDF

시-공간 특징을 이용한 효율적인 3차원 인체 자세 재구성 (Efficient Reconstruction of 3D Human Body Pose Using Spatio-Temporal Features)

  • 양희덕;아마드;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.892-894
    • /
    • 2005
  • 본 논문에서는 스테레오 영상에서 깊이 정보를 추출하여 사람의 자세를 학습된 2차원 깊이 영상들의 선형 결함으로 표현하여 3차원 인체 모델을 재구성하는 방법을 제안한다. 한 장의 2차원 깊이 영상으로 최소 제곱법을 이용하여 프로토타입 깊이 영상의 선형 결합으로 표현되는 최적의 계수를 찾을 수 있다. 입력된 깊이 영상의 3차원 인체 모델은 프로토타입 깊이 영상에서 예측된 계수를 적용하여 생성한다. 학습 단계에서는 데이터를 계층적으로 나누어 모델을 생성한다. 또한, 재구성 단계에서는 실루엣 영상과 깊이 영상으로부터 계층적으로 나누어진 학습 데이터를 이용하여 3차원 인체 자세를 재구성한다. 학습 및 재구성의 마지막 단계에서는 실루엣 영상 대신 깊이 영상을 이용하여 3차원 인체 모델을 재구성한다. 한 장의 실루엣 영상을 이용하면 영상의 노이즈에 민감하기 때문에 재구성 단계의 상위 레벨에서는 실루엣 영상의 누적 영상을 이용한다. 실험 결과는 제안된 방법이 효율적으로 3차원 인체 자세를 재구성함을 보여준다.

  • PDF

동영상 강의의 효율성을 위한 학습자의 얼굴추출 및 탐색 (Learner′s Face Extracting and Searching for the Efficiency of Moving-Picture Lecture)

  • 김철민;이양원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.374-377
    • /
    • 2004
  • 동영상 강의는 시간이나 장소 등에 크게 구애받지 않고 인터넷을 통하여 쉽게 이용할 수 있는 간편한 학습방법중의 하나이다. 그러나 학습자의 학습자세와 태도에 따라 학습효과는 매우 다를 수 있는 문제점을 가지고 있다. 본 논문에서는 입력영상으로부터 학습자의 얼굴정보를 입력받아 주기적으로 탐색하여 학습자의 강의에 대한 집중도와 충실도를 평가하는 시스템을 제안하고자 하였다. 먼저 입력영상의 분할된 중심영역으로부터 학습자의 얼굴을 포함하는 신체정보를 입력받아 사용하였으며, 빠르고 효율적인 얼굴영역의 추출을 위하여 피부색상(skin-color)정보와 얼굴의 지역적 특성을 이용하는 방법을 사용하였다. 또한 주기적으로 입력되는 영상의 빠른 얼굴추적을 위하여 설정된 영역들로부터 구성되는 블록들의 위치와 구성정보를 이용한 블록탐색 기법을 사용하였다.

  • PDF