• 제목/요약/키워드: 영상 학습

검색결과 2,560건 처리시간 0.03초

인간의 시각 특성과 신경회로망을 이용한 칼라영상의 향상 (Color Image Enhancement Using Human Visual Properties and Neural Network)

  • 신현욱;조석제
    • 한국정보처리학회논문지
    • /
    • 제5권12호
    • /
    • pp.3265-3274
    • /
    • 1998
  • 본 논문에서는 인간의 칼랄 인식 특성인 명도, 채도 및 색조의 관계를 학습시킨 신경회로망을 이용하여 열화된 영상의 채도 부분을 향상하는 칼라영상향상법으 제안하였다. 제안한 방법은 우선 표준영상으로부터 여러 단계 열화된 영상들로부터 얻은 다양한 명도, 채도 및 색조의 관계를 신경회로망의 입력으로 하고 표준영상의 채도를 목표차로 해서 신경회로망을 학습시킨다. 그리고 이렇게 학습된 신경회로망에 열화된 영상의 명도, 채도, 색조 그리고 향상시킨 명도를 입력하면 향상된 채도를 얻을 수 있는 칼라영상향상방법이다. 본 논문에서는 제안한 방법이 기존의 칼라영상향상법에서 가장 문제가 되었던 영상 향상 시 칼라범위를 초과하는 문제와 채도 향상비의 인위적 선택문제를 해결하고 채도의 대비를 향상시켜 선명한 영상을 얻을 수 있는 방법임을 밝혔다.

  • PDF

훈련 샘플 수집을 통한 온라인 학습 기반 사람 추적 방법 (Online Learning based Human Tracking by Collecting Training Samples)

  • 길종인;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.19-20
    • /
    • 2016
  • 비디오로부터 객체를 검출하기 위해서는 오프라인에서 미리 객체를 검출할 수 있는 분류기가 학습되어있어야 한다. 이러한 분류기는 훈련에 사용된 훈련 집합에 매우 의존적이어서, 다양한 환경의 비디오 영상에 모두 적용할 수 있는 분류기의 설계는 불가능하다. 또한 분류기의 학습을 위해서는 상당히 많은 수의 훈련 집합이 필요하므로, 이는 신뢰도 높은 분류기 학습을 위한 높은 비용을 초래한다. 본 논문에서는 이러한 문제를 해결 할 수 있는 온라인 학습 기반 사람 추적 방법을 제안한다. 실험 영상으로부터 적절하게 훈련 집합을 수집함으로써 해당 실험 영상에 최적화된 분류기의 학습이 가능하며, 다양한 환경의 영상에 적용적으로 설계될 수 있다.

  • PDF

3D CNN 기반 전립선 MRI 영상 분할 기술 (3D CNN-Based Segmentation of Prostate MR images)

  • 문주혁;최환;이세호;장원동;김창수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.145-146
    • /
    • 2017
  • 본 논문에서는 남성의 하반신을 촬영한 MRI 영상으로부터 전립선을 분할하는 알고리즘을 제안한다. 우선 3 차원 입체 영상을 학습하기 위해 3D 컨볼루션 계층(convolutional layer) 및 3D 풀링 계층(pooling layer)에 기반한 네트워크를 제안한다. 다음으로 네트워크의 최후단에 해당하는 전연결 계층(fully connected layer)의 강인한 학습을 돕는 잡음 계층을 제안한다. 잡음 계층은 네트워크의 학습 파라미터 혹은 출력 영상에 가우시안 잡음를 더함으로써 드롭 아웃과 같이 훈련 영상에 대한 과적합(overfitting)을 막고 테스트 영상에 강인한 네트워크의 학습을 돕는다. 마지막으로 실험을 통해 제안하는 기법이 기존 기법에 비해 우수한 분할 성능을 보임을 확인한다.

  • PDF

결정 트리를 이용한 뇌 MRI 시리즈 분류 (Classification of Brain MRI Series by using Decision Tree)

  • 김용욱;김준태;엄기현;조형제
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1087-1092
    • /
    • 2002
  • 본 논문에서는 결정 트리 학습을 이용하여 뇌 MRI 시리즈를 분류하는 시스템을 제안한다. 영상으로부터 얻을 수 있는 정보에는 두 종류가 있다. 하나는 크기, 색상, 질감, 윤곽선 등 원 영상으로부터 직접 얻을 수 있는 하위레벨(low-level) 특징들이고, 다른 하나는 특정 개체의 존재유무, 여러 부위 사이의 공간적 관계 등 분할된 영상들에 대한 해석을 통하여만 얻을 수 있는 상위레벨(high-level) 특징들이다. 영상을 의미에 따라 분류하기 위해서는 학습 및 분류가 상위레벨 특징들을 기반으로 수행되어야 한다. 제안된 시스템에서는 결정 트리 학습을 이용하여 영상을 구성하는 요소를 학습하고 분류하며 그에 따라 영상 시리즈를 대표할 수 있는 상위레벨 특징을 추출하였다. 정상, 뇌경색, 뇌종양이 있는 뇌 MRI 시리즈에 대하여 분류 실험을 수행하였으며, 그 결과를 설명 하였다.

  • PDF

2D 렌더링 정보를 활용한 손-객체의 3D 복원 (Hand-Object 3D Reconstruction Based on 2D Rendering)

  • 남현길;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.327-330
    • /
    • 2021
  • 본 논문은 RGB 영상 데이터셋의 일부만을 지도학습하여(Sparsely-supervised learning) Annotation 되지 않은 영상에 대해 손-객체의 3D 포즈를 복원하기 위한 방법을 제안한다. 기존의 연구에서는 손-객체의 포즈에 해당하는 6DoF 만을 학습 데이터로 활용한다. 이와 달리, 본 논문에서는 정확도 향상을 위해 복원된 결과를 동일한 입력 영상 내에서 비교 가능하도록 3D 모델로 복원한 결과를 입력 영상의 마스크로 만들어 학습에 반영하였다. 구체적으로 추정된 포즈로 만들어낸 마스크를 입력 영상에 적용한 결과와 Ground-truth 포즈를 적용한 영상을 학습 시에 손실 함수에 반영하였다. 비교 실험을 통해 제안된 방법이 해당 방법을 적용하지 않은 경우 보다 3D 매쉬 오차가 적었음을 확인할 수 있었다.

  • PDF

조명 변화 환경에서 PCA 기반 얼굴인식 알고리즘의 신뢰도에 대한 연구 (Study on The Confidence Level of PCA-based Face Recognition Under Variable illumination Condition)

  • 조현종;강민구;문승빈
    • 전자공학회논문지CI
    • /
    • 제46권2호
    • /
    • pp.19-26
    • /
    • 2009
  • 본 논문은 PCA기반 얼굴인식 알고리즘에서 조명 변화에 따른 인식율의 변화 및 Cumulative Match Characteristic을 이용한 누적 식별 값 측정을 통해 알고리즘의 신뢰도를 확인하였다. 이를 위해 본 논문에서는 한 사람당 하나의 학습 영상만을 사용하는 경우뿐만 아니라 조명 조건이 다른 다중 학습 영상을 사용하여 실험하였고, 입력 영상 또한 다양한 조명 조건의 영상을 사용함으로서 학습 영상의 선택과 입력 영상의 조명 변화에 따른 알고리즘의 신뢰도에 관해 연구하였다. 실험 결과, 한사람 당 하나의 정면조명조건 학습 영상을 사용한 방식에 비하여 다중 학습 영상 사용 시 인식율은 떨어졌다. 그러나 학습 영상의 개수와 입력 영상의 조명 변화 범위에 관계없이 상위 유사도군에 들어가는 비율은 높은 양상을 보임으로서 조명 변화 환경에서 PCA 알고리즘의 인식 결과에 대한 신뢰도를 확인 할 수 있었다.

캡슐내시경의 위치추적을 위한 CNN 기반 위장관 랜드마크 분류기 설계 (Design of CNN-based Gastrointestinal Landmark Classifier for Tracking the Gastrointestinal Location)

  • 장현웅;임창남;박예슬;이광재;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1019-1022
    • /
    • 2019
  • 최근의 영상 처리 분야는 딥러닝 기법들의 성능이 입증됨에 따라 다양한 분야에서 이와 같은 기법들을 활용해 영상에 대한 분류, 분석, 검출 등을 수행하려는 시도가 활발하다. 그중에서도 의료 진단 보조 역할을 할 수 있는 의료 영상 분석 소프트웨어에 대한 기대가 증가하고 있는데, 본 연구에서는 캡슐내시경 영상에 주목하였다. 캡슐내시경은 주로 소장 촬영을 목표로 하며 식도부터 대장까지 약 8~10시간 동안 촬영된다. 이로 인해 CT, MR, X-ray와 같은 다른 의료 영상과 다르게 하나의 데이터 셋이 10~15만 장의 이미지를 갖는다. 일반적으로 캡슐내시경 영상을 판독하는 순서는 위장관 교차점(Z-Line, 유문판, 회맹판)을 기준으로 위장관 랜드마크(식도, 위, 소장, 대장)를 구분한 뒤, 각 랜드마크 별로 병변 정보를 찾아내는 방식이다. 그러나 워낙 방대한 영상 데이터를 가지기 때문에 의사 혹은 의료 전문가가 영상을 판독하는데 많은 시간과 노력이 소모되고 있다. 본 논문의 목적은 캡슐내시경 영상의 판독에서 모든 환자에 대해 공통으로 수행되고, 판독하는 데 많은 시간을 차지하는 위장관 랜드마크를 찾는 것에 있다. 이를 위해, 위장관 랜드마크를 식별할 수 있는 CNN 학습 모델을 설계하였으며, 더욱 효과적인 학습을 위해 전처리 과정으로 학습에 방해가 되는 학습 노이즈 영상들을 제거하고 위장관 랜드마크 별 특징 분석을 진행하였다. 총 8명의 환자 데이터를 가지고 학습된 모델에 대해 평가 및 검증을 진행하였는데, 무작위로 환자 데이터를 샘플링하여 학습한 모델을 평가한 결과, 평균 정확도가 95% 가 확인되었으며 개별 환자별로 교차 검증 방식을 진행한 결과 평균 정확도 67% 가 확인되었다.

PDA 기반의 학습 영역 추출을 이용한 강의 영상 디스플레이 기법 (Lecture Video Display Technique using Extraction Region of Study based on PDA)

  • 서정희;박흥복
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2127-2134
    • /
    • 2007
  • 전자적인 학습은 이동성 및 접근의 용이성, 즉시성, 유연성을 제공하여 학습자의 시간적인 제약을 극복할 수 있었으나 유선 컴퓨터상에서 공간에 의한 제약은 많은 문제로 남아있다. 따라서 이런 전자적인 학습은 학습자에게 시간과 공간적인 제약을 극복할 수 있는 모바일 학습 환경으로 변화하는 추세이다. 그러나 모바일 디바이스들은 작은 디스플레이 사이즈로 인하여 실시간 동영상에서 제공되는 학습 내용을 정확하게 인식하기는 어려운 실정이다. 따라서 본 논문은 실시간 학습 영상을 관심 영역에 대한 학습 영역을 추출하고 작은 디스플레이 디바이스 사이즈에 적절한 영상 크기로 축소하여 무선 PDA에 디스플레이하는 기법을 제안한다. 실험 결과, 다양한 강의 영상에서 학습 내용 중심의 영역을 적응적으로 추출하고, 사용자 디바이스 사이즈에 적합한 영역을 효과적으로 계산함으로써 계산에 소요되는 시간을 크게 줄일 수 있었다.

Deep Convolution Neural Networks 이용하여 결함 검출을 위한 결함이 있는 철도선로표면 디지털영상 재 생성 (Regeneration of a defective Railroad Surface for defect detection with Deep Convolution Neural Networks)

  • 김현호;한석민
    • 인터넷정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.23-31
    • /
    • 2020
  • 본 연구는 철도표면상에 발생하는 노후 현상 중 하나인 결함 검출을 위해 학습데이터를 생성함으로써 결함 검출 모델에서 더 높은 점수를 얻기 위해 진행되었다. 철도표면에서 결함은 선로결속장치 및 선로와 차량의 마찰 등 다양한 원인에 의해 발생하고 선로 파손 등의 사고를 유발할 수 있기 때문에 결함에 대한 철도 유지관리가 필요 하다. 그래서 철도 유지관리의 자동화 및 비용절감을 위해 철도 표면 영상에 영상처리 또는 기계학습을 활용한 결함 검출 및 검사에 대한 다양한 연구가 진행되고 있다. 일반적으로 영상 처리 분석기법 및 기계학습 기술의 성능은 데이터의 수량과 품질에 의존한다. 그렇기 때문에 일부 연구는 일반적이고 다양한 철도표면영상의 데이터베이스를 확보하기위해 등간격으로 선로표면을 촬영하는 장치 또는 탑재된 차량이 필요로 하였다. 본연구는 이러한 기계적인 영상획득 장치의 운용비용을 감소시키고 보완하기 위해 대표적인 영상생성관련 딥러닝 모델인 생성적 적대적 네트워크의 기본 구성에서 여러 관련연구에서 제시된 방법을 응용, 결함이 있는 철도 표면 재생성모델을 구성하여, 전용 데이터베이스가 구축되지 않은 철도 표면 영상에 대해서도 결함 검출을 진행할 수 있도록 하였다. 구성한 모델은 상이한 철도 표면 텍스처들을 반영한 철도 표면 생성을 학습하고 여러 임의의 결함의 위치에 대한 Ground-Truth들을 만족하는 다양한 결함을 재 생성하도록 설계하였다. 재생성된 철도 표면의 영상들을 결함 검출 딥러닝 모델에 학습데이터로 사용한다. 재생성모델의 유효성을 검증하기 위해 철도표면데이터를 3가지의 하위집합으로 군집화 하여 하나의 집합세트를 원본 영상으로 정의하고, 다른 두개의 나머지 하위집합들의 몇가지의 선로표면영상을 텍스처 영상으로 사용하여 새로운 철도 표면 영상을 생성한다. 그리고 결함 검출 모델에서 학습데이터로 생성된 새로운 철도 표면 영상을 사용하였을 때와, 생성된 철도 표면 영상이 없는 원본 영상을 사용하였을 때를 나누어 검증한다. 앞서 분류했던 하위집합들 중에서 원본영상으로 사용된 집합세트를 제외한 두 개의 하위집합들은 각각의 환경에서 학습된 결함 검출 모델에서 검증하여 출력인 픽셀단위 분류지도 영상을 얻는다. 이 픽셀단위 분류지도영상들과 실제 결함의 위치에 대한 원본결함 지도(Ground-Truth)들의 IoU(Intersection over Union) 및 F1-score로 평가하여 성능을 계산하였다. 결과적으로 두개의 하위집합의 텍스처 영상을 이용한 재생성된 학습데이터를 학습한 결함 검출모델의 점수는 원본 영상만을 학습하였을 때의 점수보다 약 IoU 및 F1-score가 10~15% 증가하였다. 이는 전용 학습 데이터가 구축되지 않은 철도표면 영상에 대해서도 기존 데이터를 이용하여 결함 검출이 상당히 가능함을 증명하는 것이다.

시각정보처리와 영상인식 (Visual Information Processing and Image Recognition)

  • 조재현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.387-388
    • /
    • 2022
  • 기계학습은 문제가 복잡하여 수학적으로 정의를 하는 것이 어려울 때 유용하게 쓸 수 있는 방법으로 최근 패턴 또는 영상을 인식하기 위하여 급속도록 많이 사용되고 있다. 본 논문에서는 기존의 학습 모델과는 다르게 인간의 시각정보처리과정 중 망막의 특성과 시각피질의 특성을 고려한 모델을 제시하여 학습의 첫 단계인 원시 데이터를 가공하는 과정을 개선함으로써 좀 더 효율적인 인식모델을 제안하고자 한다.

  • PDF