• 제목/요약/키워드: 영상 구도

검색결과 1,612건 처리시간 0.03초

사진 구도 개선을 위한 딥러닝 기반 반복적 크롭핑 (Repeated Cropping based on Deep Learning for Photo Re-composition)

  • 홍은빈;전준호;이승용
    • 정보과학회 논문지
    • /
    • 제43권12호
    • /
    • pp.1356-1364
    • /
    • 2016
  • 본 논문에서는 딥러닝 기법 중 하나인 deep convolutional neural network (DCNN)을 이용하여 영상의 구도를 개선하는 방법을 제시한다. 기존의 구도 개선 방법들은 영상의 주요 물체의 위치를 바탕으로 한 구도 평가 점수를 정의한 뒤 최적화를 통해 평가 점수를 향상시키는 방향으로 영상을 개선한다. 이는 계산량이 많고 기존 주요 물체 검출 알고리즘의 성능에 종속적이기 때문에 영상에 따라 구도 개선이 제대로 수행되지 않는 경우가 존재한다. 본 논문에서는 영상의 특징 추출에 뛰어난 성능을 보이는 DCNN을 이용해 영상을 반복적으로 크롭하여 미학적으로 구도가 개선된 영상을 얻는 방법을 제안한다. 실험 결과 및 사용자 평가를 통해 본 논문에서 제안한 알고리즘이 주어진 영상을 특정 구도 가이드라인(삼분할법, 주요 물체의 크기 등)을 따르도록 자동으로 크롭한다는 것을 보인다.

360 영상으로부터 텍스트 정보를 이용한 자연스러운 사진 생성 (Natural Photography Generation with Text Guidance from Spherical Panorama Image)

  • 김범석;정진웅;홍은빈;조성현;이승용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권3호
    • /
    • pp.65-75
    • /
    • 2017
  • 360 영상은 상하좌우 모든 영역에 대한 정보를 갖고 있기 때문에 종종 지나치게 많은 정보를 포함하게 된다. 또한 360 영상의 내용을 2D 모니터를 이용하여 확인하기 위해서는 마우스를 이용하여 360 영상을 돌려 봐야 하거나, 또는 심하게 왜곡된 2D 영상으로 변환해서 봐야 하는 문제가 있다. 따라서 360 영상에서 사용자가 원하는 물체를 찾는 것은 상당히 까다로운 일이 될 수 있다. 본 논문은 물체나 영역을 묘사하는 문장이 주어졌을 때, 360 영상 내에서 문장과 가장 잘 어울리는 영상을 추출해 내는 방법을 제시한다. 본 논문에서 제시한 방법은 주어진 문장 뿐 아니라 구도 역시 고려하여 구도 면에서도 보기 좋은 결과 영상을 생성한다. 본 논문에서 제시하는 방법은 우선 360 영상을 2D 큐브맵으로 변환한다. 일반적인 큐브맵은 큐브맵의 경계 부분에 걸쳐 있는 물체가 있을 경우, 이를 검출하기 어려운 문제가 있다. 따라서 더 정확한 물체 검출을 위해 본 논문에서는 변형된 큐브맵을 제시한다. 이렇게 변형된 큐브맵에 Long Short Term Memory (LSTM) 네트워크 기반의 자연어 문장을 이용한 물체 검출 방법을 적용한다. 최종적으로 원래의 360영상에서 검출된 영역을 포함하면서도 영상 구도 면에서 보기 좋은 영역을 찾아서 결과 영상을 생성한다.

MPEG 비디오 스트림에서의 대표 프레임 추출 및 멀티미디어 검색 기법 (Key Frame Detection and Multimedia Retrieval on MPEG Video)

  • 김영호;강대성
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.297-300
    • /
    • 2000
  • 본 논문에서는 MPEG 비디오 스트림을 분석하여 DCT DC 계수를 추출하고 이들로 구성된 DC 이미지로부터 제안하는 robust feature를 이용하여 shot을 구하고 각 feature들의 통계적 특성을 이용하여 스트림의 특징에 따라 weight를 부가하여 구해진 characterizing value의 시간변화량을 구한다. 구해진 변화량의 local maxima와 local minima는 MPEG 비디오 스트림에서 각각 가장 특징적인 frame과 평균적인 frame을 나타낸다. 이 순간의 frame을 구함으로서 효과적이고 빠른 시간 내에 key frame을 추출한다. 추출되어진 key frame에 대하여 원영상을 복원한 후, 색인을 위하여 다수의 parameter를 구하고 사용자가 질의한 영상에 대해서 이들 파라메터를 구하여 key frame들과 가장 유사한 대표영상들을 검색한다.

  • PDF

영상구도에 근거한 영상내의 주요객체 자동추출 기법 (Automatic Extraction of Major Object in the Image based on Image Composition)

  • 강선도;유헌우;신영근;장동식
    • 한국콘텐츠학회논문지
    • /
    • 제8권3호
    • /
    • pp.8-17
    • /
    • 2008
  • 본 논문에서는 새로운 주요객체 자동추출 알고리즘을 제안한다. 제안된 알고리즘은 크게 2단계 과정으로 요약될 수 있다. 1단계로 객체와 배경을 분리하는 영상분할 작업을 수행한다. 우선적으로 '인간은 3또는 4개의 주요 색상으로 축약하여 사물을 인식한다'는 연구 결과에 따라 K-means 알고리즘을 이용하여 3구역으로 분할하고, 분할된 영상 간 히스토그램 유사도를 계산하여 임계값 이상으로 유사하면 병합하는 과정을 수행한다. 2단계로 영상구도에 근거해 분할된 영상 중에 객체라고 지정하는 작업을 수행한다. 사람이 사진을 잘 찍기 위해서는 '주요객체의 위치를 영상구도에 맞추어 촬영하는 것이 바람직하다는 사실'에 근거하여 삼각구도를 바탕으로 가중치 마스크를 설계하여 객체위치를 역 추정하였다. 제안된 방법의 우수성을 보이기 위해 약 400개의 영상에 대해 실험하였으며, 최근에 발표된 KMCC, GBIS방법과도 비교하였다.

모양 특징을 이용한 영상 검색 (Image Retrieval using Shape Feature)

  • 정성호;황병곤;이상렬
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.57-61
    • /
    • 2000
  • 본 논문에서는 영상의 다양한 특징 정보 중에서 모양 특징을 이용한 영상 검색 시스템 을 제안한다. 모양 특징을 추출하기 위한 과정은 Chain Code를 이용 경계면의 좌표와 깊이를 구하는 과정, 경계면에 대한 무게 중심 추출 과정 그리고 영역의 넓이를 구하는 과정으로 구성되고, 무게 중심으로부터 경계면 가지 거리의 합, 표준 편차, 장축/단축 비율 등을 특징 정보로 이용한다. 각 질의 영상들의 특징 정보와 데이터베이스에 저장된 영상들의 특징 정보들을 비교하여 유사도 순위에 따라 후보영상들이 검색된다. 실험 대상으로는 170개의 폐곡선을 이루는 이진 도형 영상에 대한 검색 실험을 실시하였으며, 실험 결과 평균 Recall/Precision이 0.65/0.81을 보임으로써 제안된 방법이 유용함을 보였다.

  • PDF

구형 객체의 깊이 영상 부호화 방법 (Depth Video Coding Method for Spherical Object)

  • 권순각;이동석;박유현
    • 한국산업정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.23-29
    • /
    • 2016
  • 본 논문은 구형 객체가 촬영된 깊이 영상에서 깊이 정보를 통하여 제일 근접한 구를 찾아내어 깊이 영상을 부호화하는 방법을 제안한다. 블록단위로 분할된 깊이 영상에 대해 최소자승법을 통해 촬영된 구형 객체와 제일 근접한 구의 형태를 찾는다. 그 후 찾아낸 구의 형태로 깊이 값을 예측하고, 측정된 깊이 값과의 오차를 통해 깊이 영상을 부호화한다. 또한, 블록 내의 부호화된 각 깊이 화소들과 찾아낸 구의 인자 정보를 같이 부호화한다. 제안된 방법으로 구형 객체에 대해 기존 DPCM 방법보다 최대 81% 이상의 부호화 효율 향상이 이루어졌다.

비반구 유동모델과 영역기반 윤곽선 기법에 기초한 자동근위 등속표면적의 결정 및 혈류량 추정 (Automatic Proximal Isovelocity Surface Area Determination using Non-hemispherical Flow Model and Region Based Contour Scheme for Blood Flow Rate Estimation)

  • 진경찬;조진호
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권5호
    • /
    • pp.449-455
    • /
    • 2000
  • 순간적으로 승모판에서 혈류가 역류하는 영역을 측정하기 위해서, PISA 방법이 자주 이용되고 있다. 이 방법은 물질보존법칙에 근거하여, 구멍을 통과하는 유체량을 isotach 표면적과 이에 대응하는 속도의 곱으로 구하는 것이다. 이러한 PISA 방법에서 사용되는 유동모델은 반구모델과 비반구모델의 형태인데, 이는 isotach 표면적이 반구이거나 비반구임을 가정하여 계산된 것이다. 이러한 isotach 모델링에서는 isotach의 높이와 폭의 결정이 유체량을 추정하는데 아주 중요한 변수가 된다. 본 연구에서는 in-vitro 칼라 도플러 영상으로부터 PISA 영역을 추정을 위하여 영역기반을 근간으로 하는 비반구모델에 대한 표면적 추정방법을 제안하였다. 이 방법의 타당성을 알아보기 위해 180개의 칼라 도플러 영상에 대해 isotach의 높이와 폭을 추정한 결과, 기존의 에지기반방법이 19개 영상에서 에러를 가지는 반면, 제안한 방법에서는 에러영상이 없음을 알 수 있었다.

  • PDF

로스 텍스처 필터 기반 영상의 자동 깊이 생성 기법 (Automatic Depth Generation Using Laws' Texture Filter)

  • 조철용;김제동;장성은;최창열;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.87-90
    • /
    • 2009
  • 영상의 깊이 정보를 추출하는 것은 매우 어려운 연구이다. 다양한 유형의 영상 구조의 분석이 필요하지만 많은 경우에 주관적인 판단의 도움이 필요하다. 본 논문에서는 로스 텍스처 필터를 기반으로 정지 영상의 깊이를 자동으로 생성하는 방법을 제안한다. 로스 텍스처 필터는 단안 비전에서 3D 깊이를 얻기 위한 방법으로 활용되었는데, 실제 2D 영상에서 깊이를 예측하기 위해 텍스처 편차, 텍스처 기울기, 색상 등을 활용한다. 로스 필터는 $1{\times}5$ 벡터로부터 콘볼루션을 이용하여, 20여개의 $5{\times}5$ 콘볼루션 필터가 구해지는데, 영상에 필터를 적용하여 로스 에너지를 계산한다. 구해진 에너지를 깊이 맵으로 변환하고, 깊이 맵에서 특징 점을 구하고, 특징 점들로부터 델러노이 삼각화를 이용하여 삼각형 깊이 메쉬를 얻는다. 구해진 깊이 맵의 성능을 측정하기 위해 카메라 시점을 변경하면서 영상의 3D 구조를 분석하였으며, 입체영상을 생성하여 3D 입체 시청 결과를 분석하였다. 실험에서는 로스 텍스처 필터를 이용하는 깊이 생성 방법이 좋은 효과를 얻는 것을 확인하였다.

  • PDF

스터드 기반의 레이저 레이다 삼차원 영상센서기술

  • 민봉기
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2013년도 제44회 동계 정기학술대회 초록집
    • /
    • pp.120-120
    • /
    • 2013
  • 본 발표에서는 최근 무인전투기 및 무인자율주행차량 등의 어플리케이션에 응용되고 있는 삼차원 영상 센서 시스템 기술에 관한 소개와 더불어 한국전자통신연구원에서 독자적인 구도를 기반으로 최근 시연에 성공한 스터드(STUD) 레이저 레이다의 동작원리 및 구현결과를 소개하고자 한다. 최근 전세계의 삼차원 레이저 영상 센서 시스템은 1) 한 관측점을 회전을 통해 스캔하는 2D 스캔 방식에서 벗어나, 2) 일차원 배열 형태로 구현된 관측점을 센서가 회전하면서 얻어지는 3D 스캔 방식과 3) 이차원 어레이 형태의 검출기로 삼차원 영상을 검출하는 방식으로 삼차원 영상을 확보하는 노력으로 구분되어 진행되어 왔다. 이번 시연에 성공한 제안된 방법은, 기존의구도와는 다른 독자적인 방식으로, 대면적 검출기를 기반으로 센서부가 회전하지 않으면서, 하나로 통합된 검출기 출력을 이용할 수 있는 구도인 스터드(STUD: STatic and Unitary Detector)기반의 삼차원 레이저 레이다 시스템이다. 최근 구현 결과는 수평해상도 320, 수직해상도 240인 QVGA 영상 수준으로, 이는 지금까지 세계 최고해상도인 ASC사의 128x128 해상도를 뛰어 넘는 우수한 결과이다. 제안된독자적인 구도의 삼차원 레이저 영상 시스템은 다양한 관련 기술들과의 접목하여 향후 군수용 뿐만아니라 민수용 시장의 기술발전에 큰 영향을 미칠 것으로 예상되고 있다.

  • PDF

폐 랑게르한스 조직구 증식증의 비전형적 영상 소견: 2예에 대한 보고 (Early and Atypical Radiologic Presentations of Pulmonary Langerhans Cell Histiocytosis: A Report of Two Cases)

  • 유경화;남보다;황정화;김동원;박영우;오홍철;박수빈
    • 대한영상의학회지
    • /
    • 제82권3호
    • /
    • pp.756-763
    • /
    • 2021
  • 폐의 랑게르한스 조직구 증식증은 드문 질환으로 주로 흡연력이 있는 젊은 성인 남성에서 발생한다. 이번 증례 보고는 폐 랑게르한스 조직구 증식증 2예에 대한 보고이며 이들은 모두 초기 검사에서 비전형적인 영상 소견을 보였다. 흉부 전산화단층촬영에서 폐 랑게르한스 조직구 증식증은 질환의 침범 정도와 시기에 따라 다양한 소견을 보일 수 있으며, 때로 악성 질환을 포함한 다른 중요 폐 질환들과 감별이 필요하고 영상 진단에 어려움을 줄 수 있다. 따라서, 이번 증례 보고를 통하여 폐 랑게르한스 조직구 증식증의 초기 및 비전형적인 영상 소견을 숙지함으로써 정확한 영상 진단에 도움을 주고 불필요하고 침습적인 검사를 줄일 수 있을 것으로 생각된다.