• Title/Summary/Keyword: 다중 2D 영상

Search Result 161, Processing Time 0.028 seconds

단안 이미지로부터 3D 사람 자세 추정을 위한 순서 깊이 기반 연역적 약지도 학습 기법 (Ordinal Depth Based Deductive Weakly Supervised Learning for Monocular 3D Human Pose Estimation)

  • 이영찬;이규빈;유원상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.826-829
    • /
    • 2024
  • 3D 사람 자세 추정 기술은 다양한 응용 분야에서의 높은 활용성으로 인해 대량의 학습 데이터가 수집되어 딥러닝 모델 연구가 진행되어 온 반면, 동물 자세 추정의 경우 3D 동물 데이터의 부족으로 인해 관련 연구는 극히 미진하다. 본 연구는 동물 자세 추정을 위한 예비연구로서, 3D 학습 데이터가 없는 상황에서 단일 이미지로부터 3D 사람 자세를 추정하는 딥러닝 기법을 제안한다. 이를 위하여 사전 훈련된 다중 시점 학습모델을 사용하여 2D 자세 데이터로부터 가상의 다중 시점 데이터를 생성하여 훈련하는 연역적 학습 기반 교사-학생 모델을 구성하였다. 또한, 키포인트 깊이 정보 대신 2D 이미지로부터 레이블링 된 순서 깊이 정보에 기반한 손실함수를 적용하였다. 제안된 모델이 동물데이터에서 적용 가능한지 평가하기 위해 실험은 사람 데이터를 사용하여 이루어졌다. 실험 결과는 제안된 방법이 기존 단안 이미지 기반 모델보다 3D 자세 추정의 성능을 개선함을 보여준다.

2차원 참조 기법을 이용한 3D 컬러 집적 영상의 압축 (Compression of 3D color integral images using 2D referencing technique)

  • 김종호;유훈
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2693-2700
    • /
    • 2009
  • 본 논문에서는 렌즈 배열에 의한 대용량의 3차원 집적 영상을 활용하기 위한 효율적인 압축 방법을 제안한다. 기존의 정지영상 압축 기법은 각 요소 영상간의 상관도를 적절하게 제거하지 못하여 압축 효율 및 화질 측면에서 낮은 성능을 보인다. 또한, 각 요소 영상을 1차원 스캔방법에 의해 분리하여 동영상 압축기법을 이용할 경우 요소 영상간 상관도를 효과적으로 제거하는 데 한계가 있다. 제안하는 방식에서는 2차원 참조기법에 의해 각 요소 영상을 분리하고, 이를 H.264/AVC의 다중 프레임 참조 기법을 이용하여 효과적으로 압축한다. 제안하는 2차원 참조 기법은 요소 영상의 수직, 수평 및 대각 방향의 상관도에 따라 최적의 참조 영상을 선택할 수 있어 가장 좋은 압축성능을 나타낸다. 실험 결과는 정지 영상 압축 방법에 비해 요소 영상을 분리하는 방법이 압축 성능을 향상시킴을 보이고, 제안하는 2차원 참조 기법이 1차원 스캔 방식에 비해 주관적 화질 및 객관적 성능에 있어 뛰어남을 보인다.

비디오로부터의 움직이는 3D 인체 형상 및 자세 복원 (Moving Human Shape and Pose Reconstruction from Video)

  • 한지수;조명래;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.66-68
    • /
    • 2018
  • 본 논문에서는 비디오로부터 추출된 프레임에서 3D 인체 모델의 복원하고 이를 부드럽게 재생될 수 있도록 보정하는 기법을 제안한다. 매개변수 기반의 모델을 사용하여 자세 및 체형을 복원하도록 접근하고 있다. 매개변수 기반의 인체 모델은 다양한 인체 데이터의 학습을 통해 만들어지며 입력 영상으로부터 최적의 자세와 체형 매개변수 값을 찾아 복원하게 된다. 자세 복원은 CNN 을 사용하여 영상으로부터 인체의 관절 위치를 추정하고 3D 모델로부터 2D 로 투영을 통해 관절 간의 거리가 최소화되는 매개변수 값을 찾아 복원한다. 형상 복원은 2D 영상으로부터 취득된 사람의 윤곽 데이터와 3D 모델의 윤곽 데이터 간의 매칭을 통해 복원된다. 이러한 단일 입력 영상에서 비디오와 같은 다중 입력 영상으로 확장하여 칼만 필터를 적용하여 오류 프레임을 검출하고 이전, 이후 프레임의 매개변수와의 보간을 통해 보다 자연스럽고 정확한 모델을 생성한다.

  • PDF

퍼지 클러스터링을 이용한 다중 스펙트럼 자기공명영상의 분할 (Segmentation of Multispectral MRI Using Fuzzy Clustering)

  • 윤옥경;김현순;곽동민;김범수;김동휘;변우목;박길흠
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권4호
    • /
    • pp.333-338
    • /
    • 2000
  • 본 논문에서는 T1 강조영상, T2 강조 영상 그리고 PD의 영상의 특징을 상호 보완적으로 이용한 자동적인 영상 분할법을 제안한다. 제안한 분할 알고리듬은 3단계로 이루어지는데, 첫 단계에서는 PD 영상으로부터 대뇌 마스크를 획득한 후, T1과 T2, PD의 입력 영상에 대뇌 마스크를 씌워 각각의 대뇌 영상을 추출하고, 둘째 단계에서는 대뇌 내부 조직에 해당하는 두드러진 클러스터(outstanding cluster)를 3차원 클러스터들 중에서 선택한다. 3차원 클러스터는 최적스케일 영상(optimal scale image)으로 이루어지는 3차원 공간상에서 화소가 밀집된 봉우리들을 교집합해서 생성되는 클러스터로 결정한다. 최적스케일 영상은 각 2타원 히스토그램에 스케일 스페이스 필터링을 적용시키고 그래프(graph) 구조를 검색하여 2차원 히스토그램의 모양을 가장 잘 나타내는 봉우리(peak) 영상을 최적 스케일 영상으로 선택한다. 마지막 단계에서는 앞에서 찾은 두드러진 클러스터의 중심값을 FCM 알고리듬의 초기중심 값으로 두고, FCM 알고리듬을 이용하여 대뇌 영상을 분할한다. 제안한 분할 알고리듬은 정확한 클러스터의 중심값을 계산함으로 초기 값을 영향을 많이 받는 FCM 알고리듬의 단점을 보완하였고 다중 스펙트럼 영상의 특성을 조합하여 분할에 이용함으로 단일 스펙트럼 영상만을 이용하는 방법보다 향상된 결과를 얻을 수 있었다.

  • PDF

다중영상 강화에 의한 고해상도 수치영상획득 (The Digital Image Acquisition of High-resolution by Enhancing the Multiple Images)

  • 강준묵;오원진;엄대용
    • 한국측량학회지
    • /
    • 제17권2호
    • /
    • pp.167-176
    • /
    • 1999
  • 각종 영상매체와 수치영상처리 기술이 발전함에 따라 수치영상을 이용한 대상물의 정량적 또는 정성적 분석에 관한 연구가 활발히 진행되고 있다. 그러나 높은 정확도의 영상해석에 있어 고해상도의 영상획득 시스템에 대한 의존도가 매우 높은 실정이며 이들은 고가의 장비라는 문제점을 안고 있다. 본 연구에서는 저가의 영상획득 시스템에 의해 획득한 다중영상을 강화ㆍ분석하여 최적의 강화조건을 도출하고 이를 적용하여 3차원 정확도 분석을 실시하였다. 저해상도의 원시영상과 최적의 조건에 의해 강화한 영상을 이용하여 평균 3차원 위치오차를 분석한 결과, 강화영상은 원시영상에 비해 10%정도 향상된 정확도를 보였다.

  • PDF

실시간 다중 렌더링을 위한 이중 서버 구조 (A 2-Tier Server Architecture for Real-time Multiple Rendering)

  • 임충규
    • 한국게임학회 논문지
    • /
    • 제12권4호
    • /
    • pp.13-22
    • /
    • 2012
  • 초고속 인터넷의 광범위한 보급으로 가능해진 클라우드 컴퓨팅 기반 게임 서비스는 클라우드 노드에서 게임을 실행하고 게임의 영상을 원격 사용자의 단말기에 영상 스트림으로 전송함으로써 게임 서비스가 이루어진다. 사용자 입력은 게임에 즉각적으로 전송되고 반영된다. 이러한 서비스가 가능한 이유는 사용자 입력이 반영되고 게임 영상이 사용자에게 전달되는데 걸리는 시간이 최소화되어. 컴퓨터 게임에서 요구되는 반응성을 일반적으로 만족시킬 수 있었기 때문이다. 하지만 이러한 서비스는 고품질 3D 게임을 서비스하는 경우, 서버 구축에 많은 비용이 소요될 수 있다. 클라우드 노드가 탑재하고 있는 일반적인 그래픽 시스템은 동시에 하나의 3D 어플리케이션을 지원하도록 설계되어 있기 때문이다. 하나의 클라우드 노드에서 다수의 3D 게임을 실행하기 위해서는 그 실행에 필요한 실시간 다중 렌더링 기술이 필수적이다. 본 논문은 다수의 컴퓨터 게임을 하나의 클라우드 노드에서 실행시키고 다른 노드에서 각 게임 영상을 획득할 수 있는 이중 서버 구조를 제안한다. 몇가지 실험을 실시하여 기술적 가능성을 알아본다.

위성영상의 토지정보 분석정확도 향상을 위한 응용체계의 개발 - 다중시기 영상과 주성분분석 및 정준상관분류 알고리즘을 이용하여 - (Development of a Compound Classification Process for Improving the Correctness of Land Information Analysis in Satellite Imagery - Using Principal Component Analysis, Canonical Correlation Classification Algorithm and Multitemporal Imagery -)

  • 박민호
    • 대한토목학회논문집
    • /
    • 제28권4D호
    • /
    • pp.569-577
    • /
    • 2008
  • 본 연구의 목적은 위성영상으로부터 보다 정확한 토지정보를 취득하기 위해 다중시기데이터의 혼합과 특정 영상강조기법 및 영상분류알고리즘을 병합하여 적용하는 응용분류체계의 개발이다. 즉, 본 연구에서는 혼합된 다중시기데이터를 주성분분석한 후 정준상관분류기법을 적용하는 분류과정을 제안한다. 이 분류과정의 결과를 단일영상별 정준상관분류결과, 다중시기혼합영상의 정준상관분류결과, 시기별 주성분분석 후 정준상관분류결과와 비교한다. 사용된 위성영상은 1994년 7월 26일과 1996년 9월 1일에 취득된 Landsat 5 TM 영상이다. 정확도평가를 위한 지상실제데이터는 지형도 및 항공사진으로부터 취득되었으며, 연구대상영역 전체가 정확도평가 대상으로 사용되었다. 제안된 응용분류체계는 단일영상만을 사용하여 정준상관분류를 수행한 경우보다 분류정확도면에서 약 8.2% 상승되는 우수한 효과를 보여주었다. 특히, 복잡한 토지특성이 혼합되어 있는 도시역을 정확히 분류하는데 유효하였다. 결론적으로 Landsat TM 영상을 사용한 토지피복정보 추출시 분류정확도를 높이기 위해서, 다중시기영상을 사전에 주성분분석 후 정준상관분류기법을 적용하면 매우 효과적임을 확인하였다.

안테나배열을 이용한 콘크리트부재 내부의 비파괴시험과 영상화방법 개발 (Subsurface Imaging Technology For Damage Detection of Concrete Structures Using Microwave Antenna Array)

  • 김유진;최고일;장일영
    • 한국방재학회 논문집
    • /
    • 제5권2호
    • /
    • pp.1-8
    • /
    • 2005
  • 콘크리트 구조물 내부 결함이나 철근 위치를 탐지하기 위하여 초단파를 이용하는 비파괴 시험방법이 구조물 안전진단 분야에서도 최근 관심을 불러일으키고 있다. 본 연구의 목적은 기 개발된 2차원 영상화 방법을 확장하여 3차원 영상처리방법을 개발하는 것이다. 그 방법으로 콘크리트 구조물 내의 결함을 탐지하기 위한 안테나를 구성, 수치적 초점조절시스템을 이용하여 송신부와 수신부의 초점을 동시 조절하여 구조물 내부의 모든 부분을 검색하였다. 또한 다중주파수 방식을 이용, 데이터의 오류를 제거하고 해상도를 향상시켜 구조물 내부의 결함이나 내부모습을 탐지할 수 있는 3차원 영상장치를 개발하고자 하였다. 실험 결과, 데이터 오류를 줄이는 다중주파수방식에 의하여 재현된 영상의 정확성을 검증하고, 주파수 조절방법에 의하여 $4{\times}4$ 안테나배열을 설계함으로써 5.2 GHz에서 주파수대역의 우수한 투과성능을 입증하였다. 즉 본 연구에서 개발된 슬롯안테나는 파동의 방사기능과 주파수대역의 넓이 등에서 구조부재의 결함탐지에 이용될 수 있음을 검증하였다.

제안된 GBD 알고리즘을 이용한 이차원 영상에서의 다중해상도 거리 측정 (A Multi-Resolution Distance Measure in Two Dimensional Images Using Proposed Grey Block Distance Algorithms)

  • 홍준식;정순원
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.392-397
    • /
    • 2006
  • 본 논문에서는 기존의 그레이 블록 거리(grey block distance; GBD, 이하 GBD)알고리즘과 비교하여 다중해상도에서 이차원 영상간의 상대적 식별을 더 용이하게 하기 위한 새로운 GBD 알고리즘 방법을 제안한다. 이 제시된 방법은 영상 전체 및 부분에 대한 정보를 측정할 수 있으며, 이차원 영상의 응용에 있어서 기존의 GBD 알고리즘과 비교해서 영상이 급격히 변화하는 부분의 정보를 잃지 않게 개선할 수 있었다. 또한, 모의실험 결과로부터 기존의 GBD 알고리즘에 비하여 상대적 식별이 더 용이함을 확인할 수 있었다.

  • PDF

360도 영상에서 다중 객체 추적 결과에 대한 뷰포트 추출 가속화 (Acceleration of Viewport Extraction for Multi-Object Tracking Results in 360-degree Video)

  • 박희수;백석호;이석원;이명진
    • 한국항행학회논문지
    • /
    • 제27권3호
    • /
    • pp.306-313
    • /
    • 2023
  • 실사 및 그래픽 기반 가상현실 콘텐츠는 360도 영상을 기반으로 하며, 시청자의 의도나 자동 추천 기능을 통한 뷰포트 추출이 필수적이다. 본 논문은 360도 영상에서 다중 객체 추적 기반의 뷰포트 추출 시스템을 설계하고, 다중 뷰포트 추출에 필요한 병렬화된 연산 구조를 제안한다. 360도 영상에서 뷰포트 추출 과정을 ERP 좌표의 3D 구 표면 좌표 변환과 3D 구 표면 좌표의 뷰포트 내 2D 좌표 변환 과정을 순서대로 픽셀 단위의 스레드로 구성하여 연산을 병렬화하였다. 제안 구조는 항공 360도 영상 시퀀스들에 대하여 최대 30개의 뷰포트 추출 과정에 대한 연산 시간이 평가되었으며, 뷰포트 수에 정비례하는 CPU 기반 연산 시간에 비해 최대 5240배 가속화됨을 확인하였다. ERP 프레임 I/O 시간을 줄일 수 있는 고속의 I/O나 메모리 버퍼를 사용 시 뷰포트 추출 시간을 7.82배 추가 가속화가 가능하다. 제안하는 뷰포트 추출 병렬화 구조는 360도 비디오나 가상현실 콘텐츠들에 대한 동시 다중 접속 서비스나 사용자별 영상 요약 서비스 등에 활용될 수 있다.