• 제목/요약/키워드: 영상 이미지

검색결과 3,018건 처리시간 0.041초

YOLACT를 이용한 스티칭 속도 개선 방안 (Stitching speed improvement method using YOLACT)

  • 고성영;이성배;박성환;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.10-13
    • /
    • 2020
  • 최근 초고화질 영상, 가상현실 등 프리미엄 콘텐츠에 대한 요구가 커지면서 360° VR과 8K TV 등의 시장이 확대되고 있다. 360° VR 영상을 만드는 데에 스티칭 기술이 사용되고 있고, 8K 영상을 촬영할 수 있는 장비는 매우 제한적이기 때문에 스티칭 기술을 통해 콘텐츠를 확보하려는 노력이 이어지고 있다. 스티칭 기술은 여러 영상을 합성하여 기존 카메라의 좁은 시야각 문제를 해결하고 보다 넓은 시야각의 영상을 만드는 기술이다. 최근에는 해당 분야에 관한 연구가 진행됨에 따라 이미지를 넘어 동영상 스티칭에 대한 연구가 주로 진행되고 있다, 기존 동영상 스티칭 방식은 이미지 스티칭 방식을 프레임마다 반복하기 때문에 시간이 오래 걸린다는 단점이 있다. 컴퓨터 비전 분야에서는 딥러닝을 활용하여 객체가 존재할 것으로 예측되는 부분에 사각형 모양의 경계 상자(Bounding box)를 생성하는 객체 탐지(Object detection) 분야에 관한 많은 연구가 이루어져 왔고 이를 기반으로 객체의 경계선을 검출하여 해당 영역만을 구분하는 객체 분할(Instance segmentation)에 대한 연구 또한 진행 중이다. 본 논문에서는 앞서 말한 스티칭 속도 문제를 해결하기 위하여 빠른 속도로 객체 분할이 가능한 YOLACT를 이용하여 스티칭 속도를 개선하는 방안을 제안한다.

  • PDF

충돌음 자동생성을 위한 영상/음향 동기화 기술 개발 (Image/Sound Synchronization for Simulating Sound from Colliding Objects)

  • 김재우;김용완;김현빈
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1998년도 추계학술발표 논문집
    • /
    • pp.168-171
    • /
    • 1998
  • 멀티미디어 기술의 발달로 그래픽을 포함한 영상데이터의 사용이 급증하고 있다. 멀티미디어 및 가상현실 응용 시스템은 그래픽을 포함한 영상과 음향이 동기화 되어 제공될 경우 사용자의 현장감과 몰입감을 증대시킬 수 있다. 본 논문에서는 가정용 비디오를 통하여 입력되는 일련의 영상데이타로부터 관심있는 물체의 운동을 추적함으로 물체가 발생시키는 충돌음을 공간적으로 동기화 하여 생성하는 이미지 기반 영상/음향 동기화 기술의 개발에 관하여 논의한다. 대용량의 영상데이터에 대하여 실시간으로 음향을 동기화시키는 것은 현재 기술로 불가능하며, 본 논문에서는 영상과 음향의 공간적 동기화 기술에 대하여 기술한다.

  • PDF

디지털 정보환경에 있어 뇌내 이미지와 영상표현의 특성에 관한 연구 (A study on the characteristics of brain image and yeongsang expression in the digital information environment)

  • 이규옥
    • 디자인학연구
    • /
    • 제16권2호
    • /
    • pp.323-334
    • /
    • 2003
  • 본 연구는 디지털 정보환경에 있어 시각화되기 전 단계에 생성되는 주관적인 이미지와 그것을 구체화시키는 객관적인 동적 영상표현에 중점을 두었다. 먼저 시각세계의 확장을 눈의 시각, 뇌의 시각, 카메라의 시각으로 구분하여 서술하였다. 또한 이미지와 영상의 개념을 재정의 하였다. 이미지는 지각상과 심상상의 뜻이 강하게 내포하고 있는 것으로 영상은 끊임없이 변화하는 빛의 정보가 물리적인 프로세스에 의해 생성되고 재현되는 시지 각상이라고 정의하였다. 또한 21세기 영상표현의 특성은 디지털 기술에 의해 실존하는 구체적인 허상에서 정보화된 허상으로, 종합화, 단순화, 집중화되고 있다는 것을 서술하였다. 이것은 영상커뮤니케이션에 있어 근대의 아날로그 환경과 현대의 디지털환경에 의한 표현양식이 각각 본질적으로 차이가 있다는 것을 의미한다. 이와 같이 테크놀러지의 발달과 함께 영상의 정보화는 인간의 감각기능을 확장시켜 가상적공간에서 대리체험을 통한 조형적 리얼리티를 높이고 있다. 한편으로는 인간이 갖고 있는 창조적 능력을 테크놀러지에 의존하는 경향이 동시에 일어나고 있다. 21세기 영상표현은 $\ulcorner$디지털정보환경$\lrcorner$ 에 의한 사이버 공간에 의한 인간 신체 외적 표현에서 내부적 표현으로 영상세계를 우주화, 내면화하는 양면성을 추구하게 될 것이다.

  • PDF

룩업 테이블을 이용한 물체의 3-D 형상복원 (Real 3-D Shape Restoration using Lookup Table)

  • 김국세;이정기;송기범;김충원;이준
    • 한국정보통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.1096-1101
    • /
    • 2004
  • 산업현장에서의 3-D 이미지의 활용은 영화, 애니메이션, 산업 디자인, 의학, 그리고 교육과 공학분야에서 많은 영향을 미치고 있다. 90년대부터 두 개의 영상을 이용하여 영상으로부터 깊이 정보를 추출하기 위한 활발한 연구가 진행되기 시작하면서 3-D 정보 획득에 관한 연구가 진행되었다. 3-D 정보를 획득하는 방법으로, Structured Light 기법은 제어할 수 있는 점, 선, 격자, 원모양의 광원을 대상물체에 투사하며, 대상물체에 형성된 실루엣을 시각센서로 3-D 정보를 추출하는 방식이다. 또 다른 Time of flight 방식은 초음파를 이용한 방법과 레이저를 이용한 방법이 있으며, 그 외에도 쌍안비젼, Shape from Shading, Surface from Texture 그리고 Focusing 등의 원리를 이용한 기법이 있다. 이런 방범들은 여러 어려운 점들이 있어 이를 감안하여 손쉽게 3-D 영상 이미지를 얻는 방법으로 3-D 정보를 얻기 위해 본 논문에서는 삼각측량 시스템을 만들어 룩업 테이블을 만든다. 3-D 정보를 가지고 있는 룩업 테이블을 통해 시스템 위에 있는 물체의 이미지 좌표와 대칭을 통해 3-D 정보를 획득하여 영상 이미지를 복원하는 방법을 고찰 연구하였다.

SURF 알고리즘 기반 특징점 추출기의 FPGA 설계 (FPGA Design of a SURF-based Feature Extractor)

  • 류재경;이수현;정용진
    • 한국멀티미디어학회논문지
    • /
    • 제14권3호
    • /
    • pp.368-377
    • /
    • 2011
  • 본 논문에서는 특징점 정합을 통한 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 사용될 수 있는 알고리즘 중 대표적인 SURF 알고리즘 기반 특징점 추출기의 하드웨어 구조 설계 및 FPGA 검증 결과에 대해 기술한다. SURF 알고리즘은 크기와 회전변화에 강한 특징점과 서술자를 생성함으로써 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 활용될 수 있다. 하지만 ARMl1(667Mhz) 프로세서와 128Mbytes의 DDR 메모리를 사용하는 임베디드 환경에서 실험결과 VGA($640{\times}480$) 해상도 C영상의 특정점 추출 처리 시약 7,200msec의 시간이 걸려 실시간 동작이 불가능한 것으로 파악되었다. 본 논문에서는 SURF 알고리즘의 핵심 요소인 적분 이미지 메모리 접근 패턴을 분석하여 메모리 접근 횟수와 메모리 사용량을 줄이는 방법을 이용해 실시간 동작이 가능하도록 하드웨어로 설계하였다. 설계된 하드웨어를 Xilinx(社)의 Vertex-5 FPGA 를 이용하여 검증한 결과 l00Mhz 클록에서 VGA 영상의 특징점 추출시 약 60frame/sec로 동작하여 실시간 응용으로 충분함을 알 수 있다.

소비자의 페이스북 바이럴 광고 구전의도에 영향을 미치는 요인에 관한 연구 (Factors Influencing Consumer's Sharing Intent of Facebook Viral Advertising)

  • 허서정;조창환
    • 광고학연구
    • /
    • 제28권3호
    • /
    • pp.53-81
    • /
    • 2017
  • 온라인 동영상 광고 시장의 성장으로, 바이럴 광고가 주목받고 있다. 소비자, 기업, 콘텐츠, 네트워크는 바이럴 광고를 구성하는 네 가지 차원이다. 본 연구는 각 차원에 속한 세부요인들이 바이럴 광고 구전의도에 미치는 영향을 검증하였다. 수집한 설문자료에 대한 다중회귀분석을 실시한 결과, 바이럴 광고 구전의도에 유의미한 영향을 미치는 요인은 콘텐츠 차원의 설득의도, 기업 차원의 기업-광고이미지 관련성, 소비자 차원의 인지된 자기표현, 그리고 네트워크차원의 교량적 사회 자본으로 나타났다. 콘텐츠 차원의 사회적가치와 네트워크 차원의 결속적사회자본은 유의미한 영향력을 보이지 않았다. 결과적으로 바이럴 광고가 설득의도를 적게 나타낼수록, 광고 이미지와 기업의 이미지 관련성이 높을수록, 소비자가 광고를 공유함으로써 자신의이미지를 원하는대로 표현할 수 있다고 인지할수록, 그리고 소비자가 교량적 사회자본을 많이가지고 있을수록 바이럴 광고에 대한 공유의도를 높게 보이는 것으로 나타났다. 본 연구는 바이럴 광고 구전의도를 주제로 진행한 첫 번째 실증적인 연구이며, 바이럴 광고의 정의와 특징을 체계적으로 정리하여 다양한 차원의 요인들이 바이럴 광고 구전의도에 미치는 영향력을 통합적으로 검증하였다는 점에서 의의가 있다. 또한 기존의 온라인 구전 관련 연구에서는 드물게 할당표집을 사용하였고, 설문 영상으로 현재 바이럴 광고 소재로 가장 많이 사용되고 있는 감동 소재와유머 소재를 사용한 각각의 영상 두 개를 선정하여 결과의 일반화 가능성을 높였다.

합성곱 신경망 및 영상처리 기법을 활용한 피부 모공 등급 예측 시스템 (A Prediction System of Skin Pore Labeling Using CNN and Image Processing)

  • 이태희;황우성;최명렬
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.647-652
    • /
    • 2022
  • 본 논문은 사용자들에 의해 촬영된 피부이미지를 가공하여 데이터 세트를 구축하고, 제안한 영상처리 기법에 의해 모공 특징이미지를 생성하여, CNN(Convolution Neural Network) 모델 기반의 모공 상태 등급 예측 시스템을 구현한다. 본 논문에서 활용하는 피부이미지 데이터 세트는, 피부미용 전문가의 육안 분류 기준에 근거하여, 모공 특징에 대한 등급을 라벨링 하였다. 제안한 영상처리 기법을 적용하여 피부이미지로 부터 모공 특징 이미지를 생성하고, 모공 특징 등급을 예측하는 CNN 모델의 학습을 진행하였다. 제안한 CNN 모델에 의한 모공 특징은 전문가의 육안 분류 결과와 유사한 예측 결과를 얻었으며, 비교 모델(Resnet-50)에 의한 결과보다 적은 학습시간과 높은 예측결과를 얻었다. 본 논문의 본론에서는 제안한 영상처리 기법과 CNN 적용의 결과에 대해 서술하며, 결론에서는 제안한 방법에 대한 결과와 향후 연구방안에 대해 서술한다.