• 제목/요약/키워드: 영상기반

검색결과 11,645건 처리시간 0.037초

Hadoop 기반 클라우드 컴퓨팅을 이용한 영상 처리 프레임워크 구현 (Implementaion of Video Processing Framework using Hadoop-based cloud computing)

  • 류충모;이대철;장민욱;김철기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.139-142
    • /
    • 2013
  • 최근 대용량 영상데이터로부터 정보 수집, 영상 처리를 위한 클라우드 관련 연구들이 활발하다. 그러나 공개 소프트웨어를 이용한 클라우드 연구의 대부분은 라이브러리 수준이 아닌 단순히 프로그램 수준의 조합으로 작동한다. 이런 이유로 단순 조합에 따른 비효율성에 의한 성능문제는 크게 다루어지지 않는다. 본 논문에서는 이 비효율성을 해결하는데 중점을 두고 FFmpeg과 Hadoop을 라이브러리 수준으로 결합하여 기존보다 더 나은 성능의 영상클라우드 환경을 구축하였다. C기반의 영상처리 라이브러리인 FFmpeg와 JAVA기반의 클라우드 환경 Hadoop의 결합을 위해 JNI(Java Native Interface)를 이용하였다. 상세구현으로는 HDFS(Hadoop Distributed File System)을 확장하여 Hadoop MapReduce가 직접 FFmpeg을 통한 영상파일 접근이 가능하게 하였다. 이로써 FFmpeg과 Hadoop간 상이한 파일 접근 방식에서 발생하는 불필요한 작업에 의한 시스템의 성능저하를 막았다. 또한 응용의 확장성을 위해 영상작업시 작업영상을 영상처리의 최소단위인 GOP(Group of Pictures)단위로 잘라 클라우드의 노드들에게 분산시켰다. 결과적으로 기존에 존재하는 Hadoop과 FFmpeg을 프로그램적으로 결합한 영상처리 클라우드보다 총 처리시간을 앞당겼고, GOP 단위의 영상 처리는 영상기반 작업에 안정성과 응용의 확장성을 보장해주었다.

양방향 다이나믹 프로그래밍 기반 변이 추정을 이용한 3차원 영상의 중간 시점 영상 합성 (Bidirectional Dynamic Programming Based Disparity Estimation and its application to the Intermediate View Reconstruction of 3D Images)

  • 배진환;김성식;손정영;손광훈
    • 한국통신학회논문지
    • /
    • 제26권7B호
    • /
    • pp.975-982
    • /
    • 2001
  • 본 논문에서는 3차원 영상 시스템에서 기준이 되는 좌우 영상이 있을 때 임의의 중간 시점 영상 합성 기법을 제안하였다. 제안한 기법은 양방향 다이나믹 프로그래밍 기반 변이 추정 과정과, 이를 기반으로 양방향 변이 정합과정에 의해 가려진 영역을 추출하는 과정, 그리고 완성된 변이 맵을 바탕으로 중간 시점 영상을 생성하는 과정으로 구성된다. 이중 변이 추정 과정에 제안된 양방향 다이나믹 프로그래밍 기법은, 일반적인 다이나믹 프로그래밍이 가진 장점을 살리면서, 영상 특성을 고려한 코스트 값의 사용 및 양방향 코스트 행렬 생성 방법으로 발생될 수 있는 오류를 최소화함으로써 가려진 영역을 보다 정확하게 구분해 낼 수 있었다. 이후 이러한 과정에서 생성된 변이 맵에 대해 적절한 후처리 과정으로 가려진 영역을 판별하고, 이를 기반으로 한 중간 영상 생성에서 모호한 영역을 고려하여 보다 정확하고 안정적인 결과를 얻을 수 있었다.

  • PDF

표면 정보 기반 MRI-PET 영상 정합을 위한 볼륨 영상 처리 (Volume Image Processing for Surface Based MRI-PET Registration)

  • 정명진;최유주;김민정;김명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.475-478
    • /
    • 2002
  • 영상 정합이란 영상들을 배열하여 대응되는 특성을 연관시키는 과정으로, 서로 다른 정보를 결합하여 상호 보완적이고 복합적인 새로운 정보를 생성한다는 점에서 유용하다. 본 논문에서는 MRI와 PET 뇌 영상을 표면 정보에 기반하여 정합하기 위한 영상 처리 방법에 대하여 연구하였다. 특히 정합을 위한 특징점 집합을 샘플링하는데 있어서 표면 곡률 정보를 사용한 샘플링 기법을 적용하고, 실 관심 객체의 볼륨 크기에 기반한 바운딩 박스를 생성하여 기하 변환을 수행함으로써 표면정보기반 다중모달리티 영상 정합을 위한 보다 효과적인 영상 처리 결과를 얻도록 하였다.

  • PDF

VL-KE-T5: 한국어와 영어로 구성된 영상-언어 병렬 데이터를 이용한 대조학습 기반 사전학습모델 구축 (VL-KE-T5: A contrastive learning-based pre-trained model using image-language parallel data composed of Korean and English)

  • 김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.337-342
    • /
    • 2022
  • 본 논문은 한국어-영어 기반 영상-언어 모델인 VL-KE-T5를 소개한다. VL-KE-T5는 영상-텍스트 쌍으로 구성된 한국어와 영어 데이터 약 2천 3백만개를 이용하여 영상-언어 모델의 임베딩 벡터들을 정렬시킨 사전학습모델이며, 미세조정을 통하여 여러 영상-언어 작업에 활용할 할 수 있다. VL-KE-T5는 텍스트 기반 영상 검색 작업에서 높은 성능을 보였으나, 세세한 속성을 가진 여러 객체들의 나열이나 객체 간 관계를 포함한 텍스트 기반 영상 검색에서는 비교적 낮은 성능을 보였다.

  • PDF

MegaDepth Network를 활용한 깊이 기반 영상 스티칭 (Depth-based Image Stitching Using MegaDepth Network)

  • 김가현;장혜민;최유진;이성배;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.275-278
    • /
    • 2021
  • 영상 스티칭은 다수의 영상을 넓은 시야각을 갖는 하나의 영상으로 합성하여 사용자들에게 몰입감과 현장감을 제공하는 기술이다. 그러나 영상에 시차(Parallax)가 존재하는 경우 스티칭된 영상에서 왜곡이 발생할 수 있는데 이는 사용자의 몰입을 방해할 수 있다. 따라서 스티칭 영상의 다양한 활용을 위해서는 시차로 인한 왜곡을 최소화하여 자연스러운 스티칭 영상을 만드는 것이 중요하다. 기존 호모그래피 추정 방법으로 발생할 수 있는 고스트 현상을 최소화하기 위해서 seam 기반 스티칭 방법이 사용되었지만, 단순히 작은 특징값을 따라 생성된 seam은 사물 영역 정보가 반영되지 않아 seam이 특징이 있는 부분을 지나가면서 시차 왜곡이 발생할 수 있다. 이에 본 논문에서는 딥러닝 기반의 MegaDepth를 활용한 depth 예측 정보를 에너지 함수 기반의 seam 생성 행렬의 가중치로 사용하여 seam이 사물을 피해 생성되면서 시차가 작은 영역으로 유도되도록 하는 seam optimization 기법을 제안한다.

  • PDF

클라우드 기반 미디어 서비스 설계 및 구현 (A Design and Development on Cloud based Media Service)

  • 김수웅
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.850-853
    • /
    • 2014
  • 다양한 단말의 발달과 네트워크 대역폭 확대, 고화질의 컨텐츠 등장 등의 기술 발전으로 인해 클라우드 기반에서 사용자 및 사업자 영상을 서비스하는 시스템을 구축하는 것이 중요해 졌다. 본 연구에서는 고화질의 영상을 기존의 TV 에서 제공하는 것뿐만 아니라 모바일 및 PC 에서도 동시에 이용할 수 있는 클라우드 기반의 미디어 서비스 제공 시스템을 설계, 구현한다. 클라우드 기반의 미디어 서비스를 위하여 다양한 환경에서 사용자 및 사업자의 영상을 이용할 수 있도록 미디어 처리를 위한 기능을 제공하는 클라우드 기반 미디어 시스템을 개발한다. 또한 다양한 포맷의 영상을 처리하고, 이 영상을 등록, 관리, 배포, 제공 할 수 있는 기능도 구현한다. 다양한 미디어 및 단말을 동시에 제공하기 위해 시스템은 현재의 클라우드 환경을 고려하여 개발되고 있으며, 추후 다양한 클라우드 환경에서 동시에 서비스를 확장할 수 있도록 인터-클라우드 방안을 지원한다. 또한 이 클라우드 기반의 미디어 서비스를 기반으로 새로운 사업자 서비스를 추가 구현하고, 이를 상용으로 서비스하는 PaaS 형식의 서비스 플랫폼 기능도 제공한다.

영상 기반 모델링 및 렌더링 (Image-based Modeling and Rendering)

  • 한정현
    • 한국CDE학회지
    • /
    • 제7권3호
    • /
    • pp.41-46
    • /
    • 2001
  • 영상기반 모델링 및 렌더링은 1990년대 초반 이후 집중적으로 연구되기 시작한 분야로, 영상 자체를 입력으로 하여 출력 영상을 생성하여 자연스럽게 photorealism을 달성할 수 있고, scene의 복잡도에 무관한 렌더링을 가능케 한다. 본 논문은 파노라마 렌더링, light field 렌더링, LDI 렌더링을 중심으로 지난 10년 간에 걸친 영상깁ㄴ 모델링 및 렌더링의 연구 성과를 개괄한다.

  • PDF

고해상도 위성영상의 객체기반 분석을 위한 영상 분할 기법 개발 및 평가 (Development and Evaluation of Image Segmentation Technique for Object-based Analysis of High Resolution Satellite Image)

  • 변영기;김용일
    • 한국측량학회지
    • /
    • 제28권6호
    • /
    • pp.627-636
    • /
    • 2010
  • 영상분할은 관심대상이 되는 물체의 영역을 추출하기 위한 객체기반 영상분류의 전처리과정으로서 원격 탐사 영상분석에서 그 중요성 날로 커지고 있다. 본 연구에서는 고해상도 위성영상의 분광 및 공간정보를 반영할 수 있는 새로운 분할방법을 제안한다. 이를 위해 우선 다중분광 에지정보의 지역적 변이특성을 이용하여 영상에서 자동으로 초기시드 점을 추출하였다. 추출된 시드 점과 이웃하는 점들과의 유사성을 기반으로 영역 확장의 우선순위를 결정하는 MSRG가법을 이용하여 영상분할을 수행하였다. 제안된 기법의 효율성을 평가하기 위해 기존에 위성영상분할에 많이 사용된 유역분할법과 영역성장기법과의 시각적/정량적 비교평가를 수행하였다. 정량적 비교평가 방법으로는 무감독 영상분할 평가 측정치와 동일한 조건하에서 수행된 객체기반 분류 정확도를 이용하였다. 실험 결과 제안한 기법은 고해상도 위성영상의 객체기반분석에 유용하게 적용될 수 있으리라 판단된다.

IMToon: 영상처리를 활용한 영상기반 카툰 저작 시스템 (IMToon: Image-based Cartoon Authoring System using Image Processing)

  • 서반석;김진모
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권2호
    • /
    • pp.11-22
    • /
    • 2017
  • 본 연구는 영상처리 알고리즘을 활용하여 영상 기반의 카툰을 제작하는 저작 시스템인 IMToon(IMage-based carToon)을 제안한다. 제안하는 IMToon은 영상을 기반으로 하여 일반 사용자들도 쉽고 효율적으로 카툰을 구성하는 프레임들을 제작할 수 있도록 한다. 이를 위해 저작시스템을 크게 카툰 이펙터와 대화형 이야기 편집기의 두 기능으로 나누어 설계한다. 카툰 이펙터는 입력 영상을 카툰 형식의 영상으로 자동 변환하는 기능으로 영상기반 카툰 쉐이딩과 윤곽 드로잉의 단계로 진행된다. 영상기반 카툰 쉐이딩은 사용자로부터 원하는 장면의 사진을 입력으로 받아 입력 사진의 컬러 모델에서 명암 정보를 분리하고, 원하는 단계의 음영대로 단순화하여 카툰 형식의 영상으로 생성하는 방법이다. 그리고 테두리 검출을 통해 쉐이딩된 영상에 윤곽선을 적용시키는 윤곽 드로잉 단계를 거쳐 최종적으로 카툰 형식의 영상을 생성한다. 대화형 이야기 편집기는 웹툰이나 만화책과 같이 이야기를 전달하는 완성된 카툰의 한 장면을 생성하기 위하여 말풍선과 자막 등을 대화형 구조로 입력하는 기능이다. 여기에 단일 영상을 카툰방식으로 변환하는 카툰 이펙터를 비디오로 확장시켜 정지 영상 뿐 아니라 동영상에도 응용할 수 있도록 설계한다. 마지막으로 제안한 IMToon 시스템을 통해 사용자가 원하는 카툰을 영상을 기반으로 보다 쉽고 효율적으로 제작할 수 있는지 여부를 다양한 실험을 통해 확인한다.

의료 영상의 3차원 공간색인을 위한 비정상 영역의 정보 추출 (Information Extraction for 3D Spatial Indexing in Abnormal Region of Medical Images)

  • 조경은;송미영;조형제
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.206-209
    • /
    • 2002
  • 의료 영상 처리 시스템에서는 영상들의 검색이 중요한 문제로 대두되고 있다. 그에 대한 해결 방법으로는 의료 영상 처리 시스템에 지능적인 내용 기반의 영상 검색 방법을 도입하는 것이다. 본 연구에서는 의료 영상에 적합한 분할 방법을 사용하여 뇌의 MR 영상에 대하여 내용기반 검색을 하기 위한 영상 특징 색인화 방법을 제안한다. 제안하는 색인화 방법은 뇌 MR 영상에서 뇌영역을 분할하고 특징들을 추출한 후 이 정보를 가지고 대상 영상의 그룹핑 정보를 유추하고, 각 대상 영상에서의 비정상 후보 영역 위치를 찾아내어 3차원 공간 색인을 하는 방법이다.

  • PDF