• 제목/요약/키워드: 비디오검색

검색결과 484건 처리시간 0.025초

미디엄 숏 검출에 관한 연구 (A Study of Medium Shot Detection)

  • 이형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.93-95
    • /
    • 2023
  • 본 논문에서는 장편의 드라마나 영화에서 스토리 기반의 축약된 요약본을 자동으로 제작하기 위해 미디엄 숏(medium shot) 크기의 숏(shot)들을 추출하기 위한 방법을 고려한다. 미디엄 숏 정도의 크기는 보통 인물에 중심을 둔 숏들로 인물들 간의 관계에서 특히 대사나 표정으로 내용을 전달하기 위한 목적으로 적극 권장된다. 비디오 검색을 위한 인덱싱에서 신(scene) 전환 검출 및 숏 경계 검출, 그리고 이미지에서 심도와 초점기반의 화질 및 피사체 추출 등을 위해 전통적인 신호/영상처리 기법의 활용에서부터 최근의 기계학습 접목 등 다양한 연구들이 진행되고 있다. 영상문법에 근거하여 편집된 영상물에서 미디엄 숏 정도 크기의 숏들을 추출하여 배열한다면 어느 정도 원본 내용을 충실히 전달할 수 있는 축약된 요약본을 제작할 수 있다는 가정하에 해당 샷들을 블러(blur) 기반으로 검출하기 위해 이와 관련된 키워드들을 기반으로 기존 연구들을 살펴보고 적용 방법을 모색한다.

  • PDF

이질적인 멀티미디어 메타데이터 통합 관리를 위한 시스템 구조 (Integrated System for Managing Heterogeneous Multimedia Metadata)

  • 박성규;이양구;채덕진;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.371-374
    • /
    • 2008
  • 최근 인터넷과 네트워크 기술이 급격히 발전함에 따라 대용량의 동영상 데이터에 대한 서비스 요구가 급격히 증가하고 있으며, 인터넷 사용자는 비디오, 오디오, 텍스트 등으로 표현되는 다양한 멀티미디어 컨텐츠를 쉽게 이용할 수 있게 되었다. 이러한 환경에서 동영상 컨텐츠의 저장, 교환 및 검색에 있어서 보다 나은 편리성을 요구하게 되었고, 이것은 동영상 데이터의 다양한 정보를 기술하기 위한 메타데이터의 중요성을 더욱 증대시키게 되었다. 그러나 이러한 서비스들을 데이터 포맷 및 서비스 종류에 따라 각기 다른 표준을 사용하고 있어 업계간 또는 서비스간에 다르게 표현되는 메타데이터 정보들을 통합 관리하기는 어려운 실정이다. 따라서, 이 논문에서는 기존의 메타데이터 관리 시스템의 이점을 수용하고, 이를 확장하여 각각의 표준에 따라 서로 다르게 표현되는 동영상 메타데이터를 통합 관리하기 위한 시스템을 제안한다.

행동패턴 인식기법을 이용한 지능형 감시 시스템 (Intelligent Surveillance System using an Activity Recognition Technique)

  • 박진희;이조셉;김호준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.63-65
    • /
    • 2007
  • 본 연구에서는 비디오 영상데이터로부터 인간의 행동패턴의 인식기술 및 상황인식 기법을 소개하고 이를 활용한 실용적 응용으로서 지능형 감시시스템을 제안한다. 순차적 영상신호에서 형태기반의 정적 특징과 목표물의 움직임 요소를 측정한 동적 특징을 결합한 형태의 특징 표현 및 추출기법과 행동패턴 및 상황패턴에 대한 인식 모델을 제시하고 구현한다. 모듈구조의 시스템에서 영상처리 모듈과 패턴인식 모듈은 특징추출 및 인식과정을 수행하며, 감시영상에 대한 상황판단 기능은 데이터베이스 모듈과 연동하여 효과적인 검색기능과 경보기능 등을 지원한다. 이러한 기능은 기존의 시스템에서 운영자의 지속적인 감시작업과 상황판단 작업을 보조 또는 대행하여 수행할 수 있을 뿐만 아니라 데이터저장 공간을 획기적으로 줄이고 부수적으로 효율적인 영상의 조회기능 및 추적기능 등의 유용한 인터페이스를 지원한다.

재구성이 가능한 멀티스토리 3D 애니메이션 (Reusable Multi-story 3D Animation)

  • 김성래;김호성;탁지영;박지은;임선혁;김수산나;이규선;이지현
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.238-242
    • /
    • 2007
  • 기존 UCC웹사이트에서는 사용자가 완성한 콘텐츠를 게시할 뿐 UCC의 소스나 이를 재구성할 수 있는 플랫폼을 제공하지 못하여 일반 사용자들이 새로운 콘텐츠를 제작하기 어렵다. 본 연구에서는 기존의 영상을 장면단위로 제공하고 User가 재구성함으로써 또 다른 내용의 콘텐츠를 제작할 수 있는 플랫폼을 개발하고 이에 적합한 다중 이야기 구조의 3D애니메이션을 제작해보았다. 제공된 영상을 User가 쉽게 재구성하기 위해서는 영상의 검색이 필수적이다. 영상의 용이한 검색을 위해 영상에 대한 내용설명과 영상 정보를 분류하였다. 동영상은 그 특성에 따라 하나의 단어로 표현하기가 모호하다. 그렇기 때문에 사용자가 원하는 요소를 최대한 반영하여 해당장면이 포함하고 있는 모든 요소를 검색할 수 있도록 제시된 카테고리를 중복 선택하여 검색할 수 있다. 검색된 장면 중 원하는 특정구간을 선택할 수 있으며, 선택된 장면들을 원하는 순서대로 나열하여 하나의 이야기를 만들어내고, 자막 및 BGM 등을 삽입할 수도 있다. 완성된 동영상은 카테고리, 신규, 인기별로 분류된다. 이러한 기획의도에 부합하는 3D 애니메이션으로 헝겊인형을 캐릭터로 인형세계에서 벌어지는 사건들을 모은 멀티스토리를 기획하고 제작해보았다. 이러한 시도는 뮤직비디오나 드라마, 영화, 광고 등 영상 미디어 분야의 새로운 마케팅 수단으로서의 활용될 수 있을 것이다.

  • PDF

영상 피드백을 이용한 단일 영상에서의 적응적 피부색 검출 (Adaptive Skin Color Segmentation in a Single Image using Image Feedback)

  • 도준형;김근호;김종열
    • 대한전자공학회논문지SP
    • /
    • 제46권3호
    • /
    • pp.112-118
    • /
    • 2009
  • 피부색 검출 기법은 안면 정보를 이용한 체질 진단 및 건강 진단, 인간과 로봇과의 상호작용, 영상 검색 시스템 등 다양한 응용분야에서 사람의 얼굴과 손의 검출을 위해 많이 사용되어 왔다. 비디오 영상의 경우 조명이나 환경 변화에 강인한 피부색 영역의 추적을 위해 매 프레임마다 대상 영역의 피부색 모델을 업데이트 하는 것이 일반적이나, 단일 영상에서 피부색 영역을 검출하거나 비디오 영상의 첫 프레임에서 피부색 영역을 검출할 때에는, 많은 연구들이 하나의 고정된 피부색 모델을 이용하기 때문에 입력 영상의 특징에 따라 낮은 검출율이나 높은 긍정 오류율이 발생하는 경우가 많다. 이러한 문제점을 해결하기 위해 본 논문에서는 피부색 검출 결과를 피드백 받아 피드백 받은 정보를 바탕으로 피부색 검출 조건을 수정하는 과정을 반복함으로써 다양한 환경 조건들을 가지는 단일 영상에 대해 효과적으로 피부색을 검출할 수 있는 방법을 제안한다.

MPEG-7 기술자를 이용한 TV 골프 프로그램의 이벤트검출 및 요약 (Semantic Event Detection and Summary for TV Golf Program Using MPEG-7 Descriptors)

  • 김천석;이희경;남제호;강경옥;노용만
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.96-106
    • /
    • 2002
  • 본 논문에서는 최근 증가하는 TV 골프 경기의 하이라이트 부분을 요약하기 위해 시청자가 관심을 갖는 주요 이벤트를 시각 특징정보들을 이용하여 자동 추출할 수 있는 알고리즘을 제시하였다. 본 알고리즘은 4단계로 구성된다. 첫 번째 단계에서는 입력된 비디오의 샷 (Shot) 및 키 프레임 (Key Frame)을 구하여 데이터베이스화하는 구조를 분석하고, 두 번째 단계에서는 이들 정보를 이용하여 하위 레벨의 특징정보를 추출한다. 세 번째 단계에서는 특징 전보들을 통합하여 샷의 의미를 부여하여, 이벤트 구성 요소들과 정합시킨다. 네 번째 단계에서는 사전에 정의된 추론 규칙과 시간 정보를 이용하여 구성 요소들을 통합하여 이벤트를 결정한다. 본 연구에서는 하위 레벨의 특징 정보를 상호 호환성과 재사용성이 가능하도록 MPEG-7 비주얼 특징 정보를 사용하였다 TV-Anytime의 하이라이트/이벤트 스키마(schema)를 이용하여 검출된 이벤트들로 구성된 요약문을 XML 문서로 작성하였다. 제안 알고리즘의 성능을 검사하기 위해 비디오 자동 요약 시스템과 브라우징을 제작하여 실험하였으며 평균 80%의 검색 율과 정확도를 얻었다.

GOP를 구성하는 프레임들의 순서 변경을 이용한 효율적인 스무딩 알고리즘 (An Efficient Smoothing Algorithm Using the Change of Frame Sequence in GOP)

  • 이면재
    • 한국게임학회 논문지
    • /
    • 제6권2호
    • /
    • pp.51-60
    • /
    • 2006
  • 스무딩은 가변 비트율로 저장된 비디오 데이터를 클라이언트로 전송할 때 일련의 고정 비트율로 전송할 수 있도록 전송 계획을 세우는 것으로 이러한 스무딩 알고리즘에는 CBA, MCBA, MVBA, PCRTT 등이 있다. 그러나 이 알고리즘들에서는 GOP내에서 프레임들간의 바이트 수의 차이가 심한 경우에도 이 순서대로 전송 계획을 세우기 때문에 불필요하게 전송률이 변화되거나 급격하게 높은 전송률이 요구될 수 있다. 이는 네트워크 자원의 효율적 인 사용을 어렵게 할 수 있다. 이를 개선하기 위하여 본 논문에서는 빠른 시간안에 최적의 해를 찾을 수 있는 백트랙킹 방법을 이용하여 GOP 내에서 가장 완만하게 프레임의 바이트 수가 변화되는 프레임들의 순서를 검색하여 이 순서대로 전송 계획을 세우는 스무딩 알고리즘과 이를 위한 구조를 제안한다. 제안 알고리즘의 성능은 다양한 비디오 소스를 가지고 MVBA 알고리즘과 전송률 변화 횟수, 첨두 전송률, 전송률 변화량을 비교 분석하여 평가한다.

  • PDF

동영상에서 인물식별을 위한 얼굴검출 알고리즘 구현 (Implementation of a face detection algorithm for the identification of persons)

  • 조미남;지유강
    • 정보보호학회논문지
    • /
    • 제21권1호
    • /
    • pp.85-91
    • /
    • 2011
  • 영화, 드라마와 같은 비디오에서 등장하는 인물을 검출하고 인식하는 기술은 일반 사용자를 대상으로 PVR(personal video recorder), 모바일 폰과 멀티미디어 공급자를 위한 얼굴 영상의 데이터베이스 관리와 같은 응용분야에 이용될 수 있다. 본 논문에서는 비디오 등장인물을 자동으로 검색하는 얼굴검출 기법을 제안한다. 본 논문에서 제안한 얼굴검출 기법은 크게 세 단계로 구성하였다. 첫 번째, 정지 영상을 생성한 후 장면전환점 검출단계, 두 번째, 색상정보를 이용한 얼굴검출 단계, 마지막으로 얼굴영역을 이용한 얼굴 특징점 검출단계로 구성하였다. 실험결과 다양한 환경에서 성공적으로 얼굴을 검출하였으며, 기존의 색상정보를 이용한 얼굴 검출기법보다 성능이 개선된 것을 확인할 수 있었다.

시공간 엔트로피 임계법과 카메라 패닝 보상을 이용한 객체 기반 동영상 분할 (Object-Based Video Segmentation Using Spatio-temporal Entropic Thresholding and Camera Panning Compensation)

  • 백경환;곽노윤
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.126-133
    • /
    • 2003
  • 본 논문은 비디오 시퀸스에 카메라 패닝 보상과 2차원 시공간 엔트로피 임계법을 적용하여 추출한 객체포함영역을 대상으로 영상 분할을 수행하는 이동객체 분할 기법에 관한 것이다. 우선, 웨이블렛 변환에 의해 구성한 피라미드 계층 구조상에서 카메라 패닝 벡터를 추정하여 전역 움직임을 보상한다. 이후, 전역 움직임이 보상된 기준영상을 대상으로 각 프레임간에서 2차원 시공간 엔트로피 임계법을 적용하여 이동 객체가 포함될 가능성이 있는 영역을 블록 단위로 추출한다 다음으로, 2차원 시공간 엔트로피 임계법에 의해 분류된 영역을 토대로 각 블록을 움직임 블록, 준 움직임 블록, 비 움직임 블록 중 어느 하나로 분류한 검색 테이블을 작성한다. 이어서, 검색 테이블을 참조하여 초기 탐색 계층 및 탐색 영역을 적응적으로 선정함으로써 피라미드 계층 구조상에서 효율적인 고속 움직임 추정을 수행하여 이동 객체에 해당하는 객체포함영역만을 추출한다. 최종적으로, 이렇게 추출된 객체포함영역에서 임계 기울기 영상을 정의한 후, 이를 기준 삼아 객체포함영역에 화소단위의 형태학 기반 영상 분할 알고리즘을 적용함으로써 비디오 시퀸스에 포함된 이동 객체를 분할한다. 컴퓨터 시뮬레이션 결과를 통해 고찰할 때, 제안된 방법은 이동 객체에 대한 상대적으로 우수한 분할 특성을 제공할 수 있고, 특히 저대조 경계면의 분할 특성을 제고시키고 있음을 확인할 수 있다.

  • PDF

고령자의 사용편의성을 위한 웹 네비게이션 디자인에 관한 연구 (A Study of Web Navigation Design to Improve Usability of Old-aged Users)

  • 배윤선;이현주
    • 디자인학연구
    • /
    • 제19권1호
    • /
    • pp.129-140
    • /
    • 2006
  • 본 연구는 지식과 정보가 경쟁력이 되고 있는 현대 사회에서 고령자들이 웹을 통하여 보다 쉽게 정보를 찾을 수 있는 웹 네비게이션 디자인의 유형을 개발하고자 하였다. 예비조사를 통하여 고령자를 위한 웹 네비게이션 디자인의 유형을 제안하였고 30명의 고령자 그룹을 대상으로 정보 검색소요 시간, 오류 발생 측면, 웹 네비게이션 디자인 요소의 크기와 위치, 레이아웃에 관한 조사를 하였다. 측정된 정보 검색소요 시간은 반복측정 이원변량분석에 의하여 분석하였고 비디오 분석과 사후 설문조사를 실시하였다. 고령자에겐 이상적인 정 네비게이션 디자인은 페이지의 상단에 가로로 길게 위치한 글로벌 메뉴 아래에 세로로 서브 카테고리 메뉴가 나타나는 유형이며 롤오버 메뉴와 단계적으로 분류된 메뉴, 크게 처리된 본문과 레이블, 움직이지 않는 이미지는 고령자가 정보를 쉽게 찾을 수 있도록 하였다. 이상에서 제시하는 바와 같이 사용편의성이 향상된 웹 네비게이션 디자인에서는 고령자가 효율적으로 오류 없이 정보를 쉽고 편하게 찾을 수 있으며 고령자를 위한 웹 네비게이션 디자인의 개발은 고령화 사회에서 노인 계층의 인터넷 사용을 활성화시킬 수 있을 것이다.

  • PDF