• 제목/요약/키워드: 비디오 분류

검색결과 277건 처리시간 0.024초

분산 기반의 Gradient Based Fuzzy c-means 에 의한 MPEG VBR 비디오 데이터의 모델링과 분류 (Modeling and Classification of MPEG VBR Video Data using Gradient-based Fuzzy c_means with Divergence Measure)

  • 박동철;김봉주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.931-936
    • /
    • 2004
  • GPDF(Gaussian Probability Density Function)을 효율적으로 군집화할 수 있는 GBFCM(DM)(Gradient Based Fuzzy c_means with Divergence Measure) 알고리즘이 본 논문에서 제안되었다. 제안된 GBFCM(DM)은 데이터 사이의 거리 척도로 발산거리(Divergence measure)를 적용한 새로운 형태의 FCM으로, 기존의 GBFCM에 기반을 두는 알고리즘이다. 본 논문에서는 MPEG VBR 비디오 데이터를 GPDF형태의 다차원 데이터로 변형시켜 모델링 하고, 모델링 한 MPEG VBR 비디오 데이터를 영화 또는 스포츠 형태로 분류하는데 응용되었다. 본 논문의 실험에서 기존의 FCM, GBFCM과 새롭게 제안된 GBFCM(DM)을 사용하여 모델링 및 분류결과를 상호 비교하였다. 비교결과 GBFCM(DM)이 오분류율의 기준에서 기존의 다른 알고리즘들에 비해 약 5∼l5%의 향상된 성능을 보였다.

GoF 특징을 이용한 유해 동영상 자동 분류 (Automatic Classification of Objectionable Videos Based on GoF Feature)

  • 이승민;이호균;남택용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.197-200
    • /
    • 2005
  • 본 논문은 유해한 동영상을 실시간으로 분석하고 차단하기 위하여, 동영상의 비주얼 특징으로서 그룹 프레임(Group of Frame) 특징을 추출하여 SVM 학습모델을 활용하는 유해 동영상 분류에 관한 것이다. 지금까지 동영상 분류에 관한 연구는 주로 입력 동영상을 뉴스, 스포츠, 영화, 뮤직 비디오, 상업 비디오 등 사전에 정의한 몇 개의 장르에 자동으로 할당하는 기술이었다. 그러나 이러한 분류 기술은 미리 정의한 장르에 따른 일반적인 분류 모델을 사용하기 때문에 분류의 정확도가 높지 않다. 따라서, 유해 동영상을 실시간으로 자동 분류하기 위해서는, 신속하고 효과적인 동영상 내용분석에 적합한 유해 동영상 특화의 특징 추출과 분류 모델 연구가 필요하다. 본 논문에서는 유해 동영상에 대하여 신속하고, 정확한 분류를 위하여 유해 동영상의 대표 특징으로서 그룹프레임 특징을 정의하고, 이를 추출하여 SVM 학습 모델을 생성하고 분류에 활용하는 매우 높은 성능의 분석 방법을 제시하였다. 이는 최근 인터넷 뿐만 아니라 다양한 매체를 통하여 급속도로 번지고 있는 유해 동영상 차단 분야에 적극 활용될 수 있을 것으로 기대된다.

  • PDF

학습된 선형 변환 기저를 이용한 VVC 잔자신호 변환

  • 김남욱;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.160-161
    • /
    • 2020
  • 본 논문에서는 비디오 코딩 잔차신호를 보다 효율적으로 변환하기 위하여 오프라인으로 잔차신호를 학습하여 RD(Rate Distortion) Cost를 기반으로 분류된 몇 가지 변환 기저들을 생성하고, 비디오 복호화 과정 중 잔차신호를 역변환을 수행할 때 주변의 복호화가 완료된 신호들을 이용하여 최적의 변환 기저를 선택하여 해당 변환 기저로 역변환을 수행하여 효율적으로 잔차신호를 압축하는 방법에 대해 제안한다. 변환 기저 생성에는 분류된 잔차신호들에 대하여 2 차원 혹은 1 차원 KLT를 계산함으로써 얻어내어진다. 제안하는 방법은 VTM(VVC Test Model) version 10에서 실험하였으며 약 0.5% 정도의 성능향상을 보인다.

  • PDF

뉴스비디오 편집시스템 (News Video Editing System)

  • 고경철;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 추계종합학술대회
    • /
    • pp.421-425
    • /
    • 2000
  • 뉴스 비디오의 효과적인 검색을 위해서는 비디오데이터로부터 의미 있는 정보들을 추출할 수 있는 비디오 처리 및 편집기술의 개발이 요구된다. 이를 위하여 정보 선진국들을 중심으로 비디오 편집 기술이 오래 전부터 연구되어 왔으며, 최근에는 실생활의 완벽한 실용화를 위하여 연구에 중점을 두고 있는 실정이다. 본 논문은 비디오 데이터의 종류에 따라 사용자가 임의의 알고리즘을 선택하여 장면전환 검출의 정확성과 효율성을 높일 수 있으며, 시스템의 자동/수동분류에 의한 장면전환검출과 편집 시스템을 통하여 사용자의 요구에 따라 비디오 데이터로부터 의미 있는 정보들을 추출하고 편집할 수 있는 시스템을 제안한다.

  • PDF

비디오 게임 콘텐츠 제작을 위한 모션그래픽 움직임 효과에 관한 연구 (A Study of Motion Graphics Effects in Moving for Video Game Contents Projection)

  • 주헌식
    • 한국게임학회지
    • /
    • 제9권1호
    • /
    • pp.15-23
    • /
    • 2012
  • 본 논문에서는 비디오게임 콘텐츠 제작을 위한 모션그래픽 효과에 대해서 연구하였다. 모션 그래픽을 사용하여 비디오게임 콘텐츠 제작을 위한 다양한 효과들을 적용하여 나타내었다. 모션 그래픽의 효과를 움직임 효과와 이미지 모션 효과로 분류하고 적용하였다. 모션그래픽의 다양한 효과들은 비디오 게임 콘텐츠 제작에 적용함으로써 극적 효과를 증가시킨다. 본 논문에서 적용한 다양한 모션 그래픽의 효과들을 비디오 게임에 적용함으로서 보다 창조적인 비디오 아트로 발전하길 기대한다.

  • PDF

Transformer를 사용한 이미지 캡셔닝 및 비디오 캡셔닝 (Image captioning and video captioning using Transformer)

  • 김기덕;이근후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.303-305
    • /
    • 2023
  • 본 논문에서는 트랜스포머를 사용한 이미지 캡셔닝 방법과 비디오 캡셔닝 방법을 제안한다. 트랜스포머의 입력으로 사전 학습된 이미지 클래스 분류모델을 거쳐 추출된 특징을 트랜스포머의 입력으로 넣고 인코더-디코더를 통해 이미지와 비디오의 캡션을 출력한다. 이미지 캡셔닝의 경우 한글 데이터 세트를 학습하여 한글 캡션을 출력하도록 학습하였으며 비디오 캡셔닝의 경우 MSVD 데이터 세트를 학습하여 학습 후 출력 캡션의 성능을 다른 비디오 캡셔닝 모델의 성능과 비교하였다. 비디오 캡셔닝에서 성능향상을 위해 트랜스포머의 디코더를 변형한 GPT-2를 사용하였을 때 BLEU-1 점수가 트랜스포머의 경우 0.62, GPT-2의 경우 0.80으로 성능이 향상됨을 확인하였다

  • PDF

플랫폼 형태에 따른 N-Screen 서비스 분류 및 플랫폼 표준화

  • 윤용익;김스베틀라나
    • 방송과미디어
    • /
    • 제17권1호
    • /
    • pp.78-85
    • /
    • 2012
  • 무선망과 인터넷 초고속화와 함께 비디오 스트리밍, 모바일 방송, IPTV 등 통방융합 환경에서의 비디오를 중심으로 한 멀티미디어 콘텐츠 서비스가 보편화되고 있다. 이러한, 이종의 접속망과 다양한 성능의 단말이 혼재하는 융합 콘텐츠 소비환경에서 스마트폰, Tablet PC, IPTV 등 다양한 단말기에서 비디오, 음악, 게임, 데이터 등의 콘텐츠를 끊김 없이 이용할 수 있는 서비스를 일반적으로 N-Screen 서비스라고 한다. 이렇게 단말간의 이동성을 제공하기 위해서는 다양한 플랫폼 형태에 따른 N-Screen 서비스 표준화가 필요하다. 또한, 다양한 스마트 스크린간의 끊김 없는 서비스 이용이 가능한 송수신 기술 및 네트워크 자원을 활용하는 서비스들과 인터넷 기반의 서비스들 간의 상호 연계를 위한 기술들의 표준화가 계속 진행되어야 한다. 본고에서는 이러한 차세대 네트워크 환경에서 N-Screen을 위한 플랫폼과 플랫폼 형태에 따른 N-Screen 서비스 분류에 대해 살펴본다.

이미지 및 비디오 메타데이터에 관한 연구 (A Study on Metadata for Images and Videos)

  • 임은주;김성희
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.117-124
    • /
    • 2005
  • 이미지와 비디오가 효율적으로 검색되고 이용되기 위해서는 메타데이터가 구조적으로 기술될 필요가 있다. 본 논문에서는 메타데이터 구축 체계의 기반으로 MPEG-7과 Plateau, ViMod에 대해 분석하였다. MPEG-7에서는 저작 및 생산, 이용, 컨텐츠의 구조적, 개념적 측면 등과 같은 다양한 관점에서 시청각 정보가 기술된다. Plateau는 다양한 응용 분야에 적합하도록 모델링 하였기 때문에 모델이 간단명료하고 응용분야에서는 전문성을 띠고 있으나 범용성이 부족하다는 단점이 있다. ViMod는 질의의 특성을 질의의 확실성, 질의의 차원성, 데이터 의존성 관점에서 정지영상과 비디오 영상으로 분류하고 그 하위 레벨을 내용 의존적인 영상과 내용 독립적인 영상으로 분류하였다.

  • PDF

온톨로지를 이용한 뉴스 비디오의 자동 분류 기법 (Full-automatic Classification Technique of News Video using Domain Ontologies)

  • 김하은;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.193-195
    • /
    • 2005
  • 본 논문은 온톨로지를 이용하여 뉴스 비디오를 분야별로 자동으로 분류하는 효율적인 기법을 제안한다. 이를 위해서 뉴스 비디오를 파싱하여 키프레임(Key frame), 샷(Shot), 씬(Scene)으로 나누고 키프레임과 샷에서 특징 정보를 추출한다. 추출된 특징 정보를 이용하여 샷의 키워드 집합을 만들고 이를 이용하여 씬의 키워드 집합을 만든다. 그리고 씬의 키워드 집합을 어휘 온톨로지와 뉴스 온톨로지에 매칭(추론)하여, 씬의 분야를 결정한다. 또한 이렇게 결정된 분야를 기반으로 서로 유사한 씬들을 자동으로 그룹화하는 방법을 제안한다.

  • PDF

컬러-$x^2$ 명도 히스토그램기반 FCM 클러스터링을 이용한 비디오 분할 (Video Segmentation Using a $color-x^2$ intensity histogram-based FCM Clustering)

  • 이지현;강오형;나도원;이양원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.189-192
    • /
    • 2005
  • 비디오 분할의 목적은 같은 내용들을 가지는 프레임들의 순서를 표현하는 각 샷의 비디오 순서 분할을 위한 것이다. 그리고 색인에 대한 각 샷으로부터 키 프레임을 선택한다. 존재하는 비디오 분할 방법들은 2가지 그룹들로 분류될 수 있다. 먼저 경계값이 할당되어야만 하는 샷 전환 검출(SCD) 접근과 클러스터 수의 사전 지식이 요구되는 클러스터 접근이다. 본 논문에서는 컬러-$x^2$명도 히스토그램 기반 FCM(fuzzy c-means) 클러스터링 알고리즘을 사용하는 비디오 분할 방법을 제안하였다. 이 알고리즘은 앞에서 기술한 2가지 접근의 혼합이다. 그리고 이것은 두 가지 접근들의 결점을 극복하도록 설계 되었다. 실험 결과들은 컬러-$x^2$명도 히스토그램 기반 FCM 클러스링 알고리즘이 강건하고 비디오 시퀀스들의 다양한 형태들에 응용할 수 있다고 제안한다.

  • PDF