• 제목/요약/키워드: 동영상 분류

검색결과 247건 처리시간 0.028초

움직임 벡터를 이용한 사람 활동성 분석 (Analysis of Human Activity Using Motion Vector)

  • 김선우;최연성;양해권
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.157-160
    • /
    • 2011
  • 본 논문에서는 실시간 감시 시스템에서 녹화 도중에 검출된 움직임 벡터를 이용하여 사람의 활동성을 인식하고 분석하고자 한다. 전경에서 블랍(사람)을 검출하는 방법은 기존에 연구했던 차 영상을 이용하였고, MPEG-4 동영상 녹화 시 EPZS(Enhanced Predictive Zonal Search)에서 검출되는 움직임 벡터의 값을 이용하였다. 본 논문에서는 사람의 행동을 크게 세 가지의 {Active, Inactive}, {Moving, Non-moving}, {Walking, Running} 메타 클래스로 분류하고 인식하였다. 각 단계에서는 단계별 임계값을 이용하여 구분하였다. 실험을 위해서 약 150개의 상황을 연출하였으며, 실험 영상에서 각 단계를 구분하는데 약 86% ~ 98% 까지의 높은 인식률을 보였다.

  • PDF

다수 사람 추적상태에 따른 감시영상 요약 시스템 (Surveillance Video Summarization System based on Multi-person Tracking Status)

  • 유주희;이경미
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.61-68
    • /
    • 2016
  • 현대사회는 보안과 안전이 중요해지면서 감시카메라들이 여러 곳에 설치되어 있다. 하지만 감시영상을 보고 상황을 파악하는 것은 여전히 사람의 몫으로 인력과 시간이 소모된다. 그래서 자동으로 감시영상을 분석하여 주요 사건 중심으로 요약해 주는 연구의 필요성이 커지고 있다. 본 논문에서는 감시영상에서 존재하는 다수의 사람을 추적하고, 추적을 통해 얻은 정보를 이용하여 감시영상을 요약하는 방법을 제안한다. 제안하는 감시영상 요약 시스템은 조명보정을 적용하여 배경제거한 후 다수의 사람을 추출하고, 추출된 사람의 추적 정보를 상태 데이터베이스에 저장한다. 추적을 통해 얻은 정보로 추적 대상들의 추적 경로, 움직임 상태, 지체시간, 카메라 안으로의 출입시간 등을 사용한다. 또 사람의 움직임에 따라 6 가지(Enter, Stay, Slow, Normal, Fast and Exit)로 움직임 상태를 분류하였고, 움직임 상태를 시간별, 공간별로 요약 그래프로 나타내 추적대상의 움직임 상태를 빠르게 파악할 수 있다.

모델기반 특징추출을 이용한 지역변화 특성에 따른 개체기반 표정인식 (Facial Expression Recognition with Instance-based Learning Based on Regional-Variation Characteristics Using Models-based Feature Extraction)

  • 박미애;고재필
    • 한국멀티미디어학회논문지
    • /
    • 제9권11호
    • /
    • pp.1465-1473
    • /
    • 2006
  • 본 논문에서는 Active Shape Models(ASM)과 상태기반 모델을 사용하여 동영상으로부터 얼굴 표정을 인식하는 방법을 제시한다. ASM을 이용하여 하나의 입력 영상에 대한 얼굴요소특징점들을 정합하고, 그 과정에서 생성되는 모양변수벡터를 추출한다. 동영상에 대해 추출되는 모양변수벡터 집합을 세 가지 상태 중 한 가지를 가지는 상태벡터로 변환하고 분류기를 통해 얼굴의 표정을 인식한다. 분류단계에서는 표정별 표정변화에 따른 변화영역의 차이를 고려한 새로운 유사도 측정치를 제안한다. 공개데이터베이스 KCFD에 대한 실험에서는 제안한 측정치와 기존의 이친 측정치를 사용한 k-NN의 인식률이 k가 1일 때 각각 89.1% 및 86.2%을 보임으로써, 제안한 측정치가 기존의 이진 측정치보다 더 높은 인식률을 나타내는 것을 보인다.

  • PDF

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

영상 부호화를 위한 DCT 계수 블럭 크기 분류 (DCT Coefficient Block Size Classification for Image Coding)

  • 강경인;김정일;정근원;이광배;김현욱
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.880-894
    • /
    • 1997
  • 본 논문에서는 양자화 계수가 0이 되는 위치를 예측하여 축소된 영역내에서 DCT (Discrete Cosine Trans-form)를 수행하는 새로운 알고리즘을 제안한다. 이 제안한 알고 리즘은 FDCT(Forward DCT)와 IDCT(Inverse DCT)의 계산량을 줄여 부호와 시간과 복호 화 시간을 감소시킬 뿐만 아니라, 허프만(huffiman) 부호화시에도 각각의 불럭에 대하여 분류된 블럭 크기에 따라 각기 다른 수평 수직 지그재그 스캔을 수행함으로써 압축률 을 증가시킨다. 기존의 영상 부호화 방법은 모든 블럭에 대하여 똑같은 DCT 계산과 지그재그 스캔을 행한다. 그렇지만, 제안한 알고리즘은 부호화시에 분류된 블럭 크기 밖의 양자화 계수에 대해 FDCT를 계산하는 대신 0을 대입함FDCT 계산 시간을 줄인다. 또한, 복호화시에는 분류된 블럭 크기내에 존재하는 역양자화 계수만 가지고 IDCT를 수행함으로써 IDCT 계산 시간을 줄인다. 추가하여, 제안한 알고리즘은 분류된 블럭 특성에 적합한 수평 수직 지그재그 스캔을 수행함으로써 Run-length를 줄여서, 향상된 압축률을 제공한다. 한편, 제안한 알고리즘은 DCT에서 압축률과 화질면에서는 최적이지만 부호와 시간과 복호화 시간이 많이 걸리는 16*16 블럭의 처리에도 적용되어질 수 있다. 또한, 실시간을 요구하는 동영상 부호화로 확장되어 질 수 있다.

  • PDF

재구성이 가능한 멀티스토리 3D 애니메이션 (Reusable Multi-story 3D Animation)

  • 김성래;김호성;탁지영;박지은;임선혁;김수산나;이규선;이지현
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.238-242
    • /
    • 2007
  • 기존 UCC웹사이트에서는 사용자가 완성한 콘텐츠를 게시할 뿐 UCC의 소스나 이를 재구성할 수 있는 플랫폼을 제공하지 못하여 일반 사용자들이 새로운 콘텐츠를 제작하기 어렵다. 본 연구에서는 기존의 영상을 장면단위로 제공하고 User가 재구성함으로써 또 다른 내용의 콘텐츠를 제작할 수 있는 플랫폼을 개발하고 이에 적합한 다중 이야기 구조의 3D애니메이션을 제작해보았다. 제공된 영상을 User가 쉽게 재구성하기 위해서는 영상의 검색이 필수적이다. 영상의 용이한 검색을 위해 영상에 대한 내용설명과 영상 정보를 분류하였다. 동영상은 그 특성에 따라 하나의 단어로 표현하기가 모호하다. 그렇기 때문에 사용자가 원하는 요소를 최대한 반영하여 해당장면이 포함하고 있는 모든 요소를 검색할 수 있도록 제시된 카테고리를 중복 선택하여 검색할 수 있다. 검색된 장면 중 원하는 특정구간을 선택할 수 있으며, 선택된 장면들을 원하는 순서대로 나열하여 하나의 이야기를 만들어내고, 자막 및 BGM 등을 삽입할 수도 있다. 완성된 동영상은 카테고리, 신규, 인기별로 분류된다. 이러한 기획의도에 부합하는 3D 애니메이션으로 헝겊인형을 캐릭터로 인형세계에서 벌어지는 사건들을 모은 멀티스토리를 기획하고 제작해보았다. 이러한 시도는 뮤직비디오나 드라마, 영화, 광고 등 영상 미디어 분야의 새로운 마케팅 수단으로서의 활용될 수 있을 것이다.

  • PDF

HOOF와 Random Forest를 이용한 휴먼 행동 인식 (Human action recognition using HOOF and Random Forest)

  • 홍준혁;고병철;남재열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.450-452
    • /
    • 2012
  • 본 논문에서는 CCD 카메라에 입력된 동영상에서 Random Forest를 이용하여 휴먼 행동을 인식하는 알고리즘을 제안한다. 행동 인식을 위한 특징 벡터 추출을 위해 가장 최근의 N개의 비디오 프레임들을 하나의 액션 볼륨으로 생성하고, 액션 볼륨 내에서 객체 트랙킹 된 영역을 서브 볼륨으로 생성한다. 이후 서브불륨을 $N{\times}N$개의 블록으로 나누고 각 블록에서 HOOF (Histogram of oriented optical flow)를 특징 벡터로 추출한다. 각 휴먼의 행동인식을 위해 사용된 Random Forest 분류기는 걷기, 뛰기, 발차기, 주먹질, 앉기, 쓰러지기, 넘어지기 7개의 행동을 나타내는 클래스로 분류하도록 학습되었으며 Random Forest에 의한 분류결과에 따라 어떤 행동을 취하는지 최종 판단한다.

딥러닝 감정 인식 기반 배경음악 매칭 설계 (Design for Mood-Matched Music Based on Deep Learning Emotion Recognition)

  • 정문식;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.834-836
    • /
    • 2021
  • 멀티모달 감정인식을 통해 사람의 감정을 정확하게 분류하고, 사람의 감정에 어울리는 음악을 매칭하는 시스템을 설계한다. 멀티모달 감정 인식 방법으로는 IEMOCAP(Interactive Emotional Dyadic Motion Capture) 데이터셋을 활용해 감정을 분류하고, 분류된 감정의 분위기에 맞는 음악을 매칭시키는 시스템을 구축하고자 한다. 유니모달 대비 멀티모달 감정인식의 정확도를 개선한 시스템을 통해 텍스트, 음성, 표정을 포함하고 있는 동영상의 감성 분위기에 적합한 음악 매칭 시스템을 연구한다.

공간주파수 특성을 이용한 DCT 압축영상의 적응 영상 향상 (An Adaptive Image Enhancement of the DCT Compressed Image using the Spatial Frequency Property)

  • 전선동;김상희
    • 융합신호처리학회논문지
    • /
    • 제11권2호
    • /
    • pp.104-111
    • /
    • 2010
  • 본 논문은 DCT 압축 영역에서 공간 주파수 특성을 이용한 적응 영상향상 방법에 관한 것이다. 영상의 동적범위를 압축하기 위해 Retinex 이론을 이용하여 영상의 조명성분인 dc 계수들을 조절하였으며, 대비를 개선하기 위해 인간의 시각 체계와 계수들의 공간 주파수 특성을 이용하여 ac 계수들을 수정하였다. 세로 방향, 가로 방향, 그리고 혼합된 공간 주파수 성분으로 분류된 ac계수들은 영상향상에 발생하는 블록화 현상을 최소화하기 위하여 적응적으로 수정하였다. 제안된 방법은 영상의 동적 범위 압축과 적응적 대비 개선을 이용하여 기존 방법보다 블록화 현상이 없는 효과적인 영상 향상의 결과를 가져왔다.

문맥 정보를 이용한 분류 기반 무릎 뼈 검출 기법 (Classification based Knee Bone Detection using Context Information)

  • 신승연;박상현;윤일동;이상욱
    • 방송공학회논문지
    • /
    • 제18권3호
    • /
    • pp.401-408
    • /
    • 2013
  • 본 논문에서는 영상 내의 문맥 특징(context feature)과 외형 특징(appearance feature)을 함께 학습함으로써 의료영상 내의 비슷한 외형 특징을 가지는 장기들을 자동으로 검출하는 기법을 제안한다. 기존 검출 기법들은 외형 특징 정보만을 학습하여 분류기(classifier)를 생성하였기 때문에 의료영상 내에 외형이 비슷한 장기들이 다수 포함되어 있는 경우 검출 오류가 발생하였다. 제안하는 기법은 외형 특징을 이용하여 학습된 분류기를 통해 얻은 확률 값들을 바탕으로 관심 복셀(voxel) 주변의 확률 분포 특징을 반복적으로 학습함으로써 문맥 정보를 포함하는 분류기를 생성한다. 또한, 실험 단계(test stage)에서 '지역 기반 투표 방식'(region based voting scheme)을 도입함으로써 효율성과 정확성을 향상시킨다. 제안하는 기법의 성능 평가를 위해 SKI10 무릎 관절 데이터 셋 내에서 외형 특징이 비슷한 대퇴골(femur)과 경골(tibia)을 검출하는 실험을 진행하였다. 실험 결과를 통해 제안하는 기법이 외형 특징만을 이용했던 검출 기법에 비해 개선된 검출 성능을 보이고 있음을 확인할 수 있었다.