• 제목/요약/키워드: 동영상 분류

검색결과 245건 처리시간 0.027초

동영상의 필드불일치 보정 및 움직임열화 제거 시스템 개발 (Field Mismatch Compensation and Motion Blur Reduction System for Moving Images)

  • 정유찬;백준기
    • 전자공학회논문지S
    • /
    • 제36S권2호
    • /
    • pp.81-87
    • /
    • 1999
  • 비월주사방식의 TV 방송은 전송대역폭을 효율적으로 사용할 수 있기 때문에 현재 방송표준에서 사용하고 있으며, MPEG-2와 같은 압축표준에서도 이를 지원하도록 되어있다. 본 논문에서는 이러한 비월주사방식을 사용하는 동영상의 화질개선을 위한 후처리기법으로 필드불일치 보정기법과 움직임열화를 제거하는 기법을 제안한다. 필드불일치 보정기법은 에지 분류를 기반으로하는 선형보간기법과 움직임을 추정하여 이를 보상하는 방법에 대해 설명한다. 선형보간을 위한 에지의 분류는 압축표준에서 가장 널리 사용되는 DCT의 계수를 이용함으로써 추가적인 계산과정 없이 단순히 계수의 비교만으로 이루어진다. 또한 움직임을 추정하여 이를 보상하는 방법은 움직임을 기반으로 하는 영상분할 기법을 적용하여 두 필드이 정보를 모두 이용하게 되므로 정보의 이용이라는 측면에서 매우 효율적이다. 동영상의 화질개선을 위한 움직임열화 제거기법은 제안되는 열화모델을 기반으로 공간적응적인 반복적 영상복원기법을 이용하여 화질개선 효과를 얻을 수 있다.

  • PDF

공간적 특징을 이용한 신경 회로망 기반 객체 분할 및 움직임 예측 (Neural network based Object segmentation and optical flow estimation using spatial feature)

  • 김형진;이동규;이두수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.837-840
    • /
    • 2000
  • 동영상에서 움직이는 객체 분할 및 모션 예측을 동시에 수행할 수 있는 연구는 다양한 방법으로 시도 되어 왔다. 실제 이미지를 서로 다른 움직임이나 서로 다른 공간적인 특정 영역으로 분리 될 수 있다고 가정 한다면 복수의 객체 또는 객체의 움직임으로 표현 할 수 있다. 객체 분할 측면에서 볼 때 효율적인 분할을 위해서는 특징 입력 벡터의 선택이 중요한 변수로 작용한다. 본 연구에서는 정밀한 객체 분할을 위해 밝기, 질감(Texture) 정보와 같은 정지영상의 특징 입력 벡터와 움직임 벡터 같은 동영상의 특징 입력 벡터를 동시에 사용한다. 분리된 객체는 각각의 클래스를 구성하게 되고 이를 위한 클래스 분류기로서 Median Radial Basis 신경 회로망을 사용한다. 객체 분할과 움직임 예측을 위해서 확률적 방법을 통한 에너지 함수를 구하고 비용함수를 도입한다. 신경 회로망의 각 Basis 함수는 영상의 특정한 영역에서 활성화되며 객체의 분류를 위해 신경 회로망 출력으로 가중치의 합으로서 나타나게 된다.

  • PDF

불균형 블랙박스 동영상 데이터에서 충돌 상황의 다중 분류를 위한 손실 함수 비교 (Comparison of Loss Function for Multi-Class Classification of Collision Events in Imbalanced Black-Box Video Data)

  • 이의상;한석민
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.49-54
    • /
    • 2024
  • 데이터 불균형은 분류 문제에서 흔히 마주치는 문제로, 데이터셋 내의 클래스간 샘플 수의 현저한 차이에서 기인한다. 이러한 데이터 불균형은 일반적으로 분류 모델에서 과적합, 과소적합, 성능 지표의 오해 등의 문제를 야기한다. 이를 해결하기 위한 방법으로는 Resampling, Augmentation, 규제 기법, 손실 함수 조정 등이 있다. 본 논문에서는 손실 함수 조정에 대해 다루며 특히, 불균형 문제를 가진 Multi-Class 블랙박스 동영상 데이터에서 여러 구성의 손실 함수(Cross Entropy, Balanced Cross Entropy, 두 가지 Focal Loss 설정: 𝛼 = 1 및 𝛼 = Balanced, Asymmetric Loss)의 성능을 I3D, R3D_18 모델을 활용하여 비교하였다.

오디오 정보를 이용한 골프 동영상 자동 색인 알고리즘 (Automatic Indexing Algorithm of Golf Video Using Audio Information)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.441-446
    • /
    • 2009
  • 본 논문에서는 오디오 정보 분석을 이용하여 골프 통영상을 자동 색인하는 알고리즘을 제안한다. 제안하는 알고리즘에서는 입력되는 골프 동영상을 비디오 신호와 오디오 신호로 분리한 후에, 연속적인 오디오 스트림을 Adaboost Cascade 분류방식을 통하여 스튜디오 환경에서의 아나운서의 음성구간, 선수이름이 TV 화면에 소개 될 때 수반되는 음악구간, 선수들의 플레이에 따라 반응하는 관중들의 박수 및 환호성 소리구간, 필드에서의 레포터의 음성구간, 바다나 바람 등의 필드환경 잡음 사운드구간 등의 5가지 구간으로 분류한다. 그리고 드라이브 샷, 아이런 샷과 퍼팅 샷 시에 발생하는 스윙 사운드는 onset 검출과 변조스펙트럼 검증 방법을 통해 검출되며, 관객의 박수 소리 구간과 결합하여 액션 및 하이라이트를 효율적으로 색인할 수 있게 한다. 제안된 알고리즘은 오디오 신호의 간단한 연산을 통해 의미를 지니고 있는 기본구조들을 검출하기 때문에 골프 동영상에서 사용자가 원하는 부분을 빠르게 브라우징하는 임베이디드 시스템에 적용가능하다.

효율적인 유해 동영상 탐지 시스템 (Efficient Pornographic Video Detection System)

  • 박정민;김상윤;김현정;원일용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.464-467
    • /
    • 2012
  • 본 연구는 유해 동영상을 자동으로 판단하는 시스템에 대한 것이다. 연속된 영상을 특정 Frame별로 나누어 유해 영상을 분류하는 방법을 제안하였다. 제안된 시스템의 정확성과 효율성을 검증하기 위해 다양한 영상과 상황에 대하여 실험 및 분석을 하였다. 실험 결과 제안된 시스템은 기존 연구에 비하여 시간과 효율성이 개선되었음을 보였다.

화재 탐지 영역의 이미지와 동영상 인식 사이 인공지능 모델 성능 비교 연구 (A Comparative Study on Artificial in Intelligence Model Performance between Image and Video Recognition in the Fire Detection Area)

  • 이정록;이대웅;정서현;정상
    • 한국재난정보학회 논문집
    • /
    • 제19권4호
    • /
    • pp.968-975
    • /
    • 2023
  • 연구목적: 화재 탐지시 불꽃/연기의 오탐지율이 높은 것을 확인하고 오탐지율을 낮추기 위해 화재 상황을 인식하여 분류하는 방법과 데이터셋을 제안하고자 한다. 연구방법: 동영상을 학습데이터로 활용하여 화재 상황의 특징을 추출하여 분류모델에 적용하고, 평가는 한국정보화진흥원(NIA)에서 진행하는 화재 데이터셋을 이용하여 Yolov8, Slowfast의 모델 성능을 비교 및 분석하였다. 연구결과: YOLO는 배경의 영향에 따라 탐지 성능이 민감하게 변화하며, 화재의 규모가 너무 크거나 작을 때에도 화재를 제대로 감지하지 못했다. SlowFast는 동영상의 시간 축을 같이 학습하기 때문에 비정형 객체에 대해 주변이 흐리거나 밝아 형상을 명확하게 유추할 수 없는 상황에서도 우수하게 화재를 탐지하는 것을 확인했다. 결론: 화재 탐지율은 이미지 데이터 방식보다는 동영상 기반의 인공지능 인식(Detection) 모델을 활용했을 때 더 적절했음을 확인했다.

동영상 카투닝 시스템을 위한 자동 프레임 추출 기법 (Auto Frame Extraction Method for Video Cartooning System)

  • 김대진;구떠올라
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.28-39
    • /
    • 2011
  • 멀티미디어 산업의 발달과 함께 디지털 콘텐츠 시장의 확산을 가져오고 있다. 그 중 인터넷 만화와 같은 디지털 만화 시장의 확장은 급속하게 커지고 있어서, 콘텐츠의 부족과 다양성 때문에 동영상 카투닝에 대한 연구가 계속되고 있다. 지금까지는 동영상 카투닝은 비사실적 렌더링과 말풍선에 초점이 맞추어졌으나, 이러한 것들을 적용하기 위해서는 카투닝 서비스에 적합한 프레임 추출이 우선시 되어야만 한다. 기존의 방법으로는 동영상의 장면전환이 일어나는 샷(shot)안의 프레임을 추출하여, 사용자가 지정한 영역을 임의의 색상으로 렌더링(Rendering)하는 시스템이 있다. 하지만 이러한 방법은 사람의 손을 거치는 반자동적인 방법으로서 정확한 프레임 추출을 위해 사람의 손을 거쳐야하는 단점이 있다. 따라서 본 논문에서는 이러한 문제점을 해결하고, 보다 정확한 카투닝에 적용할 프레임을 추출하기 위해 오디오 및 비디오 분리를 통한 방법을 제안한다. 먼저 동영상으로부터 오디오와 비디오를 분리한다. 오디오는 먼저 MFCC와 영교차율의 특징을 추출하고, 이 특징 정보를 미리 학습된 데이터와 GMM 분류기를 통하여 음악, 음성, 음악+음성으로 분류한 후 음성 영역을 설정한다. 비디오는 히스토그램을 이용한 방법과 같은 일반적인 장면전환 프레임을 추출 후 얼굴 검색을 통해서 만화에서 의미가 있는 프레임을 추출한다. 그 후 음성 영역내에 얼굴이 존재하는 장면전환 프레임이나 일정 시간동안 음성이 지속되는 영역 중 장면전환 프레임을 추출하여 동영상 카투닝에 적합한 프레임을 자동으로 추출한다.

실시간 아바타 표정 제어를 위한 SVM 기반 실시간 얼굴표정 인식 (SVM Based Facial Expression Recognition for Expression Control of an Avatar in Real Time)

  • 신기한;전준철;민경필
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.1057-1062
    • /
    • 2007
  • 얼굴표정 인식은 심리학 연구, 얼굴 애니메이션 합성, 로봇공학, HCI(Human Computer Interaction) 등 다양한 분야에서 중요성이 증가하고 있다. 얼굴표정은 사람의 감정 표현, 관심의 정도와 같은 사회적 상호작용에 있어서 중요한 정보를 제공한다. 얼굴표정 인식은 크게 정지영상을 이용한 방법과 동영상을 이용한 방법으로 나눌 수 있다. 정지영상을 이용할 경우에는 처리량이 적어 속도가 빠르다는 장점이 있지만 얼굴의 변화가 클 경우 매칭, 정합에 의한 인식이 어렵다는 단점이 있다. 동영상을 이용한 얼굴표정 인식 방법은 신경망, Optical Flow, HMM(Hidden Markov Models) 등의 방법을 이용하여 사용자의 표정 변화를 연속적으로 처리할 수 있어 실시간으로 컴퓨터와의 상호작용에 유용하다. 그러나 정지영상에 비해 처리량이 많고 학습이나 데이터베이스 구축을 위한 많은 데이터가 필요하다는 단점이 있다. 본 논문에서 제안하는 실시간 얼굴표정 인식 시스템은 얼굴영역 검출, 얼굴 특징 검출, 얼굴표정 분류, 아바타 제어의 네 가지 과정으로 구성된다. 웹캠을 통하여 입력된 얼굴영상에 대하여 정확한 얼굴영역을 검출하기 위하여 히스토그램 평활화와 참조 화이트(Reference White) 기법을 적용, HT 컬러모델과 PCA(Principle Component Analysis) 변환을 이용하여 얼굴영역을 검출한다. 검출된 얼굴영역에서 얼굴의 기하학적 정보를 이용하여 얼굴의 특징요소의 후보영역을 결정하고 각 특징점들에 대한 템플릿 매칭과 에지를 검출하여 얼굴표정 인식에 필요한 특징을 추출한다. 각각의 검출된 특징점들에 대하여 Optical Flow알고리즘을 적용한 움직임 정보로부터 특징 벡터를 획득한다. 이렇게 획득한 특징 벡터를 SVM(Support Vector Machine)을 이용하여 얼굴표정을 분류하였으며 추출된 얼굴의 특징에 의하여 인식된 얼굴표정을 아바타로 표현하였다.

  • PDF

개미 군락 시스템을 이용한 영역 분류 알고리즘 (A Classification Algorithm Using Ant Colony System)

  • 김인겸;윤민영
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.245-252
    • /
    • 2008
  • 본 연구에서는 개미 군락 시스템을 이용하여 디지털 영상의 영역을 분류하는 방법을 제안하였다. 개미 군락 시스템(Ant Colony System, ACS)은 조합 최적화 문제뿐 아니라 최근에는 영상처리 분야의 패턴 인식, 영상 추출, 에지 검색 등에 응용되고 있다. 디지털 영상처리에서 영역 분류는 영상 정보를 처리하는 분석 및 인식 분야에서 가장 중요한 단계중의 하나로 알려져 있으며, 잘 분류된 영역은 디지털 영상 부호화나 영상 분석 혹은 영상 인식과 같은 응용분야에서 더 좋은 결과를 얻을 수 있도록 해준다. 기존의 영상 처리에서의 영역 분류는 고정된 변수에 의하여 처리되어서 후처리 작업들이 필요하였으며 그 결과 또한 영상의 특성에 따라 변하였다. 그러나 본 연구에서는 개미의 무작위성을 이용함으로써 영상에 어느 정도의 변화가 발생하더라도 여전히 안정적인 결과를 얻을 수 있었다. 이러한 안정성과 유연성은 영상을 촬영하는 동안 발생할 수 있는 여러 종류의 잡음에 대하여 안정적인 상태를 유지할 수 있을 것이며 동영상내에서 급한 움직임에 의한 흐려짐에 대한 보상도 이루어 질 수 있을 것으로 기대한다.

한국소프트웨어진흥원 디지털뱅크 구축 사업

  • 유병배
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 국제컨퍼런스 디지털컨텐츠 활용을 통한 지식경영의 확산
    • /
    • pp.235-242
    • /
    • 1999
  • 멀티미디어 컨텐트 개발에 필수적인 3차원 모델, 2차원 이미지, 동영상, 특수음향 등의 개발재료를 체계적으로 분류ㆍ구축하여 국내 멀티미디어 개발업체에 양질의 제작물을 개발하는데 필수적인 재료를 저가에 공급함으로서 - 국내 개발업체의 개발경비 절감 및 개발시간 단축 (중략)

  • PDF