• 제목/요약/키워드: 프레임 분류

검색결과 547건 처리시간 0.033초

MPEG 부호화 영역에서 Video Genre 자동 분류 방법 (Automatic Video Genre Classification Method in MPEG compressed domain)

  • 김태희;이웅희;정동석
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.836-845
    • /
    • 2002
  • Video Summary는 길이가 긴 Video를 고속으로 효율적으로 열람할 수 있도록 하는 도구의 하나이다. Video Summary는 대표 프레임(Key-frame)들의 집합으로 볼 수 있는데 대표 프레임은 Video의 Genre에 따라서 달리 정의 및 생성될 수 있다. 즉 모든 Genre의 Video에 대해서 획일적인 방법으로 Summary를 만드는 것은 적절하지 못한 결과를 초래할 수 있다. Video의 Genre를 구별해내는 기술은 위와 같이 효율적인 Video Summary 생성에 유용한 처리 과정이라 할 수 있다. 본 논문에서는 이와 같이 효율적 Video 관리를 위해 MPEG 부호화 영역에서 MPEG Video의 Genre를 분류하는 방법을 제안한다. 제안된 방법은 프레임을 복호하지 않고 비트스트림을 직접 처리하여 기존 방법들에 비해 계산이 비교적 단순하고 처리시간을 단축시키는 장점을 가지고 있다. 또한 제안된 방법은 대부분의 작업을 시각 정보만을 이용하여 수행하며 이 정보들의 시, 공간적 해석을 통해 Genre를 확인하게 된다. 실험은 만화(Cartoon), 광고(Commercial), Music Video, 뉴스, Sports, Talk Show의 6개 Genre Video에 대하여 실행하였다. 실험 결과, 구조가 명확한 Talk Show와 Sports의 경우 90% 이상의 결과를 얻었다.

시설물의 유지관리를 위한 기계학습 기반 콘크리트 균열 감지 프레임워크 (Machine Learning-based Concrete Crack Detection Framework for Facility Maintenance)

  • 지봉준
    • 한국지반환경공학회 논문집
    • /
    • 제22권10호
    • /
    • pp.5-12
    • /
    • 2021
  • 시설물의 노후화는 피할 수 없는 현상이다. 노후화된 시설물의 관리를 위해 균열을 감지하고 이를 추적하면서 시설물의 상태를 간접적으로 추론할 수 있다. 따라서 균열 감지는 노후화된 시설물의 관리를 위해 필수적 역할을 하며 감지 결과를 바탕으로 더 이상의 노후화를 막기 위한 활동을 할 수 있다. 하지만, 현재 대부분의 균열 감지는 전문가의 판단에만 의존하기에 시설물의 면적이 큰 경우 비용과 시간이 과도하게 사용되고, 전문가의 역량에 따라 다른 판단 결과가 발생할 수 있어 신뢰성에 문제가 있었다. 본 논문에서는 이러한 한계를 극복하기 위해 기계학습 기반의 콘크리트 균열 감지 프레임워크를 제안한다. 제안된 프레임워크는 데이터 분류, 기계학습 모델 학습, 학습된 모델의 검증과 테스트를 포함하는 프레임워크로 완전 자동화된 콘크리트 균열 감지가 가능하다. 제안된 프레임워크를 통해 학습된 기계학습 모델은 콘크리트 균열 이미지와 정상 이미지를 96%의 높은 정확도로 분류할 수 있었다. 본 논문에서 제안된 프레임워크를 적용하여 기존의 전문가 중심의 시설물 유지관리보다 더욱 효과적이고 효율적인 시설물의 유지관리가 가능할 것으로 기대된다.

Tensorflow를 이용한 애완동물 영상 세부 분류 (Fine grained recognition on a species of animal from image using Tensorflow)

  • 김지혜
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.684-685
    • /
    • 2020
  • 영상의 세부 분류 인식에 대한 연구는 계속적으로 발전하고 있지만, 다형성의 성질을 갖는 동물에 대한 객체인식 연구는 더디게 진행되고 있다. 본 논문은 개와 고양이에 해당하는 애완동물 이미지만을 이용하여, 세부 분류인 동물의 종을 분류하는 것을 목표로 한다. 이를 위해 본 논문에서는 기계학습으로 여러 분야에서 좋은 성과를 얻고 있는 딥러닝을 이용하였으며, 그 중에서도 이미지 인식 분야에서 뛰어난 성능을 보인 Convolutional Neural Network(CNN)과 구글에서 제공하는 오픈소스 기반 딥러닝 프레임워크인 Tensorflow를 활용하였다. 제안하는 방법에 대해 37종의 애완동물 이미지, 총 7390장에 대하여 학습 및 실험하여 그 효과를 검증하였다.

  • PDF

비디오 코딩을 위한 빠른 블록 모션 추정 방법 (A Fast Block Motion Estimation Algorithm for Video Coding)

  • 이연철;김은이;김항준
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.177-180
    • /
    • 2001
  • 본 논문에서는 비디오 코딩을 위한 빠른 움직임 추정(motion estimation) 방법을 제안한다. 계산량을 줄이기 위해서, 제안된 움직임 추정 알고리즘은 블록 당 탐색 점(searching point)의 수를 줄이는 대신에 프레임 당 탐색 블록(searching block)의 수를 줄임으로써 실행되어진다. 이를 위해서, 연속된 두 프레임간의 시간적인 상관관계(temporal correlation)를 통해 현재 프레임에 있는 모든 블록들을 움직임 블록(moving block)과 배경 블록(background block)으로 분류되어진다. 잘 알려진 비디오 영상들에게서 실험한 결과들을 통해 제안된 방법이 상당히 정확한 움직임 벡터(motion vector)들 뿐만 아니라 계산적인 효율성을 향상할 수 있음을 볼 수 있다.

  • PDF

화소 밝기와 객체 이동을 이용한 비디오 샷 경계 탐지 알고리즘 (Shot Boundary Detection Algorithm by Compensating Pixel Brightness and Object Movement)

  • 이준구;한기선;유병문;황두성
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.35-42
    • /
    • 2013
  • 비디오 데이터를 효율적으로 검색, 정렬, 탐색, 분류하기 위해서는 프레임 간의 샷 전환 탐지가 선행되어야 한다. 프레임 간 화소 밝기와 객체 이동은 높은 탐지율을 보장하는 샷 탐지 알고리즘이 극복해야할 문제이다. 본 논문에서는 프레임의 블록화 및 객체의 이동과 프레임의 밝기를 고려하는 샷 탐지 방법을 제안한다. 먼저 연속하는 두 프레임 사이에서 발생할 수 있는 객체의 이동을 고려하여 계산된 히스토그램과 밝기 차이를 반영하는 모폴러지 팽창 연산을 이용하는 알고리즘을 제안한다. 다음으로 화소 밝기 차를 보상한 프레임 블록의 화소정보와 프레임의 전역적인 밝기 히스토그램의 변화를 함께 이용하는 샷 탐지 방법을 제안한다. 제안된 방법들은 국가기록원 소장 비디오 데이터에 대한 실험에서 화소 또는 히스토그램 기반 알고리즘에 비해 높은 샷 탐지율을 보였다.

A Development Method of Framework for Collecting, Extracting, and Classifying Social Contents

  • Cho, Eun-Sook
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.163-170
    • /
    • 2021
  • 빅데이터가 여러 분야에서 다양하게 접목됨에 따라 빅데이터 시장이 하드웨어로부터 시작해서 서비스 소프트웨어 부문으로 확장되고 있다. 특히 빅데이터 의미 파악 및 이해 능력, 분석 결과 등 총체적이고 직관적인 시각화를 위하여 애플리케이션을 제공하는 거대 플랫폼 시장으로 확대되고 있다. 그 중에서 SNS(Social Network Service) 등과 같은 소셜 미디어를 활용한 빅데이터 추출 및 분석에 대한 수요가 기업 뿐만 아니라 개인에 이르기까지 매우 활발히 진행되고 있다. 그러나 이처럼 사용자 트렌드 분석과 마케팅을 위한 소셜 미디어 데이터의 수집 및 분석에 대한 많은 수요에도 불구하고, 다양한 소셜 미디어 서비스 인터페이스의 이질성으로 인한 동적 연동의 어려움과 소프트웨어 플랫폼 구축 및 운영의 복잡성을 해결하기 위한 연구가 미흡한 상태이다. 따라서 본 논문에서는 소셜 미디어 데이터의 수집에서 추출 및 분류에 이르는 과정을 하나로 통합하여 운영할 수 있는 프레임워크를 개발하는 방법에 대해 제시한다. 제시된 프레임워크는 이질적인 소셜 미디어 데이터 수집 채널의 문제를 어댑터 패턴을 통해 해결하고, 의미 연관성 기반 추출 기법과 주제 연관성 기반 분류 기법을 통해 소셜 토픽 추출과 분류의 정확성을 높였다.

CNN 기반의 모델 학습을 통한 관계 분류 모델 : AI 기반의 셀프사진관 포즈 추천 프레임워크 (Relationship classification model through CNN-based model learning: AI-based Self-photo Studio Pose Recommendation Frameworks)

  • 백강민;한연지
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.951-952
    • /
    • 2023
  • 소위 '인생네컷'이라 불리는 셀프사진관은 MZ 세대의 새로운 놀이 문화로 떠오르며 사용자 수가 나날이 증가하고 있다. 그러나 짧은 시간 내에 다양한 포즈를 취해야 하는 셀프사진관 특성상 촬영이 낯선 사람에게는 여전히 진입장벽이 존재한다. 더불어 매번 비슷한 포즈와 사진 결과물에 기존 사용자는 점차 흥미를 잃어가는 문제점도 발생하고 있다. 이에 본 연구에서는 셀프사진관 사용자의 관계를 분류하는 모델을 개발하여 관계에 따른 적합하고 다양한 포즈를 추천하는 프레임워크를 제안한다. 사용자의 관계를 'couple', 'family', 'female_friend', 'female_solo', 'male_friend', 'male_solo' 총 6 개로 구분하였고 실제 현장과 유사하도록 단색 배경의 이미지를 우선으로 학습 데이터를 수집하여 모델의 성능을 높였다. 모델 학습 단계에서는 모델의 성능을 높이기 위해 여러 CNN 기반의 모델을 전이학습하여 각각의 정확도를 비교하였다. 결과적으로 195 장의 test_set 에서 accuracy 0.91 의 성능 평가를 얻었다. 본 연구는 객체 인식보다 객체 간의 관계를 학습시켜 관계성을 추론하고자 하는 것을 목적으로, 연구 결과가 희박한 관계 분류에 대한 주제를 직접 연구하여 추후의 방향성이나 방법론과 같은 초석을 제안할 수 있다. 또한 관계 분류 모델을 CCTV 에 활용하여 미아 방지 혹은 추적과 구조 등에 활용하여 국가 치안을 한층 높이는 데 기대할 수 있다.

동영상의 컬러 및 에지 정보에 기초한 shape 영역 segmentation 기법 연구 (Shape region segmentation based on color and edge characteristics of moving images)

  • 박진남;이재덕;윤성수;허영;정성환
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.149-154
    • /
    • 2001
  • 멀티미디어 정보표현 기술인 MPEG-7 표준이 빠른 속도의 진전을 보임에 따라 이를 활용한 검색 기술 개발도 활발히 진행 중에 있다 방대한 량의 동영상 내용 검색 기술 연구에 있어서 우선적으로 고려되어야 할 부분이 내용이 연속되는 프레임들의 분류이다. 이를 위해서는 물리적인 장면전환이 이루어지는 부분에 대한 실시간 자동 cut detection 기술 및 이 컷 프레임 영상에 대한 내용 기술을 자동적으로 수행할 필요성이 있다. 각 컷 프레임의 자동 내용 기술의 전처리로써 본 논문에서는 장면전환이 생기는 프레임의 영상의 어떠한 정보도 사전 정보로 취하지 않고 사용자의 개입이 없는 상황에서 영상의 컬러 특성 및 에지 정보만을 가지고 shape 영역 segmentation을 자동으로 실행하는 방법을 제안한다. 제안한 방법의 성능은 segmentation된 영상과 원 영상과의 영역비교를 통한 유사도에 의해 평가하며, 시뮬레이션 결과에서 제안한 알고리즘은 평균 90%이상의 영역 분할이 정확하게 됨을 알 수 있었고, 컬러의 구분이 명확하지 않은 자연영상에서도 robust한 segmentation 결과를 나타냄을 본 연구를 통하여 알 수 있었다.

  • PDF

앵커 객체 추출을 이용한 앵커 프레임 검출 (Anchor Frame Detection Using Anchor Object Extraction)

  • 박기태;황두선;문영식
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.17-24
    • /
    • 2006
  • 본 논문에서는 뉴스 비디오에서 앵커 프레임 검출을 위한 알고리즘을 제안한다. 제안된 알고리즘은 다음과 같이 4단계로 구성된다. 첫 번째 단계에서, 뉴스 비디오를 비디오 샷들로 분할하기 위해 누적 히스토그램(cumulative histogram) 기법을 이용하여 샷 경계(shot boundary)를 검출한다. 두 번째 단계에서는 각 비디오 샷 경계에서 얼굴 영역들을 찾기 위해서 피부 컬러(skin color) 정보를 이용하고, 세 번째 단계에서는, 앵커 객체를 추출하기 위해서 사람의 상체 부분의 컬러 정보를 이용하여 앵커 후보 프레임을 검출하며, 마지막 단계에서, 후보 프레임들에 대해서 앵커 프레임과 비앵커 프레임을 분류하기 위해서 그래프 이론을 이용한 클러스터 분석 알고리즘을 적용한다. 실험 결과를 통해서 제안한 알고리즘이 효과적으로 앵커 프레임을 검출하는 것을 보여준다.

퓨리에 형태표현자와 SVM 을 이용한 U87 세포의 형태학적 분류기 모델구축 (Binary Classifier Construction for U87 Cell Shapes using Fourier Shape Descriptor and SVM)

  • 강미선;김정식;김명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.751-753
    • /
    • 2010
  • 본 논문에서는 위상차 현미경 영상 내 U87 세포의 정확한 형태학적 분류를 위한 이진 분류기 구축 방법을 제안한다. 본 방법은 Fourier descriptor 기반 세포형상 표현을 SVM 이진분류기 구축에 사용함으로써 분류 대상인 원추형과 원형세포에 대해 영상 내 세포의 위치와 회전, 크기의 변화에 대해 강인한 분류성능을 제공한다. 본 실험을 통해 polynomial 커널에서 학습된 SVM 분류기가 linear, RBF, sigmoid 에 비교하여 가장 정확한 분류 성능을 보임을 확인하였다. 본 연구는 논문상 기준인 두 종류의 세포 형태 분류기를 기반 프레임워크로 삼아 좀더 다양한 세포 형태를 분류할 수 있도록 개선된다면 악성뇌종양의 전이억제치료에 효과적인 전이행동분석에 도움을 줄 수 있을 것으로 기대된다.