• Title/Summary/Keyword: Video Identification

검색결과 173건 처리시간 0.027초

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

딥 러닝을 이용한 실감형 콘텐츠 특징점 추출 및 식별 방법 (A Feature Point Extraction and Identification Technique for Immersive Contents Using Deep Learning)

  • 박병찬;장세영;유인재;이재청;김석윤;김영모
    • 전기전자학회논문지
    • /
    • 제24권2호
    • /
    • pp.529-535
    • /
    • 2020
  • 4차 산업의 주요 기술로 실감형 360도 영상 콘텐츠가 주목받고 있다. 전 세계 실감형 360도 영상 콘텐츠의 시장 규모는 2018년 67억 달러에서 2020년 약 700억 달러까지 증가될 것이라고 전망하고 있다. 하지만 대부분 실감형 360도 영상 콘텐츠가 웹하드, 토렌트 등의 불법 유통망을 통해 유통되고 있어 불법복제로 인한 피해가 증가하고 있다. 이러한 불법 유통을 막기 위하여 기존 2D 영상은 불법저작물 필터링 기술을 사용하고 있다. 그러나 초고화질을 지원하고 두 대 이상의 카메라를 통해 촬영된 영상을 하나의 영상에 담는 실감형 360도 영상 콘텐츠의 특징 때문에 왜곡 영역이 존재하여 기존 2D 영상에 적용된 기술을 그대로 사용하기엔 다소 무리가 있다. 또한, 초고화질에 따른 특징점 데이터량 증가와 이에 따른 처리 속도 문제와 같은 기술적 한계가 존재한다. 본 논문에서는 이러한 문제를 해결하기 위하여 왜곡이 심한 영역을 제외한 객체 식별 영역을 선정하고, 식별 영역에서 딥 러닝 기술을 이용하여 객체를 인식하고 인식된 객체의 정보를 이용하여 특징 벡터를 추출하는 특징점 추출 및 식별 방법을 제안한다. 제안한 방법은 기존에 제안 되었던 스티칭 영역을 이용한 실감형 콘텐츠 특징점 추출방법과 비교하여 성능의 우수성을 보였다.

모폴로지 필터링 기반 센서 패턴 노이즈를 이용한 디지털 동영상 획득 장치 판별 기술 (Digital Video Source Identification Using Sensor Pattern Noise with Morphology Filtering)

  • 이상형;김동현;오태우;김기범;이해연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권1호
    • /
    • pp.15-22
    • /
    • 2017
  • 인터넷 기술이 급속도로 발전함에 따라서 다양한 소셜 네트워크 서비스들이 나타나고 있다. 특히 스마트 기기들이 발전함에 따라서 소셜 네트워크 상에는 멀티미디어 콘텐츠가 넘쳐나고 있다. 그러나 불법적 목적을 가진 사용자에 의해 발생하는 범죄도 증가하면서 멀티미디어 포렌식을 이용한 콘텐츠 보호 및 불법 사용 차단의 필요성이 사회적으로 대두되고 있다. 본 논문에서는 멀티미디어 포렌식 기술의 하나로 디지털 동영상 획득 장치 판별을 위한 포렌식 기술을 제안한다. 먼저 모폴로지 필터링을 이용한 센서 패턴 노이즈 추출하는 방법을 제안한다. 이를 이용하여 참조 장치에서 촬영한 참조 동영상의 센서 패턴 노이즈를 추정하고, 검사 동영상에서 센서 패턴 노이즈를 추출한다. 그리고 두 센서 패턴 노이즈 사이의 유사성 계산을 통하여 검사 동영상이 참조 장치로 촬영을 했는지 판별을 수행한다. 제안한 기술의 성능 분석을 위하여 DSLR 카메라, 콤팩트 카메라, 캠코더, 액션캠 및 스마트폰 등을 포함한 총 30대의 장치에 대하여 개발한 알고리즘에 대한 정량적 성능 분석을 수행하였고, 그 결과 96%의 판별 정확도를 달성하였다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.

하이퍼맵 데이타베이스에 관한 연구 (A Study on Hypermap Database)

  • 김용일;편무욱
    • 대한공간정보학회지
    • /
    • 제4권1호
    • /
    • pp.43-55
    • /
    • 1996
  • 본 연구에서는 하이퍼맵의 주요 하부구조의 하나인 동영상을 GIS에 도입하는 과정에서 필요한 동영상지원 수치지도 데이타베이스의 구조에 대한 연구를 진행하였다. 이 데이타베이스는 도로상의 위치와 연결된 동영상의 출력 및 동영상에 표현된 각종 지형지물과 2차원 수치지도내의 지형지물을 연계가 가능하도록 설계하였다. 연구의 평가를 위해 실험용 GIS시스템을 제작하여 2차원 수치지도의 기능, 동영상과 도로선형의 연계 기능, 동영상 및 수치지도상의 지형지물의 상호연계기능 등을 검토한 결과, 본 연구에서 제안된 수치지도 데이타베이스 구조를 바탕으로 수치지도 도로선형과 지형지물 데이타 및 동영상을 기능적으로 통합하여 활용하는 것이 가능함을 알 수 있었다.

  • PDF

비디오 검색을 위한 얼굴 검출 및 인식 (Face Detection and Recognition for Video Retrieval)

  • 이슬람 모하마드 카이룰;이형진;폴 안잔 쿠마;백중환
    • 한국항행학회논문지
    • /
    • 제12권6호
    • /
    • pp.691-698
    • /
    • 2008
  • 본 논문에서는 비디오 검색을 위한 새로운 얼굴 검출 및 인식 방법을 제안한다. 인물 정함은 비디오 프레임에서 어떻게 얼굴을 정확하게 찾아내는가에 달려 있다. 얼굴 영역은 Adaboost 알고리즘으로 부스트된 viola-jones의 특징을 이용하여 비디오 프레임에서 검출한다. 얼굴 검출 후 조명 보정을 하고 PCA(Principal Component Analysis)로 특징점을 추출하고 SVM(Support Vector Machine)으로 사람의 신원을 분류한다. 실험 결과 제안한 방법이 정합율면에서 우수한 성능을 보였다.

  • PDF

IoT 시대 기업 내부 네트워크의 가시성 확보를 위한 단말 식별 시스템 설계 (Device Identification System for Corporate Internal Network Visibility in IoT Era)

  • 이대효;김용권;이동범;김협
    • 융합보안논문지
    • /
    • 제19권3호
    • /
    • pp.51-59
    • /
    • 2019
  • 본 논문에서는 사물인터넷(IoT) 시대의 안전한 기업 내부 네트워크 환경을 유지시키기 위하여 네트워크 가시성을 확보할 수 있는 단말 식별 시스템을 제안한다. 최근 기업 네트워크의 영역은 점점 더 넓어지고 복잡해지고 있다. 더 이상 데스크톱과 스마트폰뿐만 아니라 업무용 패드, 바코드스캐너, AP, Video Surveillance, 디지털 도어, 방범장치, 기타 IoT 장비 등 빠르게 증가하고 있으며, 이에 따라 보안위협 역시 증가하고 있다. 따라서 본 논문에서는 IoT 시대의 폭발적으로 증가하고 있는 단말을 식별할 수 있는 프로세스 및 모듈별 기능을 포함하는 단말 식별 시스템을 제안한다. 제안하는 시스템은 기업의 보안 관리자에게 다양한 단말의 정보 및 취약점 등을 제공하여 사내 네트워크에서 발생할 수 있는 잠재적인 사이버 위협뿐만 아니라 비즈니스 위협에 대응할 수 있는 종합적인 위협 관리 기능을 제공할 수 있다.

Telemedicine for Real-Time Multi-Consultation

  • Chun Hye J.;Youn HY;Yoo Sun K.
    • 대한의용생체공학회:의공학회지
    • /
    • 제26권5호
    • /
    • pp.301-307
    • /
    • 2005
  • We introduce a new multimedia telemedicine system which is called Telemedicine for Real-time Emergency Multi-consultation(TREM), based on multiple connection between medical specialists. Due to the subdivision of medical specialties, the existing one-to-one telemedicine system needs be modified to a simultaneous multi-consulting system. To facilitate the consultation the designed system includes following modules: high-quality video, video conferenceing, bio-signal transmission, and file transmission. In order to enhance the operability of the system in different network environment, we made it possible for the user to choose appropriate data acquisition sources of multimedia data and video resolutions. We have tested this system set up in three different places: emergency room, radiologist's office, and surgeon's office. All three communicating systems were successful in making connections with the multi-consultation center to exchange data simultaneously in real-time.

Automatic Name Line Detection for Person Indexing Based on Overlay Text

  • Lee, Sanghee;Ahn, Jungil;Jo, Kanghyun
    • Journal of Multimedia Information System
    • /
    • 제2권1호
    • /
    • pp.163-170
    • /
    • 2015
  • Many overlay texts are artificially superimposed on the broadcasting videos by humans. These texts provide additional information to the audiovisual content. Especially, the overlay text in news videos contains concise and direct description of the content. Therefore, it is most reliable clue for constructing a news video indexing system. To make the automatic person indexing of interview video in the TV news program, this paper proposes the method to only detect the name text line among the whole overlay texts in one frame. The experimental results on Korean television news videos show that the proposed framework efficiently detects the overlaid name text line.

휘도 마스킹과 DC Modulus 알고리즘을 이용한 비디오 워터마킹 (A Blind Video Watermarking Technique Using Luminance Masking and DC Modulus Algorithm)

  • 장용원;김인택;한승수
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권7호
    • /
    • pp.302-307
    • /
    • 2002
  • Digital watermarking is the technique, which embeds an invisible signal including signal including owner identification and copy control information into multimedia data such as audio, video, and images for copyright protection. A new MPEG watermark embedding algorithm using complex block effect based on the Human Visual System(HVS) is introduced in this paper. In this algorithm, $8{\times}8$ dark blocks are selected, and the watermark is embedded in the DC component of the discrete cosine transform(DCT) by using quantization and modulus calculation. This algorithm uses a blind watermark retrieval technique, which detects the embedded watermark without using the original image. The experimental results show that the proposed watermark technique is robust against MPEG coding, bitrate changes, and various GOP(Group of Picture) changes.