• 제목/요약/키워드: 비디오 데이터

검색결과 1,532건 처리시간 0.206초

컨볼루션 뉴럴 네트워크를 이용한 군중 행동 감지 (Crowd Behavior Detection using Convolutional Neural Network)

  • 와셈 울라;파트 우 민 울라;백성욱;이미영
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권6호
    • /
    • pp.7-14
    • /
    • 2019
  • 감시 영상에서 군중 행동의 자동 모니터링 및 감지는 보안, 안전 및 자산 보호와 같은 방대한 응용 프로그램으로 인해 컴퓨터 비전 분야에서 중요한 관심을 받고 있다. 또한 연구 커뮤니티에서 군중 분석 분야가 점차 증가하고 있다. 이를 위해서는 군중들의 행동을 감지하고 분석하는 것이 매우 필요하다. 본 논문에서는 스마트 시티에 설치된 감시 카메라의 비정상적인 활동을 감지하는 딥러닝 기반 방법을 제안하였다. 미세 조정된 VGG-16모델은 트레이닝된 공개적으로 사용 가능한 벤치마크 군중 데이터 셋을 실시간 스트리밍으로 테스트한다. CCTV카메라는 비디오 스트림을 캡쳐하는데, 비정상적인 활동이 감지되면 경보가 발생하여 추가 손실 전에 즉각적인 조치가 이루어지도록 가장 가까운 경찰서로 전송된다. 우리는 제안된 방법이 기존의 첨단 기술 보다 성능이 뛰어남을 실험으로 입증하였다.

소프트맥스를 이용한 딥러닝 음악장르 자동구분 투표 시스템 (Deep Learning Music genre automatic classification voting system using Softmax)

  • 배준;김장영
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.27-32
    • /
    • 2019
  • 인간이 가진 뛰어난 능력 중의 하나인 곡 분류 과정을 딥러닝 알고리즘을 통해 구현하는 연구는 단일데이터를 이용한 유니모달 모델, 멀티모달 모델, 뮤직비디오를 이용한 멀티모달 방식 등이 있다. 이 연구에서는 곡의 스펙트로그램을 짧은 샘플들로 분할하여 각각을 CNN으로 분석한 뒤 그 결과를 투표하는 시스템을 제안하여 더 좋은 결과를 얻었다. 딥러닝 알고리즘 중 CNN이 RNN에 비해 음악 장르 구분에 있어 우수한 성능을 보였으며 CNN과 RNN을 같이 적용했을 때 성능이 좋아짐을 알 수 있었다. 음악샘플을 나누어 각각의 CNN 결과를 투표하는 시스템이 이전 모델에 비해 좋은 결과를 나타내었고 이 모델에 Softmax 레이어를 추가한 모델이 가장 좋은 성능을 보였다. 디지털 미디어의 폭발적인 성장과 수많은 스트리밍 서비스 속에서 음악장르의 자동분류에 대한 필요는 점점 증가하고 있는 추세이다. 향후 연구에서는 미분류 곡의 비율을 낮추고 최종적으로 미분류된 곡들의 장르구분에 대한 알고리즘을 개발할 필요가 있을 것이다.

IVC 코덱을 위한 선택적 암호화 및 복호화 방법 (Selective Encryption and Decryption Method for IVC Codec)

  • 이민구;김규태;장의선
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.1013-1016
    • /
    • 2020
  • 본 논문에서는 IVC 비트스트림의 시작 코드(Start Code)를 이용한 선택적 암호화 및 복호화 방식을 제안한다. 비디오를 위한 기존의 암호화 방식은 크게 전역 암호화 알고리즘(Naive Encryption Algorithm, NEA)과 선택적 암호화 알고리즘(Selective Encryption Algorithm, SEA)의 2가지 방식으로 분류한다. NEA 방식은 비트스트림의 모든 데이터를 암호화 하기 때문에 보안성이 높지만 계산 복잡도 역시 높은 문제가 있다. SEA 방식은 비트스트림의 일부를 암호화 하여 암호화 속도를 NEA 방식에 비해 개선하였지만 상대적으로 보안성이 낮아지는 문제가 있다. 제안 방식은 IVC 비트스트림의 시작코드를 이용하여 기존 SEA 방식의 보안성을 높이면서 암호화 속도를 개선하였다. 실험 결과 제안 방식은 NEA 방식에 비하여 평균적으로 암호화 속도는 96%, 복호화 속도는 98% 줄일 수 있었다.

스마트TV 이용에 영향을 미치는 요인에 관한 연구 (An Exploratory Analysis of Contributors to Smart TV Usage)

  • 이선미
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.524-532
    • /
    • 2021
  • 방송통신융합 미디어인 스마트TV가 글로벌 시장에서 OTT 비디오 서비스를 주요 콘텐츠로 제공하면서 유료방송의 대안으로 부상했다. 한편 국내에서 스마트TV는 확산이 느려 연구가 거의 진행되지 않았다. 하지만 글로벌 스마트TV 성장이 국내에도 영향을 미칠 것으로 예측됨에 따라 스마트TV 이용자의 특성 및 이용행태 등에 대한 분석이 필요하다. 이에 이 연구는 미디어패널데이터를 활용하여 인구사회학적 특성 및 유료미디어 이용행태가 스마트TV이용에 미치는 영향을 탐색하였다. 연구결과 연령, 가구형태, 가구소득, 거주지역규모 등이 스마트TV 이용과 관련이 있었고, 유료플랫폼 중 IPTV 가입자가 스마트TV를 보완적으로 이용했으며, VOD 지출액이 클수록 스마트TV 이용가능성이 컸다. 영화VOD 지출액이 큰 IPTV 가입자는 스마트TV로 대체할 가능성이 낮았다. 이 연구는 소홀했던 스마트TV에 대한 연구를 재점화하고 사업자들에게 전략적 시사점을 제공하는데 활용될 수 있을 것이다.

컴퓨팅 사고기반 융합 수업모델 개발 (Developing a Learning Model based on Computational Thinking)

  • 유정수;장용우
    • 산업융합연구
    • /
    • 제20권2호
    • /
    • pp.29-36
    • /
    • 2022
  • 디지털 사회를 위한 AI와 빅데이터 시대의 컴퓨팅 사고는 컴퓨터가 실행할 수 있는 방식으로 우리가 해결하고자 하는 문제와 솔루션을 표현하는 일련의 문제해결 방법을 의미한다. 컴퓨팅 사고는 컴퓨터 과학의 기본 개념을 도출함으로써 문제를 해결하고 시스템을 설계하고 인간의 행동을 이해하는 것으로, 학생들에게는 어려운 문제와 애매한 퍼즐을 맞추는 접근법이다. 본 논문에서 우리는 컴퓨팅 사고를 댄스 동작과 융합하여 학생들이 문제를 해결할 수 있는 수업 모델을 개발하였다. 개발된 수업 모델을 가지고 ◯◯대학교 1학년 예비교원 93명을 대상으로 1학기 동안 수업한 결과, 수업 참가자들은 비디오 수준의 만족스러운 알고리즘을 만들어 냈다. 또한, 제안된 모델이 수업 참여 학생들의 컴퓨팅 사고 이해에 크게 기여함을 알 수 있었다.

A Study on Implementation of Motion Graphics Virtual Camera with AR Core

  • Jung, Jin-Bum;Lee, Jae-Soo;Lee, Seung-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.85-90
    • /
    • 2022
  • 본 연구는 실제 카메라의 움직임과 동일한 가상 카메라의 움직임을 구현하기 위해 전통적인 모션그래픽 제작 방법이 가지고 있는 소요시간과 비용에 대한 단점을 줄이기 위해 AR Core 기반의 모바일 디바이스 실시간 트래킹 데이터를 이용하여 모션그래픽 가상카메라를 생성하는 방법을 제안했다. 제안하는 방법은 촬영 이후 저장된 비디오 파일에서의 트래킹 작업을 간소화하고, 촬영 단계에서 트래킹 성공 유무를 판단하기 위해 AR Core 기반 모바일 디바이스에서 촬영과 동시에 진행하는 방법이다. 실험결과 전통적인 방법과 비교하였을 때 모션그래픽 결과 이미지의 차이는 없었으나 300프레임(frame) 영상 기준 6분 10초의 시간이 소모된 반면에 제안한 방법은 이 단계를 생략할 수 있어 매우 높은 시간적 효율성을 갖는다. 현재 가상 증강 현실을 이용한 영상제작에 대한 관심과 다양한 연구가 진행되고 있는 시점에서 본 연구는 가상 카메라 생성과 매치 무빙 등에서 활용될 있을 것이다.

비전 트랜스포머 성능향상을 위한 이중 구조 셀프 어텐션 (A Dual-Structured Self-Attention for improving the Performance of Vision Transformers)

  • 이광엽;문환희;박태룡
    • 전기전자학회논문지
    • /
    • 제27권3호
    • /
    • pp.251-257
    • /
    • 2023
  • 본 논문에서는 비전 트랜스포머의 셀프 어텐션이 갖는 지역적 특징 부족을 개선하는 이중 구조 셀프 어텐션 방법을 제안한다. 객체 분류, 객체 분할, 비디오 영상 인식에서 합성곱 신경망보다 연산 효율성이 높은 비전 트랜스포머는 상대적으로 지역적 특징 추출능력이 부족하다. 이 문제를 해결하기 위해 윈도우 또는 쉬프트 윈도우를 기반으로 하는 연구가 많이 이루어지고 있으나 이러한 방법은 여러 단계의 인코더를 사용하여 연산 복잡도의 증가로 셀프 어텐션 기반 트랜스포머의 장점이 약화 된다. 본 논문에서는 기존의 방법보다 locality inductive bias 향상을 위해 self-attention과 neighborhood network를 이용하여 이중 구조 셀프 어텐션을 제안한다. 지역적 컨텍스트 정보 추출을 위한 neighborhood network은 윈도우 구조보다 훨씬 단순한 연산 복잡도를 제공한다. 제안된 이중 구조 셀프 어텐션 트랜스포머와 기존의 트랜스포머의 성능 비교를 위해 CIFAR-10과 CIFAR-100을 학습 데이터를 사용하였으며 실험결과 Top-1 정확도에서 각각 0.63%과 1.57% 성능이 개선되었다.

대용량 플래시 메모리를 위한 임베디드 텍스트 인덱스 시스템 (An Embedded Text Index System for Mass Flash Memory)

  • 윤상훈;조행래
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-10
    • /
    • 2009
  • 플래시 메모리는 비휘발성이고 저전력으로 동작하며 가볍고 내구성이 강하다. 이러한 특성으로 휴대용 멀티미디어 재생기(PMP)와 같은 모바일 컴퓨팅 환경에서의 저장 장치로 많이 사용되고 있다. 대용량의 플래시 메모리를 저장 장치로 가진 모바일 기기들은 비디오/오디오/사진등과 같은 다양한 종류의 멀티미디어 데이터를 저장하고 재생한다. 모바일 컴퓨팅 장치를 위한 기존의 인덱스 시스템은 노래 가사와 같은 텍스트 형태의 정보 검색에 비효육적이다. 본 논문에서는 대용량 플래시 메모리 기반 임베디드 텍스트 인덱스(Embedded Text Index: EMTEX) 시스템을 제안한다. EMTEX는 먼저 임베디드 시스템을 고려한 압축 알고리즘을 사용하며, 텍스트 인덱스가 구성된 필드에 삽입 및 삭제시 인덱스에 즉시 반영된다. 뿐만 아니라, 플래시 메모리의 특성을 고려한 효율적인 삽입, 삭제, 재구성 기능을 수행하며, DBMS의 상위 계층에서 독립적으로 동작한다는 장점을 갖는다. 제안한 시스템의 성능 평가를 위해 다양한 환경에서 실험을 수행하였다. 그 결과 EMTEX는 임베디드 환경에서 Oracle Text나 FT3와 같은 기존의 인덱스 시스템보다 더 좋은 성능을 보여주었다.

디지털 콘텐츠 이용이 스마트TV 이용에 미치는 영향 연구 (An Analysis of the Impact of Digital Content Usage on Smart TV Usage)

  • 이선미
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.319-326
    • /
    • 2022
  • OTT(over-the-top) 비디오 서비스가 성장하면서 스마트TV가 동반 성장 중이다. 이 연구는 간접 네트워크 효과와 보완 이론을 적용하여 디지털 콘텐츠 이용과 스마트TV 이용 간의 관계를 탐색했다. 전국 대상 설문조사를 실시한 한국미디어패널데이터를 활용하여 디지털 콘텐츠 이용(OTT 이용여부/이용량/유형별 이용, 온라인 게임/음악/교육/뉴스 서비스 이용)이 스마트TV 이용에 미치는 영향을 분석했다. 연구결과 OTT 이용자일수록, OTT 이용시간이 많을수록 스마트TV를 이용했으며, 유료OTT단독가입, 유료OTT복수가입, 무료OTT 이용자들이 OTT 비이용자 대비 스마트TV를 이용했다. 온라인 서비스 중에서 교육서비스 이용은 스마트TV 이용과 정(+)의 관계가, 뉴스 이용은 부(-)의 관계가 있었다. 이 연구결과로 디지털 콘텐츠의 다양성과 이용증대가 스마트TV의 수요를 증대시킨다는 간접 네트워크 효과 이론이 지지되었으며, OTT 이용자가 대형 TV화면을 이용하면서 OTT와 스마트TV간 보완관계가 형성된다는 보완이론이 지지되었다.

Utilizing Context of Object Regions for Robust Visual Tracking

  • Janghoon Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.79-86
    • /
    • 2024
  • 본 논문에서는 단일 영역 정보만을 활용하는 기존의 방법론을 개선하기 위해, 물체의 맥락영역에 대한 정보를 함께 물체 추적에 활용하는 새로운 기법을 제시한다. 기존의 방법론들은 모든 후보 영역들을 독립적으로 처리하는 구조로, 비슷한 외양의 영역들이 등장하는 경우 이를 성공적으로 구분하지 못하는 문제점을 보여주었다. 이는 주어진 장면 내에 등장하는 모든 후보 물체 영역들에 대한 맥락 정보를 고려하지 못하여 생기는 문제이다. 제안하는 방법론에서는 비슷한 외양의 영역들 간의 특징점 정보 교환을 보조하고 이들 간의 구별성을 높이는 것을 목표로 하였다. 이를 구현하기 위해 MLP-믹서 (MLP-Mixer) 모델을 활용하여 맥락영역 간의 정보 교환을 모델링하는 모듈을 제시하였다. 이를 통해 구현된 특징점 채널별, 영역간의 상호작용 연산은 영역의 개별 특징점 표현에 대해 장면 맥락 정보가 내장될 수 있도록 보조한다. 제안한 방법론의 성능을 평가하기 위해 대규모 물체 추적 데이터셋인 LaSOT을 사용하였고, 성능 평가 결과 제안한 알고리즘은 AUC 지표 기준 0.560의 높은 성능과 함께 65fps의 실시간 속도로 동작함을 확인하였다.