• 제목/요약/키워드: 비디오 이해

검색결과 146건 처리시간 0.026초

수학영재 수업 사례분석 (A Case Study on Instruction for Mathematically Gifted Children)

  • 박광순
    • 영재교육연구
    • /
    • 제20권3호
    • /
    • pp.655-679
    • /
    • 2010
  • 본 연구는 수학영재교육 담당교사의 교수학습 전문성 향상을 위해 수학영재 수업 사례를 주로 Flanders 언어 상호작용 분석법과 TIMSS 비디오 분석법을 이용하여 분석하고 이를 통해 수학영재 수업을 어떻게 해야 하는 것인가에 대한 시사점을 주고자 시작되었다. 본 연구를 통하여 수학영재교육 담당교사의 영재수업 질적 제고 방안에 대한 심층적인 이해와 반성적 성찰의 계기가 되어 더 나은 교사로서의 삶을 계획하고 영재수업 전문가로서 발돋움하는 기회가 되었으면 한다.

온라인 행동 탐지 기술 동향 (Trends in Online Action Detection in Streaming Videos)

  • 문진영;김형일;이용주
    • 전자통신동향분석
    • /
    • 제36권2호
    • /
    • pp.75-82
    • /
    • 2021
  • Online action detection (OAD) in a streaming video is an attractive research area that has aroused interest lately. Although most studies for action understanding have considered action recognition in well-trimmed videos and offline temporal action detection in untrimmed videos, online action detection methods are required to monitor action occurrences in streaming videos. OAD predicts action probabilities for a current frame or frame sequence using a fixed-sized video segment, including past and current frames. In this article, we discuss deep learning-based OAD models. In addition, we investigated OAD evaluation methodologies, including benchmark datasets and performance measures, and compared the performances of the presented OAD models.

심층 네트워크의 과계산 문제에 대한 고찰 (A study on the Problems of Overcomputation in Deep Networks)

  • 박다솔;손정우;김선중;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.120-124
    • /
    • 2019
  • 딥러닝은 자연어처리, 이미지 처리, 음성인식 등에서 우수한 성능을 보이고 있다. 그렇지만 복잡한 인공신경망 내부에서 어떠한 동작이 일어나는지 검증하지 못하고 있다. 본 논문에서는 비디오 캡셔닝 분야에서 인공신경망 내부에서 어떠한 동작이 이루어지는지 검사한다. 이를 위해서 우리는 각 단계에서 출력층을 추가하였다. 출력된 결과를 검토하여 인공 신경망의 정상동작 여부를 검증한다. 우리는 한국어 MSR-VTT에 적용하여 우리의 방법을 평가하였다. 이러한 방법을 통해 인공 신경망의 동작을 이해하는데 도움을 줄 수 있을 것으로 기대된다.

  • PDF

이동 객체의 효과적 표현을 위한 시맨틱 어노테이션 방법 (A Semantic Annotation Method for Efficient Representation of Moving Objects)

  • 이진활;홍명덕;이기성;정진국;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.67-76
    • /
    • 2011
  • 최근 비디오가 대화형 콘텐츠를 위한 타입으로 많은 각광을 받기 시작하면서 비디오 데이터에 포함된 객체들을 의미적으로 표현하고 검색하기 위한 시맨틱 어노테이션 방법에 대한 연구가 활발히 진행되고 있다. 비디오 데이터에 포함된 객체들은 시간의 변화에 따라 공간적 위치가 변화하기 때문에 매 프레임마다 상이한 위치 데이터가 발생한다. 따라서 모든 프레임의 객체에 대한 위치 데이터들을 저장하는 것은 매우 비효율적이므로 이를 부적절한 오차가 발생하지 않는 범위 내에서, 효과적으로 압축하여 표현할 필요가 있다. 본 논문은 컴퓨터 또는 에이전트가 직관적으로 객체에 대한 정보를 이해할 수 있도록 표현하기 위해 비디오 데이터가 포함하는 객체에 대하여 의미적 정보를 부여하기 위한 온톨로지 모델링 방법과 이동 객체의 위치 데이터를 압축하기 위해 3차 스플라인 보간법을 적용하여 의미적 정보와 함께 어노테이션 하는 방법을 제안한다. 제안한 어노테이션 방법의 효율을 검증하기 위한 대화형 비디오 시스템을 구현하고, 다양한 특징을 가지는 객체가 나타나는 비디오 데이터 셋을 이용하여 샘플링 간격에 따른 오차율과 데이터량을 비교하였다. 그 결과, 샘플링 간격이 15프레임 이하 일 때, 최대 80%의 데이터 저장 공간을 절약할 수 있을 뿐만 아니라 객체의 실제 좌표 대비 최대 31픽셀, 평균 4픽셀 미만의 오차 편차를 얻을 수 있었다.

제로기반 코드 변조 기법을 통한 비디오 핑거프린팅 시스템 (Video Fingerprinting System through Zero-based Code Modulation Technique)

  • 최선영;이해연;강인구;이흥규
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.443-450
    • /
    • 2005
  • 디지털 핑거프린팅은 워터마킹 기술에 기반한 콘텐츠 보호 기술로 디지털 콘텐츠에 구매자의 정보인 핑거프린트를 삽입하는 기술을 말한다. 콘텐츠 안에 삽입된 핑거프린트 정보는 다양한 공격을 받게 된다. 특히 동일한 콘텐츠 안에 서로 다른 구매자의 정보를 넣게 되는 핑거프린팅의 특성으로 인해 공모 공격이 가능하고, 그 중 평균화 공격은 빠르고 효과적인 공모 공격에 해당한다. 본 논문에서는 평균화 공격에 강인한 비디오 핑거프린팅 시스템을 제안한다. 공모 공격 후에도 특정 위치의 코드 값이 원래의 값을 유지할 수 있는 공모 방지 코드를 적용하였다. 또한 사용자의 수가 늘어남에 따라 핑거프린트 코드의 길이가 증가하는데 이와 같은 코드의 효율적인 삽입 및 검출을 위해 제로기반 코드 변조 기법을 적용함으로써 올바른 공모자 추적이 가능하도록 하였다. 제안한 방식을 사용하여 원본 비디오를 사용하지 않는 비디오 핑거프린팅 시스템을 구현하였고, 다양한 공모자의 수에 따른 실험을 수행하였다. 실험 결과에 따르면 대부분의 경우 공모자를 올바르게 추출할 수 있었고, 최소 한 명 이상의 공모자를 성공적으로 검출할 수 있었다.

5G 코어 네트워크 진화 방향

  • 조창길
    • 정보와 통신
    • /
    • 제33권6호
    • /
    • pp.27-32
    • /
    • 2016
  • 본고에서는 5G 포럼 네트워크 위원회에서 진행하고 있는 기술백서의 내용을 중심으로 5G 네트워크에 대한 고찰을 통해서 다가올 5G 네트워크에 대한 진화를 예측해 보고자 한다. 5G, 즉 IMT-2020은 홀로그램, 8K UHD와 같은 진화된 비디오 서비스를 안정적으로 사용하기 위하여 기존 대비 20배 증가된 20Gbps의 최고 전송 속도, 기존 대비 10배 향상된 100Mbps 이상의 이용자 체감 전송 속도 제공을 기본 목표로 하고 있다. 이런 5G 네트워크의 요구 사항을 기능, 구조, 운영 관점에서 살펴보고, 코어네트워크에서 필요한 요구 사항과 고려되고 있는 기술에 대한 고찰을 통해 5G에서의 코어 네트워크에 대한 이해를 돕고자 한다.

청각장애인을 위한 지상파 UHD 기반 감정표현 자막 수신 시스템 설계 (Design of Emotion Subtitles System based on Terrestrial UHD TV for the Hearing-Impaired)

  • 송진혁;배병준;조숙희;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.135-136
    • /
    • 2021
  • 최근 지상파 UHD 방송에서는 자막을 비디오 패킷에 삽입하여 전달하는 기존 방식이 아닌 별도의 전송로로 전달하는 폐쇄형 자막(closed caption) 방식을 적용하고 있다. 또한 자막에는 문자 뿐만 아니라 이미지까지 포함하여 청각장애인의 프로그램 이해도를 높이는데 활용할 수 있다. 따라서 본 논문에서는 청각장애 시청자가 방송 콘텐츠 내용의 이해도를 향상시키기 위하여 지상파 UHD 방송에서 기존의 문자 자막과 움직이는 이미지 자막(=감정표현 자막)을 수신하여 동시에 표현할 수 있는 수신시스템을 제안한다.

  • PDF

비디오 시각적 관계 이해 기술 동향 (Trends in Video Visual Relationship Understanding)

  • 권용진;김대회;김종희;오성찬;함제석;문진영
    • 전자통신동향분석
    • /
    • 제38권6호
    • /
    • pp.12-21
    • /
    • 2023
  • Visual relationship understanding in computer vision allows to recognize meaningful relationships between objects in a scene. This technology enables the extraction of representative information within visual content. We discuss the technology of visual relationship understanding, specifically focusing on videos. We first introduce visual relationship understanding concepts in videos and then explore the latest existing techniques. Next, we present benchmark datasets commonly used in video visual relationship understanding. Finally, we discuss future research directions in video visual relationship understanding.

시공간 2D 특징 설명자를 사용한 BOF 방식의 동작인식 (BoF based Action Recognition using Spatio-Temporal 2D Descriptor)

  • 김진옥
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.21-32
    • /
    • 2015
  • 동작인식 연구에서 비디오를 표현하는 시공간 부분 특징이 모델 없는 상향식 방식의 주요 주제가 되면서 동작 특징을 검출하고 표현하는 방법이 여러 연구를 통해 다양하게 제안되고 있다. 그 중에서 BoF(bag of features)방식은 가장 일관성 있는 인식 결과를 보여주고 있다. 비디오의 동작을 BoF로 나타내기 위해서는 어떻게 동작의 역동적 정보를 표현할 것인가가 가장 중요한 부분이다. 그래서 기존 연구에서는 비디오를 시공간 볼륨으로 간주하고 3D 동작 특징점 주변의 볼륨 패치를 복잡하게 설명하는 것이 가장 일반적인 방법이다. 본 연구에서는 기존 3D 기반 방식을 간략화하여 비디오의 동작을 BoF로 표현할 때 비디오에서 2D 특징점을 직접 수집하는 방식을 제안한다. 제안 방식의 기본 아이디어는 일반적 공간프레임의 2D xy 평면뿐만 아니라 시공간 프레임으로 불리는 시간축 평면에서 동작 특징점을 추출하여 표현하는 것으로 특징점이 비디오에서 역동적 동작 정보를 포착하기 때문에 동작 표현 특징 설명자를 3D로 확장할 필요 없이 2D 설명자만으로 간단하게 동작인식이 가능하다. SIFT, SURF 특징 표현 설명자로 표현하는 시공간 BoF 방식을 주요 동작인식 데이터에 적용하여 우수한 동작 인식율을 보였다. 3D기반의 HoG/HoF 설명자와 비교한 경우에도 제안 방식이 더 계산하기 쉽고 단순하게 이해할 수 있다.

디지털 방송 서비스에서 트랜스포트 스트림 분석 및 파싱 능력 향상에 관한 연구 (A Study on Transport Stream Analysis and Parsing Ability Enhancement in Digital Broadcasting and Service)

  • 김장원
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.552-557
    • /
    • 2017
  • 유 무선 디지털 방송이 고화질 TV의 탄생과 함께 2010년 이후로 급격하게 확산되었으며, 단방향 콘텐츠 이용뿐만 아니라 양방향 콘텐츠 이용이 급격하게 증가되고 있다. 현재 우리나라 위성 통신망에서는 유럽 디지털 방송 표준화기구의 DVB를 국내 데이터 방송의 표준으로 채택하고 있으며, IPTV의 발전에 의해 선택적 콘텐츠의 이용방법도 또한 다양하게 연구되었다. 디지털 방송에서는 MPEG-2 system의 비디오, 오디오, 그리고 데이터 등의 멀티미디어 정보를 전송하기 위해 정보를 다중화 하는 방식으로 Transport Stream Packet(TSP)을 이용한 방식을 사용하는데, 이 Stream에는 비디오, 오디오 정보는 물론, TV 편성표와 프로그램에 대한 상세한 정보까지도 포함되어 있다. 본 연구에서는 이러한 데이터 방송 시스템을 이해하기 위하여 Linux 환경에서 Transport Stream(TS)을 Packet별로 구분하고 각각의 기능별로 분석, 출력해주는 TS Analyzer를 구현하였으며, TS의 이해를 돕고 Stream Parsing 능력향상을 이룰 수 있었다.