• Title/Summary/Keyword: 비디오 이해

Search Result 147, Processing Time 0.027 seconds

A Domain-Extensible Hierarchical Approach to Recognize Visual Verbs (도메인 확장성을 지원하는 계층적 시각동사 인식 방법)

  • Moon, Jinyoung;Kwon, Yongjin;Kang, Kyuchang;Park, Jongyoul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1439-1441
    • /
    • 2015
  • 본 연구는 비디오 이해를 위해 비디오에 등장하는 주요 객체들의 행동이나 상태를 시각 동사라고 명명하고, 도메인 확장성 있는 계층적 시각 동사의 인식을 위해 온톨로지와 규칙을 기반으로 도메인 독립적인 시각 동사를 계층적으로 인식하는 방법과 특정 도메인에 관련된 시각 동사를 도메인 독립적 시각 동사를 기반으로 확장하여 인식하는 방법을 제안하고, CCTV 감시 비디오에서 인식 시뮬레이션 결과를 보여준다.

Static and Dynamic Mosaic Construction using Parameter of Camera and Dynamic Object (카메라와 동적 객체의 파라미터 측정을 이용한 정적 및 동적 모자이크 구축)

  • Yang, Won-Bo;Lim, Moon-Sun;Choe, Hyo-Seong;Rhee, Yang-Weon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.868-873
    • /
    • 2000
  • 비디오는 상당히 많은 정보를 함축적으로 포괄하는 있는 자원이다. 하지만 비디오의 내용물을 처리하고 이해하기에는 많은 어려움이 있다. 모자이크라고 하는 것은 연속적인 영상들로부터 정합 하여 하나의 새로운 영상을 생성함을 일컫는다. 그러므로 모자이크 영상을 통해서 비디오의 많은 정보들을 효과적으로 표현해 줄 수 있다. 본 논문에서는 모자이크 구축을 위해 이동하는 카메라를 통해 입력을 받아 모자이크 영상을 생성하는 방안을 제시한다. 정적 모자이크 구축을 위해 두 영상간의 방향 벡터만큼 이동 후 차 영상을 계산하여 구축하는 방안을 제시한다. 동적 모자이크 구축을 위해 움직이는 카메라와 동적 객체의 파라미터를 모호성을 방지하기 위한 알고리즘을 제시하고, 동적 객체 판별을 위한 영역 분할 기법에 대하여 제시한다.

  • PDF

Neural Question Difficulty Estimator with Bi-directional Attention in VideoQA (비디오 질의 응답 환경에서 양방향 어텐션을 이용한 질의 난이도 분석 모델)

  • Yoon, Su-Hwan;Park, Seong-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.501-506
    • /
    • 2020
  • 질의 난이도 분석 문제는 자연어 질의문을 답변할 때 어려움의 정도를 측정하는 문제이다. 질의 난이도 분석 문제는 문서 독해, 의학 시험, 비디오 질의 등과 같은 다양한 데이터셋에서 연구되어 왔다. 본 논문에서는 질의문과 질의문에 응답하기 위한 정보들 간의 관계를 파악하는 것으로 질의 난이도 분석 문제를 접근하여 이를 BERT와 Dual Multi-head Attention을 사용하여 모델링 하였다. 본 논문에서 제안하는 모델의 우수성을 증명하기 위하여 최근 자연언어이해 부분에서 높은 성능을 보여주는 기 학습 언어 모델과 이전 연구의 질의 난이도 분석 모델과의 성능을 비교하였고, 제안 모델은 대표적인 비디오 질의 응답 데이터셋인 DramaQA의 Memory Complexity에서 99.76%, Logical Complexity에서는 89.47%의 정확도로 가장 높은 질의 난이도 분석 성능을 보여주었다.

  • PDF

Predicting User Personality Based on Dynamic Keyframes Using Video Stream Structure (비디오 스트림 구조를 활용한 동적 키프레임 기반 사용자 개성 예측)

  • Mira Lee;Simon S.Woo;Hyedong Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.601-604
    • /
    • 2023
  • 기술이 발전함에 따라 복합적인 모달리티 정보를 포함하는 멀티미디어 데이터의 수집이 용이해지면서, 사람의 성격 특성을 이해하고 이를 개인화된 에이전트에 적용하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 비디오 스트림 구조를 활용하여 사용자 특성을 예측하기 위한 동적 키프레임 추출 방법을 제안한다. 비디오 데이터를 효과적으로 활용하기 위해서는 무작위로 선택한 프레임에서 특징을 추출하던 기존의 방법을 개선하여 영상 내 시간에 따른 정보와 변화량을 기반으로 중요한 프레임을 선택하는 방법이 필요하다. 본 논문에서는 제 3자가 평가한 Big-five 지표 값이 레이블링된 대표적인 데이터셋인 First Impressions V2 데이터셋을 사용하여 외면에서 발현되는 특징들을 기반으로 영상에서 등장하는 인물들의 성격 특성을 예측했다. 결론에서는 선택된 키프레임에서 멀티 모달리티 정보를 조합하여 성격 특성을 예측한 결과와 베이스라인 모델과의 성능을 비교한다.

The Influence of Task Orientation and Preferred Self-View Size on Self-View Preference: Testing the Moderated Mediating Effect of Social Anxiety (과업지향정도 및 선호하는 화면크기가 비디오 피드백 기능 선호도에 미치는 영향: 사회불안의 조절된 매개효과 검증)

  • Peck, Soojin;Han, Kwanghee
    • Science of Emotion and Sensibility
    • /
    • v.25 no.3
    • /
    • pp.3-14
    • /
    • 2022
  • With the increase of video conferencing users and the development of technology, the situations where video conferencing is used and the layout of video conferencing interfaces are diversifying. Social anxiety affects video conferencing communication and is closely related to the self-view function, which is characteristic of video conferencing. The self-view function is part of the video conferencing interface that provides a small preview of one's own camera feed. Self-view is known to degrade work performance and cause fatigue; however, it is set as the default function on video conferencing software in a way that users generally prefer. This study used an online survey to study the effect of task orientation, preferred self-view size, and social anxiety on video feedback preference. Participants responded to questions assessing work orientation, social anxiety level, preferred self-view size, and self-view preference. The results showed that preferred self-view size mediates task orientation and video feedback preference. There was no significant difference in the mediating effect of the preferred self-view size according to the degree of social anxiety. These results offer insights into the interactions between users and video conferencing software and provide information that can be useful for designing video conferencing interfaces.

Detection of Video Scene Boundaries based on the Local and Global Context Information (지역 컨텍스트 및 전역 컨텍스트 정보를 이용한 비디오 장면 경계 검출)

  • 강행봉
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.8 no.6
    • /
    • pp.778-786
    • /
    • 2002
  • Scene boundary detection is important in the understanding of semantic structure from video data. However, it is more difficult than shot change detection because scene boundary detection needs to understand semantics in video data well. In this paper, we propose a new approach to scene segmentation using contextual information in video data. The contextual information is divided into two categories: local and global contextual information. The local contextual information refers to the foreground regions' information, background and shot activity. The global contextual information refers to the video shot's environment or its relationship with other video shots. Coherence, interaction and the tempo of video shots are computed as global contextual information. Using the proposed contextual information, we detect scene boundaries. Our proposed approach consists of three consecutive steps: linking, verification, and adjusting. We experimented the proposed approach using TV dramas and movies. The detection accuracy of correct scene boundaries is over than 80%.

Development of Emotion Subtitles Broadcast System based on Terrestrial UHD TV for the Hearing-Impaired (청각장애인을 위한 지상파 UHD 기반 감정표현 자막 송출 시스템 개발)

  • Lee, June;Ahn, Chunghyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.141-144
    • /
    • 2021
  • 최근 지상파 UHD 방송에서는 자막을 비디오 패킷에 삽입하여 전달하는 기존 방식이 아닌 별도의 전송로로 전달하는 폐쇄형 자막(closed caption) 방식을 적용하고 있다. 또한 자막에는 문자 뿐만 아니라 이미지까지 포함하여 청각장애인의 프로그램 이해도를 높이는데 활용할 수 있다. 따라서 본 논문에서는 청각장애 시청자가 방송 콘텐츠 내용의 이해도를 향상시키기 위하여 지상파 UHD 방송에서 기존의 문자 자막과 움직이는 이미지 자막(=감정표현 자막)을 송출하여 동시에 표현할 수 있는 송출시스템을 제안한다.

  • PDF

The Design and Implementation of A Video Geographic Information System (비디오 지리 정보 시스템의 설계 및 구현)

  • 유재준;주인학;남광우;이종훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.274-276
    • /
    • 2002
  • 최근에 지리 정보를 검색, 관리, 분석할 수 있는 지리 정보 시스템(Geographic information System)의 사용이 확대됨에 따라 단순한 수치지도 정보 이외에 좀 더 현실적이고. 사실적인 정보를 제공해 줄 수 있는 시스템에 대한 요구가 커지고 있다 이러한 요구에 부응하는 한 방향으로써 차량에 부착된 카메라 등등 사용하여 획득한 비디오 데이터와 수치지도 정보를 연계하여 특정 수치지도 객체의 영상을 제공함으로써 수치지도 객체에 대한 자세한 현장의 정보를 쉽게 파악할 수 있도록 하는 비디오 지리 정보 시스템이 등장하였다. 하지만 기존의 비디오 지리 정보 시스템은 획득한 비디오 데이터를 수치지도의 한 속성으로서 표현하거나, 수치지도에서 비디오 데이터로의 단순한 링크를 사용하여 수치지도와 연계함으로써 수치지도의 검색을 통한 영상 정보의 출력이라는 단방향 검색만을 지원한다. 즉, 비디오 데이터에 존재하는 수치지도 객체의 검색을 통한 수치지도의 검색 및 관리, 분석은 지원해 주지 못하고 있다. 본 논문에서는 비디오 데이터와 수치지도의 양방향 검색 및 관리를 지원하는 비디오 지리 정보 시스템을 설계하고 구현한다. 이를 위해 1) 비디오 데이터와 수치지도 정보를 효율적으로 연계하기 위한 데이터 모델을 제안하고, 2) 비디오 데이터와 수치지도 정보의 연계 정보를 추출 및 구축하는 과정을 제안하며, 3) 비디오 데이터의 출력 및 검색, 수치지도의 출력 및 검색, 연계 정보를 통한 비디오 데이터와 수치지도 정보의 연동 등을 효율적으로 지원하기 위한 시스템을 컴포넌트(Component) 구조를 사용하여 설계한다. 이해성 및 이를 기반으로 하는 교육용 애플리케이션 개발의 용이성의 증대를 기대할 수 있으며, 모델의 재사용성을 보장할 수 있다. 제안한다.수행하였다. 분석에서는 제품의 효율성뿐만 아니라 보안성을 중요하게 생각하였으며, 앞으로 보안 관련 소프트웨어 개발에 사용될 수 있는 도구들이 가이드 라인에 대한 정보를 제공한다.용할 수 있는지 세부 설계를 제시한다.다.으로서 hemicellulose구조가 polyuronic acid의 형태인 것으로 사료된다. 추출획분의 구성단당은 여러 곡물연구의 보고와 유사하게 glucose, arabinose, xylose 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의

  • PDF

Automated Video Clip Creation Using Time-based Social Bookmark Clustering (소셜 북마크의 시간 정보 클러스터링을 이용한 비디오 클립 생성 자동화)

  • Han, Sung-Hee;Lee, Jae-Ho;Kang, Dae-Kap
    • Journal of Broadcast Engineering
    • /
    • v.15 no.1
    • /
    • pp.144-147
    • /
    • 2010
  • Recently the change of content consumption trend activated the social video sharing platform and the video clip itself. There have been intensive interests and efforts to automatically abstract compact and meaningful video clips. In this paper, we propose a method which use the clustering of the bookmark data created by collective intelligence instead of using the video content analysis. The partitional clustering of points in 2-dimensional space derived from the bookmark data make it possible to abstract highlights effectively. The method is enhanced by the 1-dimensional accumulated bookmark count graph. Experiments on the real data from KBS internet service show the effectiveness of the proposed method.

Development of a video-protocol analysis system for the user interface design. (사용자 인터페이스 디자인을 위한 사용성평가 비디오정보 분석방법 개발에 관한 연구)

  • 김병욱
    • Archives of design research
    • /
    • v.11 no.1
    • /
    • pp.109-118
    • /
    • 1998
  • Recently, the importance of user-interface design has been increasing due to the development of electronic and semiconductor technology. Under these surroundings a lot of Approaches that are for the analysis of video sequential data have been developed. The study on the method of analysing various aspects in the use of real product should find the characteristics of users' behavior. Also, the study should include the interaction dffects among these aspects. For these reasons this study proposed an analysis method for the video sequential data of usability test. The study begins with discussing the nature of user-interface through reviewing the various aspects of user-interface. Based on the findings the structure of methods that analyze the characterisics of user's behavior is identified. Thereafter, we developed a computerized tool for analysing video sequential data from usability tests. The tool comprises of four different modules: module for identifying users' profiles, module for video data logging, module for analysing user's characteristics, and module for synthesizing these data for user-interface design. Finally findings are summarized and further research was suggested.

  • PDF