• Title/Summary/Keyword: 대표 프레임

Search Result 462, Processing Time 0.023 seconds

A Kinematic Approach to Answering Similarity Queries on Complex Human Motion Data (운동학적 접근 방법을 사용한 복잡한 인간 동작 질의 시스템)

  • Han, Hyuck;Kim, Shin-Gyu;Jung, Hyung-Soo;Yeom, Heon-Y.
    • Journal of Internet Computing and Services
    • /
    • v.10 no.4
    • /
    • pp.1-11
    • /
    • 2009
  • Recently there has arisen concern in both the database community and the graphics society about data retrieval from large motion databases because the high dimensionality of motion data implies high costs. In this circumstance, finding an effective distance measure and an efficient query processing method for such data is a challenging problem. This paper presents an elaborate motion query processing system, SMoFinder (Similar Motion Finder), which incorporates a novel kinematic distance measure and an efficient indexing strategy via adaptive frame segmentation. To this end, we regard human motions as multi-linkage kinematics and propose the weighted Minkowski distance metric. For efficient indexing, we devise a new adaptive segmentation method that chooses representative frames among similar frames and stores chosen frames instead of all frames. For efficient search, we propose a new search method that processes k-nearest neighbors queries over only representative frames. Our experimental results show that the size of motion databases is reduced greatly (${\times}1/25$) but the search capability of SMoFinder is equal to or superior to that of other systems.

  • PDF

Detection of Fade and Zoom Effects Using Blocks in Video (블록을 이용한 비디오의 fade와 zoom 영역 검출 기법)

  • 정인식;권오진
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.195-198
    • /
    • 2000
  • 비디오에서 적은 수의 대표 화면으로 그 비디오의 내용을 요약할 수 있다는 것은 효율적인 비디오 브라우징 및 비디오 검색에 있어서 매우 중요하다. 다양한 종류의 셔트(shot) 추출 방법이 제시되어 왔다. 다양한 종류의 셔트 추출 방법 중에서 칼라 히스토그램을 이용하는 방법이 가장 많이 사용되어 왔다. 그러나 칼라 히스토그램을 이용하는 방법은 fade effect, zoom effect 등과 같이 특별한 효과가 들어있는 비디오에서는 적절하지 못한 결과를 종종 초래한다. 이 논문에서는 블록을 이용한 fade와 zoom 효과가 있는 영역을 검출하는 방법을 제시한다. 대부분의 칼라 히스토그램 방법은 인접한 프레임간 또는 일정한 거리가 떨어져 있는 프레임간의 차이를 이용하였다. 이 논문에서는 차이를 구하고자 하는 프레임간의 거리를 변동시기는 방법을 이용하여 구함으로써 그 성능을 개선하였고, 또한 단순히 두 프레임만을 비교하는 것이 아니라 일정한 수의 프레임을 그룹핑 하여 하나의 블록으로 만들고, 그 블록에서 히스토그램 차이의 평균 및 중간 값을 이용하면 hard cut과 fade같은 효과가 한 블록 내에 같이 있는 경우 더욱 효과적으로 셔트를 추출할 수 있다.

  • PDF

A Comparative Analysis of Deep Learning Frameworks for Image Learning (이미지 학습을 위한 딥러닝 프레임워크 비교분석)

  • jong-min Kim;Dong-Hwi Lee
    • Convergence Security Journal
    • /
    • v.22 no.4
    • /
    • pp.129-133
    • /
    • 2022
  • Deep learning frameworks are still evolving, and there are various frameworks. Typical deep learning frameworks include TensorFlow, PyTorch, and Keras. The Deepram framework utilizes optimization models in image classification through image learning. In this paper, we use the TensorFlow and PyTorch frameworks, which are most widely used in the deep learning image recognition field, to proceed with image learning, and compare and analyze the results derived in this process to know the optimized framework. was made.

Predicting User Personality Based on Dynamic Keyframes Using Video Stream Structure (비디오 스트림 구조를 활용한 동적 키프레임 기반 사용자 개성 예측)

  • Mira Lee;Simon S.Woo;Hyedong Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.601-604
    • /
    • 2023
  • 기술이 발전함에 따라 복합적인 모달리티 정보를 포함하는 멀티미디어 데이터의 수집이 용이해지면서, 사람의 성격 특성을 이해하고 이를 개인화된 에이전트에 적용하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 비디오 스트림 구조를 활용하여 사용자 특성을 예측하기 위한 동적 키프레임 추출 방법을 제안한다. 비디오 데이터를 효과적으로 활용하기 위해서는 무작위로 선택한 프레임에서 특징을 추출하던 기존의 방법을 개선하여 영상 내 시간에 따른 정보와 변화량을 기반으로 중요한 프레임을 선택하는 방법이 필요하다. 본 논문에서는 제 3자가 평가한 Big-five 지표 값이 레이블링된 대표적인 데이터셋인 First Impressions V2 데이터셋을 사용하여 외면에서 발현되는 특징들을 기반으로 영상에서 등장하는 인물들의 성격 특성을 예측했다. 결론에서는 선택된 키프레임에서 멀티 모달리티 정보를 조합하여 성격 특성을 예측한 결과와 베이스라인 모델과의 성능을 비교한다.

Semi-automatic Event Structure Frame tagging of WordNet Synset (워드넷 신셋에 대한 사건구조 프레임 반자동 태깅)

  • Im, Seohyun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.101-105
    • /
    • 2018
  • 이 논문은 가장 잘 알려진 어휘부중 하나인 워드넷의 활용 범위 확장을 위해 워드넷 신셋에 "사건구조 프레임(Event Structure Frame)"을 주석하는 연구에 관한 것이다. 워드넷을 비롯하여 현재 사용되고 있는 어휘부는 풍부한 어휘의미정보가 구조화되어 있지만, 사건구조에 관한 정보를 포함하고 있지는 않다. 이 연구의 가장 큰 기여는 워드넷에 사건구조 프레임을 추가함으로써 워드넷과의 연결만으로 핵심적인 어휘의미정보를 모두 추출할 수 있도록 해준다는 점이다. 예를 들어 텍스트 추론, 자연어처리, 멀티 모달 태스크 등은 어휘의미정보와 배경지식(상식)을 이용하여 태스크를 수행한다. 워드넷에 대한 사건구조 주석은 자동사건구조 주석 시스템인 GESL을 이용하여 워드넷 신셋에 있는 예문에 먼저 자동 주석을 하고, 오류에 대해 수동 수정을 하는 반자동 방식이다. 사전 정의된 23개의 사건구조 프레임에 따라 예문에 출현하는 타겟 동사를 분류하고, 해당 프레임과 매핑한다. 현재 이 연구는 시작 단계이며, 이 논문에서는 빈도 순위가 가장 높은 100개의 동사와 각 사건구조 프레임별 대표 동사를 포함하여 총 106개의 동사 레마에 대해 실험을 진행하였다. 그 동사들에 대한 전체 워드넷 신셋의 수는 1337개이다. 예문이 없어서 GESL이 적용될 수 없는 신셋을 제외하면 1112개 신셋이다. 이 신셋들에 대해 GESL을 적용한 결과 F-Measure는 73.5%이다. 향후 연구에서는 워드넷-사건구조 링크를 계속 업데이트하면서 딥러닝을 이용해 GESL 성능을 향상 할 수 있는 방법을 모색할 것이다.

  • PDF

A Study on the Scene Change Detection using Neighbor Color Histogram (주변 화소의 컬러 히스토그램을 이용한 장면 전환 검출에 관한 연구)

  • 권정훈;최기호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05d
    • /
    • pp.605-608
    • /
    • 2002
  • 본 논문에서는 동영상에서 샘플 프레임과 주변 화소의 컬러 히스토그램을 이용한 새로운 장면 전환 방법을 제시하였다. 4개의 대표 컬러에 대한 주변 화소의 컬러 히스토그램을 이용하여 장면 전환 검출을 함으로써 기존의 컬러 히스토그램을 이용한 장면 전환 검출의 단점을 보완하였다.

  • PDF

생산성 향상의 기본 인프라

  • Park, Gwang-Ho
    • Digital Contents
    • /
    • no.1 s.80
    • /
    • pp.87-91
    • /
    • 2000
  • 지난 호에는 인터넷 유통업의 대표적인 형태인 인터넷 쇼핑몰 운영을 위한 내부 프로세스 에이전트를 정의하였다. 또한 인터넷 쇼핑몰의 후방 프로세스를 분석해 보았으며 이를 토대로 다양한 운영층 프로세스 에이전트 유형과 특성을 정의하였다. 또한, 다수의 에이전트로 구성된 프로세스 에이전트팀 조직과 활동 원칙도 제시하였다. 이번호에는 인터넷 쇼핑몰 후방 프로세스 에이전트의 참조 구축 프레임 워크를 제시한다

  • PDF

Scene Change Detection and Representative Frame Extraction Algorithm for Video Abstract on MPEG Video Sequence (MPEG 비디오 시퀀스에서 비디오 요약을 위한 장면 전환 검출 및 대표 프레임 추출 알고리즘)

  • 강응관
    • Journal of Korea Multimedia Society
    • /
    • v.6 no.5
    • /
    • pp.797-804
    • /
    • 2003
  • Scene change detection algorithm, which is very important preprocessing technique for video indexing and retrieval and determines the performance of video database system, is being studied widely. In this paper, we propose a more effective abrupt scene change detection, which is robust to large motion, sudden change of light and successive abrupt shot transitions rapidly. And we also propose a new gradual scene change detection algorithm, which can detect dissolve, and fade in/out precisely. Furthermore, we also propose a representative frame extraction algorithm which performs content-based video summary by novel DCT DC image buffering technique and accumulative histogram intersection measure (AHIM).

  • PDF

A Study on the speech synthesis-by-rue system using Multiband Excitation signal (다중대역 여기신호를 이용한 음성의 규칙합성에 관한 연구)

  • 경연정
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1993.06a
    • /
    • pp.80-83
    • /
    • 1993
  • 본 논문에서는 양질의 규칙합성을 얻기 위하여, 유성음에 대한 여기신호로 임펄스 스펙트럼과 노이즈 스펙트럼을 다중대역으로 혼합하여 생성한 여기신호를 규칙합성에 적용하는 방법을 제안한다. 이 방법에서는, 분석합성에서 각 프레임별로 요구되었던 혼합여기신호에 대한 정보량 문제를 해결하기 위해 유성음의 정상부분의 한 프레임에 대해 혼합여기신호를 구하여 규칙합성에 적용하였고, 정보량을 더욱 줄이는 방안으로, 켑스트럼 유클리디안 거리를 이용하여 유성음을 분류하여, 각 그룹에 대한 대표 여기신호를 규칙합성의 여기신호로 사용하였다. 제안된 방법으로 음성을 합성한 결과 양질의 합성음을 얻을 수 있음을 확인하였다.

  • PDF

벤처의 발견 - 잡시장에 새로운 패러다임을 세운다

  • 강관식
    • Venture DIGEST
    • /
    • no.12 s.125
    • /
    • pp.30-31
    • /
    • 2008
  • 2008년 12월 1일 '눈에 보이지 않는 일'을 사고파는 시장이 열린다. 기존 구인 구직의 개념이 아닌, 웹상에서 기업은 '일'단위로 인력을 모집하고, 구직자는 회사가 아닌 '일'을 선택하는 전자일감시장 이워크랜드(www.eworkland.co.kr)가 이달의 첫날 정식 오픈하였다. 유비쿼터스 환경을 바탕으로 시공간의 제약을 받지 않는 새로운 전자일감시장을 연 주인공은 시너지 프레임이라는 개발 프레임워크로 널리 알려진 강소벤처 아토정보기술(www.attoit.co.kr). 야심찬 서비스를 준비하고 누구보다 떨리는 가슴으로 올해의 마지막 달을 맞이하는 아토정보기술의 강관식 대표를 만나본다.

  • PDF