• 제목/요약/키워드: 대표 프레임

검색결과 462건 처리시간 0.027초

운동학적 접근 방법을 사용한 복잡한 인간 동작 질의 시스템 (A Kinematic Approach to Answering Similarity Queries on Complex Human Motion Data)

  • 한혁;김신규;정형수;염헌영
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-11
    • /
    • 2009
  • 대규모 인간 동작 데이터베이스에서 고차원의 데이터를 처리하는 것이 큰 비용을 요구하기에, 최근 데이터베이스 및 그래픽스 학계는 인간 동작 데이터 질의 및 접근에 큰 관심을 가지게 되었다. 특히, 인간 동작 데이터를 위한 효과적인 유사도(거리) 측정 방법이나 질의 처리는 여전히 많은 연구진들이 도전하고 있는 문제이다. 이에, 본 연구진은 SMoFinder 라고 명명한 동작 질의 처리 시스템을 제안한다. SMoFinder는 새롭게 고안된 운동학적 거리 측정 그리고 적응적 프레임 세그멘테이션에 기반하는 효율적인 인덱싱을 사용하여 동작 질의를 처리한다. 이를 위해, SMoFinder에서는 인간 동작을 다연결 물리 운동으로 간주하고 새로운 가중치 Minkowski 함수를 정의했다. 또한, 효율적인 인덱싱을 위해 모든 프레임을 저장하지 않고 유사한 프레임들 중에서 대표 프레임을 뽑아서 저장하는 적응적 세그멘테이션을 고안했다. 그리고, 효율적인 검색을 위해 이들 대표 프레임들만 가지고 k-근접 이웃 질의를 수행하는 새로운 방법을 제안한다. 마지막으로, SMoFinder가 데이터베이스 용량이 크게 줄지만(1/25배), 검색 능력은 다른 시스템과 동일하거나 우월하다는 것을 실험을 통해 보여주고자 한다.

  • PDF

블록을 이용한 비디오의 fade와 zoom 영역 검출 기법 (Detection of Fade and Zoom Effects Using Blocks in Video)

  • 정인식;권오진
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.195-198
    • /
    • 2000
  • 비디오에서 적은 수의 대표 화면으로 그 비디오의 내용을 요약할 수 있다는 것은 효율적인 비디오 브라우징 및 비디오 검색에 있어서 매우 중요하다. 다양한 종류의 셔트(shot) 추출 방법이 제시되어 왔다. 다양한 종류의 셔트 추출 방법 중에서 칼라 히스토그램을 이용하는 방법이 가장 많이 사용되어 왔다. 그러나 칼라 히스토그램을 이용하는 방법은 fade effect, zoom effect 등과 같이 특별한 효과가 들어있는 비디오에서는 적절하지 못한 결과를 종종 초래한다. 이 논문에서는 블록을 이용한 fade와 zoom 효과가 있는 영역을 검출하는 방법을 제시한다. 대부분의 칼라 히스토그램 방법은 인접한 프레임간 또는 일정한 거리가 떨어져 있는 프레임간의 차이를 이용하였다. 이 논문에서는 차이를 구하고자 하는 프레임간의 거리를 변동시기는 방법을 이용하여 구함으로써 그 성능을 개선하였고, 또한 단순히 두 프레임만을 비교하는 것이 아니라 일정한 수의 프레임을 그룹핑 하여 하나의 블록으로 만들고, 그 블록에서 히스토그램 차이의 평균 및 중간 값을 이용하면 hard cut과 fade같은 효과가 한 블록 내에 같이 있는 경우 더욱 효과적으로 셔트를 추출할 수 있다.

  • PDF

이미지 학습을 위한 딥러닝 프레임워크 비교분석 (A Comparative Analysis of Deep Learning Frameworks for Image Learning)

  • 김종민;이동휘
    • 융합보안논문지
    • /
    • 제22권4호
    • /
    • pp.129-133
    • /
    • 2022
  • 딥러닝 프레임워크는 현재에도 계속해서 발전되어 가고 있으며, 다양한 프레임워크들이 존재한다. 딥러닝의 대표적인 프레임워크는 TensorFlow, PyTorch, Keras 등이 있다. 딥러님 프레임워크는 이미지 학습을 통해 이미지 분류에서의 최적화 모델을 이용한다. 본 논문에서는 딥러닝 이미지 인식 분야에서 가장 많이 사용하고 있는 TensorFlow와 PyTorch 프레임워크를 활용하여 이미지 학습을 진행하였으며, 이 과정에서 도출한 결과를 비교 분석하여 최적화된 프레임워크을 알 수 있었다.

비디오 스트림 구조를 활용한 동적 키프레임 기반 사용자 개성 예측 (Predicting User Personality Based on Dynamic Keyframes Using Video Stream Structure)

  • 이미라;우사이먼성일;정혜동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.601-604
    • /
    • 2023
  • 기술이 발전함에 따라 복합적인 모달리티 정보를 포함하는 멀티미디어 데이터의 수집이 용이해지면서, 사람의 성격 특성을 이해하고 이를 개인화된 에이전트에 적용하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 비디오 스트림 구조를 활용하여 사용자 특성을 예측하기 위한 동적 키프레임 추출 방법을 제안한다. 비디오 데이터를 효과적으로 활용하기 위해서는 무작위로 선택한 프레임에서 특징을 추출하던 기존의 방법을 개선하여 영상 내 시간에 따른 정보와 변화량을 기반으로 중요한 프레임을 선택하는 방법이 필요하다. 본 논문에서는 제 3자가 평가한 Big-five 지표 값이 레이블링된 대표적인 데이터셋인 First Impressions V2 데이터셋을 사용하여 외면에서 발현되는 특징들을 기반으로 영상에서 등장하는 인물들의 성격 특성을 예측했다. 결론에서는 선택된 키프레임에서 멀티 모달리티 정보를 조합하여 성격 특성을 예측한 결과와 베이스라인 모델과의 성능을 비교한다.

워드넷 신셋에 대한 사건구조 프레임 반자동 태깅 (Semi-automatic Event Structure Frame tagging of WordNet Synset)

  • 임서현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-105
    • /
    • 2018
  • 이 논문은 가장 잘 알려진 어휘부중 하나인 워드넷의 활용 범위 확장을 위해 워드넷 신셋에 "사건구조 프레임(Event Structure Frame)"을 주석하는 연구에 관한 것이다. 워드넷을 비롯하여 현재 사용되고 있는 어휘부는 풍부한 어휘의미정보가 구조화되어 있지만, 사건구조에 관한 정보를 포함하고 있지는 않다. 이 연구의 가장 큰 기여는 워드넷에 사건구조 프레임을 추가함으로써 워드넷과의 연결만으로 핵심적인 어휘의미정보를 모두 추출할 수 있도록 해준다는 점이다. 예를 들어 텍스트 추론, 자연어처리, 멀티 모달 태스크 등은 어휘의미정보와 배경지식(상식)을 이용하여 태스크를 수행한다. 워드넷에 대한 사건구조 주석은 자동사건구조 주석 시스템인 GESL을 이용하여 워드넷 신셋에 있는 예문에 먼저 자동 주석을 하고, 오류에 대해 수동 수정을 하는 반자동 방식이다. 사전 정의된 23개의 사건구조 프레임에 따라 예문에 출현하는 타겟 동사를 분류하고, 해당 프레임과 매핑한다. 현재 이 연구는 시작 단계이며, 이 논문에서는 빈도 순위가 가장 높은 100개의 동사와 각 사건구조 프레임별 대표 동사를 포함하여 총 106개의 동사 레마에 대해 실험을 진행하였다. 그 동사들에 대한 전체 워드넷 신셋의 수는 1337개이다. 예문이 없어서 GESL이 적용될 수 없는 신셋을 제외하면 1112개 신셋이다. 이 신셋들에 대해 GESL을 적용한 결과 F-Measure는 73.5%이다. 향후 연구에서는 워드넷-사건구조 링크를 계속 업데이트하면서 딥러닝을 이용해 GESL 성능을 향상 할 수 있는 방법을 모색할 것이다.

  • PDF

주변 화소의 컬러 히스토그램을 이용한 장면 전환 검출에 관한 연구 (A Study on the Scene Change Detection using Neighbor Color Histogram)

  • 권정훈;최기호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.605-608
    • /
    • 2002
  • 본 논문에서는 동영상에서 샘플 프레임과 주변 화소의 컬러 히스토그램을 이용한 새로운 장면 전환 방법을 제시하였다. 4개의 대표 컬러에 대한 주변 화소의 컬러 히스토그램을 이용하여 장면 전환 검출을 함으로써 기존의 컬러 히스토그램을 이용한 장면 전환 검출의 단점을 보완하였다.

  • PDF

생산성 향상의 기본 인프라

  • 박광호
    • 디지털콘텐츠
    • /
    • 1호통권80호
    • /
    • pp.87-91
    • /
    • 2000
  • 지난 호에는 인터넷 유통업의 대표적인 형태인 인터넷 쇼핑몰 운영을 위한 내부 프로세스 에이전트를 정의하였다. 또한 인터넷 쇼핑몰의 후방 프로세스를 분석해 보았으며 이를 토대로 다양한 운영층 프로세스 에이전트 유형과 특성을 정의하였다. 또한, 다수의 에이전트로 구성된 프로세스 에이전트팀 조직과 활동 원칙도 제시하였다. 이번호에는 인터넷 쇼핑몰 후방 프로세스 에이전트의 참조 구축 프레임 워크를 제시한다

  • PDF

MPEG 비디오 시퀀스에서 비디오 요약을 위한 장면 전환 검출 및 대표 프레임 추출 알고리즘 (Scene Change Detection and Representative Frame Extraction Algorithm for Video Abstract on MPEG Video Sequence)

  • 강응관
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.797-804
    • /
    • 2003
  • 장면 전환검출 (scene change detection)은 영상 정보의 색인 (indexing) 및 검색을 위한 전처리로서 비디오 검색 시스템의 전체 성능을 좌우하는 중요한 기술로 현재 많은 연구가 진행되고 있다. 본 논문에서는 급격한 움직임 및 조명 변화, 빠르게 연속적으로 등장하는 장면 전환에 강건한 급격한 장면 전환 검출 기법과 디졸브, 페이드 등의 장면 전환을 보다 효과적으로 검출할 수 있는 점진적인 장면 전환 검출 기법 및 추출된 셧 (shot)의 내용을 DCT DC 이미지 버퍼링과 누적 히스토그램 교차 함수 (accumulative histogram intersection measure)에 의해 대표 프레임으로 추출하는 새로운 알고리즘을 제안하고, 모의 실험 결과 기존 방식에 비해 보다 우수한 성능을 보임을 입증하였다.

  • PDF

다중대역 여기신호를 이용한 음성의 규칙합성에 관한 연구 (A Study on the speech synthesis-by-rue system using Multiband Excitation signal)

  • 경연정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.80-83
    • /
    • 1993
  • 본 논문에서는 양질의 규칙합성을 얻기 위하여, 유성음에 대한 여기신호로 임펄스 스펙트럼과 노이즈 스펙트럼을 다중대역으로 혼합하여 생성한 여기신호를 규칙합성에 적용하는 방법을 제안한다. 이 방법에서는, 분석합성에서 각 프레임별로 요구되었던 혼합여기신호에 대한 정보량 문제를 해결하기 위해 유성음의 정상부분의 한 프레임에 대해 혼합여기신호를 구하여 규칙합성에 적용하였고, 정보량을 더욱 줄이는 방안으로, 켑스트럼 유클리디안 거리를 이용하여 유성음을 분류하여, 각 그룹에 대한 대표 여기신호를 규칙합성의 여기신호로 사용하였다. 제안된 방법으로 음성을 합성한 결과 양질의 합성음을 얻을 수 있음을 확인하였다.

  • PDF

벤처의 발견 - 잡시장에 새로운 패러다임을 세운다

  • 강관식
    • 벤처다이제스트
    • /
    • 제12호통권125호
    • /
    • pp.30-31
    • /
    • 2008
  • 2008년 12월 1일 '눈에 보이지 않는 일'을 사고파는 시장이 열린다. 기존 구인 구직의 개념이 아닌, 웹상에서 기업은 '일'단위로 인력을 모집하고, 구직자는 회사가 아닌 '일'을 선택하는 전자일감시장 이워크랜드(www.eworkland.co.kr)가 이달의 첫날 정식 오픈하였다. 유비쿼터스 환경을 바탕으로 시공간의 제약을 받지 않는 새로운 전자일감시장을 연 주인공은 시너지 프레임이라는 개발 프레임워크로 널리 알려진 강소벤처 아토정보기술(www.attoit.co.kr). 야심찬 서비스를 준비하고 누구보다 떨리는 가슴으로 올해의 마지막 달을 맞이하는 아토정보기술의 강관식 대표를 만나본다.

  • PDF