• 제목/요약/키워드: 대표프레임

검색결과 433건 처리시간 0.025초

워드넷 신셋에 대한 사건구조 프레임 반자동 태깅 (Semi-automatic Event Structure Frame tagging of WordNet Synset)

  • 임서현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-105
    • /
    • 2018
  • 이 논문은 가장 잘 알려진 어휘부중 하나인 워드넷의 활용 범위 확장을 위해 워드넷 신셋에 "사건구조 프레임(Event Structure Frame)"을 주석하는 연구에 관한 것이다. 워드넷을 비롯하여 현재 사용되고 있는 어휘부는 풍부한 어휘의미정보가 구조화되어 있지만, 사건구조에 관한 정보를 포함하고 있지는 않다. 이 연구의 가장 큰 기여는 워드넷에 사건구조 프레임을 추가함으로써 워드넷과의 연결만으로 핵심적인 어휘의미정보를 모두 추출할 수 있도록 해준다는 점이다. 예를 들어 텍스트 추론, 자연어처리, 멀티 모달 태스크 등은 어휘의미정보와 배경지식(상식)을 이용하여 태스크를 수행한다. 워드넷에 대한 사건구조 주석은 자동사건구조 주석 시스템인 GESL을 이용하여 워드넷 신셋에 있는 예문에 먼저 자동 주석을 하고, 오류에 대해 수동 수정을 하는 반자동 방식이다. 사전 정의된 23개의 사건구조 프레임에 따라 예문에 출현하는 타겟 동사를 분류하고, 해당 프레임과 매핑한다. 현재 이 연구는 시작 단계이며, 이 논문에서는 빈도 순위가 가장 높은 100개의 동사와 각 사건구조 프레임별 대표 동사를 포함하여 총 106개의 동사 레마에 대해 실험을 진행하였다. 그 동사들에 대한 전체 워드넷 신셋의 수는 1337개이다. 예문이 없어서 GESL이 적용될 수 없는 신셋을 제외하면 1112개 신셋이다. 이 신셋들에 대해 GESL을 적용한 결과 F-Measure는 73.5%이다. 향후 연구에서는 워드넷-사건구조 링크를 계속 업데이트하면서 딥러닝을 이용해 GESL 성능을 향상 할 수 있는 방법을 모색할 것이다.

  • PDF

운동학적 접근 방법을 사용한 복잡한 인간 동작 질의 시스템 (A Kinematic Approach to Answering Similarity Queries on Complex Human Motion Data)

  • 한혁;김신규;정형수;염헌영
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-11
    • /
    • 2009
  • 대규모 인간 동작 데이터베이스에서 고차원의 데이터를 처리하는 것이 큰 비용을 요구하기에, 최근 데이터베이스 및 그래픽스 학계는 인간 동작 데이터 질의 및 접근에 큰 관심을 가지게 되었다. 특히, 인간 동작 데이터를 위한 효과적인 유사도(거리) 측정 방법이나 질의 처리는 여전히 많은 연구진들이 도전하고 있는 문제이다. 이에, 본 연구진은 SMoFinder 라고 명명한 동작 질의 처리 시스템을 제안한다. SMoFinder는 새롭게 고안된 운동학적 거리 측정 그리고 적응적 프레임 세그멘테이션에 기반하는 효율적인 인덱싱을 사용하여 동작 질의를 처리한다. 이를 위해, SMoFinder에서는 인간 동작을 다연결 물리 운동으로 간주하고 새로운 가중치 Minkowski 함수를 정의했다. 또한, 효율적인 인덱싱을 위해 모든 프레임을 저장하지 않고 유사한 프레임들 중에서 대표 프레임을 뽑아서 저장하는 적응적 세그멘테이션을 고안했다. 그리고, 효율적인 검색을 위해 이들 대표 프레임들만 가지고 k-근접 이웃 질의를 수행하는 새로운 방법을 제안한다. 마지막으로, SMoFinder가 데이터베이스 용량이 크게 줄지만(1/25배), 검색 능력은 다른 시스템과 동일하거나 우월하다는 것을 실험을 통해 보여주고자 한다.

  • PDF

블록을 이용한 비디오의 fade와 zoom 영역 검출 기법 (Detection of Fade and Zoom Effects Using Blocks in Video)

  • 정인식;권오진
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.195-198
    • /
    • 2000
  • 비디오에서 적은 수의 대표 화면으로 그 비디오의 내용을 요약할 수 있다는 것은 효율적인 비디오 브라우징 및 비디오 검색에 있어서 매우 중요하다. 다양한 종류의 셔트(shot) 추출 방법이 제시되어 왔다. 다양한 종류의 셔트 추출 방법 중에서 칼라 히스토그램을 이용하는 방법이 가장 많이 사용되어 왔다. 그러나 칼라 히스토그램을 이용하는 방법은 fade effect, zoom effect 등과 같이 특별한 효과가 들어있는 비디오에서는 적절하지 못한 결과를 종종 초래한다. 이 논문에서는 블록을 이용한 fade와 zoom 효과가 있는 영역을 검출하는 방법을 제시한다. 대부분의 칼라 히스토그램 방법은 인접한 프레임간 또는 일정한 거리가 떨어져 있는 프레임간의 차이를 이용하였다. 이 논문에서는 차이를 구하고자 하는 프레임간의 거리를 변동시기는 방법을 이용하여 구함으로써 그 성능을 개선하였고, 또한 단순히 두 프레임만을 비교하는 것이 아니라 일정한 수의 프레임을 그룹핑 하여 하나의 블록으로 만들고, 그 블록에서 히스토그램 차이의 평균 및 중간 값을 이용하면 hard cut과 fade같은 효과가 한 블록 내에 같이 있는 경우 더욱 효과적으로 셔트를 추출할 수 있다.

  • PDF

맵리듀스 프레임워크를 이용한 대용량 공간 추론 방식 (Large-scale Spatial Reasoning using MapReduce Framework)

  • 남상하;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.769-772
    • /
    • 2014
  • Jeopardy 퀴즈쇼와 같은 DeepQA 환경에서 인간을 대신해 컴퓨터가 효과적으로 답하기 위해서는 인물, 지리, 사건, 역사 등을 포함하는 광범위한 지식베이스와 이를 토대로 한 빠른 시공간 추론 능력이 필요하다. 본 논문에서는 대표적인 병렬 분산 컴퓨팅 환경인 하둡/맵리듀스 프레임워크를 이용하여 방향 및 위상 관계를 추론하는 효율적인 대용량의 공간 추론 알고리즘을 제시한다. 본 알고리즘에서는 하둡/맵리듀스 프레임워크의 특성을 고려하여 병렬 분산처리의 효과를 높이기 위해, 지식 분할 문제를 맵 단계에서 해결하고, 이것을 토대로 리듀스 단계에서 효과적으로 새로운 공간 지식을 유도하도록 설계하였다. 또한, 본 알고리즘은 초기 공간 지식베이스로부터 새로운 지식을 유도할 수 있는 기능뿐만 아니라 초기 공간 지식베이스의 불일치성도 미연에 감지함으로써 불필요한 지식 유도 작업을 계속하지 않도록 설계하였다. 본 연구에서는 하둡/맵리듀스 프레임워크로 구현한 대용량 공간 추론기와 샘플공간 지식베이스를 이용하여 성능 분석 실험을 수행하였고, 이를 통해 본 논문에서 제시한 공간 추론 알고리즘과 공간 추론기의 높은 성능을 확인 할 수 있었다.

피처레벨 비디오 분석과, 적응적 장면 선택을 이용한 비디오 캡셔닝 피처 생성

  • Lee, Ju-Hee;Kang, Je-Won
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.212-214
    • /
    • 2020
  • 본 논문에서는 비디오의 피처레벨 분석을 통해 비디오의 장면 구성 특징을 파악하고, 그에 적응적으로 대표 프레임을 선택하는 방법을 제안한다. 제안된 방법으로 생성된 캡셔닝 피처는 비디오를 잘 요약하고, 이를 통해 효과적인 캡셔닝을 수행할 수 있다. 기존 비디오 캡셔닝 연구에서는 비디오의 장면 구성을 고려하지 않고 단순 등간격으로 프레임 추출을 통하여 비디오 캡셔닝을 수행하였다. 이는 다양한 장면의 모임으로 이루어진 비디오의 특성을 고려하지 않은 방법으로, 경우에 따라 주요 장면을 놓치거나, 불필요하게 중복된 프레임을 선택하는 문제가 발생한다. 본 논문에서는 비디오의 피처레벨 분석을 통해 비디오의 구성 특징을 파악하고, 이를 고려해 적응적으로 주요 프레임을 추출하여 이와 같은 문제를 해결하여 비디오 캡셔닝 에서의 성능향상을 보인다. 제안 알고리즘을 이용하여 생성된 피처는 비디오를 잘 요약하여 비디오 캡셔닝 수행 시, MSVD 데이터 셋에서 4 개의 평가지표에 대해 약 0.78%의 성능향상을 보였고, MSR-VTT 데이터 셋에서 약 0.6%의 성능향상을 보였다.

  • PDF

비디오 스트림 구조를 활용한 동적 키프레임 기반 사용자 개성 예측 (Predicting User Personality Based on Dynamic Keyframes Using Video Stream Structure)

  • 이미라;우사이먼성일;정혜동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.601-604
    • /
    • 2023
  • 기술이 발전함에 따라 복합적인 모달리티 정보를 포함하는 멀티미디어 데이터의 수집이 용이해지면서, 사람의 성격 특성을 이해하고 이를 개인화된 에이전트에 적용하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 비디오 스트림 구조를 활용하여 사용자 특성을 예측하기 위한 동적 키프레임 추출 방법을 제안한다. 비디오 데이터를 효과적으로 활용하기 위해서는 무작위로 선택한 프레임에서 특징을 추출하던 기존의 방법을 개선하여 영상 내 시간에 따른 정보와 변화량을 기반으로 중요한 프레임을 선택하는 방법이 필요하다. 본 논문에서는 제 3자가 평가한 Big-five 지표 값이 레이블링된 대표적인 데이터셋인 First Impressions V2 데이터셋을 사용하여 외면에서 발현되는 특징들을 기반으로 영상에서 등장하는 인물들의 성격 특성을 예측했다. 결론에서는 선택된 키프레임에서 멀티 모달리티 정보를 조합하여 성격 특성을 예측한 결과와 베이스라인 모델과의 성능을 비교한다.

다중대역 여기신호를 이용한 음성의 규칙합성에 관한 연구 (A Study on the speech synthesis-by-rue system using Multiband Excitation signal)

  • 경연정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.80-83
    • /
    • 1993
  • 본 논문에서는 양질의 규칙합성을 얻기 위하여, 유성음에 대한 여기신호로 임펄스 스펙트럼과 노이즈 스펙트럼을 다중대역으로 혼합하여 생성한 여기신호를 규칙합성에 적용하는 방법을 제안한다. 이 방법에서는, 분석합성에서 각 프레임별로 요구되었던 혼합여기신호에 대한 정보량 문제를 해결하기 위해 유성음의 정상부분의 한 프레임에 대해 혼합여기신호를 구하여 규칙합성에 적용하였고, 정보량을 더욱 줄이는 방안으로, 켑스트럼 유클리디안 거리를 이용하여 유성음을 분류하여, 각 그룹에 대한 대표 여기신호를 규칙합성의 여기신호로 사용하였다. 제안된 방법으로 음성을 합성한 결과 양질의 합성음을 얻을 수 있음을 확인하였다.

  • PDF

MPEG-2/4 IPMPX 기술동향 (An Analysis of MPEG-2/4 IPMPX with Consideration of Interoperable DRM Platform)

  • 최범석;홍진우
    • 전자통신동향분석
    • /
    • 제19권4호통권88호
    • /
    • pp.63-73
    • /
    • 2004
  • 최근 디지털 콘텐츠 산업에서의 저작권 보호 시스템에 대한 중요성이 강조되면서 상호 연동 가능한 DRM에 대한 연구가 활발히 진행되고 있다. MPEG-2/4 IPMPX는 이러한 요구조건을 만족시키기 위하여 시작된 대표적인 국제표준으로 현재 그 규격이 완성단계에 있다. 본 고에서는 기존의 폐쇄 프레임워크형 DRM 시스템 구조에서 탈피하여 개방 프레임워크형 기반의 DRM 플랫폼을 제시한 MPEG-2/4 IPMPX의 기술내용과 구현사례에 대하여 살펴보고 앞으로 해결해야 할 문제점을 제시하였다. 또한 관련 기술동향에 대하여도 간단히 언급하였다.

벤처의 발견 - 잡시장에 새로운 패러다임을 세운다

  • 강관식
    • 벤처다이제스트
    • /
    • 제12호통권125호
    • /
    • pp.30-31
    • /
    • 2008
  • 2008년 12월 1일 '눈에 보이지 않는 일'을 사고파는 시장이 열린다. 기존 구인 구직의 개념이 아닌, 웹상에서 기업은 '일'단위로 인력을 모집하고, 구직자는 회사가 아닌 '일'을 선택하는 전자일감시장 이워크랜드(www.eworkland.co.kr)가 이달의 첫날 정식 오픈하였다. 유비쿼터스 환경을 바탕으로 시공간의 제약을 받지 않는 새로운 전자일감시장을 연 주인공은 시너지 프레임이라는 개발 프레임워크로 널리 알려진 강소벤처 아토정보기술(www.attoit.co.kr). 야심찬 서비스를 준비하고 누구보다 떨리는 가슴으로 올해의 마지막 달을 맞이하는 아토정보기술의 강관식 대표를 만나본다.

  • PDF