• Title/Summary/Keyword: 자막 추출

Search Result 82, Processing Time 0.037 seconds

A Generalized Method for Extracting Characters and Video Captions (일반화된 문자 및 비디오 자막 영역 추출 방법)

  • Chun, Byung-Tae;Bae, Young-Lae;Kim, Tai-Yun
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.6
    • /
    • pp.632-641
    • /
    • 2000
  • Conventional character extraction methods extract character regions using methods such as color reduction, region split and merge and texture analysis from the whole image. Because these methods use many heuristic variables and thresholding values derived from a priori knowledge, it is difficult to generalize them algorithmically. In this paper, we propose a method that can extract character regions using a topographical feature extraction method and a point-line-region extension method. The proposed method can also solve the problems of conventional methods by reducing heuristic variables and generalizing thresholding values. We see that character regions can be extracted by generalized variables and thresolding values without using a priori knowledge of character region. Experimental results show that the candidate region extraction rate is 100%, and the character region extraction rate is over 98%.

  • PDF

Soccer Video Summarization Using Caption Analysis (자막 분석을 이용한 축구 비디오 요약)

  • 임정훈;국나영;곽순영;강일고;이양원
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.77-80
    • /
    • 2002
  • 비디오 데이터에서 캡션은 비디오의 중요한 부분과 내용을 나타내는 가장 보편적인 방법이다. 본 논문에서는 축구 비디오에서 캡션이 갖는 특징을 분석하고 캡션에 의한 키 프레임을 추출하도록 하며, 비디오 요약 생성 규칙에 따라 요약된 비디오를 생성하도록 한다. 키 프레임 추출은 이벤트 발생에 따른 캡션의 등장과 캡션 내용의 변화를 추출하는 것으로 탬플리트 매칭과 지역적 차영상을 통하여 추출하며 샷의 재설정 통하여 중요한 이벤트를 포함한 요약된 비디오를 생성하도록 한다.

  • PDF

Soccer Vodeo Summarization Using Caption Analysis (자막 분석을 이용한 축구비디오 요약)

  • 신성윤;강일고;이양원
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2002.11a
    • /
    • pp.579-582
    • /
    • 2002
  • 비디오 데이터에서 캡션은 비디오의 중요한 부분과 내용을 나타내는 가장 보편적인 방법이다. 본 논문에서는 축구 비디오에서 캡션이 갖는 특징을 분석하고 캡션에 의한 키 프레임을 추출하도록 하며, 비디오 요약 생성 규칙에 따라 요약된 비디오를 생성하도록 한다. 키 프레임 추출은 이벤트 발생에 따른 캡션의 등장과 캡션 내용의 변화를 추출하는 것으로 탬플리트 매칭과 지역적 차영상을 통하여 추출하며 샷의 재설정 통하여 중요한 이벤트를 포함한 요약된 비디오를 생성하도록 한다.

  • PDF

Classification of Education Video by Subtitle Analysis (자막 분석을 통한 교육 영상의 카테고리 분류 방안)

  • Lee, Ji-Hoon;Lee, Hyeon Sup;Kim, Jin-Deog
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.88-90
    • /
    • 2021
  • This paper introduces a method for extracting subtitles from lecture videos through a Korean morpheme analyzer and classifying video categories according to the extracted morpheme information. In some cases incorrect information is entered due to human error and reflected in the characteristics of the items, affecting the accuracy of the recommendation system. To prevent this, we generate a keyword table for each category using morpheme information extracted from pre-classified videos, and compare the similarity of morpheme in each category keyword table to classify categories of Lecture videos using the most similar keyword table. These human intervention reduction systems directly classify videos and aim to increase the accuracy of the system.

  • PDF

Decrease of Membrane Degradation in PEMFC by Fucoidan (후코이단에 의한 PEMFC 고분자막의 열화 감소)

  • Oh, Sohyung;Kak, Ahyeon;Oh, Sungjun;Lee, Daewoong;Na, Il-Chai;Park, Kwonpil
    • Korean Chemical Engineering Research
    • /
    • v.58 no.1
    • /
    • pp.59-63
    • /
    • 2020
  • Radical scavenger is used to improve the durability of PEMFC polymer membrane. In this study, we investigated whether fucoidan extracted from seaweed as a radical scavenger prevents electrochemical degradation through Fenton and OCV Holding experiments. Fucoidan has an antioxidant effect, protecting the polymer membrane from hydrogen peroxide and oxygen radicals, reducing the degradation rate to 1/10. Fucoidan has been shown to be more effective than MnO2, which is used as a radical scavenger. In the PEMFC cell, the accelerated durability evaluation method (OCV Holding) showed that fucoidan reduced the hydrogen permeability of the polymer membrane by 12% and enhanced the performance by 29.1% compared to without radical scavenger. And fucoidan was found to be more effective in the cathode side ionomer than the anode side.

XMARS: XML-based Multimedia Annotation And Retrieval System (XMARS: XML 기반 멀티미디어 주석 및 검색 시스템)

  • 남윤영;황인준
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05d
    • /
    • pp.1069-1074
    • /
    • 2002
  • 본 논문에서는 XML을 이용하여 멀티미디어 데이터를 구조적으로 표현하고 효율적으로 추출하기 위한 XML 기반 멀티미디어 주석 및 검색 시스템을 제안한다. 이 시스템은 멀티미디어 정보를 표현하기 위해 계층적 메타데이터 모델을 기반으로 하여 구현되였으며, 멀티미디어 데이터에 대한 주석, 검색, 브라우징 인터페이스를 제공한다. 멀티미디어에 대한 메타데이터는 MPEG-7에 정의되어 있는 서술 스키마를 기반으로 XML 스키마를 이용하여 작성하였다. 또한, 멀티미디어 데이터의 효율적인 인덱싱과 추출을 위하여 자막과 주석을 바탕으로 한 카테고라이징 기법을 사용하였다. 본 시스템의 목적은 멀티미디어 데이터에 대해 주석을 처리하고, 다양한 방법으로 검색과 그 결과를 브라우징하는 데 있다.

  • PDF

Residual Convolutional Recurrent Neural Network-Based Sound Event Classification Applicable to Broadcast Captioning Services (자막방송을 위한 잔차 합성곱 순환 신경망 기반 음향 사건 분류)

  • Kim, Nam Kyun;Kim, Hong Kook;Ahn, Chung Hyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.26-27
    • /
    • 2021
  • 본 논문에서는 자막방송 제공을 위해 방송콘텐츠를 이해하는 방법으로 잔차 합성곱 순환신경망 기반 음향 사건 분류 기법을 제안한다. 제안된 기법은 잔차 합성곱 신경망과 순환 신경망을 연결한 구조를 갖는다. 신경망의 입력 특징으로는 멜-필터벵크 특징을 활용하고, 잔차 합성곱 신경망은 하나의 스템 블록과 5개의 잔차 합성곱 신경망으로 구성된다. 잔차 합성곱 신경망은 잔차 학습으로 구성된 합성곱 신경망과 기존의 합성곱 신경망 대비 특징맵의 표현 능력 향상을 위해 합성곱 블록 주의 모듈로 구성한다. 추출된 특징맵은 순환 신경망에 연결되고, 최종적으로 음향 사건 종류와 시간정보를 추출하는 완전연결층으로 연결되는 구조를 활용한다. 제안된 모델 훈련을 위해 라벨링되지 않는 데이터 활용이 가능한 평균 교사 모델을 기반으로 훈련하였다. 제안된 모델의 성능평가를 위해 DCASE 2020 챌린지 Task 4 데이터 셋을 활용하였으며, 성능 평가 결과 46.8%의 이벤트 단위의 F1-score를 얻을 수 있었다.

  • PDF

Internet based highlight scene viewing service using DTV closed-caption data (방송 자막을 이용한 인터넷 기반 주요장면 보기 서비스)

  • Kim, Kyu-Seok;Yoon, Jeong-Hyun;Kim, Cheon-Seog;Ji, Mi-Kyong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2009.11a
    • /
    • pp.247-250
    • /
    • 2009
  • VOD(Video On Demand) 서비스는 통 방 융합 환경에서의 킬러서비스로, 지상파 방송사에서는 인터넷을 통해 '다시 보기', 'TV VOD' 등의 서비스를 제공하고 있다. 이러한 기존의 방송 VOD 서비스는 콘텐트를 실제 재생하기 전에는 사용자가 원하는 장면을 찾기가 쉽지 않으며, 또한 콘텐트를 실제 재생하더라도 대사 내용이 텍스트로 제공되지 않으므로 청각 장애자의 경우 내용을 파악하기가 어렵다. 본 논문에서는 이와 같은 기존의 방송 VOD 서비스의 단점을 보완하기 위해 디지털 방송 프로그램으로부터 자막 데이터를 추출하고 이를 기반으로 방송 콘텐트의 구간 정보를 생성하기 위한 연구 내용과 이를 적용하여 웹사이트를 통해 제공되고 있는 '주요장면 보기' 서비스의 실 구축 사례를 소개한다.

  • PDF

Implementation of Content-based News Video Retrieval System for Efficient Video Data Management (효율적인 데이터 관리를 위한 내용기반 뉴스 비디오 검색 시스템 구현)

  • Nam, Yun-Seong;Yang, Dong-Il;Bae, Jong-Sik;Choi, Hyung-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.755-758
    • /
    • 2005
  • 뉴스 데이터를 구조적으로 분할하고 의미적으로 분류하여 내용별로 세분화하여 검색하는 방법을 제안한다. 구조적 분할은 공간 밝기 분포와 명암도의 불연속성 그리고 시간적인 관계 등 프레임간의 상관 정보를 이용하여 장면을 분할한다. 의미적 분류는 키 프레임에서 추출된 특징 정보를 사전 지식 정보와 비교하여 뉴스 비디오의 세부 내용을 기사별로 분류한다. 뉴스의 진행이 앵커 프레임을 중심으로 주기적으로 반복된다는 특징을 이용하여 앵커 장면과 비 앵커 장면으로 기사를 분류한다. 비 앵커 장면은 연설장면, 인터뷰장면, 일반 장면으로 세분화하고 기사별로 분류하여 검색하도록 한다. 또한 뉴스 아이콘에 의한 요약 검색 기능 그리고 자막 통합 처리에 의한 자막 검색을 하여 뉴스 비디오를 내용별로 분류하고 인덱싱하여 신속하게 뉴스 비디오를 검색할 수 있도록 설계한다.

  • PDF

Background Music Identification in TV Broadcasting Program Algorithm using Audio Peak Detection (오디오 피크 검출을 적용한 TV 방송 프로그램 내 배경음악 식별 알고리즘)

  • Lee, Jung-Sung;Kim, Hyoung-Gook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.34-35
    • /
    • 2013
  • 본 논문에서는 오디오 피크 검출을 적용한 TV 방송 프로그램내 배경음악 식별 알고리즘을 제안한다. 제안한 알고리즘은 음악 핑거프린트 추출 및 전송부, 음악구간 검출부, 음악 핑거프린트는 고속 매칭 및 정보전송부 세 부분으로 구성되어 있다. 음악 핑거프린트 추출 및 전송부에서는 음악 원음 오디오 데이터를 퓨리에 변환하여 스펙트럼 계수를 추출한다. 추출된 스펙트럼의 성분 중에서 일정한 문턱값 이상의 에너지를 가지는 값을 피크로 검출하고 검출된 피크를 이용하이 핑거프린트를 생성하고 데이터 베이스화한다. 음악구간 검출부에서는 입력된 방송 프로그램 오디오 데이터에 GMM(Gaussian Mixture Model)을 적용하여 음악과 음악 외 오디오 데이터를 분류한다. 음악 핑거프린트 고속 매칭 및 정보전송부에서는 음악구간이라고 인식된 쿼리 오디오 데이터를 음악 핑거프린트 추출 및 전송부와 동일한 과정을 통해 핑거프린트를 생성하고 데이터 베이스화된 음악 원음의 핑거프린트들과 비교하여 가장 유사한 음원의 정보를 TV의 화면에 자막으로 보여준다.

  • PDF