An Efficient Scheme for Detecting Caption Regions in DCT-Compressed Images (DCT 기반 압축 영상에서 자막 영역을 검출하기 위한 효율적인 방법)

  • 장현성;강경옥
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2002.11a
    • pp.127-130
    • 2002
  • 동영상 장면에서 자막은 흔히 중요한 의미 정보를 나타내기 때문에 영상으로부터 자막 영역을 검출하는 것은 동영상에 대한 의미적인 분석 및 색인 등 다양한 범위에서 널리 응용될 수 있다. 본 논문에서는 DCT 기반으로 압축된 영상에서 자막 후보 영역을 검출하기 위한 고속의 방법을 제안한다. 제안하는 방법은 자막 영역에서 나타나는 수평 밝기 값의 교대 패턴을 검출하기 위하여 각 블록 별로 1회의 1-D IDCT 과정을 필요로 한다

Image Caption Area extraction using Saliency Map and Max Filter (중요도 맵과 최댓값 필터를 이용한 영상 자막 영역 추출)

  • Kim, Youngjin;Kim, Manbae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2014.11a
    • pp.63-64
    • 2014
  • 본 논문에서는 Saliency map과 Max Filter를 이용한 영상의 자막영역을 추출 한다. Saliency map은 눈에 띄는 영역, 즉 영상에서 주변영역에 비해 밝기 차이가 심한 영역과 윤곽선에 대한 특징이 강한 영역을 돌출하는 것을 말하며, MaxFilter는 중심 픽셀을 최대 윈도우 값을 사용하는 것으로 극단적인 Impulse Noise를 제거하는데 효과적이며 특히 어두운 스파이크를 제거하는데 유용하게 사용된다. 이 두 가지의 특징들을 이용하여 영상의 자막 영역을 추출한다.

Development of Emotion Subtitles Broadcast System based on Terrestrial UHD TV for the Hearing-Impaired (청각장애인을 위한 지상파 UHD 기반 감정표현 자막 송출 시스템 개발)

  • Lee, June;Ahn, Chunghyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2021.06a
    • pp.141-144
    • 2021
  • 최근 지상파 UHD 방송에서는 자막을 비디오 패킷에 삽입하여 전달하는 기존 방식이 아닌 별도의 전송로로 전달하는 폐쇄형 자막(closed caption) 방식을 적용하고 있다. 또한 자막에는 문자 뿐만 아니라 이미지까지 포함하여 청각장애인의 프로그램 이해도를 높이는데 활용할 수 있다. 따라서 본 논문에서는 청각장애 시청자가 방송 콘텐츠 내용의 이해도를 향상시키기 위하여 지상파 UHD 방송에서 기존의 문자 자막과 움직이는 이미지 자막(=감정표현 자막)을 송출하여 동시에 표현할 수 있는 송출시스템을 제안한다.

Soccer Vodeo Summarization Using Caption Analysis (자막 분석을 이용한 축구비디오 요약)

  • 신성윤;강일고;이양원
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • 2002.11a
    • pp.579-582
    • 2002
  • 비디오 데이터에서 캡션은 비디오의 중요한 부분과 내용을 나타내는 가장 보편적인 방법이다. 본 논문에서는 축구 비디오에서 캡션이 갖는 특징을 분석하고 캡션에 의한 키 프레임을 추출하도록 하며, 비디오 요약 생성 규칙에 따라 요약된 비디오를 생성하도록 한다. 키 프레임 추출은 이벤트 발생에 따른 캡션의 등장과 캡션 내용의 변화를 추출하는 것으로 탬플리트 매칭과 지역적 차영상을 통하여 추출하며 샷의 재설정 통하여 중요한 이벤트를 포함한 요약된 비디오를 생성하도록 한다.

A Case Study on Closed Captions: Focusing on on Netflix (넷플릭스 <오징어 게임> 폐쇄자막 연구)

  • Jeong, Sua;Lee, Jimin
    • The Journal of the Convergence on Culture Technology
    • v.10 no.2
    • pp.279-285
    • 2024
  • This study aims to evaluate the accuracy and completeness of Korean and English closed captions for Netflix's "Squid Game" and to present implications based on the findings. To achieve this, the closed captioning guidelines of the U.S. Federal Communications Commission, DCMP, and the Korea Communications Commission were identified and analyzed. The analysis of the subtitle of the entire "Squid Game" series reveals that, while Korean closed captions accurately present slangs and titles, they present non-existent information in speaker identification. In English closed captions, speaker identification guidelines are well followed, but omissions of slangs and title mistranslations are observed. In terms of completeness, both Korean and English closed captions are found to omit certain audio parts. To address these issues, the study suggests strengthening the QA process, establishing a system to communicate original text problems during translation, and utilizing general English subtitles.

Control of Time-varying and Nonstationary Stochastic Systems using a Neural Network Controller and Dynamic Bayesian Network Modeling (신경회로망 제어기와 동적 베이시안 네트워크를 이용한 시변 및 비정치 확률시스템의 제어)

  • Cho, Hyun-Cheol;Lee, Jin-Woo;Lee, Young-Jin;Lee, Kwon-Soon
    • Journal of the Korean Institute of Intelligent Systems
    • v.17 no.7
    • pp.930-938
    • 2007
  • Captions which appear in images include information that relates to the images. In order to obtain the information carried by captions, the methods for text extraction from images have been developed. However, most existing methods can be applied to captions with fixed height of stroke's width. We propose a method which can be applied to various caption size. Our method is based on connected components. And then the edge pixels are detected and grouped into connected components. We analyze the properties of connected components and build a neural network which discriminates connected components which include captions from ones which do not. Experimental data is collected from broadcast programs such as news, documentaries, and show programs which include various height caption. Experimental result is evaluated by two criteria : recall and precision. Recall is the ratio of the identified captions in all the captions in images and the precision is the ratio of the captions in the objects identified as captions. The experiment shows that the proposed method can efficiently extract captions various in size.

Standardizing Korean transliteration of foreign proper names and loan words in headings and notes in the 4th edition of KDC (KDC 4판(1996)상의 외국인명, 지명 및 외래어의 한글표기 문제)

  • 유경숙
    • Journal of Korean Library and Information Science Society
    • v.30 no.4
    • pp.27-57
    • 1999
  • Standardization is a prerequisite of quality control in any field. Library field is not an exception. The bibliographic control structures of AACR2R, MARC, DDC, LCC, LCSH, ISBD are highly standardized and dependent on rigorous authority work, so that libraries and bibliographic utilities using these tools could provide effective quality services. In order to emphasize the importance of standardization in the field of bibliographic control structures, this study focuses on inconsistencies in transliterated foreign personal and geographic names in headings, used as the caption of a given class as well as in notes describing what is found in a class or clarifying the notation hierarchy in the 4th edition of KDC. This study also examines Korean transliteration of loan words in the schedule as well as the transliterated entries of the Relative Index.

Automatic Summarization of Basketball Video Using the Score Information (스코어 정보를 이용한 농구 비디오의 자동요약)

  • Jung, Cheol-Kon;Kim, Eui-Jin;Lee, Gwang-Gook;Kim, Whoi-Yul
    • The Journal of Korean Institute of Communications and Information Sciences
    • v.32 no.9C
    • pp.881-887
    • 2007
  • In this paper, we proposed a method for content based automatic summarization of basketball game videos. For meaningful summary, we used the score information in basketball videos. And the score information is obtained by recognizing the digits on the score caption and analyzing the variation of the score. Generally, important events of basketball are the 3-point shot, one-sided runs, the lead changes, and so on. We have detected these events using score information and made summaries and highlights of basketball video games.

Analysis of Perception on TV Caption and Graphics (방송자막의 시각인지도 분석)

  • Lee, Kook-Se;Moon, Nam-Mee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2008.11a
    • pp.77-80
    • 2008
  • 영상매체를 통한 다양한 정보가 지식을 습득하는 보편화된 수단으로써 자리를 잡아가고 있다. 방송자막은 불과 10여 년 전만 해도 영상의 효과적 전달을 위한 하나의 보조적 수단에 불과했지만 이제는 프로그램의 가치를 높여주는 중요한 정보 중 하나로 꼽을 수 있다. 현재의 방송자막은 SDTV의 가이드라인을 기준 삼아 타 매체에도 그대로 사용되고 있고 수신기 역시 점차 화면이 대형화, 소형화되고 있어 정보전달 면에서 문자의 가독성에 여러 가지 문제점을 지니고 있다. 본 논문에서는 2차의 설문을 통해 전문가 그룹을 대상으로 한 델파이조사를 기반으로 영상화면의 자막크기, 글꼴, 문자속성, 표출효과 등의 시각적 요소와 인지도가 어떤 연관을 가지고 있는지를 고찰하고 OSMU 환경에서의 각 매체별 특성을 고려한 가이드라인을 제안한다.

Internet based highlight scene viewing service using DTV closed-caption data (방송 자막을 이용한 인터넷 기반 주요장면 보기 서비스)

  • Kim, Kyu-Seok;Yoon, Jeong-Hyun;Kim, Cheon-Seog;Ji, Mi-Kyong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2009.11a
    • pp.247-250
    • 2009
  • VOD(Video On Demand) 서비스는 통 방 융합 환경에서의 킬러서비스로, 지상파 방송사에서는 인터넷을 통해 '다시 보기', 'TV VOD' 등의 서비스를 제공하고 있다. 이러한 기존의 방송 VOD 서비스는 콘텐트를 실제 재생하기 전에는 사용자가 원하는 장면을 찾기가 쉽지 않으며, 또한 콘텐트를 실제 재생하더라도 대사 내용이 텍스트로 제공되지 않으므로 청각 장애자의 경우 내용을 파악하기가 어렵다. 본 논문에서는 이와 같은 기존의 방송 VOD 서비스의 단점을 보완하기 위해 디지털 방송 프로그램으로부터 자막 데이터를 추출하고 이를 기반으로 방송 콘텐트의 구간 정보를 생성하기 위한 연구 내용과 이를 적용하여 웹사이트를 통해 제공되고 있는 '주요장면 보기' 서비스의 실 구축 사례를 소개한다.

