• Title/Summary/Keyword: 장면 텍스트

Search Result 70, Processing Time 0.024 seconds

Text Extraction using Character-Edge Map Feature From Scene Images (장면 이미지로부터 문자-에지 맵 특징을 이용한 텍스트 추출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Lee, Woo-Ram;Kwon, Kyo-Hyun;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.05a
    • /
    • pp.139-142
    • /
    • 2006
  • 본 연구는 장면 이미지로부터 텍스트에 존재하는 문자-에지 특징을 이용하여 텍스트를 추출하는 방법을 제안한다. 캐니(Canny)에지 연산자를 이용하여 장면 이미지로부터 에지를 추출하고, 추출된 에지로부터 16종류의 에지-맵 생성한다. 생성된 에지 맵을 재구성하여 문자 특징을 갖는 8종류의 문자-에지 맵을 만단다. 텍스트는 배경과 잘 분리되는 특징이 있으므로 텍스트에 존재하는 '문자-에지 맵'의 특징을 이용하여 텍스트를 추출한다. 텍스트 영역에 대한 검증은 문자-에지 맵의 분포와 텍스트에 존재하는 글자간의 공백 특징으로 한다. 제안한 방법은 다양한 종류의 장면 이미지를 실험대상으로 하였고, 텍스트는 적어도 2글자 이상으로 구성된다는 제한조건과 너무 크거나 작은 텍스트는 텍스트 추출에서 제외하였다. 실험결과 텍스트 영역 추출률은 약 83%를 얻었다.

  • PDF

The Slope Extraction and Compensation Based on Adaptive Edge Enhancement to Extract Scene Text Region (장면 텍스트 영역 추출을 위한 적응적 에지 강화 기반의 기울기 검출 및 보정)

  • Back, Jaegyung;Jang, Jaehyuk;Seo, Yeong Geon
    • Journal of Digital Contents Society
    • /
    • v.18 no.4
    • /
    • pp.777-785
    • /
    • 2017
  • In the modern real world, we can extract and recognize some texts to get a lot of information from the scene containing them, so the techniques for extracting and recognizing text areas from a scene are constantly evolving. They can be largely divided into texture-based method, connected component method, and mixture of both. Texture-based method finds and extracts text based on the fact that text and others have different values such as image color and brightness. Connected component method is determined by using the geometrical properties after making similar pixels adjacent to each pixel to the connection element. In this paper, we propose a method to adaptively change to improve the accuracy of text region extraction, detect and correct the slope of the image using edge and image segmentation. The method only extracts the exact area containing the text by correcting the slope of the image, so that the extracting rate is 15% more accurate than MSER and 10% more accurate than EEMSER.

Development of a Script-Based Multimedia Simulator for Representing Spatio-Temporal Situation (스크립트에 기반한 시공간 상황들을 표현하기 위한 멀티미디어 시뮬레이터의 개발)

  • 백경훈;박종희;김남철
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1996.06a
    • /
    • pp.119-124
    • /
    • 1996
  • 본 논문에서는 복잡하고 다양한 시공간적 장면들을 하이퍼텍스트적 구조[1]를 이용하여 서로 연결하고 스크립트 및 프레임이라는 구조를 통해서 장면을 구성함으로써 객체의 재활용도 및 네트워킹을 높이는 객체지향적 멀티미디어 시스템을 설계하고 개발한다. 장면을 구성하는 사물을 객체로 정의하며, 이러한 객체는 2D 그래픽, 텍스트, 사운드와 같은 멀티미디어 정보와 장면에 적용되었을 때 필요한 정보로 구성되어져 있다. 이와 함께 장면과 객체 사이를 연결하는 스크립트와 프래임구조를 통해서 장면 속에서의 객체의 역할을 정의한다.

  • PDF

MPEG-4 컨텐츠 저작 도구

  • 김상욱;차경애;김희선;배수영;지동해;민옥기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.254-256
    • /
    • 1999
  • MPEG-4는 멀티미디어 객체들로 구성된 시청각 장면을 컨텐츠 단위로 표현하기 위해서 장면을 기술하는 장면 디스크립션을 가진다. 이것은 장면을 구성하는 각 멀티미디어 객체들의 시공간적인 위치와 그들 사이의 관계를 표현하는 이진 형식의 스트림이다. 즉 MPEG-4 장면을 저작하기 위해서는 텍스트 형태로 장면 디스크립션을 기술한다. 그러나 시청각 컨텐츠로 구성되는 장면의 저작은 시각적으로 컨텐츠를 구성할 수 있는 저작 환경의 제공이 보다 효과적이고 편리한 작업을 가능하게 할 것이다. 본 논문에서는 시청각 장면의 텍스트 저작 작업의 한계를 극복하고 MPEG-4 컨텐츠의 시공간적 관계를 시각적으로 저작할 수 있는 MPEG-4 장면의 시각적 저작도구를 제안하고 그 구현 예를 보인다.

  • PDF

Effective EPG service on the basis of using MPEG-4 LASeR scene description (MPEG-4 LASeR 장면기술을 활용한 효율적인 EPG 서비스 제공 방법)

  • Park, YongChul;Kim, ByungChul;Kim, Kyuheon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.11a
    • /
    • pp.188-191
    • /
    • 2011
  • 본 논문에서는 MPEG-4 LASeR (Lightweight Application Scene Representation) 장면기술을 활용하여 효과적인 EPG(Electronic Program Guide) 서비스를 제공하는 방안을 제안한다. EPG는 텔레비전 방송 프로그램의 편성표를 텔레비전 화면상에 표시하는 것으로, 텔레비전을 시청하는 사람은 이 편성표를 통해 원하는 프로그램을 선택하거나 시간, 제목, 채널, 장르 등을 기준으로 원하는 프로그램을 검색할 수 있는 서비스를 말한다. 국제 표준 규격인 MPEG-4에는 장면의 동적인 업데이트를 위해 다양한 명령을 포함한 장면 서술정보를 제공 할 수 있는 LASeR 기술을 제공하고 있다. 특히, LASeR 표준은 구조화된 정보의 표현 및 수정 방법을 제공하기 위한 방법으로 PMSI (Presentation Method & Structured Information)를 제정하였으며, 해당 기술은 장면 서술정보에서 구조화된 정보의 일부분을 참조하여 장면에 효과적으로 표현하는 것을 가능하게 해 준다. 본 논문에서는 MPEG-4 LASeR PMSI를 기존의 텍스트 중심의 단순 EPG에 적용하여 텍스트 뿐만이 아닌 이미지 비디오 등의 멀티미디어 데이터를 활용하여 보다 동적으로 EPG 서비스를 제공하는 방법에 대하여 제안한다.

  • PDF

Mobile Phone Camera Based Scene Text Detection Using Edge and Color Quantization (에지 및 컬러 양자화를 이용한 모바일 폰 카메라 기반장면 텍스트 검출)

  • Park, Jong-Cheon;Lee, Keun-Wang
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.3
    • /
    • pp.847-852
    • /
    • 2010
  • Text in natural images has a various and important feature of image. Therefore, to detect text and extraction of text, recognizing it is a studied as an important research area. Lately, many applications of various fields is being developed based on mobile phone camera technology. Detecting edge component form gray-scale image and detect an boundary of text regions by local standard deviation and get an connected components using Euclidean distance of RGB color space. Labeling the detected edges and connected component and get bounding boxes each regions. Candidate of text achieved with heuristic rule of text. Detected candidate text regions was merged for generation for one candidate text region, then text region detected with verifying candidate text region using ectilarity characterization of adjacency and ectilarity between candidate text regions. Experctental results, We improved text region detection rate using completentary of edge and color connected component.

Text Detection in Scene Images using spatial frequency (공간주파수를 이용한 장면영상에서 텍스트 검출)

  • Sin, Bong-Kee;Kim, Seon-Kyu
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.31-39
    • /
    • 2003
  • It is often assumed that text regions in images are characterized by some distinctive or characteristic spatial frequencies. This feature is highly intuitive, and thus appealing as much. We propose a method of detecting horizontal texts in natural scene images. It is based on the use of two features that can be employed separately or in succession: the frequency of edge pixels across vertical and horizontal scan lines, and the fundamental frequency in the Fourier domain. We confirmed that the frequency features are language independent. Also addressed is the detection of quadrilaterals or approximate rectangles using Hough transform. Since texts that is meaningful to many viewers usually appear within rectangles with colors in high contrast to the background. Hence it is natural to assume the detection rectangles may be helpful for locating desired texts correctly in natural outdoor scene images.

A Study on Stop Motion Text Contents Production using Motion Graphics (모션 그래픽을 이용한 스톱모션 텍스트 콘텐츠 제작에 관한 연구)

  • Joo, Heon-Sik
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.189-190
    • /
    • 2015
  • 본 연구에서는 모션 그래픽을 이용하여 스톱 모션 텍스트 제작을 나타내었다. 스톱모션은 컴퓨터애니메이션의 한 종류로서 인형이나 찰흙 같은 소재를 이용하여 한 장면씩 정지 영상을 촬영하여 연속적으로 나타냄으로써 애니메이션으로 이용된다. 본 연구에서는 스톱모션 응용으로 텍스트 애니메이션 기법을 적용하여 텍스트 콘텐츠로 제작하여 나타내었다. 따라서 다양한 영역에서 스톱모션 활용을 할 수 있음을 나타낸다.

  • PDF

Scene Text Detection Using Color-Based Binarization and Text Region Verification Using Support Vector Machine (색기반 이진화를 이용한 장면 텍스트 추출과 써포트 벡터머신을 이용한 텍스트 영역 검증)

  • Jang, Dae-Geun;Kim, Eui-Jeong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.06a
    • /
    • pp.161-163
    • /
    • 2007
  • 기존의 텍스트 추출을 위한 이진화 방법은 입력 이미지를 명도 이미지로 변환한 뒤 이진화 하는 방법을 사용하였다. 이러한 방법은 칼라 이미지에서는 극명히 구분되는 색이라 할지라도 명도 이미지로 변환하는 과정에서 같은 밝기를 같게 되는 경우(예를 들어, 배경은 붉은색, 텍스트는 초록색), 텍스트를 추출하는 데 어려움이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 입력 이미지를 R, G, B로 분리하고 각각을 이진화 하여 텍스트를 추출하고 다해상도 웨이블릿(Wavelet) 변환을 이용하여 텍스트의 획 특징을 추출하여 추출된 특징들을 SVM(Support Vector Machine) 분류기로 검증하여 최종 텍스트 영역을 확정한다. 제안한 방법을 적용함으로써 명도 정보만으로는 추출하기 어려웠던 텍스트 영역을 효과적으로 추출하고 텍스트와 구별하기 어려운 영역을 획수준으로 검증할 수 있었다.

  • PDF

AEMSER Using Adaptive Threshold Of Canny Operator To Extract Scene Text (장면 텍스트 추출을 위한 캐니 연산자의 적응적 임계값을 이용한 AEMSER)

  • Park, Sunhwa;Kim, Donghyun;Im, Hyunsoo;Kim, Honghoon;Paek, Jaegyung;Park, Jaeheung;Seo, Yeong Geon
    • Journal of Digital Contents Society
    • /
    • v.16 no.6
    • /
    • pp.951-959
    • /
    • 2015
  • Scene text extraction is important because it offers some important information on different image based applications pouring in current smart generation. Edge-Enhanced MSER(Maximally Stable Extremal Regions) which enhances the boundaries using the canny operator after extracting the basic MSER shows excellent performance in terms of text extraction. But according to setting the threshold of the canny operator, the result images using Edge-Enhanced MSER are different, so there needs a method figuring out the threshold. In this paper, we propose a AEMSER(Adaptive Edge-enhanced MSER) that applies the method extracting the boundary using the middle value of histogram to Edge-Enhanced MSER to get the canny operator's threshold. The proposed method can acquire better result images than the existing methods because it extracts the area only for the obvious boundaries.