• 제목/요약/키워드: Text line information

검색결과 147건 처리시간 0.024초

체인 정합과 확장된 그룹핑 방법을 사용한 곡선형 텍스트 라인 추출 (Extracting curved text lines using the chain composition and the expanded grouping method)

  • ;윤진선;송영준;김남;김용기
    • 정보처리학회논문지B
    • /
    • 제14B권6호
    • /
    • pp.453-460
    • /
    • 2007
  • 본 논문은 정형화되지 않은 텍스트 라인들을 추출하기 위한 방법을 보여주고 있다. 텍스트 라인들은 각기 다른 각도로 구성되고, 심하게 굴곡이 있는 모양, 그리고 텍스트 라인내의 약간의 단어 사이의 공간이 생기게 된다. 그러한 텍스트 라인들은 포스터, 주소, 그리고 예술 문서 등에서 발견된다. 제안하는 방법은 기존의 직관적인 그룹핑 방법에 기반을 두고 있지만, 하나의 라인에서 발생하는 불충분한 특징점들과 모호한 회전 등을 극복하기 위한 방법을 개발하였다. 본 논문에서 텍스트 라인들은 몇 개의 연결된 성분들로 구성되고, 이 성분들은 하나의 문자 또는 연결된 문자들의 검은색 화소들의 집합이라고 가정하였다. 제안하는 방법은 반복적으로 증가되는 임계값과 가까운 성분들은 하나의 체인으로 병합하게 되고 확장되어 길어진 체인들은 라인의 원시 체인으로서 인지된다. 그때 원시 체인들은 텍스트 라인의 부분적 회전에 따라 좌우로 확장되어 진다. 텍스트 라인의 부분적인 회전은 원시 체인이 확장될 때, 체인들의 각 면에서 재구성될 것이다. 이러한 과정을 통해서 모든 텍스트 라인들이 구성되어 진다. 제안 방법은 로고와 슬로건에서 사용된 곡면으로 쓰여진 텍스트 라인들에 대해서 실험한 결과 직선 텍스트 라인은 98%, 곡선 텍스트 라인은 94%로서 높은 추출율을 보여주고 있다.

A Consistent Quality Bit Rate Control for the Line-Based Compression

  • Ham, Jung-Sik;Kim, Ho-Young;Lee, Seong-Won
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권5호
    • /
    • pp.310-318
    • /
    • 2016
  • Emerging technologies such as the Internet of Things (IoT) and the Advanced Driver Assistant System (ADAS) often have image transmission functions with tough constraints, like low power and/or low delay, which require that they adopt line-based, low memory compression methods instead of existing frame-based image compression standards. Bit rate control in the conventional frame-based compression systems requires a lot of hardware resources when the scope of handled data falls at the frame level. On the other hand, attempts to reduce the heavy hardware resource requirement by focusing on line-level processing yield uneven image quality through the frame. In this paper, we propose a bit rate control that maintains consistency in image quality through the frame and improves the legibility of text regions. To find the line characteristics, the proposed bit rate control tests each line for ease of compression and the existence of text. Experiments on the proposed bit rate control show peak signal-to-noise ratios (PSNRs) similar to those of conventional bit rate controls, but with the use of significantly fewer hardware resources.

텐서보팅을 이용한 텍스트 배열정보의 획득과 이를 이용한 텍스트 검출 (Extraction of Text Alignment by Tensor Voting and its Application to Text Detection)

  • 이귀상;또안;박종현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권11호
    • /
    • pp.912-919
    • /
    • 2009
  • 본 논문에서는 이차원 텐서보팅과 에지 기반 방법을 이용하여 자연영상에서 문자를 검출하는 새로운 방법을 제시한다. 텍스트의 문자들은 보통 연속적인 완만한 곡선 상에 배열되어 있고 서로 가깝게 위치하며, 이러한 특성은 텐서보팅에 의하여 효과적으로 검출될 수 있다. 이차원 텐서보팅은 토큰의 연속성을 curve saliency 로 산출하며 이러한 특성은 다양한 영상해석에 사용된다. 먼저 에지 검출을 이용하여 영상 내의 텍스트 영역이 위치할 가능성이 있는 텍스트 후보영역을 찾고 이러한 후보영역의 연속성을 텐서보팅에 의해 검증하여 잡음영역을 제거하고 텍스트 영역만을 구분한다. 실험 결과, 제안된 방법은 복잡한 자연영상에서 효과적으로 텍스트 영역을 검출함을 확인하였다.

복잡한 영상에서 적응적 에지검출을 이용한 텍스트 추출 알고리즘 연구 (Text Extraction Algorithm in Complex Images using Adaptive Edge detection)

  • 신성;김선동;백영현;문성룡
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.251-252
    • /
    • 2007
  • The thesis proposed the Text Extraction Algorithm which is a text extraction algorithm which uses the Coiflet Wavelet, YCbCr Color model and the close curve edge feature of adaptive LoG Operator in order to complement the demerit of the existing research which is weak in complexity of background, variety of light and disordered line and similarity of text and background color. This thesis is simulated with natural images which include naturally text area regardless of size, resolution and slant and so on of image. And the proposed algorithm is confirmed to an excellent by compared with an existing extraction algorithm in same image.

  • PDF

'라인 프렌즈' 캐릭터의 트랜스미디어 브랜딩 사례연구 (A Case Study of Line Friends Character TransMedia Branding)

  • 장효진;김영재
    • 디지털산업정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.153-166
    • /
    • 2015
  • This paper proposes a trans-media branding for the trans-media-based cultural content marketing strategy. Trans-media brand analytical framework is proposed with previous studies. And mobile messenger Character 'Line Friends' is analyzed for the text. Trans-media branding is accessible through a multi-platform in the technological environment. Consumer culture, as well as participate include business models to generate revenue also as brand equity. While the character elements that make up the story from the perspective of cultural content storytelling act as an independent cultural goods. Character is segmented elements. Therefore, trans- media branding of the characters are more meaningful. 'Line Friends' trans-media branding can be summarized as follows: First, it takes advantage of the characteristics of the existing Information-Technology-based mobile. Second, it puts consistently found the content of the attributes of Mobile Messenger 'communication' and 'friendship'. And third, while the content of each platform is constantly linked with other platforms, the brand is positioned inside the window effect.

카메라기반 문서인식 시스템을 위한 현장문서에 적합한 이진화 알고리즘 특징성능의 비교 (Comparison of Feature Performance of Binarization Methods for Character Recognition System Based on Digital Camera)

  • 지수영;김계경;유원필;정연구;김태윤
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.373-376
    • /
    • 2002
  • This paper represents a survey of a variety thresholding techniques including both global and local thresholding. Several thresholding methods are examined in detail to evaluate their performance based on a given set of test images. We also attempt to evaluate the performance of several thresholding methods for construction field documents image recognition system using a broken line structures, broken symbols and text, blurring of lines, symbols and text, noise in homogeneous areas measure as a criterion functions.

  • PDF

텍스트마이닝 기술을 이용한 효율적인 검색시스템 알고리즘에 대한 연구 (A Study of an Efficient Retrieval System Algorithm using a Text Mining)

  • 김제석;김장형
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.531-534
    • /
    • 2005
  • 현재 네트워크 자원과 온라인 정보의 증가속도는 기존 정보시스템의 운용한계를 초과하고 있으며 서버의 처리속도나 네트워크 트래픽 해결을 위해 하드웨어 업그레이드와 네트워크 대역폭 확장으로 많은 문제가 제기 되고 있다. 본 연구에서는 많은 양의 온라인 데이터에서 원하는 문서의 위치를 빠르게 검색 할 수 있는 알고리즘을 연구함으로써 문서집합의 내용변화 또는 사용자의 관점변화에 적용한 최적의 검색내용을 검색할 수 있는 유기적 통합시스템 아키텍쳐를 제안한다.

  • PDF

외국인 암 환자를 위한 국내 방사선치료 영문 텍스트 가독성 분석 (Analysis of Readability of Text in English for Radiation Therapy for Foreigner Patient with Cancer in South Korea)

  • 김대건;김성철
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제45권6호
    • /
    • pp.543-552
    • /
    • 2022
  • This study compared and analyzed with the United States(USA) to evaluated the level of readability of radiotherapy information (English text) provide to foreign patients with cancer by medical institutions in South Korea (KOR). A total of 20 the KOR and USA medical hospitals in 10 each provide information for radiation therapy technology were selected. The readability was comparatively analyzed a total of three aspects (lexical, syntactic, cohesion and readability) by using a Coh-Metrix on-line web program. In readability respect, the mean of the Flesch Reading Ease (FRE) was lower in the KOR (8.3) than in the USA (23.2), Flesch-Kincaid grade level (FKGL) was higher in the KOR than in the USA (14.2) indicating that KOR was less readable than the US (p<.05). In both KOR and USA, the reading level (literacy) of the English text for the radiation therapy was found to be higher than high school (FRE level 50 or lower). Therefore, text information in English for the radiation therapy to foreign patients with cancer should be lowered to elementary school level and read to improve the quality of medical services.

A Fast Algorithm for Korean Text Extraction and Segmentation from Subway Signboard Images Utilizing Smartphone Sensors

  • Milevskiy, Igor;Ha, Jin-Young
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.161-166
    • /
    • 2011
  • We present a fast algorithm for Korean text extraction and segmentation from subway signboards using smart phone sensors in order to minimize computational time and memory usage. The algorithm can be used as preprocessing steps for optical character recognition (OCR): binarization, text location, and segmentation. An image of a signboard captured by smart phone camera while holding smart phone by an arbitrary angle is rotated by the detected angle, as if the image was taken by holding a smart phone horizontally. Binarization is only performed once on the subset of connected components instead of the whole image area, resulting in a large reduction in computational time. Text location is guided by user's marker-line placed over the region of interest in binarized image via smart phone touch screen. Then, text segmentation utilizes the data of connected components received in the binarization step, and cuts the string into individual images for designated characters. The resulting data could be used as OCR input, hence solving the most difficult part of OCR on text area included in natural scene images. The experimental results showed that the binarization algorithm of our method is 3.5 and 3.7 times faster than Niblack and Sauvola adaptive-thresholding algorithms, respectively. In addition, our method achieved better quality than other methods.