• 제목/요약/키워드: Text density

검색결과 73건 처리시간 0.019초

Text Extraction in HIS Color Space by Weighting Scheme

  • Le, Thi Khue Van;Lee, Gueesang
    • 스마트미디어저널
    • /
    • 제2권1호
    • /
    • pp.31-36
    • /
    • 2013
  • A robust and efficient text extraction is very important for an accuracy of Optical Character Recognition (OCR) systems. Natural scene images with degradations such as uneven illumination, perspective distortion, complex background and multi color text give many challenges to computer vision task, especially in text extraction. In this paper, we propose a method for extraction of the text in signboard images based on a combination of mean shift algorithm and weighting scheme of hue and saturation in HSI color space for clustering algorithm. The number of clusters is determined automatically by mean shift-based density estimation, in which local clusters are estimated by repeatedly searching for higher density points in feature vector space. Weighting scheme of hue and saturation is used for formulation a new distance measure in cylindrical coordinate for text extraction. The obtained experimental results through various natural scene images are presented to demonstrate the effectiveness of our approach.

  • PDF

Research of Adaptive Transformation Method Based on Webpage Semantic Features for Small-Screen Terminals

  • Li, Hao;Liu, Qingtang;Hu, Min;Zhu, Xiaoliang
    • ETRI Journal
    • /
    • 제35권5호
    • /
    • pp.900-910
    • /
    • 2013
  • Small-screen mobile terminals have difficulty accessing existing Web resources designed for large-screen devices. This paper presents an adaptive transformation method based on webpage semantic features to solve this problem. According to the text density and link density features of the webpages, the webpages are divided into two types: index and content. Our method uses an index-based webpage transformation algorithm and a content-based webpage transformation algorithm. Experiment results demonstrate that our adaptive transformation method is not dependent on specific software and webpage templates, and it is capable of enhancing Web content adaptation on small-screen terminals.

화소 밀집도, 화소 하부구조, 휘도, 조명 조도가 스마트폰 가독성에 미치는 영향 (The effects of pixel density, sub-pixel structure, luminance, and illumination on legibility of smartphone)

  • 박종진;이형철;김신우
    • 감성과학
    • /
    • 제17권3호
    • /
    • pp.3-14
    • /
    • 2014
  • 2009년 아이폰의 국내 출시 이후 스마트폰의 보급이 급격히 증가하여 기존에 다양한 장비로 수행되어 오던 작업이 스마트폰으로 대체되었다. 이 과정에서 스마트폰의 작은 화면을 통하여 글자를 읽는 과제를 수행하는 비중이 상당히 증가하였다. 본 연구에서는 일상적인 스마트폰 사용 환경에서 디스플레이 요인(화소 밀집도, 화소 하부구조, 휘도)과 환경 요인(조명 조도)이 글자를 읽을 때의 가독성 관련 불편감에 어떤 영향을 미치는지를 확인하였다. 그 결과 지각된 가독성 관련 불편감에 영향을 미치는 것은 주로 화소 밀집도로, 화소 밀집도가 300 PPI미만인 경우 글자를 읽는데 불편함을 느낀다는 것을 확인하였다. 조명 조도는 제한적인 영향을 보였다. 참가자들은 조명 조도가 변화 할 때 변화하지 않을 때 보다 더 큰 가독성 관련 불편감을 보고하였다. 화소 하부구조와 밝기는 가독성 관련 불편감에 영향을 미치지 않았다. 이 결과를 바탕으로 가독성을 고려할 때 다양한 크기를 가지는 스마트 기기(스마트 폰, 태블릿 컴퓨터)에서 가독성을 해치지 않는 해상도의 하한선을 제안하였다.

DCT와 정보 화소 밀도를 이용한 PDA로 획득한 명함 영상에서의 영역 해석 (Region Analysis of Business Card Images Acquired in PDA Using DCT and Information Pixel Density)

  • 김종흔;장익훈;김남철
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1159-1174
    • /
    • 2004
  • 본 논문에서는 PDA에 장착된 카메라를 사용하여 획득한 명함 영상에 대한 효율적인 영역 해석 알고리듬을 제안한다. 제안된 방법은 크게 영역 분할, 정보 영역 분류, 문자 영역 분류의 3개 과정으로 구성된다. 영역 분할에서는 입력 명함 영상을 8${\times}$8 크기의 블록으로 나누고 각 블록을 저주파 대역에서의 정규화 된 DCT 계수의 에너지를 이용하여 정보 블록과 배경 블록으로 분류한 다음, 블록에 대한 영역 라벨링을 통하여 정보 영역과 배경 영역으로 분할한다. 정보 영역 분류에서는 각 정보 영역을 블록 신호의 수평, 수직 방향 에지 성분과 저주파 대역에서의 DCT 계수의 에너지 비와 이진화 된 정보 영역 내에서의 흑화소인 정보 화소의 밀도를 이용하여 문자 영역과 배경 영역으로 분류한다. 문자 영역 분류에서는 분류된 문자 영역을 정보 화소의 밀도와 평균 런 길이를 이용하여 다시 큰 문자와 작은 문자 영역으로 분류한다. 실험결과 제안된 영역 해석 방법은 여러 종류의 명함을 다양한 주변 여건에서 PDA로 획득한 시험 영상에 대하여 정보 영역과 배경 영역을 잘 분할하고, 정보 영역을 문자 영역과 그림 영역으로 잘 분류하며, 다시 문자 영역을 큰 문자와 작은 문자 영역으로 잘 분류함을 보였다 그리고 제안된 영역 분할 방법과 정보 영역 분류 방법은 기존의 방법들보다 각각 약 2.2-10.1%와 7.7%의 에러율 향상을 보였다.

Main Content Extraction from Web Pages Based on Node Characteristics

  • Liu, Qingtang;Shao, Mingbo;Wu, Linjing;Zhao, Gang;Fan, Guilin;Li, Jun
    • Journal of Computing Science and Engineering
    • /
    • 제11권2호
    • /
    • pp.39-48
    • /
    • 2017
  • Main content extraction of web pages is widely used in search engines, web content aggregation and mobile Internet browsing. However, a mass of irrelevant information such as advertisement, irrelevant navigation and trash information is included in web pages. Such irrelevant information reduces the efficiency of web content processing in content-based applications. The purpose of this paper is to propose an automatic main content extraction method of web pages. In this method, we use two indicators to describe characteristics of web pages: text density and hyperlink density. According to continuous distribution of similar content on a page, we use an estimation algorithm to judge if a node is a content node or a noisy node based on characteristics of the node and neighboring nodes. This algorithm enables us to filter advertisement nodes and irrelevant navigation. Experimental results on 10 news websites revealed that our algorithm could achieve a 96.34% average acceptable rate.

e-Book 인터페이스에서 시각적 경험 설계를 위한 디지털 텍스트 구조의 물리적 요인분석 및 콘텐츠 개발 (Factor Analysis and Content Development of Digital Text Structure for Designing Visual Experience in e-Book Interface)

  • 성은모
    • 한국콘텐츠학회논문지
    • /
    • 제11권11호
    • /
    • pp.79-90
    • /
    • 2011
  • e-Book의 인터페이스 설계는 인쇄 텍스트를 읽고 이해하는 과정에서 시각적 경험에 의해 획득되는 물리적 요인을 반영할 필요가 있다. 이에 본 연구에서는 e-Book 인터페이스 설계를 위한 디지털 텍스트 구조의 물리적 요인은 무엇인지를 규명하고, 이를 반영한 프로토타입의 e-Book 인터페이스를 개발해 봄으로써 그 가능성을 확보하고자 하였다. 디지털 텍스트 구조의 물리적 요인을 규명하기 위하여 탐색적 요인분석과 확인적 요인분석이 실시되었으며, 이를 위해 237명의 대학생들이 설문조사에 참여하였다. 연구결과, 디지털 텍스트 구조의 물리적 요인에 대한 29개의 문항이 개발되었으며 신뢰도는 0.91이었다. 탐색적 요인분석 결과, 부피(volume), 깊이(depth), 밀도(density), 공간(space), 배열(layout), 형태 (format), 단서(signal), 크기(size), 그리고 길이(length) 등 9개의 요인이 도출되었으며, 설명량은 71.49%였다. 9개 요인의 구조에 대한 확인적 요인분석 결과, 각 요인의 적재량은 p<.01 수준에서 유의미한 것으로 나타났으며, 전체적인 모형 적합지수도 양호한 것으로 나타났다. 마지막으로 연구결과의 논의와 추후연구를 위한 시사점이 제시되었다.

Client/Server구조를 이용한 PDA기반의 문자 추출 시스템 (PDA-based Text Extraction System using Client/Server Architecture)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권2호
    • /
    • pp.85-98
    • /
    • 2005
  • 최근, PDA를 이용한 모바일 비젼 시스템에 관한 많은 연구가 진행되고 있다. 대부분의 PDA에서 사용하는 CPU는 실수 연산 구성요소(floating-computation component)가 없는 정수(integer)형 CPU를 사용하므로, 실수 연산이 많은 영상 처리 및 비젼 시스템에서는 많은 시간이 소요되는 단점이 있다 본 논문에서는 이를 해결하기 위해 무선 랜(LAN)으로 연결된 Client(PDA)/server(PC)구조론 이용한 시스템을 제안하며, 연속 영상에서 Client(PDA)와 Server(PC) 각각의 CPU를 이용하여 파이프라이닝 형식으로 시스템을 구축함으로써 수행 시간을 단축한다. Client(PDA)는 에지 밀도(edge density)론 이용하여 대략적인 문자 영역을 추출하며, Server(PC)는 Client(PDA)에서 대략적으로 검출된 견과를 바탕으로 정밀한 문자 영역을 추출하기 위해, MLP(multi-layer perceptron) 기반의 텍스춰 분류 방법과 연결 성분(connected component: CC) 기반의 필터링 방법을 이용한다. 본 실험에서 제안한 방법은 MLP와 CC를 이용함으로써 효과적인 문자 추출 결과를 보였으며, 파이프라이닝 형식의 Client(PDA)/server(PC)구조를 이용함으로써 빠른 수행 시간을 보였다.

새로운 비디오 자막 영역 검출 기법 (A new approach for overlay text detection from complex video scene)

  • 김원준;김창익
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.544-553
    • /
    • 2008
  • 최근 영상 편집 기술의 발달과 더불어 시청자의 이해를 돕기 위해 인위적으로 자막을 삽입하는 경우가 늘고 있다. 인위적으로 삽입된 자막은 해당 장면의 내용이나 편집자의 의도를 잘 표현하고 있기 때문에 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에 유용하다. 기존의 자막 영역 추출 방법은 에지(edge), 색상(color), 텍스처(texture) 정보와 같은 하위 계층(low-level) 특징을 기반으로 하기 때문에 다양한 필체나 밝기 대비를 가진 자막이 동시에 나타나거나 복잡한 배경에 포함된 자막 영역의 경우 잘 검출하지 못한다. 이에 본 논문은 기존의 방법과는 전혀 다른 천이 영역 기반의 새로운 영상 내 자막 영역 검출 기법을 제안하고자 한다. 먼저, 영상 내 삽입된 글자 주변은 시청자에게 영상으로부터의 높이 감을 주기 위해 해당 글자와 다른 색으로 표현된다는 관찰 결과를 바탕으로 천이 지도를 생성한다. 생성된 천이 지도를 이용하여 후보 영역을 추출하고 상태 밀도 개념을 바탕으로 후보 영역 중에서 삽입된 자막 영역을 추출한다. 제안하는 알고리즘은 글자 색, 크기, 위치, 필체, 밝기 대비에 관계없이 적용이 가능하며, 다양한 언어에 관계없이 뛰어난 성능을 보인다. 또한, 프레임 간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.