• 제목/요약/키워드: Text color

검색결과 198건 처리시간 0.024초

분산맵을 이용한 웹 이미지 텍스트 영역 추출 (Text Region Segmentation from Web Images using Variance Maps)

  • 정인숙;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제9권9호
    • /
    • pp.68-79
    • /
    • 2009
  • 분산맵은 텍스트 영역이 주변과의 색상 혹은 밝기 변화가 심하다는 특징을 이용하는 방법으로 특히 잦은 포맷 변환에 의하여 해상도가 낮거나 일정하지 않은 웹 이미지의 텍스트 영역을 추출하는 데 적용할 수 있다. 그러나 이전의 분산맵을 적용한 방법들은 입력 영상 전역에 고정된 마스크를 한 번만 적용하는 광역 분산맵을 사용하므로 텍스트 크기가 매우 작거나 큰 경우, 획의 색상에 gradation효과가 있는 경우, 각도, 위치, 색상 등이 복잡한 경우 텍스트 추출 성능이 안정 적이지 못하다. 본 논문은 2단계 분산맵을 사용하여 Web 이미지에서 텍스트 영역을 안정적으로 추출하는 방법을 제안한다. 제안된 방법은 광역 및 지역 분산맵이 각 단계에서 적용되며 서로 계층적 관계를 가진다. 1단계는 텍스트 영역 추출 재현율을 높일 수 있도록, 충분히 큰 글자 혹은 작은 글자도 추출할 수 있는 일정한 마스크 크기를 가진 광역의 수직 및 수평 색 분산맵을 적용하여 유사 텍스트 영역을 추출한다. 2단계에서는 1단계의 각 연결요소영역에 새로운 마스크 크기를 가진 명암 분산맵을 적용하여 최종적인 텍스트 영역을 추출한다. 2단계 분산맵 적용에 의하여 1단계에서 구한 유사 텍스트 영역에 남아 있는 배경 부분이 많이 사라지게 되어 추출 정확률이 높아진다. 제안한 방법을 400개의 Web 이미지에 적용한 결과 배경이 복잡해도 비교적 안정적으로 텍스트 영역을 추출하는 것을 확인할 수 있었다.

빅데이터를 활용한 색조화장품의 구매 요인에 관한 연구: 토픽모델링과 Concor 분석을 중심으로 (A Study on the Purchasing Factors of Color Cosmetics Using Big Data: Focusing on Topic Modeling and Concor Analysis)

  • 이은희;배승희
    • 한국응용과학기술학회지
    • /
    • 제40권4호
    • /
    • pp.724-732
    • /
    • 2023
  • 본 연구에서는 코로나 이후 색조화장품 시장의 소비자들의 온라인 관심 정보에 대한 자료 수집을 통하여 색조화장품 정보 검색의 특성과 텍스트 마이닝 분석 결과에 나타난 코로나 이후 색조화장품 시장의 주요 관심정보들을 분석하고자 하였다. 실증분석에서는 "색조화장품" 이라는 단어를 포함하는 뉴스, 블로그, 카페, 웹페이지 등의 모든 문서들을 분석 대상으로 텍스트 마이닝을 수행하였다. 분석 결과 코로나 이후 색조화장품에 대한 온라인 정보 검색은 주로 구매 정보와 피부와 마스크 관련 화장법 등에 관한 정보와 관심 브랜드와 행사 정보 등의 주요 토픽이 주를 이루고 있었다. 결과적으로 코로나 이후 색조화장품 구매자들은 적극적인 온라인 정보 검색을 통하여 제품 가치와 안전성, 가격 혜택, 매장 정보 등의 구매 정보에 더욱 민감하게 될 것이므로 이에 대한 대응전략이 요구된다.

Traffic Signal Recognition System Based on Color and Time for Visually Impaired

  • P. Kamakshi
    • International Journal of Computer Science & Network Security
    • /
    • 제23권4호
    • /
    • pp.48-54
    • /
    • 2023
  • Nowadays, a blind man finds it very difficult to cross the roads. They should be very vigilant with every step they take. To resolve this problem, Convolutional Neural Networks(CNN) is a best method to analyse the data and automate the model without intervention of human being. In this work, a traffic signal recognition system is designed using CNN for the visually impaired. To provide a safe walking environment, a voice message is given according to light state and timer state at that instance. The developed model consists of two phases, in the first phase the CNN model is trained to classify different images captured from traffic signals. Common Objects in Context (COCO) labelled dataset is used, which includes images of different classes like traffic lights, bicycles, cars etc. The traffic light object will be detected using this labelled dataset with help of object detection model. The CNN model detects the color of the traffic light and timer displayed on the traffic image. In the second phase, from the detected color of the light and timer value a text message is generated and sent to the text-to-speech conversion model to make voice guidance for the blind person. The developed traffic light recognition model recognizes traffic light color and countdown timer displayed on the signal for safe signal crossing. The countdown timer displayed on the signal was not considered in existing models which is very useful. The proposed model has given accurate results in different scenarios when compared to other models.

VDT화면에서 텍스트의 행간구분방법과 색상이 가독성에 미치는 영향 (Effects of Background, Underline, and Color on Readability of Visually Displayed Text)

  • 오승빈;박성하
    • 산업경영시스템학회지
    • /
    • 제32권4호
    • /
    • pp.208-214
    • /
    • 2009
  • In this study, we examined the effects of background and underline on the readability of displayed text. The background was placed on every other line and the underline was done with every line of the text. The effect of adding color to the background and underline was also of primary concern. Twenty subjects were tested on their reading efficiency (i.e. time-to-read and comprehension) and subjective preference of different text format presented on a LCD. Result showed that for the background condition, the background with green format significantly decreased the time-to-read as compared to the format without any background. The results of ANOVA on comprehension and subjective preference were also consistent with this finding. For the underline condition, otherwise, the underline with yellow format yielded higher speed and better comprehension. The results imply that adding background or underlines with appropriate colors can be an additional and useful way of improving text readability.

랜드마크 항공 사진을 이용한 관광 경험과 색채 연관성 분석 (An Analysis of Tourism Experience and Color Relationships Using Landmark Air Photos)

  • 윤승식;도진우;강주영
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.51-57
    • /
    • 2018
  • 본 연구는 관광지를 선택할 때 중요한 관광 경험 중 시각적 요소에 해당하는 색상과 관광 경험 사이의 유효한 연관성을 찾는 것에 있다. 즉 관광지별로 대표되는 색상이 실제 관광지에 대한 경험과 관련이 있는지 찾아봄으로써, 시각적 요소 중 색채의 영향력에 대해 살펴보고자 하였다. 관광지 색상을 추출하기 위해 본 연구에서는 관광지별 랜드마크 항공 사진을 사용하였고, 기술표준원의 한국 표준색 색채 분석 도구인 KSCA를 이용하여 주요 배색을 추출하였다. 그리고 색상과 색상별 형용사 간의 관계를 매칭한 IRI image scale을 통해 관광지별 주요 색상에 대한 형용사를 추출하였다. 관광 경험은 색상을 추출한 관광지에 대한 Tripadvisor 리뷰를 분석하여 주요 키워드를 도출해 내었다. 항공 사진의 유효성 검증을 위해 Tripadvisor에서 제공하는 대표 전경 사진도 함께 분석에 활용되었다. 분석 결과 색상에서 추출된 형용사과 관광지별 리뷰 주요 키워드 간의 유효한 연관성은 찾을 수 없었는데, 이는 관광지 전체의 주요 색상은 관광지 세부 경험에 비해 중요한 요인이 되지 않고 있는 것으로 판단된다. 본 연구는 색상 분석 연구와 텍스트 마이닝을 결합한 새로운 연구 방향을 제시함으로써 추후 색상을 활용한 연구에 기여하고자 하였다.

색 분산 특징을 이용한 텍스트 추출에서의 손실된 분산 복원 (Variance Recovery in Text Detection using Color Variance Feature)

  • 최영우;조은숙
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.73-82
    • /
    • 2009
  • 본 논문은 자연이미지에 포함된 텍스트 영역을 찾기 위한 방법으로서 기존에 제안한 색 분산 특징을 이용한 방법에서 분산이 제대로 추출되지 않는 문자 획들에 대한 복원 방법을 제안한다. 이전의 색 분산 특징을 이용한 추출방법에서는 고정된 크기의 수평 및 수직 분간 추출 윈도우를 사용함으로서 문자 획이 두껍거나 긴 경우에는 색 분산이 제대로 추출되지 않는 단점이 있었다. 따라서 본 논문에서는 미 추출된 색 분산을 연결요소 외곽사각형의 기하학적인 정보와 경험적인(Heuristic) 지식을 함께 이용하여 복원하는 방법을 제안한다. 제안한 방법은 다양한 종류의 디지털 카메라와 휴대폰 카메라를 이용해서 취득한 문서 유형의 이미지와 간판, 거리 표지판 등의 자연이미지를 사용하여 테스트 하였으며, 특히 큰 글자를 포함하는 자연이미지에 대해서도 텍스트 추출의 정확성이 향상된 것을 확인할 수 있었다.

문자 영역을 강조하기 위한 적응적 오차 확산법 (Adaptive Error Diffusion for Text Enhancement)

  • 권재현;손창환;박태용;조양호;하영호
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.9-16
    • /
    • 2006
  • 본 논문에서는 최대 기울기 차이(maximum gradient difference, MGD)를 이용한 효과적인 문자 분할과 문자 영역을 강조하기 위한 적응적 오차 확산법을 제안한다. 스캔 라인을 따라 기울기를 계산하고, 잠재적 문자 영역을 융합하기 위해 국부적 윈도우 내에 MGD 값을 채운다. 노이즈 필터링을 거친 후, 배경에는 기존 오차 확산법, 문자에는 경계 향상 오차 확산법을 적용한다. 서로 다른 하프토닝 알고리즘의 사용으로 눈에 거슬리는 결함이 발생하기 때문에 경계 결함을 줄이기 위해 단계적 팽창(gradual dilation)을 적용한다. 단계적으로 팽창된 문자 영역(gradually dilated to저 region, GDTR)에 기반한 샤프닝(sharpening)은 문자 영역의 경계에서 연속적으로 점이 찍히는 것을 막을 수 있다. 제안한 적응적 오차 확산법은 일반적인 오차 필터를 이용하여 경계 향상 정도를 조절할 수 있는 칼라 하프토닝 방법이다. 경계 향상 정도와 색차를 분석하여 경계 향상 계수를 정하고, 경계 향상 오차 확산법의 사용으로 인해 점이 찍히지 않는 결함을 줄이기 위하여 추가적인 오차 요소를 반영하였다. 스캔한 영상을 제안한 방법을 이용하여 하프토닝하면 배경의 변화 없이 문자 부분이 선명한 결과를 얻을 수 있다.

색상 단순화와 윤곽선 패턴 분석을 통한 이미지에서의 글자추출 (Text extraction in images using simplify color and edges pattern analysis)

  • 양재호;박영수;이상훈
    • 한국융합학회논문지
    • /
    • 제8권8호
    • /
    • pp.33-40
    • /
    • 2017
  • 본 논문은 이미지에서 효과적인 문자검출을 위해 색상단순화 및 윤곽선에서의 패턴 분석을 통한 문자 검출방법을 제안한다. 윤곽선 기반방법을 사용하는 문자검출 알고리즘은 단순한 배경의 이미지에서는 우수한 성능을 보이지만, 복잡한 배경의 이미지에서는 성능이 떨어지는 단점이 있다. 따라서 제안하는 방법은 복잡한 배경에서의 비문자영역을 최소화하기 위해 이미지 단순화 및 패턴분석을 통한 문자 검출 알고리즘을 제안한다. 먼저 이미지에서의 문자영역 부분을 검출하기 위하여 전처리 과정으로 K-means 군집화를 사용하여 이미지의 색상을 단순화하고, 색상 단순화 과정에서의 물체의 경계의 흐릿해짐을 개선하기 위해 고주파통과필터를 통해 물체의 경계를 강화한다. 그 후 모폴로지 기법의 팽창과 침식의 차이를 이용하여 물체의 윤곽선을 검출하고, 획득한 영역의 윤곽선 부분의 정보(높이, 너비 면적)를 구한 후 패턴분석을 통해 조건을 줌으로써 문자 후보영역을 판별하여 문자가 아닌 불필요한 영역(그림, 배경)을 제거한다. 최종 결과로 라벨링을 통해 불필요한 영역이 제거된 결과를 보여준다.

Text Location and Extraction for Business Cards Using Stroke Width Estimation

  • Zhang, Cheng Dong;Lee, Guee-Sang
    • International Journal of Contents
    • /
    • 제8권1호
    • /
    • pp.30-38
    • /
    • 2012
  • Text extraction and binarization are the important pre-processing steps for text recognition. The performance of text binarization strongly related to the accuracy of recognition stage. In our proposed method, the first stage based on line detection and shape feature analysis applied to locate the position of a business card and detect the shape from the complex environment. In the second stage, several local regions contained the possible text components are separated based on the projection histogram. In each local region, the pixels grouped into several connected components based on the connected component labeling and projection histogram. Then, classify each connect component into text region and reject the non-text region based on the feature information analysis such as size of connected component and stroke width estimation.