• 제목/요약/키워드: Text image

검색결과 972건 처리시간 0.029초

선명화 기법을 이용한 TextFuseNet 성능 향상 (Performance Improvement of TextFuseNet using Image Sharpening)

  • 정지연;천지은;정유철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.71-73
    • /
    • 2021
  • 본 논문에서는 Scene Text Detection의 새로운 프레임워크인 TextFuseNet에 영상처리 관련 기술인 선명화 기법을 제안한다. Scene Text Detection은 야외 간판이나 표지판 등 불특정 배경에서 글자를 인식하는 기술이며, 그중 하나의 프레임워크가 TextFuseNet이다. TextFuseNet은 문자, 단어, 전역 기준으로 텍스트를 감지하는데, 여기서는 영상처리의 기술인 선명화 기법을 적용하여 TextFuseNet의 성능을 향상시키는 것이 목적이다. 선명화 기법은 기존 Sharpening Filter 방법과 Unsharp Masking 방법을 사용하였고 이 중 Sharpening Filter 방법을 적용하였을 때 AP가 0.9% 향상되었음을 확인하였다.

  • PDF

Joint-transform Correlator Multiple-image Encryption System Based on Quick-response Code Key

  • Chen, Qi;Shen, Xueju;Cheng, Yue;Huang, Fuyu;Lin, Chao;Liu, HeXiong
    • Current Optics and Photonics
    • /
    • 제3권4호
    • /
    • pp.320-328
    • /
    • 2019
  • A method for joint-transform correlator (JTC) multiple-image encryption based on a quick-response (QR) code key is proposed. The QR codes converted from different texts are used as key masks to encrypt and decrypt multiple images. Not only can Chinese text and English text be used as key text, but also symbols can be used. With this method, users have no need to transmit the whole key mask; they only need to transmit the text that is used to generate the key. The correlation coefficient is introduced to evaluate the decryption performance of our proposed cryptosystem, and we explore the sensitivity of the key mask and the capability for multiple-image encryption. Robustness analysis is also conducted in this paper. Computer simulations and experimental results verify the correctness of this method.

Text-to-Image를 위한 아동 손그림 학습 모델 생성 연구 (Study on Generation of Children's Hand Drawing Learning Model for Text-to-Image)

  • 이은채;문미경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.505-506
    • /
    • 2022
  • 인공지능 기술은 점차 빠른 속도로 발전되며 응용 분야가 확대되어 창작 산업에서의 역할도 커져 예술, 영화 및 기타 창조적인 산업에도 영향을 주고 있다. 이러한 인공지능 기술을 이용하여 텍스트로 설명하면 다양한 스타일의 이미지를 생성해내는 기술이 있지만 아동이 직접 그린 손그림 스타일의 그림을 생성하지는 못한다. 본 논문에서는 아동 손그림 데이터를 통해 Text-to-Image를 학습시켜 새로운 학습 모델을 생성하는 과정에 대해서 기술한다. 이 연구를 통해 생성된 픽셀을 결합하여 텍스트를 기반으로 하나의 아동 손그림을 만들 수 있을 것으로 기대한다.

  • PDF

신경망 기반의 텍스춰 분석을 이용한 효율적인 문자 추출 (Efficient Text Localization using MLP-based Texture Classification)

  • 정기철;김광인;한정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.180-191
    • /
    • 2002
  • 본 논문은 MLP와 MultiCAMShift 알고리즘을 이용한 텍스춰 기반의 영상 내 문자 추출 방법을 제안한다. MLP를 이용한 텍스춰 분석기는 별도의 특징값 추출 단계 없이 다양한 환경의 입력 영상에 대해 효과적으로 문자 확률 영상을 생성하며, 문자 확률 영상 상에서 수행되는 MultiCAMShift 알고리즘은 국소 탐색만으로 효율적으로 문자 영역을 추출할 수 있다.

Text Embedded JPEG를 이용한 Image Gallery의 설계 및 구현 (Design and Implementation of Image Gallery using Text Embedded JPEG)

  • 천시영;곽미라;조동섭
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.724-727
    • /
    • 2003
  • 현재 웹상의 이미지 갤러리에는 이미지와 함께 제목이나 설명이 포함되는 경우가 많다. 본 논문에서는 갤러리의 검색, 정렬 등의 기능을 강화하고 이미지와 정보의 통합을 위해서 JPEG 이미지의 헤더를 확장하여 이미지의 저작자, 만든 날짜, 설명, 파일크기 등의 텍스트 정보를 내장한 Text Embedded JPEG를 고안하였다. 이 Text Embedded JPEG를 이용한 웹 갤러리에서 이용자는 이미지에 대한 보다 자세한 정보를 볼 수 있고 이 각각의 정보들에 따라 정렬할 수도 있고 이미지 정보를 변경할 수도 있도록 설계하였다.

  • PDF

텍스트 기반 의료영상 검색의 최근 발전 (Recent Development in Text-based Medical Image Retrieval)

  • 황경훈;이해준;고건;김석균;선용한;최덕주
    • 대한의용생체공학회:의공학회지
    • /
    • 제36권3호
    • /
    • pp.55-60
    • /
    • 2015
  • An effective image retrieval system is required as the amount of medical imaging data is increasing recently. Authors reviewed the recent development of text-based medical image retrieval including the use of controlled vocabularies - RadLex (Radiology Lexicon), FMA (Foundational Model of Anatomy), etc - natural language processing, semantic ontology, and image annotation and markup.

A Study on Visual Behavior for Presenting Consumer-Oriented Information on an Online Fashion Store

  • Kim, Dahyun;Lee, Seunghee
    • 한국의류학회지
    • /
    • 제44권5호
    • /
    • pp.789-809
    • /
    • 2020
  • Growth in online channels has created fierce competition; consequently, retailers have to invest an increasing amount of effort into attracting consumers. In this study, eye-tracking technology examined consumers' visual behavior to gain an understanding of information searching behavior in exploring product information for fashion products. Product attribute information was classified into two image-based elements (model image information and detail image information) and two text-based elements (basic text information, detail text information), after which consumers' visual behavior for each information element was analyzed. Furthermore, whether involvement affects consumers' information search behavior was investigated. The results demonstrated that model image information attracted visual attention the quickest, while detail text information and model image information received the most visual attention. Additionally, high-involvement consumers tended to pay more attention to detailed information while low-involvement consumers tended to pay more attention to image-based and basic information. This study is expected to help broaden the understanding of consumer behavior and provide implications for establishing strategies on how to efficiently organize product information for online fashion stores.

대용량 텍스트를 위한 손실 없는 영상 은닉기술 (Simple Image Stenography Technology for Large Scale Text)

  • 이근무
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.1104-1107
    • /
    • 2008
  • 이미지 혹은 문서 은닉기술은 문서, 영상, 오디오 등 모든 종류의 디지털 데이터에 대하여 연구가 진행되고 있다. 이들은 다양한 목적과 용도로 이용되고 있다. 본 연구에서는 낮은 수준의 보안을 요하는 텍스트를 대용량으로 은닉하여 전달할 수 있는 단순하고 단순한 기법을 구현하였다. 먼저 텍스트 이미지를 결합하고 이를 24 비트 심도의 칼라이미지에 인코딩하여 복구하였다. 결과는 상관기법을 이용하여 분석하였으며 텍스트 이미지의 손실율이 미미한 것으로 판명되었다.

고 품질 텍스트 압축 기능을 지원하는 정지영상 압축 시스템 (A Still Image Compression System with a High Quality Text Compression Capability)

  • 이제명;이호석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.275-302
    • /
    • 2007
  • 본 논문은 고품질 텍스트 압축 기능을 지원하는 우수한 정지영상 압축 시스템을 제안한다. 영상에서 텍스트 부분을 분리하여 압축을 수행함으로서 고품질의 텍스트 압축 기능을 지원한다. 시스템은 코드블록 단위로 적응 이진 산술부호화를 수행하여 48:1 이상의 높은 정지영상 압축률을 보여주고 있다. 코드블록은 비트평면을 구성하는 비트들을 서브블록 단위로 파악하여 산술부호에 적합한 코드블록을 구성한 것이다. 산술부호기는 구성된 코드블록을 문맥을 기반으로 압축한다. 시스템의 입력 모드는 분할(Segmentation) 모드와 ROI(Region Of Interest) 모드로 구성된다. 분할 모드는 입력 영상을 텍스트 부분과 배경 영상 부분으로 분할하여 입력할 수 있게 한다. ROI 모드는 입력 영상을 관심 영역과 그 밖의 영역으로 구분하여 입력할 수 있게 한다. 현재 시스템이 나타내는 텍스트 압축 기능과 높은 압축률은 다른 JPEG2000 시스템들과 충분히 비교할 수 있는 수준이다. 시스템은 그 밖에 그레이 코딩을 수행하여 압축률을 향상시킨다.

SOM 기반 웹 이미지 분류에서 고수준 텍스트 특징들의 효과 (The Effectiveness of High-level Text Features in SOM-based Web Image Clustering)

  • 조수선
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.121-126
    • /
    • 2006
  • 본 논문에서는 웹 이미지의 분류 효과를 높이기 위해 이미지 자체에서 추출된 저수준의 비주얼 특징뿐만 아니라 이미지와 관련된 텍스트 정보로부터 나온 고수준 시맨틱 특징들을 이용하는 분류 방법을 제안한다. 이 고수준의 텍스트 특징들은 이미지 URL, 파일명, 페이지 타이틀, 하이퍼링크 및 이미지 주변 텍스트로부터 얻어진다. 분류 엔진으로는 Kohonen의 SOM(Self Organizing Map)을 사용한다. 고수준의 텍스트 특징들과 저수준의 비주얼 특징들을 동시에 사용하는 SOM 기반의 이미지 분류에서는 10개의 카테고리로부터 수집된 200개의 테스트 이미지들이 사용되었다. 분류 성능을 평가하기 위해 간단하면서도 새로운 두 가지 척도, 즉 동일 카테고리 이미지들의 산포 정도와 집적 정도를 나타내는 각각의 척도를 정의하고 사용하였다. 실험결과, SOM기반의 웹 이미지 분류에서는 고수준의 텍스트 특징들이 보다 유용한 것임이 밝혀졌다.