• Title/Summary/Keyword: 텍스트 효과

검색결과 623건 처리시간 0.04초

분산맵을 이용한 웹 이미지 텍스트 영역 추출 (Text Region Segmentation from Web Images using Variance Maps)

  • 정인숙;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제9권9호
    • /
    • pp.68-79
    • /
    • 2009
  • 분산맵은 텍스트 영역이 주변과의 색상 혹은 밝기 변화가 심하다는 특징을 이용하는 방법으로 특히 잦은 포맷 변환에 의하여 해상도가 낮거나 일정하지 않은 웹 이미지의 텍스트 영역을 추출하는 데 적용할 수 있다. 그러나 이전의 분산맵을 적용한 방법들은 입력 영상 전역에 고정된 마스크를 한 번만 적용하는 광역 분산맵을 사용하므로 텍스트 크기가 매우 작거나 큰 경우, 획의 색상에 gradation효과가 있는 경우, 각도, 위치, 색상 등이 복잡한 경우 텍스트 추출 성능이 안정 적이지 못하다. 본 논문은 2단계 분산맵을 사용하여 Web 이미지에서 텍스트 영역을 안정적으로 추출하는 방법을 제안한다. 제안된 방법은 광역 및 지역 분산맵이 각 단계에서 적용되며 서로 계층적 관계를 가진다. 1단계는 텍스트 영역 추출 재현율을 높일 수 있도록, 충분히 큰 글자 혹은 작은 글자도 추출할 수 있는 일정한 마스크 크기를 가진 광역의 수직 및 수평 색 분산맵을 적용하여 유사 텍스트 영역을 추출한다. 2단계에서는 1단계의 각 연결요소영역에 새로운 마스크 크기를 가진 명암 분산맵을 적용하여 최종적인 텍스트 영역을 추출한다. 2단계 분산맵 적용에 의하여 1단계에서 구한 유사 텍스트 영역에 남아 있는 배경 부분이 많이 사라지게 되어 추출 정확률이 높아진다. 제안한 방법을 400개의 Web 이미지에 적용한 결과 배경이 복잡해도 비교적 안정적으로 텍스트 영역을 추출하는 것을 확인할 수 있었다.

SOM 기반 웹 이미지 분류에서 고수준 텍스트 특징들의 효과 (The Effectiveness of High-level Text Features in SOM-based Web Image Clustering)

  • 조수선
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.121-126
    • /
    • 2006
  • 본 논문에서는 웹 이미지의 분류 효과를 높이기 위해 이미지 자체에서 추출된 저수준의 비주얼 특징뿐만 아니라 이미지와 관련된 텍스트 정보로부터 나온 고수준 시맨틱 특징들을 이용하는 분류 방법을 제안한다. 이 고수준의 텍스트 특징들은 이미지 URL, 파일명, 페이지 타이틀, 하이퍼링크 및 이미지 주변 텍스트로부터 얻어진다. 분류 엔진으로는 Kohonen의 SOM(Self Organizing Map)을 사용한다. 고수준의 텍스트 특징들과 저수준의 비주얼 특징들을 동시에 사용하는 SOM 기반의 이미지 분류에서는 10개의 카테고리로부터 수집된 200개의 테스트 이미지들이 사용되었다. 분류 성능을 평가하기 위해 간단하면서도 새로운 두 가지 척도, 즉 동일 카테고리 이미지들의 산포 정도와 집적 정도를 나타내는 각각의 척도를 정의하고 사용하였다. 실험결과, SOM기반의 웹 이미지 분류에서는 고수준의 텍스트 특징들이 보다 유용한 것임이 밝혀졌다.

가상현실에 기반한 가상 천체 학습 시스템 구현 (Implemention of a Heavently Body Study System based on Virtual Reality)

  • 문혜린;송완기;정성태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.291-296
    • /
    • 1998
  • 기존의 텍스트만 제공하던 학습방법에서 발전해 텍스트, 이미지, 사운드 동영상 자료를 제공함으로써 시각적 청각적인 학습효과를 증가시킬 수 있었다. 하지만 많은 경우 2차원 화면상에 문자나 사진 정보만을 제공함으로써 일상적이고 수동적인 학습에 지나지 않았다. 최근에 들어서는 이러한 문제를 극복하려는 한가지 방법으로서 가상현실을 이용한 체험학습을 통하여 보다 능동적이고 효과적인 교육을 시도하려는 연구가 진행되고 있다. 따라서 본 논문에서는 PC상에서 몰입감을 느낄 수 있는 HMD(Head Mounted Display)와 3차원 마우스를 사용하여 가상현실의 태양계를 탐험하고 이를 바탕으로 학습활동을 함으로써 학습 효과를 높일 수 있는 가상천체 학습 시스템을 구현하였다.

  • PDF

텍스트 이해 모델에 기반한 정보 검색 시스템 (Text Undestanding System for Summarization)

  • 송인석;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.1-6
    • /
    • 1997
  • 본 논문에서는 인지적 텍스트 이해 모형을 제시하고 이에 기반한 자동 요약 시스템을 구현하였다. 문서는 정보의 단순한 집합체가 아닌 정형화된 언어 표현 양식으로서 단어의 의미적 정보와 함께 표현 양식, 문장의 구조와 문서의 구성을 통해 정보를 전달한다. 요약 목적의 텍스트 이해 및 분석 과정을 위해 경제 분야 기사 1000건에 대한 수동 요약문을 분석, 이해 모델을 정립하였고. 경제 분야 기사 1000건에 대한 테스트 결과를 토대로 문장간의 관계, 문서의 구조에서 요약 정보 추출에 사용되는 정보를 분석하였다. 본 텍스트 이해 모형은 단어 빈도수에 의존하는 통계적 모델과 비교해 볼 때, 단어 간의 관련성을 찾아내고, 문서구조정보에 기반한 주제문 추출 및 문장간의 관계를 효과적으로 사용함으로서 정보를 생성한다. 그리고 텍스트 이해 과정에서 사용되는 요약 지식과 구조 분석정보의 상관관계를 체계적으로 연결함으로서 자동정보 추출에서 야기되는 내용적 만족도 문제를 보완한다.

  • PDF

텍스트 문서 인식을 위한 학습 기반 단어 분할 (Learning-based Word Segmentation for Text Document Recognition)

  • 로말리자쟝피에르;문광석;박한훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.41-42
    • /
    • 2018
  • 텍스트 문서 영상으로부터 단어를 검출하고, LLAH(locally likely arrangement hashing) 알고리즘을 이용하여 이웃 단어 사이의 기하 관계를 표현하는 특징 벡터를 계산한 후, 특징 벡터를 비교함으로써 텍스트 문서를 효과적으로 인식하거나 검색할 수 있다. 그러나, 이는 문서 내 각 단어가 정확하고 강건하게 검출된다는 전제를 필요로 한다. 본 논문에서는 텍스트 내 각 라인을 검출하고, 각 라인 내에서 단어 사이의 간격과 글자 사이의 간격을 깊은 신경망(deep neural network)을 이용하여 학습하고 분류함으로써, 보다 카메라와 텍스트 문서 사이의 거리나 방향이 동적으로 변하는 조건에서 각 단어를 강건하게 검출하는 방법을 제안한다. 모바일 환경에서 제안된 방법을 구현하였으며, 실험을 통해 단어 사이의 간격과 글자 사이의 간격을 92.5%의 정확도로 구별할 수 있으며, 이를 통해 동적인 환경에서 단어 검출의 강건성을 크게 개선할 수 있음을 확인하였다.

  • PDF

OCR 시스템에서 YOLOv4를 활용한 텍스트 이미지 전처리 연구 (A Study on Preprocessing Image Text Using Yolov4 in OCR System)

  • 김하윤;유상인;주혜경;최여진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.964-966
    • /
    • 2022
  • 본 연구는 유료 OCR 서비스를 이용하여 야외 촬영 이미지의 텍스트를 검출하는 프로젝트에서 야외 촬영 텍스트를 학습시킨 Yolov4 모델을 통한 전처리 작업을 제안한다. 텍스트 감지를 통한 이미지 텍스트 전처리 진행은 불필요한 OCR 실행을 줄여 리소스를 절약하고 유료 서비스의 경우 비용 절감 효과까지 도모할 수 있다는 장점이 있다.

강화학습 기반의 제로샷 텍스트 분류 (Zero-shot Text Classification based on Reinforced Learning)

  • 장송밍 ;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.439-441
    • /
    • 2023
  • 전통적인 텍스트 분류 방법은 상당량의 라벨링된 데이터와 미리 정의된 클래스가 필요해서 그 적용성과 확장성이 제한된다. 그래서 이런 한계를 극복하기 위해 제로샷 러닝(Zero-shot Learning)이 등장했다. 텍스트 분류 분야에서 제로샷 텍스트 분류는 모델이 대상 클래스의 샘플을 미리 접하지 않고도 인스턴스를 분류할 수 있도록 하는 중요한 주제이다. 이 문제를 해결하기 위해 정책 네트워크를 활용한 심층 강화 학습(DRL) 기반 접근법을 제안한다. 이러한 방법을 통해 모델이 새로운 의미 공간에 효과적으로 적응하면서, 다른 모델들과 비교하여 제로샷 텍스트 분류의 정확도를 향상시킬 수 있었다. XLM-R 과 비교하면 최대 15.9%의 정확도 향상이 나타났다.

문학과 드라마의 통섭 양상 연구 -<쓸쓸하고 찬란하신(神) 도깨비>, <신사의 품격>을 중심으로 (A Study on the Cooperative Patterns of Literature and Drama -Focused on , )

  • 손미영
    • 문화기술의 융합
    • /
    • 제5권1호
    • /
    • pp.37-43
    • /
    • 2019
  • 2000년대 이후의 한국 드라마는 새로운 서사적 가능성을 지속적으로 실험하고 있다. 특히 최근의 한국 드라마에는 다양한 양태의 혼종과 혼합, 그리고 변형의 시도가 나타난다. 그러므로 본 연구는 2010년대애 대중적으로 성공한 드라마를 통해 문학과 드라마의 통섭을 검토하고자 한다. 본 연구는 김은숙 작가의 <쓸쓸하고 찬란하신(神) 도깨비>와 <신사의 품격>을 통해 드라마 내에서 문학 텍스트가 어떻게 활용되며, 이로써 어떠한 서사적, 영상적 효과를 얻어내는가를 세밀히 검토한다. 이 두 편의 드라마는 한국 내에서 대중적으로 성공한 드라마일 뿐만 아니라, 문학 텍스트를 드라마 내에서 적극적으로 활용하고 있어 문학과 드라마 통섭을 해석하는 데에 중요한 시사점을 제시한다. 이는 문학이 드라마와 통섭하는 주요한 장면을 해석하고, 그 의의를 파악하는 과정이다. 이 연구를 통해 드라마라는 영상 텍스트가 문자 텍스트의 한 부분을 차용하고, 그 물질성으로서의 '책'을 활용함으로써 스토리텔링의 효과를 얻어내는 과정을 해석한다. 이로써 다양한 장르가 하나의 영상 텍스트 내에 혼합되고 병치되는 양상과 그 효과를 확인하게 될 것이다.

텍스트 기반 프로그래밍 학습과 로보틱스 프로그래밍 학습 간의 학습 효과 비교 분석 (Comparative Analysis of Learning Effect Between Text-Based Programming Learning and Robotics Programming Learning)

  • 김세민;정종인;문채영
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 추계학술발표논문집 2부
    • /
    • pp.692-695
    • /
    • 2010
  • 본 논문에서는 정보교과에서 알고리즘 및 프로그래밍 관련 학습을 진행하는데 있어서, 기존의 텍스트 기반 프로그래밍과 로보틱스 프로그래밍으로 프로그래밍 학습을 하였을 때의 학습 효과에 대해서 분석하였다. 연구는 초등학교 고학년 학생들을 대상으로 하였고, 학습에 필요한 학습 프로그램은 기존 텍스트기반 프로그래밍 학습 도구로는 Visual C를, 로보틱스 프로그래밍 학습도구로는 MSRDS(Microsoft Robotics Developer Studio)에서 제공하는 Visual Programming Language를 이용하였다. 그 결과 학생들의 흥미도와 몰입도가 상승하였고, 알고리즘 이해도와 과제 수행 능력이 증가하였음을 확인할 수 있었다. 본 연구에서 제안하는 로보틱스 프로그래밍 학습은 개정 교육과정에서 제안하는 알고리즘을 통한 문제해결능력 신장에 도움이 될 것으로 기대한다.

  • PDF

빅데이터 환경에서 텍스트마이닝 기법을 활용한 공공문서 분류체계의 적용사례 연구 (Case Study on Public Document Classification System That Utilizes Text-Mining Technique in BigData Environment)

  • 심장섭;이강욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1085-1089
    • /
    • 2015
  • 과거의 텍스트마이닝기법은 텍스트 자체의 복잡성과 텍스트 내에 산재한 변수의 자유도 때문에 분석 알고리즘을 구현하는데 어려움이 있었다. 의미 있는 정보를 얻기 위하여 어렵게 알고리즘을 구현했다고 하더라도, 기계적으로 텍스트 분석에 소요되는 시간이 텍스트를 사람이 직접 읽어 분석 하는 것보다 많은 시간이 요구 되었다. 그러나 최근 하드웨어와 분석 알고리즘의 발전과 함께 빅데이터라는 기술이 등장하였으며, 앞에서 설명한 제약사항을 극복할 수 있게 되었고, 텍스트마이닝을 통한 분석이 현실세계에서 그 가치를 충분히 인정받고 있다. 만약, 텍스트의 탐색 수준에서 벗어나 마이닝을 통하여 분석이 가능하다면 텍스트 분석에 소비되는 인적, 물적 자원의 비용을 절감할 수 있기 때문에 공공분야에서 절실히 요구되는 창조적인 일에 더 많은 자원을 효과적으로 활용할 수 있을 것이다. 이에 본 논문에서는 인적 자원이 수작업으로 하는 공공분야 문서 분류의 결과값과 빅데이터 환경에서 텍스트마이닝기반의 문서내 단어 빈도수(TF-IDF)와 문서간 코사인 유사도(Cosine Similarity)를 활용한 공공분야 문서분류의 결과값을 비교하여 평가한다.

  • PDF