• 제목/요약/키워드: 전자텍스트

검색결과 442건 처리시간 0.028초

요약문 기반 문학 스타일 문장 생성 (Generating Literature-Style Sentences based on Summarized Text )

  • 최부광;이은찬;안상태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.67-70
    • /
    • 2022
  • 최근 자연어 생성 연구는 딥러닝 기반의 사전 학습 모델을 중심으로 활발하게 연구되고 있다. 하위 분야 중 하나인 텍스트 확장은 입력 텍스트를 출력에 잘 반영하는 것이 무엇보다도 중요하다. 기존 한국어 기반 텍스트 확장 연구의 경우 몇 개의 개념 집합에 기반해 문장을 생성하도록 한다. 그러나 이는 사람의 실제 발화 길이에 비해 짧고 단순한 문장만을 생성한다는 문제점이 존재한다. 본 논문은 이러한 문제점을 개선하면서 문학 스타일의 문장들을 생성하는 모델을 제안하였다. 또한 동일 모델에 대해 학습 데이터의 양에 따른 성능도 비교하였다. 그 결과, 짧은 요약문을 통해 문학 스타일의 여러 문장들을 생성하는 것을 확인하였고, 학습 데이터를 추가한 모델이 성능이 더 높게 나타나는 것을 확인하였다.

  • PDF

한국어 사전학습 모델 KE-T5 기반 자동 논문 요약 (Korean Pre-trained Model KE-T5-based Automatic Paper Summarization)

  • 서현태;신사임;김산
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.505-506
    • /
    • 2021
  • 최근 인터넷에서 기하급수적으로 증가하는 방대한 양의 텍스트를 자동으로 요약하려는 연구가 활발하게 이루어지고 있다. 자동 텍스트 요약 작업은 다양한 사전학습 모델의 등장으로 인해 많은 발전을 이루었다. 특히 T5(Text-to-Text Transfer Transformer) 기반의 모델은 자동 텍스트 요약 작업에서 매우 우수한 성능을 보이며, 해당 분야의 SOTA(State of the Art)를 달성하고 있다. 본 논문에서는 방대한 양의 한국어를 학습시킨 사전학습 모델 KE-T5를 활용하여 자동 논문 요약을 수행하고 평가한다.

  • PDF

업계소식

  • 한국전자산업진흥회
    • 전자진흥
    • /
    • 제7권6호
    • /
    • pp.75-80
    • /
    • 1987
  • PDF

이미지-텍스트 쌍을 활용한 이미지 분류 정확도 향상에 관한 연구 (A Study on Improvement of Image Classification Accuracy Using Image-Text Pairs)

  • 김미희;이주혁
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.561-566
    • /
    • 2023
  • 딥러닝의 발전으로 다양한 컴퓨터 비전 연구를 수행할 수 있게 됐다. 딥러닝은 컴퓨터 비전 연구 중 이미지 처리에서 높은 정확도와 성능을 보여줬다. 하지만 대부분의 이미지 처리 방식은 이미지의 시각 정보만을 이용해 이미지를 처리하는 경우가 대부분이다. 이미지-텍스트 쌍을 활용할 경우 이미지와 관련된 설명, 주석 등의 텍스트 데이터가 이미지 자체에서는 얻기 힘든 추가적인 맥락과 시각 정보를 제공할 수 있다. 본 논문에서는 이미지-텍스트 쌍을 활용하여 이미지와 텍스트를 분석하는 딥러닝 모델 제안한다. 제안 모델은 이미지 정보만을 사용한 딥러닝 모델보다 약 11% 향상된 분류 정확도 결과를 보였다.

딥러닝 모델을 활용한 실시간 인쇄물 문자 탐지 시스템 (Real-time Printed Text Detection System using Deep Learning Model)

  • 최예준;김송원;문미경
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.523-530
    • /
    • 2024
  • 웹페이지나 디지털 문서 등과 같은 온라인에서는 사용자가 검색하고 싶은 특정 단어나 특정 문구를 실시간으로 검색하는 기능이 있다. 인쇄된 도서나 참고서 등과 같은 인쇄물에는 실시간으로 특정 단어나 특정 문구를 찾는 기능이 없어 어려움을 겪는 경우가 많다. 본 논문에서는 텍스트를 탐지(Detection)하는 딥러닝 모델과 텍스트를 인식(Recognition)하는 OCR을 활용한 실시간 문자 탐지 시스템의 개발내용에 관해 기술한다. 본 연구에서는 EAST 모델을 사용하여 텍스트를 탐지하는 방법, 탐지한 텍스트를 EasyOCR을 사용하여 인식하는 방법, 인식한 텍스트를 사용자가 검색하고 싶은 특정 단어나 특정 문구를 비교하여 bounding box로 나타내는 방법을 제안한다. 이 시스템을 통해 사용자는 도서나 참고서 등과 같은 인쇄물에서 실시간으로 검색하고 싶은 특정 단어나 특정 문구를 찾아 필요한 정보를 쉽고 빠르게 찾는 것에 효과적일 것을 기대한다.

한국어 전자 사전을 위한 하이퍼텍스트 네트워크에 관한 연구 (A Study of the Hypertext Network for Korean Eletronic Dictionary)

  • 이태승;최윤철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.28-35
    • /
    • 1991
  • 본 연구는 한국어 천자사전에 알맞은 하이퍼텍스트의 네트워크 구조와 전자사전의 구조에 관한 것으로 인간의 연관적 사고과정을 이용하여 사전을 구성하고자 하였다. 사용하는 사람을 계층적으로 선별하여 그에 알맞는 정보검색의 실마리를 제공하였으며 필요한 즉시 원하는 항목으로의 전환이 가능하도록 하였다. 특히 그래픽 브라우저(Graphics Browser)에 중점을 두어 사용자가 보다 편리하게 정보를 얻을 수 있도록 설계하였다.

  • PDF

자동 스크롤 가능을 이용한 주의력 집중을 위한 웹기반 전자교과서 텍스트 화면 설계전략 (Strategies on Text Screen Design Of The Electronic Textbook For Focused Attention Using Automatic Text Scroll)

  • 권형규
    • 컴퓨터교육학회논문지
    • /
    • 제5권4호
    • /
    • pp.134-145
    • /
    • 2002
  • 본 연구는 학습자가 전자교과서에서 문자별로 초점이 다른 텍스트요인을 학습시 내용흐름에 따라 편하게 읽을 수 있게 하기 위한 기능 및 기술적 방안을 제시한다. 본 연구에서 제시한 전자교과서의 텍스트 화면은 학습자가 전자교과서의 텍스트를 접할 때 설정된 값 이상의 데이터가 디스플레이 되면 마우스나 키보드의 작동 없이 학습자별로 원하는 형태로 자동으로 스크롤되어 쉽게 읽을 수 있게 된다. 또한 학습내용이나 개인차에 따라 제시방법이나 속도를 수시로 제어할 수 있다. 자동 텍스트 스크롤은 텍스트 내용구조(특정 및 영역 분류 등), 제시형태(밀도, 사이즈, 폰트 등), 제시방법(스크롤방법, 속도 등), 프로그램 통제유형(램 상주 등)과 화면디자인 적용(가독성 등)등에 따른 데이터 및 화면의 자동 스크롤 방법으로 텍스트 학습에 대한 개인의 능력 및 성향을 반영할 수 있다. 이를 위한 기술적 해결책을 환경설정단계, 스크롤지정단계, 복사단계, 데이터분석단계, 스크롤코딩단계, 중앙포커스코딩단계, 좌우포커스코딩단계, 실행단계로 나누어 제시하였다.

  • PDF

VL-KE-T5: 한국어와 영어로 구성된 영상-언어 병렬 데이터를 이용한 대조학습 기반 사전학습모델 구축 (VL-KE-T5: A contrastive learning-based pre-trained model using image-language parallel data composed of Korean and English)

  • 김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.337-342
    • /
    • 2022
  • 본 논문은 한국어-영어 기반 영상-언어 모델인 VL-KE-T5를 소개한다. VL-KE-T5는 영상-텍스트 쌍으로 구성된 한국어와 영어 데이터 약 2천 3백만개를 이용하여 영상-언어 모델의 임베딩 벡터들을 정렬시킨 사전학습모델이며, 미세조정을 통하여 여러 영상-언어 작업에 활용할 할 수 있다. VL-KE-T5는 텍스트 기반 영상 검색 작업에서 높은 성능을 보였으나, 세세한 속성을 가진 여러 객체들의 나열이나 객체 간 관계를 포함한 텍스트 기반 영상 검색에서는 비교적 낮은 성능을 보였다.

  • PDF

효과적인 전자책 구독을 위한 콘텐츠 표시 방법 설계 (A Design of Contents Display Method for Effective E-book Reading)

  • 고기남;김종인;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.171-172
    • /
    • 2013
  • 기존의 종이책은 다양한 스마트 모바일기기의 활발한 보급으로 인해 전용 단말기와 뷰어 앱(Veiwer App)을 통해 전자책(e-book)으로 서비스되고 있다. 최근에는 텍스트(Text) 중심의 전자책과 달리, 텍스트와 함께 동영상, 다양한 상호작용 요소를 중심으로 하는 앱북(App book)의 형태로 진화되고 있다. 아이패드(iPad)용 앱스토어(App Store)에서는 도서 관련 앱이 28%를 차지할 정도로 앱북 시장이 빠르게 성장함에도 불구하고, 여러 가지 전자책 전용 단말기, 뷰어 앱 UI(User Interface) 관련 연구들에 비해 앱북의 콘텐츠 및 UI에 대한 연구가 상대적으로 부족한 상황이다. 이에, 본 논문에서는 앱북 콘텐츠의 표시 방법에 따라 3개의 유형으로 분류하고, 대표 앱북을 선정하여, 콘텐츠의 객체 표시방법에 대해 분석하고, 상호작용 요소들을 분석하였다. 이를 통해, 객체 별 상호작용 요소를 고려한 전자잡지형 앱북의 콘텐츠 표시 방법 프레임워크를 설계하였다.

  • PDF