• 제목/요약/키워드: Title Generation

검색결과 32건 처리시간 0.029초

다중 어댑터를 이용한 교차 언어 및 스타일 기반의 제목 생성 (Cross-Lingual Style-Based Title Generation Using Multiple Adapters)

  • 박요한;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.341-354
    • /
    • 2023
  • 문서의 제목은 문서의 내용을 가장 효율적으로 요약하여 제공해 준다. 이때 독자들이 선호하는 스타일과 언어에 따라 문서의 제목을 다르게 제공해 준다면, 독자들은 문서의 내용을 좀 더 쉽게 예측할 수 있다. 본 연구에서는 문서가 주어졌을 때 언어와 스타일에 따라 제목을 자동 생성하는'교차 언어 및 스타일 기반의 제목 생성 모델을 제안한다. 모델을 학습하기 위해서는 같은 내용을 다른 언어와 다른 스타일로 작성한 병렬데이터가 필요하다. 그러나 이러한 종류의 병렬데이터는 구축하기 매우 어렵다. 반면, 단일 언어와 단일 스타일로 구축된 제목 생성 데이터는 많으므로 본 연구에서는 제로샷(zero-shot) 학습으로 제목 생성을 수행하고자 한다. 교차 언어 및 스타일 기반의 제목 생성을 학습하기 위해 다중 언어로 사전 학습된 트랜스포머 모델에 각 언어, 스타일, 기계번역을 위한 어댑터를 추가하였다. 기계 번역용 병렬데이터를 이용하여 기계번역을 먼저 학습한 후, 동일 스타일의 제목 생성을 학습하였다. 이때, 필요한 어댑터만을 학습하고 다른 부분의 파라미터는 모두 고정시킨다. 교차 언어 및 스타일 기반의 제목을 생성할 때에는 목적 언어와 목적 스타일에 해당하는 어댑터만을 활성화시킨다. 실험 결과로는 각 모델을 따로 학습시켜 파이프라인으로 연결시킨 베이스라인에 비해 본 연구에서 제안한 제로샷 제목 생성의 성능이 크게 떨어지지 않았다. 최근 대규모 언어 모델의 등장으로 인한 자연어 생성에서의 많은 변화가 있다. 그러나 제한된 자원과 제한된 데이터만을 이용하여 자연어 생성의 성능을 개선하는 연구는 계속되어야 하며, 그런 점에서 본 연구의 의의를 모색한다.

RNN과 강화 학습을 이용한 자동 문서 제목 생성 (Automatic Document Title Generation with RNN and Reinforcement Learning)

  • 조성민;김우생
    • Journal of Information Technology Applications and Management
    • /
    • 제27권1호
    • /
    • pp.49-58
    • /
    • 2020
  • Lately, a large amount of textual data have been poured out of the Internet and the technology to refine them is needed. Most of these data are long text and often have no title. Therefore, in this paper, we propose a technique to combine the sequence-to-sequence model of RNN and the REINFORCE algorithm to generate the title of the long text automatically. In addition, the TextRank algorithm was applied to extract a summarized text to minimize information loss in order to protect the shortcomings of the sequence-to-sequence model in which an information is lost when long texts are used. Through the experiment, the techniques proposed in this study are shown to be superior to the existing ones.

주의집중 및 복사 작용을 가진 Sequence-to-Sequence 순환신경망을 이용한 제목 생성 모델 (Title Generation Model for which Sequence-to-Sequence RNNs with Attention and Copying Mechanisms are used)

  • 이현구;김학수
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.674-679
    • /
    • 2017
  • 대용량의 텍스트 문서가 매일 만들어지는 빅데이터 환경에서 제목은 문서의 핵심 아이디어를 빠르게 집어내는데 매우 중요한 단서가 된다. 그러나 블로그 기사나 소셜 미디어 메시지와 같은 많은 종류의 문서들은 제목을 갖고 있지 않다. 본 논문에서는 주의집중 및 복사 작용을 가진 sequence-to-sequence 순환신경망을 사용한 제목 생성 모델을 제안한다. 제안 모델은 양방향 GRU(Gated Recurrent Unit) 네트워크에 기반 하여 입력 문장을 인코딩(encoding)하고, 입력 문장에서 자동 선별된 키워드와 함께 인코딩된 문장을 디코딩함으로써 제목 단어들을 생성한다. 93,631문서의 학습 데이터와 500문서의 평가 데이터를 가진 실험에서 주의집중 작용방법이 복사 작용방법보다 높은 어휘 일치율(ROUGE-1: 0.1935, ROUGE-2: 0.0364, ROUGE-L: 0.1555)을 보였고 사람이 정성평가한 지표는 복사 작용방법이 높은 성능을 보였다.

시공간 동기화 관리기를 이용한 멀티미디어 저작 시스템의 설계 및 구현 (Design and Implementation of Multimedia Authoring System using Temporal/Spatial Synchronization Manager)

  • 여인국;황대훈
    • 한국정보처리학회논문지
    • /
    • 제4권11호
    • /
    • pp.2679-2689
    • /
    • 1997
  • 본 논문에서는 멀티미디어 타이틀 제작을 쉽고 효율적으로 할 수 있도록, 시공간 동기화 관리기를 이용한 멀티미디어 저작 시스템을 설계하고 구현하였다. 이를 위하여 타이틀 저작자의 설계 의도를 별도의 변화 과정을 거치지 않고 실제 타이틀 구성 로직으로 표현하는 흐름도 방식의 로직 생성기와 생성된 로직을 번역하여 실행하는 로직 인터프리터를 설계하였다. 아울러 멀티미디어 프리젠테이션에 필요한 미디어 데이타 간의 시${\cdot}$공간 동기화 정보를 관리하기 위한 동기화 관리기를 설계하였다. 특히 미디어 객체들 간의 시간적 관계를 동기화하기 위하여 시간 명세 모델과 그 모델의 형식 언어인 MRL를 설계하였다. MRL은 복잡한 시간 관계를 간결한 형태로 표현할 수 있는 좋은 표현력을 가지고 있으며 사용자의 의도에 따라 효과적으로 멀티미디어 프리젠테이션을 동기화시키는 것이 가능하다. 공간적 동기화를 위하여 표시 매체의 공간 상의 가시적인 크기와 접속점을 일치시키는 표시 화면 편집기를 구현하였다.

  • PDF

여행 유튜브 제목에 대한 Z세대의 인식 유형 연구 (A Study on the Perception of Travel YouTube Title: Focusing on the Group of Generation Z)

  • 최원주;홍장선
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.175-184
    • /
    • 2022
  • 전통과 새로움의 경계를 넘나드는 여행 유튜버들의 소통은 SNS 기반의 미디어를 매개로 나의 활동상을 타인과 공유하는 환경을 마련한다. 나만 좋아해서도 안되고, 너무 목적 지향적이어서도 안된다. 사용자로 하여금 자연스럽게 콘텐츠에 쉽게 접근하도록 유튜브 채널을 운영해야 하는데, 이용과 충족 이론을 기반으로 더욱 다각적인 방법을 추구할 수 있기도 하다. 본 연구는 여행 유튜브 제목에 대한 Z세대의 인식 유형 연구이다. Q 방법론적 시각에서 34개의 Q 표본과 28개의 P 표본을 대상으로 QUANL 프로그램 분석을 진행한 결과 총 3개의 유형을 발견하였다. 독특한 특성을 지닌 유형을 대상으로 그 성향을 종합적으로 반영하여 제1유형을 '상상을 끌어내는 키워드 중시', 제2유형을 '호기심을 자극하는 스토리 선호', 제3유형을 '기대가 반영된 이미지 만족'이라 명명화하였다. 이와 함께 발견한 유형별 특징을 고려해 Z세대 여행 유튜버들이 펼쳐 보이고자 하는 활동의 확장성과 전략적 방안을 제시하였다.

ChatGPT가 자동 생성한 더블린 코어 메타데이터의 품질 평가: 국내 도서를 대상으로 (Quality Evaluation of Automatically Generated Metadata Using ChatGPT: Focusing on Dublin Core for Korean Monographs)

  • 김선욱;이혜경;이용구
    • 정보관리학회지
    • /
    • 제40권2호
    • /
    • pp.183-209
    • /
    • 2023
  • 이 연구의 목적은 ChatGPT가 도서의 표지, 표제지, 판권기 데이터를 활용하여 생성한 더블린코어의 품질 평가를 통하여 ChatGPT의 메타데이터의 생성 능력과 그 가능성을 확인하는 데 있다. 이를 위하여 90건의 도서의 표지, 표제지와 판권기 데이터를 수집하여 ChatGPT에 입력하고 더블린 코어를 생성하게 하였으며, 산출물에 대해 완전성과 정확성 척도로 성능을 파악하였다. 그 결과, 전체 데이터에 있어 완전성은 0.87, 정확성은 0.71로 준수한 수준이었다. 요소별로 성능을 보면 Title, Creator, Publisher, Date, Identifier, Right, Language 요소가 다른 요소에 비해 상대적으로 높은 성능을 보였다. Subject와 Description 요소는 완전성과 정확성에 대해 다소 낮은 성능을 보였으나, 이들 요소에서 ChatGPT의 장점으로 알려진 생성 능력을 확인할 수 있었다. 한편, DDC 주류인 사회과학과 기술과학 분야에서 Contributor 요소의 정확성이 다소 낮았는데, 이는 ChatGPT의 책임표시사항 추출 오류 및 데이터 자체에서 메타데이터 요소용 서지 기술 내용의 누락, ChatGPT가 지닌 영어 위주의 학습데이터 구성등에 따른 것으로 판단하였다.

픽미세대를 위한 자유교육 소고: 천원 오천석의 자유 개념을 중심으로 (Education and Freedom for the 'Pick-Me' Generation in reading of Chun-suk Oh and Byun-chul Han)

  • 윤선인
    • 한국교육논총
    • /
    • 제38권3호
    • /
    • pp.189-210
    • /
    • 2018
  • 본고는 천원 오천석의 민주주의 교육에 대한 현대적 의미를 제고한다. 특히 그의 후기 저서에 강조된 민족주의에 대한 논의 또한 요구되는 바이나 본고에서는 천원의 민주주의 교육이념 나타난 자유 개념을 분석하는 것으로 한정짓도록 한다. 이를 위하여 오늘날의 시대적 담론을 비판적으로 분석한 한병철의 논의를 바탕으로 천원의 민주주의의 의미와 평가를 논하고 그의 사상에 내재된 교육철학적 한계를 비판적으로 고찰한다. 이를 바탕으로 천원이 궁극적으로 지향하였던 도의적 민주주의 사상을 제고하여 오늘날 픽미세대에게 요구되는 자유 개념을 고찰하도록 한다.

  • PDF

IEEE 802.11p 구현을 위한 RF 회로 설계 (RF Circuit Design for IEEE 802.11p Implementation)

  • 이세연;이명호
    • 한국항행학회논문지
    • /
    • 제16권1호
    • /
    • pp.54-61
    • /
    • 2012
  • 차세대 ITS 환경을 위한 차량용 무선 통신 규격인 WAVE 규격은 IEEE 802.11p와 IEEE P1609 규격을 통칭하며, IEEE 802.11p의 규격제정이 마무리됨에 따라 최근 많은 연구가 진행되고 있다. 고속 차량 환경과 실내 환경의 차이는 무선 통신 채널 모델이 훨씬 가혹하다는 것이다. 따라서, 무선 통신 시스템의 설계 시 온도, 잡음, 다중 경로 페이딩과 같은 시스템의 성능을 저하시킬 수 있는 사항들을 충분히 고려하여야 한다. 본 논문에서는 IEEE 802.11p PHY/MAC을 기반으로 하는 WAVE 무선 통신 시스템을 위한 RF 회로를 설계하고 실제로 구현하면서 나타나는 문제들을 보이고 이를 해결하는 과정을 보였다.

리듬정보를 이용한 악보생성 시스템 구현 (Implementation of Musical Note Generation System using Rhythm Information)

  • 소두석;최재원;이종혁
    • 한국정보통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1210-1216
    • /
    • 2003
  • 본 논문에서는 기존의 오디오검색 관련 시스템의 텍스트 정보기반의 음악 검색의 한계를 극복하기 위해 사용자가 입력한 음악데이터에서 리듬정보를 추출해 내어 데이터 베이스 내의 음악 정보 검색이 가능하게 하는 내용기반 검색 시스템의 일종인 리듬 추출 시스템을 제안하였다. 본 논문에서는 음악정보에서 리듬의 특징 정보를 추출하여 특정 파라미터를 생성하고 신경회로망을 사용하여 악기 인식을 통한 악보생성 시뮬레이션을 하였다.

이메일 추천 시스템의 분류 향상을 위한 3단계 전처리 알고리즘 (A Three-Step Preprocessing Algorithm for Enhanced Classification of E-Mail Recommendation System)

  • 조동섭;정옥란
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제54권4호
    • /
    • pp.251-258
    • /
    • 2005
  • Automatic document classification may differ significantly according to the characteristics of documents that are subject to classification, as well as classifier's performance. This research identifies e-mail document's characteristics to apply a three-step preprocessing algorithm that can minimize e-mail document's atypical characteristics. In the first 5go, uncertain based sampling algorithm that used Mean Absolute Deviation(MAD), is used to address the question of selection learning document for the rule generation at the time of classification. In the subsequent stage, Weighted vlaue assigning method by attribute is applied to increase the discriminating capability of the terms that appear on the title on the e-mail document characteristic level. in the third and last stage, accuracy level during classification by each category is increased by using Naive Bayesian Presumptive Algorithm's Dynamic Threshold. And, we implemented an E-Mail Recommendtion System using a three-step preprocessing algorithm the enable users for direct and optimal classification with the recommendation of the applicable category when a mail arrives.