• 제목/요약/키워드: 텍스트생성

검색결과 672건 처리시간 0.03초

음소 단위 임베딩 모형을 이용한 감성 분석 (Sentimental Analysis using the Phoneme-level Embedding Model)

  • 현경석;최우성;정순영;정재화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1030-1032
    • /
    • 2019
  • 형태소 분석을 통하여 한국어 문장을 형태소 단위의 임베딩 및 학습 관련 연구가 되었으나 최근 비정형적인 텍스트 데이터의 증가에 따라 음소 단위의 임베딩을 통한 신경망 학습에 대한 요구가 높아지고 있다. 본 논문은 비정형적인 텍스트 감성 분석 성능 향상을 위해 음소 단위의 토큰을 생성하고 이를 CNN 모형을 기반으로 다차원 임베딩을 수행하고 감성분석을 위하여 양방향 순환신경망 모델을 사용하여 유튜브의 비정형 텍스트를 학습시켰다. 그 결과 텍스트의 긍정 부정 판별에 있어 90%의 정확도를 보였다.

동화 삽화 자동 생성 시스템 설계 (Design of Fairy Tale Illustrations Automatic Generation System)

  • 문영주;홍선기;이화민;김현빈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1121-1124
    • /
    • 2013
  • 프로그램 실행 시 동화(텍스트)를 읽을 수 있게 하는 입력 파일을 받을 수 있게 만든다. 이렇게 받은 텍스트를 프로그램이 읽어 들여 알고리즘으로 대입한다. 알고리즘은 읽은 텍스트 중에 중요 단어를 뽑아내어 DB에 이에 알맞은 삽화를 요청하게 된다. 요청을 받은 데이터베이스는 다시 프로그램에 이미지를 보내주고, 프로그램은 이 삽화를 그 텍스트에 출력시키게 된다. 이 과정이 한 페이지를 만드는 과정이며, 원하지 않는 페이지는 건너 뛸 수 있게 한다. 이러한 작업을 반복하여 새로운 책 한권이 완성이 된다.

의사결정트리 기반의 컨텍스트 시각화 SMS (Context Visualizing SMS Based on Decision Tree)

  • 강신욱;오제환;이은석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.515-518
    • /
    • 2009
  • 이동단말기가 보급이 확산됨에 따라 많은 사용자들이 이동단말기를 사용하고 필연적으로 많은 통신행동을 하고 있다. 특히 SMS 는 시간과 장소의 제한이 적어 사용자들의 통신행동 중 큰 비중을 차지하고 있다. SMS 통신행동에서 이모티콘의 사용이 많이 나타나고 있으며 이는 텍스트 기반의 의사소통의 한계를 극복하기 위한 방안으로 볼 수 있다. SMS 로부터 사용자의 감정을 추론하려는 기존의 연구가 있었지만 SMS 텍스트에 국한된다는 문제점이 있다. 본 논문에서는 최근 휴대폰, PDA, 스마트폰 등 이동단말기의 발전에 따라 통신행동 기록, 위치 정보와 같은 컨텍스트 정보를 수집하고 이용할 수 있음에 착안하여 SMS 텍스트와 함께 이동단말기의 컨텍스트 정보를 추론에 사용하였다. 의사결정트리를 이용하여 가용한 컨텍스트 정보로부터 추론한 정황 정보를 SMS 통신에서 사용하여 기존의 텍스트 기반의 의사소통의 한계를 극복할 수 있는 Visual SMS 를 제안한다. 사전에 정의한 훈련 데이터 집합을 통하여 의사결정트리를 생성하고 이를 기반으로 Visual SMS 를 구현, 시뮬레이션하여 추론 결과를 통해 그 기대효과를 확인한다.

EyeBERT: 아이트래킹 기반의 휴먼 리딩을 반영한 추출 요약 기법 (EyeBERT: Eye tracking based Human Reading for Extractive Text Summarization)

  • 이설화;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.522-526
    • /
    • 2019
  • 추출 요약(Extractive summarization)은 문서내에 주요한 요약정보가 되는 문장 또는 단어를 추출하여 요약을 생성하는 기법이다. 딥러닝 기법들이 많이 발전하면서 요약 기법에도 sequence-to-sequence와 같은 많은 시도들이 있었지만 대부분의 방법론들은 딥러닝의 모델 구조관점으로 접근하거나 요약에 있어서 단순히 입력 텍스트를 넣고 알고리즘이 처리하는 머신 리딩(Machine reading)관점으로 접근한다. 텍스트 요약 태스크 자체는 사람이 텍스트에 대한 정보 파악을 요약문을 통해 빠르게 하고 싶은 궁극적인 목표가 있으므로, 사람이 텍스트 요약에 필요한 인지처리과정을 반영할 필요가 있다. 결국, 기존의 머신 리딩보다는 휴먼 리딩(Human reading)에 관한 이해와 구조적 접근이 필요하다. 따라서 본 연구는 휴먼 리딩을 위한 인지처리과정을 위해 아이트래킹 데이터 기반의 새로운 추출 요약 모델을 제안한다.

  • PDF

에지 및 국부적 최소/최대 변환을 이용한 자연 이미지로부터 텍스트 영역 검출 (Text Region Detection using Edge and Regional Minima/Maxima Transformation from Natural Scene Images)

  • 박종천;이근왕
    • 한국산학기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.358-363
    • /
    • 2009
  • 자연이미지로부터 텍스트 영역 검출은 다양한 응용분야에 활용됨으로 이 분야의 많은 연구가 필요하다. 최근의 연구 방법은 에지 및 연결요소 기반 방법을 결합하는 다양한 알고리즘을 이용하여 텍스트 영역을 검출하고 있다. 그러므로 본 논문은 이러한 결합방법으로 에지 및 국부적 최소/최대 변환 방법을 이용하여 텍스트 영역을 검출하는 알고리즘을 제안한다. 명도 이미지로부터 에지 및 국부적 최소/최대 연결성분을 검출하고, 에지 및 국부적 최소/최대 연결성분을 레이블화한다. 레이블된 영역을 분석하여 텍스트 후보 영역을 검출하고, 검출된 각각의 텍스트 후보 영역을 결합하여 단일 텍스트 후보 이미지를 생성한다. 텍스트 후보 개별문자의 인접성 및 유사도를 비교하여 검증함으로서 최종적인 텍스트 영역을 검출한다. 실험결과 제안한 알고리즘은 에지 요소 및 국부적 최소/최대 연결요소 검출 방법을 결합하여 자연 이미지로부터 텍스트 영역 검출의 정확도 및 재현률을 향상할 수 있었다.

체계적인 사용자 참여형 디자인 방법론을 활용한 스마트 텍스트로닉스 제품 개발 프로세스 (Smart-textronics Product Development Process by Systematic Participatory Design Method)

  • 임수연;이상원
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.163-170
    • /
    • 2021
  • 기능성 섬유를 가능하게 하는 스마트 텍스트로닉스가 최근 스마트 의류, 스마트 홈, 스마트 헬스케어 등 다양한 분야에서 활용되어 다양한 제품이 개발되고 있다. 이러한 관점에서 본 연구에서는 체계적인 참여형 디자인 방법을 기반으로 한 스마트 텍스트로닉스 제품 개발 프로세스를 제안한다. 프로세스는 심층 인터뷰와 분석의 두가지 단계로 구성되며 심층 인터뷰 단계에서는 참여자가 사용행위, 행위별 요구조건, 만족도 수준 등을 포함한 사용자 여정맵과 스케치 및 간단한 프로토타입 제작을 통한 아이디어 생성 활동을 수행한다. 이 후 분석 단계에서는 디자인 연구자가 심층 인터뷰 단계로부터 도출된 결과에 행동 패턴 분석 방법을 적용하여 핵심 특성을 도출하고 이를 기반으로 한 사용자 페르소나를 생성하고 각 페르소나의 주요 니즈를 E3 가치 체계의 가치요소와 연관시킨다. 본 연구에서는 사전 설문조사를 실시하여 스마트 텍스트로닉스 시장 파악하였으며, 제안된 방법론에 대한 검증을 위해 스마트 홈 분야에서 가장 많은 사용자와의 상호작용을 갖는 소파의 디자인 사례연구를 수행하였다.

한국어 및 영어 이미지 캡션이 가능한 범용적 모델 및 목적에 맞는 텍스트를 생성해주는 기법 (A general-purpose model capable of image captioning in Korean and Englishand a method to generate text suitable for the purpose)

  • 조수현;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1111-1120
    • /
    • 2022
  • Image Captioning은 이미지를 보고 이미지를 언어로 설명하는 문제이다. 해당 문제는 이미지 처리와 자연어 처리 두 가지의 분야를 하나로 묵고 이해하고 하나로 묶어 해결할 수 있는 중요한 문제이다. 또한, 이미지를 자동으로 인식하고 텍스트로 설명함으로써 시각 장애인을 위해 이미지를 텍스트로 변환 후 음성으로 변환하여 주변 환경을 이해하는 데 도움을 줄 수 있으며, 이미지 검색, 미술치료, 스포츠 경기 해설, 실시간 교통 정보 해설 등 많은 곳에 적용할 수 있는 중요한 문제이다. 지금까지의 이미지 캡션 구 방식은 이미지를 인식하고 텍스트화시키는 데에만 집중하고 있다. 하지만 실질적인 사용을 하기 위해 현실의 다양한 환경이 고려되어야 하며 뿐만 아니라 사용하고자 하는 목적에 맞는 이미지 설명을 할 수 있어야 한다. 본 논문에서는 범용적으로 사용 가능한 한국어 및 영어 이미지 캡션 모델과 이미지 캡션 목적에 맞는 텍스트 생성 기법을 제한한다.

XHTML 코드 생성기의 설계와 구현 (Design and Implementation of XHTML Code Generator)

  • 계승철;전서현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.24-29
    • /
    • 2001
  • XHTML은 HTML의 요소와 XML의 문법을 가진 마크업 언어이다. XML과 HTML의 장점을 결합하여 발표되었으며, HTML에서 XML로 가는 중간단계로, HTML을 대체할 언어로, 또는 유무선 통합을 위한 마크업 언어로 보고 있다. XHTML 언어를 이용하기 위해 텍스트나 기존에 널리 쓰이고 있는 HTML을 규칙에 맞는 HTML로 바꾸고, 간단한 조작으로 쉽게 XHTML로 바꿀 수 있도록 하는 XHTML 코드 생성기를 설계·구현하였다.

  • PDF

생성적 적대 네트워크로 자동 생성한 감성 텍스트의 성능 평가 (Evaluation of Sentimental Texts Automatically Generated by a Generative Adversarial Network)

  • 박천용;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권6호
    • /
    • pp.257-264
    • /
    • 2019
  • 최근 자연언어처리 분야에서 딥러닝 모델이 좋은 성과를 보이고 있다. 이러한 딥러닝 모델의 성능을 향상시키기 위해서는 많은 양의 데이터가 필요하다. 하지만 많은 양의 데이터를 모으기 위해서는 많은 인력과 시간이 소요되기 때문에 데이터 확장을 통해 이와 같은 문제를 해소할 수 있다. 그러나 문장 데이터의 경우 이미지 데이터에 비해 데이터 변형이 어렵기 때문에 다양한 문장을 생성할 수 있는 생성 모델을 통해 문장 데이터 자동 확장을 해보고자 한다. 본 연구에서는 최근 이미지 생성 모델에서 좋은 성능을 보이고 있는 생성적 적대 신경망 중 하나인 CS-GAN을 사용하여 학습 데이터로부터 새로운 문장들을 생성해 보고 유용성을 다양한 지표로 평가하였다. 평가 결과 CS-GAN이 기존의 언어 모델을 사용할 때보다 다양한 문장을 생성할 수 있었고 생성된 문장을 감성 분류기에 학습시켰을 때 감성 분류기의 성능이 향상됨을 보였다.

그림책 "누가 내 머리에 똥 쌌어?" 의 심층의미 분석 - Greimas기호학을 중심으로 - (A Semiotic In-depth Analysis of the Children's Picture Book : "Who Pooped on My Head?")

  • 장성단;이주리
    • 한국보육지원학회지
    • /
    • 제9권2호
    • /
    • pp.263-283
    • /
    • 2013
  • 본 연구는 Greimas 기호학적 방법을 사용하여 그림책 "누가 내 머리에 똥 쌌어?"에 내포된 심층의미를 분석한 후 텍스트에서 생성된 의미가 아동발달과 연관성이 있는가를 탐색하고자 하였다. 텍스트에 내재된 심층의미를 분석한 결과 사회적으로 바람직하다 인정된 배변규범이 전제되었으며, 배변규범을 준수하는 과정에 발생하는 갈등과 불안과 심리적 안정을 제공하는 내용을 담고 있었다. 또한 의미생성과정인 기호작용과 인지발달이 유사한 맥락이 있는가를 확인하기 위해 기호사각형 모델을 적용하여 그림책의 의미생성과정을 분석하였을 때 사고의 확장을 가능하게 하는 의미가 생성됨을 확인하였다. 이는 Piaget의 인지발달 주요개념인 도식, 동화, 조절이라는 의미와 같은 맥락이라 보았다. 따라서 연구 텍스트는 배변과 관련하여 심리적인 측면과 인지적인 측면에서 아동의 발달과 연관성이 있는 내용을 내포하고 있음을 확인하였다.