• 제목/요약/키워드: Sentence Generation

검색결과 103건 처리시간 0.029초

문장생성에 의한 통신보조시스템의 설계 및 구현 (Design and Implementation of a Augmentative and Alternative Communication System Using Sentence Generation)

  • 우요섭;민홍기;황인정
    • 한국멀티미디어학회논문지
    • /
    • 제8권9호
    • /
    • pp.1248-1257
    • /
    • 2005
  • 본 논문은 통신보조시스템을 위한 문장생성의 구현과 설계에 관한 것이다. 통신보조시스템은 언어장애인을 위한 보조 시스템으로서 시간과 키의 수를 줄여 문장을 생성하는데 그 목적이 있다. 본 논문에서는 기존의 문장생성의 장단점을 보완하여 문장생성을 하였다. 문장생성을 위하여 동사와 조사에 따라 명사가 한정되는 한글 구조를 이용하였다. 본 논문의 특징은 도메인 개념을 이용하여 명사와 동사를 연결하였다. 문장생성을 위해 한글의 특성으로 구축한 어휘정보를 이용하였다. 또한 현재 문장생성에 관한 여러 방법을 비교하였다. 문장생성은 문장특징 추출에 의한 어휘정보에 바탕을 둔다.

  • PDF

보완 대체 통신을 위한 문장생성 방법 (A Method of Sentence Generation for Augmentative and Alternative Communication)

  • 황인정;민홍기
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.323-328
    • /
    • 2005
  • 본 연구는 보완 대체 통신을 위한 문장생성에 관한 것이다. 문장생성의 목적은 언어생활이 불편한 사람들을 위한 보완 대체 통신에 사용하기 위해서이다. 보완 대체 통신은 사용자가 원하는 문장을 만들어 음성으로 출력해주는 시스템이다. 문장을 생성하기 위해서 어휘 정보를 보완대체 통신의 개념에 맞도록 변형하여 도입하였고, 어휘정보는 동사에 연결될 수 있는 명사와 조사로 이루어져 있다. 어휘정보를 이용하여 시스템을 구현하였고, 구현된 시스템으로 문장생성의 효용을 측정하였다. 구축된 시스템은 올바른 문장의 생성과 저장, 검색, 어휘입력의 기능을 갖는다.

한국어 문장 유형의 자동 분류 한국어-수화 변환 및 한국어 음성 합성에의 응용 (Sentence Type Identification in Korean Applications to Korean-Sign Language Translation and Korean Speech Synthesis)

  • 정진우;이호준;박종철
    • 한국HCI학회논문지
    • /
    • 제5권1호
    • /
    • pp.25-35
    • /
    • 2010
  • 본 논문에서는 한국어 문장 유형을 자동으로 분류하는 방법을 제안하고 한국어-수화 변환과 한국어 음성 합성 분야에서 문장 유형 정보가 자연스러운 수화 표현과 음성 표현을 생성하는데 이용되는 과정을 보인다. 한국어에서 문장 유형은 크게 평서문, 명령문, 청유문, 의문문, 감탄문의 다섯 가지로 분류되는데, 기존의 방법으로는 대화체 문장에서 동일한 문장이 여러 가지 유형으로 해석되는 중의성의 문제가 발생한다. 본 논문에서는 문장 내에서 형태소 및 구문단위의 다양한 단서들을 활용하여 이를 해결하는 방법을 제안하며, 실험 결과 본 논문에서 제시한 문장 유형 분류 시스템이 만족할 만한 성능을 보이는 것을 확인하였다. 이를 이용하여 한국어-수화 변환 시스템에서 문장 유형에 따라 수화의 비수지신호가 다르게 표현되는 현상을 처리하는 과정과 한국어 음성 합성 시스템에서 문장 유형에 따라 문장의 문미 억양이 변하는 현상을 처리하는 과정을 제시한다. 문장 유형 정보를 음성 합성과 수화 자동 생성에 이용하는 것은 기존에는 연구되지 않았던 방법으로, 좀 더 자연스러운 음성과 수화 표현을 생성하는데 중요한 역할을 할 것으로 기대한다.

  • PDF

복합 자질 정보를 이용한 통계적 한국어 채팅 문장 생성 (Statistical Generation of Korean Chatting Sentences Using Multiple Feature Information)

  • 김종환;장두성;김학수
    • 인지과학
    • /
    • 제20권4호
    • /
    • pp.421-437
    • /
    • 2009
  • 채팅 시스템은 인간이 사용하는 언어를 이용하여 인간과 컴퓨터 간의 대화를 시뮬레이션하는 프로그램이다. 본 논문에서는 핵심어와 화행을 입력으로 받아 자연스러운 채팅 문장을 생성하는 통계 모델을 제안한다. 제안 모델은 먼저 핵심어를 포함한 어절을 말뭉치에서 선택하고, 해당 어절의 주위에 있는 어절의 출현 정보와 구문 정보를 이용하여 후보 문장들을 생성한다. 그리고 화행에 기초한 언어 모델, 어절간 공기 정보, 각 어절의 구문 정보를 이용하여 생성된 후보 문장 중 하나를 선택한다. 실험 결과에 따르면 제안 모델은 단순한 언어 모델에 기반한 기존의 모델보다 좋은 86.2%의 적합 문장 생성률을 보였다.

  • PDF

Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구 (A Study on Image Generation from Sentence Embedding Applying Self-Attention)

  • 유경호;노주현;홍택은;김형주;김판구
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.63-69
    • /
    • 2021
  • 사람이 어떤 문장을 보고 그 문장에 대해 이해하는 것은 문장 안에서 주요한 단어를 이미지로 연상시켜 그 문장에 대해 이해한다. 이러한 연상과정을 컴퓨터가 할 수 있도록 하는 것을 text-to-image라고 한다. 기존 딥 러닝 기반 text-to-image 모델은 Convolutional Neural Network(CNN)-Long Short Term Memory(LSTM), bi-directional LSTM을 사용하여 텍스트의 특징을 추출하고, GAN에 입력으로 하여 이미지를 생성한다. 기존 text-to-image 모델은 텍스트 특징 추출에서 기본적인 임베딩을 사용하였으며, 여러 모듈을 사용하여 이미지를 생성하므로 학습 시간이 오래 걸린다. 따라서 본 연구에서는 자연어 처리분야에서 성능 향상을 보인 어텐션 메커니즘(Attention Mechanism)을 문장 임베딩에 사용하여 특징을 추출하고, 추출된 특징을 GAN에 입력하여 이미지를 생성하는 방법을 제안한다. 실험 결과 기존 연구에서 사용되는 모델보다 inception score가 높았으며 육안으로 판단하였을 때 입력된 문장에서 특징을 잘 표현하는 이미지를 생성하였다. 또한, 긴 문장이 입력되었을 때에도 문장을 잘 표현하는 이미지를 생성하였다.

영한 기계 번역에서 한국어 부사의 어순 결정에 관한 연구 (A Study of Korean Adverb Ordering in English-Korean Machine Translation)

  • 이신원;안동언;정성종
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(3)
    • /
    • pp.203-206
    • /
    • 2001
  • In the EKMT system, the part of Korea generation makes Korea sentence by using information obtained in the part of transfer. In the case of Korea generation, the conventional EKMT system don't arrange hierarchical word order and performs word order in the only modifier word. This paper proposes Korean adverb odering rule in English-Korean Machine Translation system which generates Korean sentence.

  • PDF

Sentence-Chain Based Seq2seq Model for Corpus Expansion

  • Chung, Euisok;Park, Jeon Gue
    • ETRI Journal
    • /
    • 제39권4호
    • /
    • pp.455-466
    • /
    • 2017
  • This study focuses on a method for sequential data augmentation in order to alleviate data sparseness problems. Specifically, we present corpus expansion techniques for enhancing the coverage of a language model. Recent recurrent neural network studies show that a seq2seq model can be applied for addressing language generation issues; it has the ability to generate new sentences from given input sentences. We present a method of corpus expansion using a sentence-chain based seq2seq model. For training the seq2seq model, sentence chains are used as triples. The first two sentences in a triple are used for the encoder of the seq2seq model, while the last sentence becomes a target sequence for the decoder. Using only internal resources, evaluation results show an improvement of approximately 7.6% relative perplexity over a baseline language model of Korean text. Additionally, from a comparison with a previous study, the sentence chain approach reduces the size of the training data by 38.4% while generating 1.4-times the number of n-grams with superior performance for English text.

대화형 유전 프로그래밍을 이용한 적응적 문장생성 열차예약 에이전트 (Train Booking Agent with Adaptive Sentence Generation Using Interactive Genetic Programming)

  • 임성수;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제12권2호
    • /
    • pp.119-128
    • /
    • 2006
  • 대화형 에이전트가 다양한 분야에서 적용됨에 따라서 현실성 있는 대화 생성을 위한 자연언어 생성에 대한 연구가 관심을 끌고 있다. 대화형 에이전트에서는 보통 미리 준비된 답변을 이용하여 사용자와 대화를 수행하지만, 최근에는 문장을 동적으로 생성하고 학습함으로써 보다 유연하고 현실성있는 서비스를 제공하는 대화형 에이전트가 활발히 연구되고 있다. 본 논문에서는 대화형 유전 프로그래밍을 이용한 문장생성 방법을 제안한다. 이 방법은 문장의 구조를 나타내는 문장계획 트리로 인코딩된 개체를 평가자의 평가를 통해 적응적인 문장을 얻는다. 이 방법의 유용성을 검증하기 위해 제안하는 방법으로 열차예약 에이전트를 구현한 후, 사용자 평가를 수행하였다. 그 결과 제안하는 방법이 도메인에 적합한 문장을 생성하는 것을 확인할 수 있었다.

프로그램 재사용을 통한 한/영 기계번역시스템의 구현에 관한 연구 (On Implementation of Korean-English Machine Translation System through Program Reuse)

  • 김형근;양기철;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.559-570
    • /
    • 1993
  • 본 논문에서는 범용 영어 생성기인 펜맨을 이용한 한/영 번역기에 대해 소개한다. 펜맨은 영어문장 생성기로서 그 입력 언어는 문장생성을 위해 특별히 고안된 문장계획언어이다. 문장계획언어는 문장을 생성하기 위한 다양한 구문적, 의미적인 사양들을 포함하고 있다. 본 연구에서 우리는 한국어 분석을 위해서 의존문법에 기반한 한국어 분석기를 사용하고, 영어의 생성을 위해서 펜맨을 사용한다. 그리고 한국어 해석의 결과인 문장의 의존구조를 펜맨의 입력인 문장계획언어로 변환하는 모듈을 작성하였다.

  • PDF

Using Syntax and Shallow Semantic Analysis for Vietnamese Question Generation

  • Phuoc Tran;Duy Khanh Nguyen;Tram Tran;Bay Vo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권10호
    • /
    • pp.2718-2731
    • /
    • 2023
  • This paper presents a method of using syntax and shallow semantic analysis for Vietnamese question generation (QG). Specifically, our proposed technique concentrates on investigating both the syntactic and shallow semantic structure of each sentence. The main goal of our method is to generate questions from a single sentence. These generated questions are known as factoid questions which require short, fact-based answers. In general, syntax-based analysis is one of the most popular approaches within the QG field, but it requires linguistic expert knowledge as well as a deep understanding of syntax rules in the Vietnamese language. It is thus considered a high-cost and inefficient solution due to the requirement of significant human effort to achieve qualified syntax rules. To deal with this problem, we collected the syntax rules in Vietnamese from a Vietnamese language textbook. Moreover, we also used different natural language processing (NLP) techniques to analyze Vietnamese shallow syntax and semantics for the QG task. These techniques include: sentence segmentation, word segmentation, part of speech, chunking, dependency parsing, and named entity recognition. We used human evaluation to assess the credibility of our model, which means we manually generated questions from the corpus, and then compared them with the generated questions. The empirical evidence demonstrates that our proposed technique has significant performance, in which the generated questions are very similar to those which are created by humans.