• 제목/요약/키워드: 질문 생성

검색결과 132건 처리시간 0.022초

Image captioning 데이터와 Visual QA 데이터를 활용한 질문 자동 생성 (Automatic question generation based on image captioning data & visual QA data)

  • 이경호;최용석;이공주
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.176-180
    • /
    • 2016
  • 대화형 시스템이 사람의 경청 기술을 모방할 수 있다면 대화 상대방과 더 효과적으로 상호작용 할 수 있을 것이다. 본 논문에서는 시스템이 경청 기술을 모방할 수 있도록 사용자의 발화를 기반으로 질문을 생성하는 것에 대해 연구하였다. 그리고 이러한 연구를 위해 필요한 데이터를 Image captioning과 Visual QA 데이터를 기반으로 생성하고 활용하는 방안에 대해 제안한다. 또한 이러한 데이터를 Attention 메커니즘을 적용한 Sequence to sequence 모델에 적용하여 질문을 생성하고, 생성된 질문의 질문 유형을 분석하였다. 마지막으로 사람이 작성한 질문과 모델의 질문 생성 결과 비교를 BLEU 점수를 이용하여 수행하였다.

  • PDF

Image captioning 데이터와 Visual QA 데이터를 활용한 질문 자동 생성 (Automatic question generation based on image captioning data & visual QA data)

  • 이경호;최용석;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.176-180
    • /
    • 2016
  • 대화형 시스템이 사람의 경청 기술을 모방할 수 있다면 대화 상대방과 더 효과적으로 상호작용 할 수 있을 것이다. 본 논문에서는 시스템이 경청 기술을 모방할 수 있도록 사용자의 발화를 기반으로 질문을 생성하는 것에 대해 연구하였다. 그리고 이러한 연구를 위해 필요한 데이터를 Image captioning과 Visual QA 데이터를 기반으로 생성하고 활용하는 방안에 대해 제안한다. 또한 이러한 데이터를 Attention 메커니즘을 적용한 Sequence to sequence 모델에 적용하여 질문을 생성하고, 생성된 질문의 질문 유형을 분석하였다. 마지막으로 사람이 작성한 질문과 모델의 질문 생성 결과 비교를 BLEU 점수를 이용하여 수행하였다.

  • PDF

정답과 구절의 공동 주의 집중 계층을 이용한 한국어 질문 생성 (Korean Question Generation Using Co-Attention Layer of Answer and Passage)

  • 김진태;노형종;이연수;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.315-320
    • /
    • 2019
  • 질문 생성이란 구절이 입력되면 구절에서 답을 찾을 수 있는 질문을 자동으로 생성하는 작업으로 교육용 시스템, 대화 시스템, QA 시스템 등 다양한 분야에서 중요한 역할을 한다. 질문 생성에서 정답의 단어가 질문에 포함되는 문제점을 해결하기 위해 구절과 정답을 분리한다. 하지만 구절과 정답을 분리하게 되면 구절에서 정답의 정보가 손실되고, 정답에서는 구절의 문맥 정보가 손실되어 정답 유형에 맞는 질문을 생성할 수 없는 문제가 발생된다. 본 논문은 이러한 문제를 해결하기 위해 분리된 정답과 구절의 정보를 연결시켜주는 정답과 구절의 공동 주의 집중 계층을 제안한다. 23,658개의 질문-응답 쌍의 말뭉치를 이용한 실험에서 정답과 구절의 공동 주의 집중 계층이 성능 향상에 기여해 우수한 성능(BLEU-26.7, ROUGE-57.5)을 보였다.

  • PDF

BERT 기반 Sequence-to-Sequence 모델을 이용한 한국어 질문 생성 (Korean Question Generation using BERT-based Sequence-to-Sequence Model)

  • 이동헌;황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.60-63
    • /
    • 2020
  • 기계 독해는 입력 받은 질문과 문단의 관계를 파악하여 알맞은 정답을 예측하는 자연어처리 태스크로 양질의 많은 데이터 셋을 필요로 한다. 기계 독해 학습 데이터 구축은 어려운 작업으로, 문서에서 등장하는 정답과 정답을 도출할 수 있는 질문을 수작업으로 만들어야 한다. 이러한 문제를 해결하기 위하여, 본 논문에서는 정답이 속한 문서로부터 질문을 자동으로 생성해주는 BERT 기반의 Sequence-to-sequence 모델을 이용한 한국어 질문 생성 모델을 제안한다. 또한 정답이 속한 문서와 질문의 언어가 같고 정답이 속한 문장의 주변 단어가 질문에 등장할 확률이 크다는 특성에 따라 BERT 기반의 Sequence-to-sequence 모델에 복사 메카니즘을 추가한다. 실험 결과, BERT + Transformer 디코더 모델의 성능이 기존 모델과 BERT + GRU 디코더 모델보다 좋았다.

  • PDF

대학생의 질문수준, 질문과정 및 질문저해요인 (The Relationship among Questions Level, Questions Process, and Hesitation Factor of Questions of University Students)

  • 우정희;유재용;박주영
    • 한국콘텐츠학회논문지
    • /
    • 제15권12호
    • /
    • pp.336-346
    • /
    • 2015
  • 본 연구의 목적은 대학생의 학습자 생성 질문수준, 질문과정 및 질문저해요인 간 관계를 파악하기 위함이다. 연구 대상자는 2015년 9월 9일부터 10일까지 D시에 소재하는 일개대학의 대학생을 편의추출 하였으며, 174명을 대상으로 하였다. 자료는 SPSS WIN 21.0 프로그램을 이용하여 빈도, 백분율, 평균 및 표준편차, t-test, ANOVA, Correlation analysis를 분석하였다. 대상자는 개인의 다양한 수준들을 통하여 질문을 생성하게 되면서도 인지적 혼란을 통한 질문생성은 실제질문과 관련함을 알 수 있다. 또한 질문저해요인의 내적요인은 실제질문과 음의 상관관계를 보인다. 즉 대학생의 질문이 잘 표출되기 위해서는 학습자의 질문을 주저하는 외적요인 뿐만 아니라 내적요인을 감소하기 위하여 고민이 필요할 것이다. 또한, 인지적 혼란-질문생성-실제질문의 연계성을 인식하여 교수 개인 차원의 효율적인 교과목 운영이 이루어져야 할 것으로 생각된다.

통계적 문제해결 과정에서 나타난 예비초등교사들의 통계적 추론 분석 : 질문 생성 단계를 중심으로 (Statistical Reasoning of Preservice Elementary School Teachers Engaged in Statistical Problem Solving: Focused on Question Posing Stage)

  • 이은정;박민선
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제22권4호
    • /
    • pp.205-221
    • /
    • 2019
  • 이 연구는 통계적 문제해결 과정 중에 설문지 질문 생성 단계에서 나타나는 예비초등교사들의 통계적 추론을 조사하고 이것이 이후 단계들에서의 활동에 어떻게 영향을 미치는지를 분석하는 데 목적을 두었다. 이를 위해 24개 조의 교육대학교 2학년 학생들 80명이 통계적 문제해결 과정을 직접 실행하고 통계 보고서를 작성하였으며, 그 중 22개 조의 보고서를 분석하였다. 분석 결과, 설문지 질문 생성 단계에서 예비교사들의 9가지 통계적 추론이 확인되었으며, 특히 그 중 질문 명확화 지향 추론과 변이 기반 추론은 기존 연구에서 보고되지 않았던 추론이었다. 또한, 설문지 질문 생성 단계에서의 통계적 추론이 이후 단계의 활동에 미친 영향을 알아보기 위해 자료 분석 및 결론 단계에서 예비교사들이 보고서에 기술하였던 어려움 및 이슈를 확인하였다. 그 결과, 예비교사들의 어려움이 설문지 질문 생성 과정에서의 모집단 관련 추론, 범주 수준 추론, 표준화 추론, 질문의 일관성 지향 추론, 질문 명확화 지향 추론과 관련이 있는 것으로 나타났다. 그동안 선행연구에서 질문 생성하기 단계에 크게 주목하지 않았다는 점에 비추어보면, 본 연구 결과는 질문 생성 단계에서 나타나는 다양한 통계적 추론에 좀 더 주목할 필요가 있다는 점과 질문 생성 단계에서 적절한 통계적 추론이 이루어지도록 하기 위한 교수 방안들을 논의할 필요가 있다는 점을 시사한다.

정답 분리 인코더와 복사 메커니즘을 이용한 한국어 질문 생성 (Using Answer-Separated Encoder And Copying Mechanism)

  • 김건영;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.419-423
    • /
    • 2019
  • 질문과 그에 대한 근거가 있는 문서를 읽고 정답을 예측하는 기계 독해 연구가 최근 활발하게 연구되고 있다. 기계 독해 문제를 위해 주로 사용되는 방법은 다층의 신경망으로 구성된 딥러닝 모델로 좋은 성능을 위해서는 양질의 대용량 학습 데이터가 필요하다. 그러나 질과 양을 동시에 만족하는 학습 데이터를 구축하는 작업에는 많은 경제적 비용이 소모된다. 이러한 문제를 해결하기 위해, 본 논문에서는 정답 분리 인코더와 복사 메커니즘을 이용한 단답 기반 한국어 질문 자동 생성 모델을 제안한다.

  • PDF

개체명 기반 질문-답변 검사를 통한 요약문 사실관계 확인 (Factual consistency checker through a question-answer test based on the named entity)

  • 정지수;류휘정;장두성;정이우;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.112-117
    • /
    • 2021
  • 기계 학습을 활용하여 요약문을 생성했을 경우, 해당 요약문의 정확도를 측정할 수 있는 도구는 필수적이다. 원문에 대한 요약문의 사실관계 일관성의 파악을 위해 개체명 유사도, 기계 독해를 이용한 질문-답변 생성을 활용한 방법이 시도되었으나, 충분한 데이터 확보가 필요하거나 정확도가 부족하였다. 본 논문은 딥러닝 모델을 기반한 개체명 인식기와 질문-답변쌍 정확도 측정기를 활용하여 생성, 필터링한 질문-답변 쌍에 대해 일치도를 점수화하는 방법을 제안하였다. 이러한 기계적 사실관계 확인 점수와 사람의 평가 점수의 분포를 비교하여 방법의 타당성을 입증하였다.

  • PDF

증강된 질문을 이용한 RoBERTa 기반 Dense Passage Retrieval (Dense Retrieval using Pretrained RoBERTa with Augmented Query)

  • 박준범;홍범석;최원석;한영섭;전병기;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.141-145
    • /
    • 2022
  • 다중 문서 기반 대화 시스템에서 응답 시스템은 올바른 답변을 생성하기 위해서 여러 개의 문서 중 질문과 가장 관련 있는 문서를 검색하는 것부터 시작해야 한다. DialDoc 2022 Shared Task[1]를 비롯한 최근의 연구들은 대화 시스템의 문서 검색 과정을 위해 Dense Passage Retrieval(DPR)[2] 모델을 사용하고 있으며 검색기의 성능 개선을 위해 Re-ranking과 Hard negative sampling 같은 방법들이 연구되고 있다. 본 논문에서는 문서에 기반하는 대화 데이터의 양이 적거나 제한될 경우, 주어진 데이터를 효율적으로 활용해 보고자 검색기를 생성 모델을 이용하여 문서의 엔티티를 기반으로 질문을 생성하고 기존 데이터에 증강하는 방법을 제시했으며 실험의 결과로 MRR metric의 경우 0.96 ~ 1.56의 성능 향상을, R@1 metric의 경우 1.2 ~ 1.57의 성능 향상을 확인하였다.

  • PDF

복사 방법 및 검색 방법을 이용한 종단형 생성 기반 질의응답 채팅 시스템 (End-to-End Generative Question-Answering Chat System Using Copying and Retrieving Mechanisms)

  • 김시형;김학수;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-28
    • /
    • 2017
  • 채팅 시스템은 기계와 사람이 서로 의사소통 하는 시스템이다. 의사소통 과정에서 질문을 하고 질문에 대한 답변을 하는 질의응답 형태의 의사소통이 상당히 많다. 그러나 기존 생성 기반 채팅 시스템에서 자주 사용되는 Sequence-to-sequence모델은 질문에 대한 답변보다는 좀 더 일반적인 문장을 생성하는 경우가 대부분이다. 이러한 문제를 해결하기 위해 본 논문에서는 복사 방법과 검색 방법을 이용한 생성 기반 질의응답 채팅 시스템을 제안한다. 템플릿 기반으로 구축한 데이터를 통한 실험에서 제안 시스템은 복사 방법만 이용한 질의응답 시스템 보다 45.6% 높은 정확도를 보였다.

  • PDF