• 제목/요약/키워드: 문제 생성

검색결과 4,183건 처리시간 0.032초

강건한 응답 생성을 위한 디노이징 메커니즘 기반 다중 디코더 대화 모델 (Multi-Decoder Conversational Model for Generating Robust Response Based on Denoising Mechanism)

  • 김태형;박성배;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.141-146
    • /
    • 2018
  • 최근 대화 모델 학습에는 시퀀스-투-시퀀스 모델이 널리 활용되고 있다. 하지만 기본적인 시퀀스-투-시퀀스 모델로 학습한 대화 모델은 I don't know 문제와 사오정 문제를 내포한다. I don't know 문제는 입력 발화에 대해 안전하고 무미건조한 단편적인 대답을 많이 생성하는 문제이다. 사오정 문제는 입력 발화에 대해 적절한 응답을 생성했지만 입력 발화와 동일한 의미를 지니지만 어순, 어미 등의 변화가 있는 발화에는 적절한 응답을 생성하지 못하는 문제이다. 이전 연구에서 디노이징 메커니즘을 활용하여 각각의 문제를 완화하는 대화 모델들을 학습할 수 있음을 보였으나 하나의 모델에서 두 문제를 동시에 해결하지는 못하였다. 본 논문에서는 디노이징 메커니즘을 활용하여 각각의 문제에 강점을 지닌 디코더들을 학습하고 응답 생성 시 입력 발화에 따라 두 디코더를 적절하게 반영하여 언급한 문제 모두에 대해 강건한 응답을 생성할 수 있는 모델을 제안한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 한국어 대화 데이터로 실험을 수행하였다. 실험 결과 단일 문제를 해결하는 모델들과 비교하여 ROUGE F1 점수와 사람이 평가한 정성 평가에서 성능 향상을 보였다.

  • PDF

단어 생성 이력을 이용한 시퀀스-투-시퀀스 요약의 어휘 반복 문제 해결 (Reduce Redundant Repetition Using Decoding History for Sequence-to-Sequence Summarization)

  • 류재현;노윤석;최수정;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.120-125
    • /
    • 2018
  • 문서 요약 문제는 최근 심층 신경망을 활용하여 활발히 연구되고 있는 문제 중 하나이다. 많은 기존 연구들이 주로 시퀀스-투-시퀀스 모델을 활용하여 요약을 수행하고 있으나, 아직 양질의 요약을 생성하기에는 많은 문제점이 있다. 시퀀스-투-시퀀스 모델을 활용한 요약에서 가장 빈번히 나타나는 문제 중 하나는 요약문의 생성과정에서 단어나 구, 문장이 불필요하게 반복적으로 생성되는 것이다. 이를 해결하기 위해 다양한 연구가 이루어지고 있으며, 이들 대부분은 요약문의 생성 과정에서 정확한 정보를 주기 위해 모델에 여러 모듈을 추가하였다. 하지만 기존 연구들은 생성 단어가 정답 단어로 나올 확률을 최대화 하도록 학습되기 때문에, 생성하지 말아야 하는 단어에 대한 학습이 부족하여 반복 생성 문제를 해결하는 것에는 한계가 있다. 따라서 본 논문에서는 기존 요약 모델의 복잡도를 높이지 않고, 단어 생성 이력을 직접적으로 이용하여 반복 생성을 제어하는 모델을 제안한다. 제안한 모델은 학습할 때 생성 단계에서 이전에 생성한 단어가 이후에 다시 생성될 확률을 최소화하여 실제 모델이 생성한 단어가 반복 생성될 확률을 직접적으로 제어한다. 한국어 데이터를 이용하여 제안한 방법을 통해 요약문을 생성한 결과, 비교모델보다 단어 반복이 크게 줄어들어 양질의 요약을 생성하는 것을 확인할 수 있었다.

  • PDF

외국인의 한국어 학습을 위한 어휘 문제 자동 생성 (Automatic Generation of Vocabulary Problem for Learning Korean as a Foreign Language)

  • 김성욱;임재현;김예인;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.247-250
    • /
    • 2014
  • 국내에서 거주하는 외국인들을 대상으로 한 여러 정책들이 만들어지고 있다, 그에 따른 한국어 교육의 수요는 증가하고 있지만 그에 적합한 한국어 교육시스템의 자동화 및 발전은 미약하다. 본 논문에서는 사전예문과 획득이 용이한 말뭉치를 가공하여 적절한 수준의 문제를 자동으로 생성하는 방법을 제안한다. 자동문제생성에서는 말뭉치와 사전 예문에서 문제와 보기문항을 생성하고, 보기 리스트를 생성한다. 웹문서 검색빈도를 이용하여 생성된 보기리스트의 적합성을 분석하여 정제된 보기 리스트를 획득한다. 얻어진 보기들을 임의로 선택하여 출력함으로써 사용자들이 다양한 문제를 접할 수 있도록 한다.

  • PDF

웹기반 TOEIC 문법 문제 자동 생성 시스템 (A Web-Based System for Automatic Generation of TOEIC Grammar Test)

  • 정형구;김상철;채희락;이찬종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.602-604
    • /
    • 2007
  • 본 논문에서는 웹기반의 TOEIC 문법 문제 자동 생성 시스템을 제안한다. 본 시스템은 웹에서 문서를 가져온 후, 문서의 각 문장이 데이터베이스에 저장된 문제 패턴에 일치하는 지를 검사하여 문제를 생성한다. 본 시스템을 통해서 생성되는 문법 문제를 영어 전문가를 통해서 검중한 결과, 대부분의 문제가 TOEIC 실전 문제로 사용하기에 충분한 것이었다. 우리의 조사에 의하면, TOEIC 문법 문제의 자동 생성에 관한 기존 연구는 거의 발표되고 있지 않다.

  • PDF

자동 문제 생성 기술을 이용한 한국어 어휘학습시스템 (Korean Word Learning System Using Automatic Question Generation Technique)

  • 최수일;임지희;최호섭;옥철영
    • 인지과학
    • /
    • 제17권4호
    • /
    • pp.271-286
    • /
    • 2006
  • 본 논문은 한국어 어휘에 대한 풍부한 정보를 담고 있는 한국어사전과 사용자 어휘지능망(User-Word Intelligent Network: U-WIN)등의 언어자원을 이용한 자동 문제 생성 기술을 소개하고, 이 기술을 이용한 한국어 어휘학습시스템을 제시한다. 대부분의 학습시스템에서 사용하는 문제 은행식 출제 방식의 문제점을 해소하기 위하여, 자동 문제 생성을 위한 한국어 어휘 문제의 유형을 8가지로 분류하고, 각 문제 유형별 자동 문제 생성 패턴을 구축하였다. 이러한 자동 문제 생성 패턴에 따라 언어자원이 가지고 있는 한국어 어휘의 형태적 정보와 의미적 정보를 이용하여 어휘 문제를 자동으로 출제하는 한국어 어휘학습 시스템을 구현하였다.

  • PDF

오픈 도메인 대화를 위한 노이징된 가이드 기반 생성 모델 (Noised Guide-based Generative Model for Open-domain Conversation)

  • 금빛나;김홍진;박상민;김재은;황금하;권오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.82-87
    • /
    • 2022
  • 대화 모델은 대표적으로 검색 모델 또는 생성 모델을 기반으로 구현된다. 최근에는 두 모델의 장점은 융합하고 단점은 보완하기 위해 검색 기법과 생성 기법을 결합하는 연구가 활발히 이루어지고 있다. 그러나 생성 모델이 검색된 응답을 전혀 반영하지 않고 응답을 생성하여 검색 모델을 간과하는 문제 또는 검색된 응답을 그대로 복사해 생성하여 검색 모델에 과의존하는 문제가 발생한다. 본 논문에서는 이러한 문제들을 완화하며 검색 모델과 생성 모델을 모두 조화롭게 활용할 수 있는 대화 모델을 제안한다. 생성 모델이 검색 모델을 간과하는 문제를 완화하기 위해 학습 시 골드 응답을 검색된 응답과 함께 사용한다. 또한, 검색 모델에 과의존하는 문제를 완화하기 위해 검색된 응답들의 내용어 일부를 마스킹하고 순서를 무작위로 섞어 노이징한다. 검색된 응답은 대화 컨텍스트와의 관련성이 높은 것만을 선별하여 생성에 활용한다. 정량 평가 및 정성 평가를 통해 제안한 방법의 성능 향상 효과를 확인하였다.

  • PDF

고해상도 영상 자료로부터 추출한 DEM 및 정사영상 생성에 관한 연구 (Research for DEM and ortho-image generated from high resolution satellite images.)

  • 정재훈;이태윤;김태정;박완용
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2008년도 춘계학술대회 논문집
    • /
    • pp.80-85
    • /
    • 2008
  • 최근 도심지역이 급변하고 고해상도 위성영상의 보급이 증가함에 따라 고해상도 위성영상을 이용한 수치표고모델과 정사영상 생성에 관한 연구가 활발해 지고 있다. 본 연구에서는 IKONOS, SPOT5, QUICKBIRD, KOMPSAT2 위성영상을 이용하여 DEM 과 정사영상을 생성하였으며 USGS DTED 와 기준점을 이용하여 결과의 정확도를 비교 분석하였다. 보다 정확한 DEM 생성을 위해 자동 피라미드 알고리즘을 적용하고 영상 정합시 에피폴라 기하학을 적용하였다. 정사 영상 생성시 DTED 높이값을 이용하여 보정을 수행하였으며 생성 속도를 높이기 위하여 리샘플링 그리드를 적용하였다. 본 연구에서 DEM 과 정사영상 생성시 QUICKBIRD 와 SPOT5 의 경우 영상의 용량이 매우 커 메모리 부족문제와 알고리즘 수행 속도 저하가 발생함을 확인하였다. 이를 개선하기 위하여 DEM 생성시 정합 후보점의 개수를 줄이는 알고리즘을 고안하여 기존에 메모리 문제로 생성하지 못했던 QUICKBIRD와 SPOT5 의 DEM 을 생성하였으며 정사 영상 생성시 리샘플링 그리드를 적용하여 고해상도 정상영상 생성 속도 개선에 상당한 효과를 가져왔다. 그러나 고해상도 위성 영상의 용량이 점점 커져감에 따라 이러한 메모리 문제와 처리 속도 저하에 관한 문제는 추후 계속적으로 연구되어야 할 부분이라고 할 수 있다. 본 연구에서 생성한 IKONOS, SPOT5, QUICKBIRD DEM 의 정확도를 USGS DTED 와 비교한 결과 13${\sim}$15 m 정도의 RMS 높이 오차가 산출되었으며 생성된 IKONOS, QUICKBIRD, KOMPSAT2 정사영상을 기준점과 비교한 결과 3 m 정도의 거리오차가 산출되었음을 확인하였다.

  • PDF

예비교사의 문제 생성과 재구성 활동에 관한 탐색 (An Investigation on the Application for Problem Generation and Problem Reformulation by Pre-service Teachers)

  • 김슬비;황혜정
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제29권3호
    • /
    • pp.533-551
    • /
    • 2015
  • 본 연구에서는 '동일한' 문제 조건으로부터 생성과 재구성을 모두 경험할 수 있는 문제제기 활동을 적용하되, 활동을 세분화하여 학생들의 자주적인 활동을 강조한 활동과 학생들의 보편적 사고를 유도하며 교사 안내가 수반되는 활동으로 구분하여 이에 대한 두 절차를 구안하고, 이 두 활동에 의거하여 문제생성과 재구성 활동에 관해 탐색하고자 한다. 이를 위하여, 본 연구에서는 예비교사들을 대상으로 연구자가 구안한 문제제기 활동을 적용한 실험 수업 후 설문조사를 통하여 문제생성과 재구성에 대한 난이도 및 흥미도, 인지적 정의적 측면에서의 효과, 그리고 수학 수업 및 평가에서의 활용성 등을 탐색하였다. 그 결과, 문제생성은 창의력을 증진시키고 수학에 대한 흥미를 유발하며, 문제 재구성은 문제 해결력 향상에 도움이 되고 자신감을 길러주는 것으로 나타났다. 또한 수업 상황에서는 문제생성 활동이 더 효과적이고, 평가 상황에서는 문제재구성 활동이 더 효과적인 것으로 나타났으나 각 상황에서 문제생성과 재구성에 대한 응답의 차이가 크지 않았으므로 두 활동 모두 수업 및 평가에 적용이 가능할 것으로 판단된다. 따라서 교사는 학습자의 수준, 가르칠 영역, 진도 등을 고려하여 수업 및 평가 상황에서 문제생성과 재구성 활동을 적절한 시기에 알맞게 적용함으로써 학습자의 인지적, 정의적 성취의 함양을 돕도록 해야 할 것이다.

Anycase Subgoal을 위한 EBL 기반의 제어지식형 계획기의 확장 (Extending An EBL Based Conrol-Knowledge Planner for Anycase Subgoals)

  • 이동복;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.18-20
    • /
    • 1998
  • 본 논문은 EBL 기반의 제어지식형 계획기에서 다양한 목표확장 방법을 사용하여 MEA의 불완전한 계획생성을 해결하는 새로운 방법을 제안한다. 계획기의 문제 공간을 탐색하는 방법 중 하나인 MEA는 현재상태와 목표상태의 차이를 줄이기 위하여 연산자를 선택한 후에, 연산자의 조건절을 현재상태가 만족하는지의 여부에 따라서 조건절의 부목표화를 결정한다. 그러나 이러한 목표확장 방법은 현재상태에서 만족된 부목표에 대한 목표확장을 하지않음으로써 문제공간 탐색에서 제한된 범위만을 탐색하므로 목표를 만족하는 최적의 계획을 생성할 수 없으며, 또한 문제를 해결하는 계획이 있음에도 불구하고 탐색범위의 제한으로 인해 계획을 생성하지 못하는 경우도 발생한다. 이와 같이 현재 상태에서 만족되어 목표확장을 하지 않은 부목표를 Anycase Subgoal이라 한다. 본 논문에서 제안하는 목표확장 방법은 ELB기반의 제어지식형 계획기를 Anycase Subgoal을 위하여 확장하는 방법으로 서, 초기의 문제공간 탐색에서 사용된 목표확장 방법에서 문제를 해결하지 못할 경우 탐색공간을 확장하여 문제를 해결하고, 문제에 적합한 목표확장 방법을 제어지식형 규칙으로 학습하여 유사한 문제에 대하여 효율적으로 계획을 생성한다.

  • PDF

통계 언어모델 기반 객관식 빈칸 채우기 문제 생성 (Automatic Generation of Multiple-Choice Questions Based on Statistical Language Model)

  • 박영기
    • 정보교육학회논문지
    • /
    • 제20권2호
    • /
    • pp.197-206
    • /
    • 2016
  • 빈칸 채우기 문제는 학생들이 학습 내용을 제대로 이해했는지 확인하기 위해 널리 사용되어 왔다. 이런 유형의 문제를 컴퓨터 알고리즘에 의해 자동으로 생성하는 많은 방법들이 제안되어 왔지만, 대부분 어떤 부분을 빈칸으로 만들면 좋을지에 대해 집중했기 때문에 적절한 보기를 자동으로 생성하는 연구는 미흡했다. 본 논문에서는 빈칸이 주어졌다고 가정하고, 이에 어울리는 보기를 자동 생성하는 알고리즘을 제안한다. 본 알고리즘은 통계 언어 모델에 기반하여 보기를 생성하기 때문에, 사람이 생성하는 경우보다 출제자에 편향되지 않은 보기를 제공할 수 있다. 또, 확률값에 기반하여 난이도를 자동으로 조절하는 것이 가능하기 때문에, 직접 사람이 문제를 만드는 것에 비해 상당한 비용 절감 효과가 있다. TEPS 문법, 어휘 시험에 대해 적용하여 실험한 결과, 사람과 유사한 결과를 생성함을 확인하였다. 향후 스마트 교육 분야에서 높은 활용도를 보일 것으로 기대한다.