• 제목/요약/키워드: 사전 질문

검색결과 190건 처리시간 0.024초

초등학교 과학수업에서 학생의 사전질문 분석틀 개발 및 적용 (Development and Application of Student's Pre-question Framework for Analysisin Elementary Science Class)

  • 강헌태;노석구
    • 한국과학교육학회지
    • /
    • 제38권2호
    • /
    • pp.235-247
    • /
    • 2018
  • 학생의 사전질문은 교사에게 학생의 관심사와 수준을 제공해줄 뿐만 아니라, 교육의 수요자인 학생의 관점을 반영하여 교수-학습을 진행할 수 있는 단서를 제공해주는 유용한 수단이다. 이 연구의 목적은 학생의 사전질문을 효과적으로 분석하기 위한 분석틀을 개발하고, 이 분석틀을 적용하여 2009 개정 교육과정의 초등과학 학습 단원과 관련된 학생의 사전질문을 분석하는 것이다. 개발된 분석틀은 지식형, 확장형, 호기심형 질문의 3개의 대범주로 구성되며, 각각의 범주에서 다시 몇 개의 하부 영역으로 세분된다. 개발된 분석틀을 이용하여 2009 개정 교육과정 초등과학 5, 6학년 학습 단원에서 제시한 학생사전질문 914개를 분석한 결과, 학년 및 학습 단원, 차시별로 분포하는 질문 유형이 다른 것으로 나타났으며, 유형별 질문의 비율에도 차이가 있었다. 이러한 결과를 바탕으로 사전질문 분석틀을 통해 학습에 대한 학생의 요구를 파악하고 이를 반영한 학생 중심의 교수-학습의 방향을 제시하였으며, 추후 연구에서도 분석틀이 유의미한 기여를 할 것으로 기대된다.

기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가 (Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment)

  • 임준호;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

표 질의응답을 위한 언어 모델 학습 및 데이터 구축 (Pre-trained Language Model for Table Question and Answering)

  • 심묘섭;전창욱;최주영;김현;장한솔;민경구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.335-339
    • /
    • 2021
  • 기계독해(MRC)는 인공지능 알고리즘이 문서를 이해하고 질문에 대한 정답을 찾는 기술이다. MRC는 사전 학습 모델을 사용하여 높은 성능을 내고 있고, 일반 텍스트문서 뿐만 아니라 문서 내의 테이블(표)에서도 정답을 찾고자 하는 연구에 활발히 적용되고 있다. 본 연구에서는 기존의 사전학습 모델을 테이블 데이터에 활용하여 질의응답을 할 수 있는 방법을 제안한다. 더불어 테이블 데이터를 효율적으로 학습하기 위한 데이터 구성 방법을 소개한다. 사전학습 모델은 BERT[1]를 사용하여 테이블 정보를 인코딩하고 Masked Entity Recovery(MER) 방식을 사용한다. 테이블 질의응답 모델 학습을 위해 한국어 위키 문서에서 표와 연관 텍스트를 추출하여 사전학습을 진행하였고, 미세 조정은 샘플링한 테이블에 대한 질문-답변 데이터 약 7만건을 구성하여 진행하였다. 결과로 KorQuAD2.0 데이터셋의 테이블 관련 질문 데이터에서 EM 69.07, F1 78.34로 기존 연구보다 우수한 성능을 보였다.

  • PDF

대규모 문서 데이터 집합에서 Q&A를 위한 질의문 분류 기법 (A Query Classification Method for Question Answering on a Large-Scale Text Data)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.253-255
    • /
    • 2000
  • 어떠한 질문에 대한 구체적 해답을 얻고 싶은 경우, 일반적인 정보 검색이 가지는 문제점은 검색 결과가 사용자가 찾고자 하는 답이라 하기 보다는 해답을 포함하는(또는 포함하지 않는) 문서의 집합이라는 점이다. 사용자가 후보문서를 모두 읽을 필요 없이 빠르게 원하는 정보를 얻기 위해서는 검색의 결과로 문서집합을 제시하기 보다는 실제 원하는 답을 제공하는 시스템의 필요성이 대두된다. 이를 위해 기존의 TF-IDF(Term Frequency-Inversed Document Frequency)기반의 정보검색의 방삭에 자연언어처리(Natural Language Processing)를 이용한 질문의 분류와 문서의 사전 표지(Tagging)를 사용할 수 있다. 본 연구에서는 매년 NIST(National Institute of Standards & Technology)와 DARPA(Defense Advanced Research Projects Agency)주관으로 열리는 TREC(Text REtrieval Conference)중 1999년에 열린 TREC-8의 사용자의 질문(Question)에 대한 답(Answer)을 찾는 ‘Question & Answer’문제의 실험 환경에서 질문을 특징별로 분류하고 검색 대상의 문서에 대한 사전 표지를 이용한 정보검색 시스템으로 사용자의 질문(Question)에 대한 해답을 보다 정확하고 효율적으로 제시할 수 있음을 실험을 통하여 보인다.

  • PDF

초등학생의 계절별 별자리 학습에서 SBF 질문이 개념성취와 시선이동에 미치는 영향 (The Effect of SBF Question on Conceptual Achievement and Eye Movement in Seasonal Constellation Learning of Elementary School Students)

  • 김재선;양일호;임성만
    • 대한지구과학교육학회지
    • /
    • 제16권2호
    • /
    • pp.302-318
    • /
    • 2023
  • 이 연구 목적은 시스템 사고가 요구되는 계절별 별자리 학습에서 SBF 질문을 제시한 경우, 초등학생의 개념성취 수준과 시선이동에 미치는 영향을 분석하는 것이다. 본 연구에서는 SBF 질문의 효과를 알아보기 위해 연구집단과 비교집단으로 나누고 질문 유형을 달리한 과학 텍스트를 제시하여 초등학교 6학년 학습자의 개념성취 수준 및 시선이동 차이를 분석하였다. 개념성취 수준을 분석하기 위해 집단 내·집단 간 사전·사후 검사를 실시하였으며, 시선이동 차이를 분석하기 위해 Eye-tracker를 활용하여 학습자의 시선을 추적하였다. 연구 참여자는 연구 참여 동의서를 통해 자발적으로 연구 참여 의사를 밝힌 초등학교 6학년 학생 36명이다(연구집단 18명, 비교집단 18명). 본 연구를 위해 연구 참여자는 2015 개정 교육과정에서 제시한 계절별 별자리와 관련된 학습 내용 전까지만 학습한 상태로 연구에 참여하였다. 자료 분석은 개발한 개념 검사지의 사전·사후 검사 결과와 계절별 별자리와 관련된 과학 텍스트를 학습할 때의 시선이동 자료를 정량적으로 분석하였다. 연구 결과 첫째, 계절별 별자리 학습에서 SBF 질문은 유효한 학습 전략이었다. 학습자에게 구조(Structure)-작용(Behavior)-기능(Function)과 관련된 질문을 순차적이고 구체적으로 제시하였을 때, 일반적인 질문보다 더 높은 학습효과를 나타내었다. 즉 SBF 질문은 집단 간 사전·사후 개념 검사에서 통계적으로 유의한 차이(p<0.05)를 보였으며, 집단 내 사전·사후 개념 검사에서 통계적으로 유의한 차이(p<0.001)를 보였다. 둘째, SBF 질문은 선개념이 높지 않은 학습자에게 개념성취에 도움이 되는 영역을 학습하도록 유도하여 학습자의 학습에 긍정적인 영향을 주었다. 즉, 우주기반 관점의 시각 자료와 함께 SBF 질문을 제시하였을 때, 교과서의 일반적인 질문을 제시한 경우보다 학습자의 총 시선고정 수에서 유의미한 차이(p<0.01)를 보임을 시선이동 분석 결과를 토대로 확인하였으며, SBF 질문으로 학습한 학습자의 개념성취 수준이 향상됨을 정량적으로 확인하였다. 이는 SBF 질문이 시각 자료가 함께 제시된 과학 텍스트 학습 과정에서 능동적인 학습을 촉진한다는 실증적인 증거이다. 반면, 과학적 선개념을 많이 가지고 있는 학습자에게는 SBF 질문의 효과보다 학습자 자신이 가지고 있는 선개념이 견고한 핵으로 작용하여 탐구의 효과가 크지 않았다. 본 연구는 계절별 별자리 학습 과정에서 SBF 질문의 효과를 사전·사후 검사와 시선이동 분석을 통해 정량적인 자료로 제공한다는 점에서 기존 계절별 별자리 학습 연구와 차별성이 있으며, 초등학생의 계절별 별자리 학습과 관련된 지도방안에 도움을 줄 수 있다.

백과사전 질의응답을 위한 구문정보기반 정답색인방법 (A LF based Answer Indexing Method for Encyclopedia Question-Answering System)

  • 김현진;이충희;오효정;왕지현;장영길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.511-513
    • /
    • 2005
  • 본 논문은 정답 색인 방법을 이용하여 응답 속도가 빠르고 정확한 백과사전 질의응답 시스템을 구현하는 방법을 제안한다. 논문에서 제안한 정답 색인 방법은 대상 문서에서 160여 개의 정답 유형 범주에 해당하는 정답 후보를 인식하고, 정답 후보와 색인 범주에 속하는 키워드를 색인단위로 정의하여 저장하였다. 특히 용언정보에 대해서는 LF(Logical Form)단위로 색인하여 색인 정확도를 높였다. 정답 랭킹에서는 사용자 질문에서 각 단어별로 문장 성분. 단어 가중치 정보 등을 이용하여, 필수단어를 산정하고 이를 정답랭킹의 방법으로 활용하였다. 이러한 방법론은 용언 정보를 활용해야 효과적인 백과사전이라는 문서 도메인의 특성을 반영하고, 빠른 질문 응답 시간을 보장하는 백과사전 질의응답 시스템에 적합하다.

  • PDF

템플릿 기반 미세조정을 통한 토익 모델 훈련 (TOEIC Model Training Through Template-Based Fine-Tuning)

  • 이정우;문현석;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.324-328
    • /
    • 2022
  • 기계 독해란 주어진 문서를 이해하고 문서 내의 내용에 대한 질문에 답을 추론하는 연구 분야이며, 기계 독해 문제의 종류 중에는 여러 개의 선택지에서 질문에 대한 답을 선택하는 객관식 형태의 문제가 존재한다. 이러한 자연어 처리 문제를 해결하기 위해 기존 연구에서는 사전학습된 언어 모델을 미세조정하여 사용하는 방법이 널리 활용되고 있으나, 학습 데이터가 부족한 환경에서는 기존의 일반적인 미세조정 방법으로 모델의 성능을 높이는 것이 제한적이며 사전학습된 의미론적인 정보를 충분히 활용하지 못하여 성능 향상에 한계가 있다. 이에 본 연구에서는 기존의 일반적인 미세조정 방법에 템플릿을 적용한 템플릿 기반 미세조정 방법을 통해 사전학습된 의미론적인 정보를 더욱 활용할 수 있도록 한다. 객관식 형태의 기계 독해 문제 중 하나인 토익 문제에 대해 모델을 템플릿 기반 미세조정 방법으로 실험을 진행하여 템플릿이 모델 학습에 어떠한 영향을 주는지 확인하였다.

  • PDF

우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구 (Design of a Korean Question-Answering System for News Item Retrieval)

  • 정영미
    • 정보관리학회지
    • /
    • 제4권1호
    • /
    • pp.3-23
    • /
    • 1987
  • 이 연구에서 구현한 질문응답시스템은 한글 자연어로 된 텍스트와 질문을 자동으로 처리하는 지능형 정보시스템이다. 입력데이타는 스포츠관계 기사로 국한하였으며 프로그래밍 언어로는 코볼을 사용하였다. 이 시스템의 구문분석기는 격문법에 기초한 것으로서 어휘사전, 용언의 격프레임, 언어학적 규칙 등을 사용하여 문장을 분석한다. 본문검색과 사실검색이 모두 가능한 이 시스템에서는 질문에 대한 해답이 문장형태이거나 사실데이타 형태로 출력된다.

  • PDF

질문-단락 간 N-gram 주의 집중을 이용한 단락 재순위화 모델 (Passage Re-ranking Model using N-gram attention between Question and Passage)

  • 장영진;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.554-558
    • /
    • 2020
  • 최근 사전학습 모델의 발달로 기계독해 시스템 성능이 크게 향상되었다. 하지만 기계독해 시스템은 주어진 단락에서 질문에 대한 정답을 찾기 때문에 단락을 직접 검색해야하는 실제 환경에서의 성능 하락은 불가피하다. 즉, 기계독해 시스템이 오픈 도메인 환경에서 높은 성능을 보이기 위해서는 높은 성능의 검색 모델이 필수적이다. 따라서 본 논문에서는 검색 모델의 성능을 보완해 줄 수 있는 오픈 도메인 기계독해를 위한 단락 재순위화 모델을 제안한다. 제안 모델은 합성곱 신경망을 이용하여 질문과 단락을 구절 단위로 표현했으며, N-gram 구절 사이의 상호 주의 집중을 통해 질문과 단락 사이의 관계를 효과적으로 표현했다. KorQuAD를 기반으로한 실험에서 제안모델은 MRR@10 기준 93.0%, Top@1 Precision 기준 89.4%의 높은 성능을 보였다.

  • PDF

중학교 "기술.가정" 교과서의 가정영역에 나타난 Bloom의 인지적 영역 질문 분석 (An Analysis of Bloom's Cognitive Domain Questions in the Home Economics area of the "Technology.Home Economics" Textbooks)

  • 김현희;박미정;채정현
    • 한국가정과교육학회지
    • /
    • 제22권1호
    • /
    • pp.97-115
    • /
    • 2010
  • 본 연구는 제 7차 교육과정 중학교 "기술.가정" 교과서의 가정 영역에 제시된 질문을 Bloom의 인지적 영역의 수준에 따라 질문의 빈도, 수준, 위치를 분석하는 데 목적이 있다. 이에 임의로 5개의 출판사의 교과서를 선정해 총 15권을 분석하였다. 본 연구의 결과는 다음과 같다. 첫째, 가정 교과서에 포함된 Bloom의 인지적 영역 질문은 1학년(36.9%)이 가장 많았고, 2학년(33.6%), 3학년(29.5%)의 순이었으나 그 비율은 세 개의 학년이 비슷하였다. 가정 교과서에 제시된 질문을 Bloom의 인지적 영역에 따라 분류하였을 때 이해 질문(28.9%)과 적용 질문(28.3%)이 많았고, 지식(21.8%), 분석(8.6%), 종합(6.8%), 평가(5.6%) 수준의 질문은 그 비율이 점차 줄어들었다. 학년별로는 1학년과 3학년은 이해 질문과 적용 질문이 많았고, 2학년은 적용 질문이 가장 많은 비중을 차지했다. 둘째, 중학교 가정교과서에서 Bloom의 인지적 영역 질문의 위치는 읽기 후 질문이 49.2%로 가장 많았고, 읽기 중 질문이 36.7%, 읽기 전 질문은 14.1%를 차지하였다. 읽기 전 질문에서는 학습자들의 흥미를 불러일으키고 사전지식을 조성하고 활성화시키는 목적으로써 지식수준(11.4%), 이해수준(43.2%)의 질문이 주로 나타났고, 읽기 중 질문에서는 학습의 이해와 좀 더 폭 넓은 사고를 할 수 있는 수단으로 적용수준(36.7%)의 질문과 이해수준(25.5%)의 질문이 이용되고 있었다 읽기 후 질문에서는 지금까지 학습한 내용의 점검을 하는 역할로서의 질문인 지식수준(33.4%)과 이해수준(26.8%)의 질문이 많이 나타났다.

  • PDF