• 제목/요약/키워드: 언어학습향상

검색결과 562건 처리시간 0.03초

언어 모델 다중 학습을 이용한 한국어 개체명 인식 (Korean Named Entity Recognition using Joint Learning with Language Model)

  • 김병재;박찬민;최윤영;권명준;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-337
    • /
    • 2017
  • 본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.

  • PDF

언어 학습 능력 향상을 위한 청각 및 시각 자극에 대한 반응속도 측정 플랫폼과 응용 (Reaction Test Platform and Application by Auditory and Visual Stimulus for Language Learning Ability Improvement)

  • 이혜란;백승현
    • 인터넷정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.77-84
    • /
    • 2010
  • 모국어나 외국어를 습득할 때 언어 처리의 '속도' 및 '정확도'가 적절하지 않으면 언어발달이 지연되거나 외국어 학습에 어려움을 보이게 되며, 실제 이를 통한 의사소통 상황에서 어려움을 겪게 된다. 따라서, 언어 학습 능력을 평가할 때 단순히 언어 처리의 정확도만이 아닌 '속도'와 '정확도'를 동시에 측정하는 것이 중요하며, 학습에 있어서도 이러한 처리의 효율성을 향상 시키는 것이 필요하다. 우리는 음성 및 시각 자극에 대한 '반응속도 측정기 플랫폼'을 개발함으로써 효율적인 언어 수행 능력을 평가하고 학습 향상에 적용하고자 하였다. 이 글에서는 먼저 이 플랫폼의 구성 및 내용 그리고 온라인 컨텐츠 구성 등의 개발 과정에 대하여 제시하였다. 또한, 이 플랫폼의 실제 적용 가능성을 검토하기 위하여 10명의 성인에게 '청각', '시각' 그리고 '시청각'의 3 가지 자극 조건을 제시하고, 각 조건에서 5회 이상 자극에 반응을 보이도록 하였다. 그리고 1회와 5회 반응의 반응 속도 및 정확도를 측정하여 비교하여 보았다. 이러한 결과 이 플랫폼이 정도의 차이는 있으나 자극의 종류에 상관없이 보다 빠르고 정확하게 언어를 처리할 수 있도록 능력을 향상시키는데 도움을 주고 있음을 알 수 있었다.

몰입형 가상현실 영어 회화 학습이 언어불안감과 학습 성취도에 미치는 영향 (Effects of Immersive Virtual Reality English Conversations on Language Anxiety and Learning Achievement)

  • 정지연;정혜선
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.321-332
    • /
    • 2021
  • 본 연구에서는 가상현실을 사용한 영어 회화 학습 프로그램을 개발하고 이를 몰입형 가상현실과 모바일 기기 조건에서 비교하였다. 학습자는 가상 캐릭터와 일상에서 일어날 수 있는 회화 패턴을 9 개의 에피소드에 걸쳐 학습하였다. 학습을 시작하기 전(사전)과 모든 학습을 마친 뒤(사후)의 언어불안감을 비교한 결과, 언어불안감은 몰입형 가상현실과 모바일 조건 모두에서 유의하게 감소하였고, 특히 몰입형 가상현실 조건에서 언어불안감이 더욱 크게 감소하였다. 학습 성취도를 알아보기 위해 각 에피소드에서 회화 패턴을 학습하기 이전의 반응(1단계)과 가상 캐릭터와의 회화 학습이 일어난 후의 문장(4단계)을 문장 길이, 적절성 및 정확성으로 구분하여 비교하였다. 그 결과 두 조건 모두 1단계보다 4단계에서 문장 길이, 적절성, 정확성이 향상되었다. 그 중 문장 길이는 몰입형 가상현실 조건에서 더욱 길어진 것으로 나타났다. 본 연구의 결과는 몰입형 가상현실이 학습자가 영어 회화 학습과 관련하여 경험하는 언어불안감 감소 및 회화능력 향상에 긍정적인 영향을 줄 수 있다는 것을 보여준다.

Large Pre-trained Language Model의 P-tuning을 이용한 질의 정규화 (Query Normalization Using P-tuning of Large Pre-trained Language Model)

  • 서수빈;인수교;박진성;남경민;김현욱;문기윤;황원요;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.396-401
    • /
    • 2021
  • 초거대 언어모델를 활용한 퓨샷(few shot) 학습법은 여러 자연어 처리 문제에서 좋은 성능을 보였다. 하지만 데이터를 활용한 추가 학습으로 문제를 추론하는 것이 아니라, 이산적인 공간에서 퓨샷 구성을 통해 문제를 정의하는 방식은 성능 향상에 한계가 존재한다. 이를 해결하기 위해 초거대 언어모델의 모수 전체가 아닌 일부를 추가 학습하거나 다른 신경망을 덧붙여 연속적인 공간에서 추론하는 P-tuning과 같은 데이터 기반 추가 학습 방법들이 등장하였다. 본 논문에서는 문맥에 따른 질의 정규화 문제를 대화형 음성 검색 서비스에 맞게 직접 정의하였고, 초거대 언어모델을 P-tuning으로 추가 학습한 경우 퓨샷 학습법 대비 정확도가 상승함을 보였다.

  • PDF

에러패턴 학습과 후처리 모듈을 이용한 연속 음성 인식의 성능향상 (Improving Performance of Continuous Speech Recognition Using Error Pattern Training and Post Processing Module)

  • 김용현;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.441-443
    • /
    • 2000
  • 연속 음성 인식을 하는 경우에 많은 에러가 발생한다. 특히 기능어의 경우나 서술어의 경우에는 동시 조음 현상에 의한 음운 변화에 의해 빈번한 에러가 발생한다. 이러한 빈번한 에러를 수정하기 위한 방법에는 언어 모델의 개선과 음향 모델의 개선등을 통한 인식률 향상과 여러 단계의 인식과정을 두어 서로 다른 언어 모델을 적용하는 등의 방법이 있지만 모두 시간과 비용이 많이 들고 각각의 상황에 의존적인 단점이 있다. 따라서 본 논문에서 제안하는 방법은 이것을 수정하기 위해 음성 인식기로부터 인식되어 나온 결과 문장을 정답과 비교, 학습함으로써 빈번하게 에러 패턴을 통계적 방법에 의해 학습하고 후처리 모듈을 이용하여 인식시에 발생하는 에러를 적은 비용과 시간으로 수정할 수 있도록 하는 것이다. 실험은 3000 단어급의 한국어 낭독체 연속 음성을 대상으로 하여 형태소와 의사형태소를 각각 인식단위로 하고, 언어모델로 World bigram과 Tagged word bigram을 각각 적용 실험을 하였다. 형태소, 의사 형태소일 경우 모두 언어 모델을 tagged word bigram을 사용하였을 경우 N best 후보 문장 중 적당한 단어 후보의 분포로 각각 1 best 문장에 비해 12%, 18%정도의 에러 수정하여 문장 인식률 향상에 상당한 기여를 하였다.

초등 국어학습을 위한 웹 컨텐츠 및 학습통합관리 시스템 개발 (Development of Web Contents and Integrated Management System for Korean-Language Learning in Elementary School)

  • 김은영;정성태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.676-678
    • /
    • 2001
  • 언어는 모든 교육에서 중요한 역할을 담당하므로 국어 교과목은 교육의 기본 목표인 언어사용의 신장을 위해서 중요하게 다루어지고 있다. 언어발달을 위한 국어 교육활동은 듣기, 말하기, 읽기, 쓰기의 네 가지 영역에 기초를 두고 있으며 학생들의 흥미를 유발할 수 있는 쌍방향 멀티미디어를 이용하면 이러한 영역의 학습효과를 증가시킬 수 있다. 그러나 기존의 웹사이트의 개발 사례를 살펴보면 교과서 중심인 일방적인 제사만이 구현되어 있다. 따라서 본 논문에서는 흥미와 자발적인 참여를 유발하고 행동한 것에 대해 즉각적인 반응(Feedback)을 주는 애니메이션과 음성, 효과음, 높이, 학습, 게임으로 결합된 오락적인 쌍방향 멀티미디어 웹 컨텐츠를 개발하여 언어를 배우는 어린이들의 학습능력의 향상과 창의적인 언어 활동의 증대에 기여하고자 한다. 특히, 이 시스템의 큰 특징은 학생에 대한 학습 결과를 도출하고 이에 대한 해결책 및 각종 정보를 추출하여 학습진단 결과, 재학습, 학습독력의 형태로 학생 개개인에게 메일로 보내는 학습 통합관리 기능을 포함하고 있다는 것이다.

  • PDF

In-Context 검색 증강형 한국어 언어 모델 (In-Context Retrieval-Augmented Korean Language Model)

  • 이성민;이정;서대룡;전동현;강인호;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.443-447
    • /
    • 2023
  • 검색 증강형 언어 모델은 입력과 연관된 문서들을 검색하고 텍스트 생성 과정에 통합하여 언어 모델의 생성 능력을 강화한다. 본 논문에서는 사전 학습된 대규모 언어 모델의 추가적인 학습 없이 In-Context 검색 증강으로 한국어 언어 모델의 생성 능력을 강화하고 기존 언어 모델 대비 성능이 증가함을 보인다. 특히 다양한 크기의 사전 학습된 언어 모델을 활용하여 검색 증강 결과를 보여 모든 규모의 사전 학습 모델에서 Perplexity가 크게 개선된 결과를 확인하였다. 또한 오픈 도메인 질의응답(Open-Domain Question Answering) 과업에서도 EM-19, F1-27.8 향상된 결과를 보여 In-Context 검색 증강형 언어 모델의 성능을 입증한다.

  • PDF

메타인지 수준에 따른 EPL 프로그래밍 학습이 논리적 사고에 미치는 영향 (The Effect of EPL Programming Loaming on Logical Thinking Ability by the Meta-Cognition Level)

  • 홍재운;이수정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권6호
    • /
    • pp.498-507
    • /
    • 2009
  • 프로그래밍 언어 학습이 논리적 사고력에 미치는 영향에 대한 선행 연구는 부족한 실정이며, 각 연구 결과마다 연구 대상, 방법과 학습 주제 등에 따라 논리 향상 정도와 영역이 다르므로, 일반화 과정에 어려움이 있다. 또한 논리적 사고력의 향상이 학습자의 인지 발달에 의한 것인지 프로그래밍 언어 학습에 의한 것인지 분명하지 않아 프로그래밍 언어 학습의 필요성이 증명되었다고 할 수 없다. 본 연구에서는 초등 6학년생들에게 교육용 프로그래밍 언어 학습을 7차시 동안 실시한 후, 메타인지 수준별로 논리적 사고력에 미치는 영향을 조사하고, 컴퓨터 활용 교육의 효과와 비교하였다. 실험 결과에 따르면, 두리틀과 로고, 그리고 파워포인트 학습 집단 모두에서, 상위 수준의 메타인지를 지닌 학생들은 논리적 사고력에 유의미한 신장 효과를 나타낸 반면, 하위 수준의 학생들은 두리틀과 로고 학습 후에만 유의미한 논리적 사고력의 신장을 나타냈다. 그러나 메타인지 수준에 상관 없이 세 학습 집단 간에 논리적 사고력 향상 정도의 유의미한 차이는 없었다.

Bi-Cross 사전 학습을 통한 자연어 이해 성능 향상 (The Bi-Cross Pretraining Method to Enhance Language Representation)

  • 김성주;김선훈;박진성;유강민;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.320-325
    • /
    • 2021
  • BERT는 사전 학습 단계에서 다음 문장 예측 문제와 마스킹된 단어에 대한 예측 문제를 학습하여 여러 자연어 다운스트림 태스크에서 높은 성능을 보였다. 본 연구에서는 BERT의 사전 학습 문제 중 다음 문장 예측 문제에 대해 주목했다. 다음 문장 예측 문제는 자연어 추론 문제와 질의 응답 문제와 같이 임의의 두 문장 사이의 관계를 모델링하는 문제들에 성능 향상을 위해 사용되었다. 하지만 BERT의 다음 문장 예측 문제는 두 문장을 특수 토큰으로 분리하여 단일 문자열 형태로 모델에 입력으로 주어지는 cross-encoding 방식만을 학습하기 때문에 문장을 각각 인코딩하는 bi-encoding 방식의 다운스트림 태스크를 고려하지 않은 점에서 아쉬움이 있다. 본 논문에서는 기존 BERT의 다음 문장 예측 문제를 확장하여 bi-encoding 방식의 다음 문장 예측 문제를 추가적으로 사전 학습하여 단일 문장 분류 문제와 문장 임베딩을 활용하는 문제에서 성능을 향상 시키는 Bi-Cross 사전 학습 기법을 소개한다. Bi-Cross 학습 기법은 영화 리뷰 감성 분류 데이터 셋인 NSMC 데이터 셋에 대해 학습 데이터의 0.1%만 사용하는 학습 환경에서 Bi-Cross 사전 학습 기법 적용 전 모델 대비 5점 가량의 성능 향상이 있었다. 또한 KorSTS의 bi-encoding 방식의 문장 임베딩 성능 평가에서 Bi-Cross 사전 학습 기법 적용 전 모델 대비 1.5점의 성능 향상을 보였다.

  • PDF

학습 공동체를 활용한 프로그래밍 언어 교육 사례 연구 (A Case Study of Programming Languages Education using Learning Community)

  • 김경아;안유정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.333-334
    • /
    • 2013
  • 프로그래밍 언어 교육은 컴퓨터 분야의 필수 과목으로 교육되고 있으나 교수자와 학습자에게 가장 어려운 과목으로 인식되고 있다. 본 연구에서는 명지전문대학에서 시행하고 있는 튜터링 제도를 프로그래밍 언어 수업에 적용하여 학습공동체(피어 튜터링)를 활용한 학습 지원 프로그램을 프로그래밍 언어 교육에 적용한 사례를 제시하고 학습자에 미치는 영향을 조사하였다. 학습 공동체 프로그램의 참여는 자발적으로 이루어졌으며. 활용 결과 학습자들의 성적이 단기간의 프로그램 참여로 많이 향상되지는 않았지만 튜터와 튜티 모두 프로그래밍 과목에 대한 흥미가 유발되고, 수업 참여도가 높아졌으며, 참여하지 않은 그룹과 비교하여 탈락자 감소에는 도움이 되었던 것으로 판단된다.

  • PDF