• 제목/요약/키워드: 언어 학습

검색결과 2,233건 처리시간 0.032초

사전 학습된 Transformer 언어 모델의 이종 언어 간 전이 학습을 통한 자원 희소성 문제 극복 (Cross-Lingual Transfer of Pretrained Transformers to Resource-Scarce Languages)

  • 이찬희;박찬준;김경민;오동석;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.135-140
    • /
    • 2020
  • 사전 학습된 Transformer 기반 언어 모델은 자연어처리 시스템에 적용되었을 시 광범위한 사례에서 큰 폭의 성능 향상을 보여준다. 여기서 사전 학습에 사용되는 언어 모델링 태스크는 비지도 학습에 속하는 기술이기 때문에 상대적으로 데이터의 확보가 쉬운 편이다. 하지만 몇 종의 주류 언어를 제외한 대부분 언어는 활용할 수 있는 언어 자원 자체가 희소하며, 따라서 이러한 사전 학습 기술의 혜택도 누리기 어렵다. 본 연구에서는 이와 같은 상황에서 발생할 수 있는 자원 희소성 문제를 극복하기 위해 이종 언어 간 전이 학습을 이용하는 방법을 제안한다. 본 방법은 언어 자원이 풍부한 언어에서 학습된 Transformer 기반 언어 모델에서 얻은 파라미터 중 재활용 가능한 부분을 이용하여 목표 언어의 모델을 초기화한 후 학습을 진행한다. 또한, 기존 언어와 목표 언어의 차이를 학습하는 역할을 하는 적응층들을 추가하여 이종 언어 간 전이 학습을 돕는다. 제안된 방법을 언어 자원이 희귀한 상황에 대하여 실험해본 결과, 전이 학습을 사용하지 않은 기준 모델 대비 perplexity와 단어 예측의 정확도가 큰 폭으로 향상됨을 확인하였다.

  • PDF

C 언어 학습을 위한 학습 지원 시스템 설계 고찰 (A Study on Design of Learning Supporting System for C Language)

  • 이경호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.283-286
    • /
    • 2013
  • C 언어는 프로그램을 간결하게 구성하기 위하여 많은 연구를 한 언어로, 프로그램 구성 시 오류를 쉽게 발견하기 위한 기능은 부족하지만 다른 고급 언어가 가지고 있는 기술상의 제약이 적어 프로그래밍하기 쉬울 뿐 아니라 다른 프로그래밍 언어의 모태 언어로 평가되어 프로그래밍 언어를 배우려고 하는 사람들의 필수 언어로 여전히 많은 사람들이 공부하고 있다. 그러나 형식 언어가 가지고 있는 여러 가지 특징으로 배우는데 어려워한다. 따라서 본 논문에서는 C 언어를 배우려는 사람들에게 쉽고 재미있고, 정확히 배우도록 하기 위해 C 언어 교육을 위한 교수 학습 지원 시스템 설계를 위한 고찰을 수행하였다. C 언어 교수 학습 지원 시스템을 설계하는데는 학습전이이론과 블랜디드교육, 문제중심학습, 게임을 참고하여 설계하였으며, 다양한 멀티미디어가 사용되게 하였다.

  • PDF

한국어 언어모델의 속성 및 정량적 편향 분석: 영어 언어모델과의 비교 및 개선 제안 (Properties and Quantitative Analysis of Bias in Korean Language Models: A Comparison with English Language Models and Improvement Suggestions)

  • 김재민;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.558-562
    • /
    • 2023
  • 최근 ChatGPT의 등장으로 텍스트 생성 모델에 대한 관심이 높아지면서, 텍스트 생성 태스크의 성능평가를 위한 지표에 대한 연구가 활발히 이뤄지고 있다. 전통적인 단어 빈도수 기반의 성능 지표는 의미적인 유사도를 고려하지 못하기 때문에, 사전학습 언어모델을 활용한 지표인 BERTScore를 주로 활용해왔다. 하지만 이러한 방법은 사전학습 언어모델이 학습한 데이터에 존재하는 편향으로 인해 공정성에 대한 문제가 우려된다. 이에 따라 한국어 사전학습 언어모델의 편향에 대한 분석 연구가 필요한데, 기존의 한국어 사전학습 언어모델의 편향 분석 연구들은 사회에서 생성되는 다양한 속성 별 편향을 고려하지 못했다는 한계가 있다. 또한 서로 다른 언어를 기반으로 하는 사전학습 언어모델들의 속성 별 편향을 비교 분석하는 연구 또한 미비하였다. 이에 따라 본 논문에서는 한국어 사전학습 언어모델의 속성 별 편향을 비교 분석하며, 영어 사전학습 언어모델이 갖고 있는 속성 별 편향과 비교 분석하였고, 비교 가능한 데이터셋을 구축하였다. 더불어 한국어 사전학습 언어모델의 종류 및 크기 별 편향 분석을 통해 적합한 모델을 선택할 수 있도록 가이드를 제시한다.

  • PDF

유아 언어학습에 대한 하이퍼망 메모리 기반 모델 (Hypernetwork Memory-Based Model for Infant's Language Learning)

  • 이지훈;이은석;장병탁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.983-987
    • /
    • 2009
  • 유아들의 언어습득에 있어서 중요한 점 하나는 학습자에 대한 언어환경의 노출이다. 유아가 접하는 언어환경은 부모와 같은 인간뿐만 아니라 각종 미디어와 같은 인공적 환경도 포함되며, 유아는 이러한 방대한 언어환경을 탐색하면서 언어를 학습한다. 본 연구는 대용량의 언어 데이터 노출이 영향을 미치는 유아언어학습을 유연하고 적절하게 모사하는 인지적 기제에 따른 기계학습 방식을 제안한다. 유아의 초기 언어학습은 문장수준의 학습과 생성 같은 행동들이 수반되는데, 이는 언어 코퍼스에 대한 노출만으로 모사가 가능하다. 모사의 핵심은 언어 하이퍼망 구조를 가진 기억기반 학습모델이다. 언어 하이퍼망은 언어구성 요소들 간의 상위차원 관계 표상을 가능케 함으로써 새로운 데이터 스트림에 대해 유사구조의 적용과 이용을 도모하여 발달적이고 점진적인 학습을 모사한다. 본 연구에서는 11 개의 유아용 비디오로부터 추출한 문장 32744개를 언어 하이퍼망을 통한 점진적 학습을 수행하여 문장을 생성해 유아의 점진적, 발달적 학습을 모사하였다.

텍스트 프로그래밍 언어 학습을 위한 블록 프로그래밍 언어를 선행조직자로 활용할 수 있는 도구 활용 전략 (Tool Utilization Strategy for Using Block Programming Language as a Preceding Organizer for Text Programming Language Learning)

  • 고학능;이영준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.395-396
    • /
    • 2022
  • 본 논문에서는 블록 프로그래밍 언어를 선행조직자로 하여 텍스트 프로그래밍 언어를 학습하는 도구 활용 전략을 연구하였다. 텍스트 프로그래밍 언어는 파이썬이며, 블록 프로그래밍 언어는 엔트리, 활용하는 도구는 주피터 노트북으로 선정하였다. 주피터 노트북을 활용한 블록 프로그래밍 언어 선행조직자 학습 전략은 code cell에 IPython.display.IFrame 클래스를 활용하여 결과 창에 엔트리 작업환경을 불러와 선행조직자로 제시하여 엔트리를 학습 후 code cell에서 파이썬으로 학습한다. 주피터 노트북을 통해 블록 프로그래밍 언어를 선행조직자로 제시 후 텍스트 프로그래밍 언어를 제시함으로써 텍스트 프로그래밍 언어를 학습할 때 인지적 부담을 줄어들고 긍정적 전이가 일어나 효과적인 학습이 될 것으로 기대된다.

  • PDF

MLM 기반 언어 간 전이학습을 이용한 개체명 인식 방법론 분석 (An Analysis of Named Entity Recognition System using MLM-based Language Transfer Learning)

  • 손준영;김경민;김진성;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.284-288
    • /
    • 2022
  • 최근 다양한 언어모델의 구축 및 발전으로 개체명 인식 시스템의 성능은 최고 수준에 도달했다. 하지만 이와 관련된 대부분의 연구는 데이터가 충분한 언어에 대해서만 다루기 때문에, 양질의 지도학습 데이터의 존재를 가정한다. 대부분의 언어에서는 개체 유형에 대한 언어의 잠재적 특성을 충분히 학습할 수 있는 지도학습 데이터가 부족하기 때문에, 종종 자원 부족의 어려움에 직면한다. 본 논문에서는 Masked language modeling 기반 언어 간 전이학습을 이용한 개체명 인식 방법론에 대한 분석을 수행한다. 이를 위해 전이를 수행하는 소스 언어는 고자원 언어로 가정하며, 전이를 받는 타겟 언어는 저자원 언어로 가정한다. 본 논문에서는 언어모델의 토큰 사전에 언어 독립적인 가상의 자질인 개체 유형에 대한 프롬프트 토큰을 추가하고 이를 소스 언어로 학습한 뒤, 타겟 언어로 전이하는 상황에서 제안하는 방법론에 대한 평가를 수행한다. 실험 결과, 제안하는 방법론은 일반적인 미세조정 방법론보다 높은 성능을 보였으며, 한국어에서 가장 큰 영향을 받은 타겟 언어는 네덜란드어, 한국어로 전이할 때 가장 큰 영향을 준 소스 언어는 중국어인 결과를 보였다.

  • PDF

자기조절학습전략 활용 과제기반언어학습의 효과분석 (Effects of Task-based Language Learning Utilizing Self-regulated Learning Strategies)

  • 김수현;이명근
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제45차 동계학술발표논문집 20권1호
    • /
    • pp.153-157
    • /
    • 2012
  • 이 연구는 자기조절학습전략 활용 과제기반언어학습을 영어수업에 적용한 후 학업성취도와 영어 학습태도 차원에서 그 효과성을 규명하고자 하였다. 먼저 학습자의 능동적인 학습과정을 도울 수 있는 자기조절학습전략 활용 과제기반언어 교수 학습 모형을 도출하였다. 이어서 초등영어 5학년 정규교육과정운영 틀에서 자기조절학습전략 활용 과제기반언어학습 수업을 설계하고 실제 적용하였다. 연구결과 첫째, 자기조절학습전략 활용 과제기반언어학습은 학업성취 상위, 중위, 하위 집단에 따른 학업성취도 변화에 대한 분석 결과 학업성취 상위집단과 하위집단 간에 유의미한 차이를 보였다. 둘째, 자기조절학습전략 활용 과제기반언 어학습은 영어에 대한 자아개념, 영어에 대한 태도, 영어에 대한 학습 습관으로 정의된 영어 학습태도의 모든 영역에서 유의미한 차이가 있었다. 자기조절학습전략 활용 과제기반언어학습은 학습자 중심 교육이라는 초등영어교육 추세를 고려할 때 교육현장에 유용하므로 자기조절학습력과 실제적 의사소통능력에 초점을 둔 보다 다양한 교수설계 연구가 요청된다.

  • PDF

대학생들의 언어학습전략, 언어학습믿음과 영어듣기성취 이해 (Understanding Language Learning Strategies, Language Learning Beliefs, and English Listening Achievement of Korean Undergraduate Students)

  • 조혜원
    • 디지털융복합연구
    • /
    • 제16권3호
    • /
    • pp.37-45
    • /
    • 2018
  • 이 연구의 목적은 블렌디드 러닝으로 듣기 수업에 참여하는 대학생들을 대상으로 영어 듣기능력이 향상한 학생과 향상하지 않은 학생들 사이에 언어학습전략 사용과 언어학습믿음에 차이가 있었는지를 알아보고 듣기성취와 언어학습전략, 언어학습믿음 사이에 관계가 있는지 조사하는 것이다. 이를 위해 69명의 참여자들은 언어학습전략과 언어학습믿음 설문에 응답하고, 사전 사후 듣기 시험을 보았다. 요인분석으로 추출된 요인을 이용하여 성적이 오른 집단과 오르지 않은 집단의 차이를 분석한 결과, 두 집단 사이에 유의미한 차이가 있었다. 영어 듣기능력이 향상된 학생은 언어학습전략을 더 많이 사용하고 있었고, 언어학습믿음에서 더 높은 동기를 갖고 있었다. 동기에 대한 믿음이 높은 학생들은 인지전략과 초인지전략을 더 많이 사용했다. 이 연구는 학습자의 학습믿음과 학습전략 중 영어 듣기능력 향상에 영향을 주는 요인을 제공하여 콘텐츠 개발과 교수법에 기여할 수 있다는 점에서 의의가 있다.

대조 분석 기반의 중국인 학습자의 한국어 발음 변이 양상 예측 (Prediction of Chinese Learners' Korean Pronunciation Variations based on Contrastive Analysis)

  • 양승희;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.206-210
    • /
    • 2014
  • 음성언어처리 기술의 발전과 외국어로서의 한국어 교육에 대한 관심이 커지면서 컴퓨터를 활용한 언어교육 (CALL) 기반의 한국어 학습 시스템에 대한 연구가 활발히 진행되고 있다. 학습자의 모국어와 학습언어의 대조 분석은 양 언어의 유사점과 차이점을 찾아내어 학습자들이 무엇을 학습해야 하고, 학습자들이 보이는 오류가 어떤 것인지 판단할 수 있는 중요한 자료를 제공한다. 본 논문에서는 중국인 학습자를 위한 컴퓨터 기반 한국어 학습 시스템 개발을 위해서 선행연구의 대조분석과 실험 결과를 정리하고, 이를 토대로 중국어 학습자들이 보일 수 있는 분절음 발음 변이 양상을 예측한다.

  • PDF

블록 기반 프로그래밍 언어에서 텍스트 기반 프로그래밍 언어로의 학습 전이를 위한 프로그램 설계 방안 (A Suggestion of Designing Program for Learning Transfer from Block-Based Programming Language to Text-Based Programming Language)

  • 이소율;이영준
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2018년도 동계학술대회
    • /
    • pp.29-31
    • /
    • 2018
  • 프로그래밍 언어 교육에서 일반적으로 학습자들은 블록 기반 프로그래밍 언어에서 텍스트 기반 프로그래밍 언어 순서로 학습한다. 블록 기반 프로그래밍 언어나 텍스트 기반 프로그래밍 언어는 여타의 프로그래밍 언어들과 마찬가지로 프로그래밍의 기본 논리는 동일하나, 형태, 언어적 특성 및 사용 등에 대하여 다소 차이가 있다. 따라서 본 연구에서는 학습자들의 블록 기반 프로그래밍 언어에서 텍스트 기반 프로그래밍 언어로의 유연한 학습 전이를 돕기 위한 프로그램의 설계 방안을 선행 조직자의 제시, 학습 콘텐츠의 체계화, 단순하고 직관적인 화면 구성으로 제시하였다.

  • PDF