• 제목/요약/키워드: grammatical errors

검색결과 43건 처리시간 0.019초

A BERT-Based Automatic Scoring Model of Korean Language Learners' Essay

  • Lee, Jung Hee;Park, Ji Su;Shon, Jin Gon
    • Journal of Information Processing Systems
    • /
    • 제18권2호
    • /
    • pp.282-291
    • /
    • 2022
  • This research applies a pre-trained bidirectional encoder representations from transformers (BERT) handwriting recognition model to predict foreign Korean-language learners' writing scores. A corpus of 586 answers to midterm and final exams written by foreign learners at the Intermediate 1 level was acquired and used for pre-training, resulting in consistent performance, even with small datasets. The test data were pre-processed and fine-tuned, and the results were calculated in the form of a score prediction. The difference between the prediction and actual score was then calculated. An accuracy of 95.8% was demonstrated, indicating that the prediction results were strong overall; hence, the tool is suitable for the automatic scoring of Korean written test answers, including grammatical errors, written by foreigners. These results are particularly meaningful in that the data included written language text produced by foreign learners, not native speakers.

보편 양화사 (UNIVERSAL QUANTIFIER)에 대한 아동들의 해석 양상

  • 강혜경
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.237-257
    • /
    • 2001
  • This paper investigates the idiosyncratic understanding of universal quantifiers such as every, each or all by young children at the ages of 4 to 7, and argues that the phenomenon is explicable in terms of the maturation of both the cognitive system and the linguistic system. Evidence for this dual explanation comes from the fact that the visual input, a picture, plays a key role in determining the children’s conceptual representation, suggesting the need for the central integration of visual and linguistic elements; and from the fact that a quantifier in the linguistic input has an intrinsic property, i.e. a <+focus> feature. I have tried to explain the nature of the cognitive factors in terms of the function of the central system, suggesting a modified form of Smith & Tsimpli’s (1995) version of Fodor’s (1983) modularity hypothesis. Conceptual representations of two kinds are in competition with each other and they are integrated into a neutral LOT (Language of Thought) representation at some point . In the process of this integration, the representations from the visual input predominate over those from the auditory input, though the quantize. (treated as new information provided by the latter) is salient in the final representations. When visual conceptual representations predominate over purely linguistic ones, quantifier spreading errors occur. By contrast, when the relevant grammatical knowledge has developed sufficiently to counteract the conceptual representations, this peculiar behaviour by children should disappear. It is argued that children have to learn two kinds of grammatical fact with regard to universal quantification: (i) they have to learn the status of the quantifier as a functional head of DP so that it has to be positioned inside DP; and (ii) they have to learn the Left-Branch Condition which specifies that movement of an element in the left-branch position is possible only by pied-piping the entire phrase.

  • PDF

학령기 말더듬아동의 읽기유창성 및 쓰기유창성 비교연구 (Comparison of Reading, Writing Fluency of the Underachieving Children and Stuttering Children and School-Aged Children)

  • 박진원
    • 한국콘텐츠학회논문지
    • /
    • 제14권8호
    • /
    • pp.476-484
    • /
    • 2014
  • 이 연구의 목적은 학령기 말더듬아동과 학습부진아동을 대상으로 읽기과업과 쓰기과업을 제시하여 유창성 및 오류 유형별 빈도에 차이가 있는지 알아보고자 하였다. 학령기 말더듬아동, 학습부진아동, 일반아동을 각 15명 선정하여 읽기와 쓰기 과업을 통하여 집단 간 차이를 비교하기 위하여 일요인 분산분석을 실시한 후 사후검정을 실시하였다. 읽기과업의 오류유형은 생략, 대치, 반복, 삽입, 자기수정으로 분류하였고, 쓰기과업의 오류유형은 생략, 대치, 첨가, 문법오류로 분류하였다. 읽기유창성과 쓰기유창성을 비교한 결과 집단 간 유의한 차이가 나타났다. 읽기유창성은 모든 집단 간 유의하였으며, 쓰기유창성은 학습부진아동 집단이 다른 집단과 비교하여 유의하게 낮았다. 오류유형별 특성으로 읽기오류는 생략, 대치, 반복, 자기수정에서 집단 간 유의한 차이를 보였으며, 쓰기오류는 문법오류에서만 유의한 차이가 있는 것으로 나타났다. 본 연구는 읽기와 쓰기에 기초한 학습능력의 측면에서 말더듬아동과 학습부진아동의 특성을 살펴보고 임상실제에서 장애유형에 적절한 보다 효율적인 치료프로그램을 고안하는데 기초 자료로서의 의의를 지닌다.

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자 음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition Using the Transformed Successive State Splitting and Demi-syllable Pair)

  • 서은경;최갑근;김순협;이수정
    • 한국멀티미디어학회논문지
    • /
    • 제9권1호
    • /
    • pp.23-32
    • /
    • 2006
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, Finile State Network(FSN) 노드를 두 음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단 음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 인한 오 인식을 줄이기 위해 인식단위를 반음절 쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징부분에서 K-means 알고리즘으로 군집화 하여, 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문맥종속 음소모델에서 10.5%, 음향모델에서 인식단위를 반음절 쌍으로 하였을 경우 문맥종속 음소모델에 비해 12.5%, 변형된 연쇄 상태분할을 하였을 경우 1.5%의 인식률을 향상시킬 수 있었다.

  • PDF

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition using the Transformed Successive State Splitting and Demi-syllable pair)

  • 김동옥;박노진
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1625-1631
    • /
    • 2005
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, FSN 노드를 두음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 연한 오 인식을 줄이기 위해 인식단위를 반음절쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징레벨에서 K-means 알고리즘(4)으로 클러스터링 하여 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문백종속 음소모델에서 $10.5\%$, 음향모델에서 인식단위를 반음절쌍으로 하였을 경우 문백종속 음소모델에 비해 $12.5\%$, 변형된 연쇄 상태분할을 하였을 경우 $1.5\%$의 인식률을 향상시킬 수 있었다.

Mindstorms NXT를 이용한 프로그래밍 학습모형 설계 (The Design of a Programming Learning Model with the Use of the Mndstorms NXT)

  • 문외식
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2011년도 동계학술대회
    • /
    • pp.23-28
    • /
    • 2011
  • 현재 교육대학교의 컴퓨터교육 전공에서 알고리즘 및 문제해결력 향상을 위해 프로그래밍교육을 실시하고 있다. 기존의 프로그래밍언어를 도구로 하는 학습은 오타 등 다량의 오류발생, 문법 표현 및 이해의 어려움, 알고리즘 표현의 난해함 등 많은 구조적인 문제점이 있어 프로그램학습 본래의 목적을 달성하기가 어렵다. 최근 ICT의 급속한 발전으로 프로그램학습을 교육용로봇을 활용할 수 있다. 본 연구에서는 교육용로봇 중 가장 많이 사용되고 있는 Mindstorms로봇의 NXT소프트웨어를 이용하여 컴퓨터교육 전공 학생들이 쉽게 프로그래밍학습을 할 수 있게 학습모형(교육과정 및 교재)을 개발하였다.

  • PDF

잘못 형성된 입력문장에 대한 CHART PARSER (CHART PARSER FOR ILL-FORMED INPUT SENTENCES)

  • 민경호
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.177-212
    • /
    • 1993
  • 본 연구는 잘못 형성된 입력에 대한 멜리쉬의 연구(1989)에 기반하고 있다. 이 글은 chart-based parser를 이용하여 구문론적 차원에서 잘못 형성된 입력 문자의 복구에 촛점을 둔다. 멜리쉬의 체계는 두가지 분석기, 즉 잘형성된 입력 분석기와 잘못 형성된 입력 분석기로 구성되는데, 필자의 연구는 그에 생각을 따르고 있다. 이글에서는 주로 chartparsing의 개념, 잘못형성된 입력에 대한 분석전략이 논의된다. 또한 필자가 제시하는 체계의 디자인과 구현, 필자의 체계를 멜리쉬의 체계와의 비교와 같은 사항들이 다루어질 것이다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로 (Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea)

  • 박소연
    • 정보관리학회지
    • /
    • 제30권2호
    • /
    • pp.297-315
    • /
    • 2013
  • 본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.

프로그래밍 수업의 플립드러닝 학습모형 설계 및 적용 (Design and Application of an Instructional Model for Flipped learning of Programming Class)

  • 최숙영
    • 컴퓨터교육학회논문지
    • /
    • 제20권4호
    • /
    • pp.27-36
    • /
    • 2017
  • 본 연구는 대학의 프로그래밍 수업을 위해 플립드러닝에 기반한 수업 모형을 설계하고 이를 적용한 내용이다. 프로그래밍 과정은 프로그래밍 언어의 문법에 대한 충분한 이해와 함께 높은 추상적인 사고를 요구하기 때문에 많은 학생들이 학습에 어려움을 갖게 된다. 이러한 프로그래밍 학습의 특징으로 인하여 한정된 수업시간에 프로그래밍 언어의 문법적인 요소들을 강의하고 예제를 따라하는 학습 방법으로는 프로그래밍 수업의 학습 목표를 효과적으로 달성할 수 없다. 이러한 문제점을 극복하고 효과적인 프로그래밍 수업이 이루어질 수 있도록 본 연구에서는 플립드러닝에 기반한 수업 모델을 설계하고 그에 따라 수업을 진행하였다. 특히, 본 연구에서는 프로그래밍 학습에서 발생되는 학습자들의 어려움과 실제 프로그래밍 과정에서 발생되는 오류들을 분석한 후 이를 기반으로 하여 수업 모형을 설계하였다. 이 모델을 실제 수업에 적용한 결과, 학생들은 교실 수업에서 다른 학생들과 많은 소통의 기회를 가졌고 학습의 참여도가 높아진 것에 대해 긍정적으로 생각하며 수업에 대해 대체로 만족하는 것으로 나타났다.