• 제목/요약/키워드: word problems

검색결과 417건 처리시간 0.026초

생성적 적대 신경망(GAN)을 이용한 한국어 문서에서의 문맥의존 철자오류 교정 (Context-Sensitive Spelling Error Correction Techniques in Korean Documents using Generative Adversarial Network)

  • 이정훈;권혁철
    • 한국멀티미디어학회논문지
    • /
    • 제24권10호
    • /
    • pp.1391-1402
    • /
    • 2021
  • This paper focuses use context-sensitive spelling error correction using generative adversarial network. Generative adversarial network[1] are attracting attention as they solve data generation problems that have been a challenge in the field of deep learning. In this paper, sentences are generated using word embedding information and reflected in word distribution representation. We experiment with DCGAN[2] used for the stability of learning in the existing image processing and D2GAN[3] with double discriminator. In this paper, we experimented with how the composition of generative adversarial networks and the change of learning corpus influence the context-sensitive spelling error correction In the experiment, we correction the generated word embedding information and compare the performance with the actual word embedding information.

수학 문장제 해결에 영향을 주는 언어적.인지적 요인 -혼합물 문제를 중심으로- (Linguistic and Cognitive Factors that Affect Word Problem Solving)

  • 김선희
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제14권3호
    • /
    • pp.267-281
    • /
    • 2004
  • 방정식의 활용 문제로 다루어지는 문장제는 학생들의 흥미를 유도하고 수학의 유용성을 보여줄 수 있는 것이지만, 학생들이 해결하기에는 여러 어려움이 있다. 본 연구는 학생들이 수학 문장제를 해결하는데 영향을 줄 수 있는 요인들을 언어적 측면과 인지적 측면에서 조사하였다. 언어적 요인에는 텍스트 기반, 실세계, 상황 모델이 있었는데, 학생들은 문장의 텍스트 기반에서 방정식의 상황 모델로 해석하는 것을 어렵게 생각하고 있었으며, 상황 모델에서 학생들은 많은 오류를 보였다. 인지적 측면에서는 방정식을 세우는 스키마와 해결 전략, 식의 복잡성 수준을 조사하였는데, 방정식을 세울 때 학생들은 복잡성 수준을 고려하기보다는 교사의 지도 내용에 따라 전략을 선택하는 경향이 있었다. 그리고 설탕의 양이나 농도, 설탕물의 양을 혼동하는 경향이 강했다. 본 연구의 결과를 통해 문장제에서 학생들에게 제시되는 문제가 해결하기에 얼마나 복잡한지, 학생들이 주로 어떤 전략을 선택하는지, 방정식의 문제 유형별로 발생하는 오류에 대해 알 수 있었다.

  • PDF

초등학생들의 문제해결전략에 따른 오류 유형 분석 (An Analysis on Elementary Students' Error Types of Word Problem Solving Strategy)

  • 김영아;김성준
    • 한국학교수학회논문집
    • /
    • 제16권1호
    • /
    • pp.113-139
    • /
    • 2013
  • 본 연구는 초등학생들의 문장제 해결과정에서 나타나는 오류를 분석하고 문제해결전략별 오류 유형 및 그 특징을 파악함으로써 문제해결학습의 실패 원인에 대한 정보를 제공하고 문제해결력을 향상시킬 수 있는 교수학습방안을 제안하기 위한 것이다. 문장제 해결과정에서 학생들이 선호하는 전략을 살펴보면 식 세우기와 예상과 확인, 규칙 찾기 순으로 나타났으며, 단순화하기 전략은 거의 사용하지 않고 있다. 문장제 해결과정에서 나타나는 오류 유형의 특징은 문제해결전략에 따라 차이를 보였는데, 이를테면 식 세우기의 경우, '문항 이해의 오류', '개념 원리의 오류', '풀이 과정의 오류' 순으로 나타난 반면, 그림그리기에서는 문제에서 설명하는 내용을 잘못 이해하여 그림으로 나타내는 오류를 주로 범하였고, 표 만들기의 경우 문제에서 주어진 정보를 표로 나타내는 과정에서 정보들 간의 관계를 잘못 이해하여 오류를 범하는 '문항 이해의 오류'가 많은 것으로 나타났다. 이처럼 문장제를 통한 문제해결 학습에서 학생들이 선호하는 문제해결전략을 확인함과 동시에 문제해결전략별 나타나는 오류의 특징을 확인함으로써 해결전략에 따른 오류를 예상하고 이에 대처하는 교수학습방안을 생각해볼 수 있을 것이다.

  • PDF

자연수의 혼합계산에 대한 초등학생들과 예비교사들의 오류 분석 (An Analysis on the Error Types of Elementary Students and Pre-service Teachers in Mixed Calculations of Natural Number)

  • 이대현
    • 한국학교수학회논문집
    • /
    • 제20권2호
    • /
    • pp.141-161
    • /
    • 2017
  • 초등학교에서 자연수의 혼합계산은 사칙계산이 섞여 있는 수식의 계산 순서를 알고 해결할 수 있는 능력을 길러 주는데 초점을 두고 있다. 이런 목표에 비추어 본 연구에서는 초등학생 67명과 예비교사 57명을 대상으로 수식과 문장제로 이루어진 검사지를 이용하여 혼합계산에 대한 해결 정도와 오류 유형을 분석하였다. 검사 결과, 초등학생들은 수식과 문장제로 된 혼합계산에서 86.2%와 73.5%의 정답률과 수식에서 계산 순서의 오류, 문장제에서 수식을 구성하지 못하는 오류를 나타내었다. 예비교사들의 경우에 나타난 몇 개의 오류와 해결과정에 비추어 혼합계산이 이루어지는 식의 계산 원리와 규약을 이해할 수 있도록 교과 교육 내용을 유의해서 지도할 필요를 제시하였다. 또한 검사 결과를 통해 혼합계산 시 괄호 사용의 유무와 적절성, 등호 개념의 사용 방법에서 문제점을 확인할 수 있었다.

  • PDF

대학생들이 또렷한 음성과 대화체로 발화한 영어문단의 구글음성인식 (Google speech recognition of an English paragraph produced by college students in clear or casual speech styles)

  • 양병곤
    • 말소리와 음성과학
    • /
    • 제9권4호
    • /
    • pp.43-50
    • /
    • 2017
  • These days voice models of speech recognition software are sophisticated enough to process the natural speech of people without any previous training. However, not much research has reported on the use of speech recognition tools in the field of pronunciation education. This paper examined Google speech recognition of a short English paragraph produced by Korean college students in clear and casual speech styles in order to diagnose and resolve students' pronunciation problems. Thirty three Korean college students participated in the recording of the English paragraph. The Google soundwriter was employed to collect data on the word recognition rates of the paragraph. Results showed that the total word recognition rate was 73% with a standard deviation of 11.5%. The word recognition rate of clear speech was around 77.3% while that of casual speech amounted to 68.7%. The reasons for the low recognition rate of casual speech were attributed to both individual pronunciation errors and the software itself as shown in its fricative recognition. Various distributions of unrecognized words were observed depending on each participant and proficiency groups. From the results, the author concludes that the speech recognition software is useful to diagnose each individual or group's pronunciation problems. Further studies on progressive improvements of learners' erroneous pronunciations would be desirable.

유해어 필터링과 SVM을 이용한 유해 문서 분류 시스템 (Harmful Document Classification Using the Harmful Word Filtering and SVM)

  • 이원휘;정성종;안동언
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.85-92
    • /
    • 2009
  • 오늘날 웹이 일반화되면서 사람들은 원하는 정보를 웹을 통해 얻고, 또한 제공하고 있다. 웹이 다양한 정보의 제공과 습득의 장이라는 편의성을 제공하고 있지만, 반면에 너무 많은 정보, 무분별한 유해 정보의 범람 등 여러 가지 문제를 내포하고 있다. 현재 유해 웹 문서를 분류하기 위한 다양한 방법이 연구되고 사용되고 있다. 그러나 각각의 방법들이 갖는 단점들로 인해 획기적인 성과를 내지 못하고 있다. 본 논문에서는 유해 정보로부터 사회적으로 보호를 받아야 할 사용자들을 보호하기 위한 수단으로 유해 웹 문서 차단 방법에 대해 제안하고자 한다. 본 논문에서는 키워드 필터링과 SVM 알고리즘을 이용한 2단계 분류 과정을 통해 분류의 정확률을 높이고자 하였다.

An evaluation of Korean students' pronunciation of an English passage by a speech recognition application and two human raters

  • Yang, Byunggon
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.19-25
    • /
    • 2020
  • This study examined thirty-one Korean students' pronunciation of an English passage using a speech recognition application, Speechnotes, and two Canadian raters' evaluations of their speech according to the International English Language Testing System (IELTS) band criteria to assess the possibility of using the application as a teaching aid for pronunciation education. The results showed that the grand average percentage of correctly recognized words was 77.7%. From the moderate recognition rate, the pronunciation level of the participants was construed as intermediate and higher. The recognition rate varied depending on the composition of the content words and the function words in each given sentence. Frequency counts of unrecognized words by group level and word type revealed the typical pronunciation problems of the participants, including fricatives and nasals. The IELTS bands chosen by the two native raters for the rainbow passage had a moderately high correlation with each other. A moderate correlation was reported between the number of correctly recognized content words and the raters' bands, while an almost a negligible correlation was found between the function words and the raters' bands. From these results, the author concludes that the speech recognition application could constitute a partial aid for diagnosing each individual's or the group's pronunciation problems, but further studies are still needed to match human raters.

Impact of Word Embedding Methods on Performance of Sentiment Analysis with Machine Learning Techniques

  • Park, Hoyeon;Kim, Kyoung-jae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.181-188
    • /
    • 2020
  • 본 연구에서는 다양한 워드 임베딩 기법이 감성분석의 성과에 미치는 영향을 확인하기 위한 비교연구를 제안한다. 감성분석은 자연어 처리를 사용하여 텍스트 문서에서 주관적인 정보를 식별하고 추출하는 오피니언 마이닝 기법 중 하나이며, 상품평이나 댓글의 감성을 분류하는데 사용될 수 있다. 감성은 긍정적이거나 부정적인 것으로 분류될 수 있기 때문에 일반적인 분류문제 중 하나로 생각할 수 있으며, 이의 분류를 위해서는 텍스트를 컴퓨터가 인식할 수 있는 언어로 변환하여야 한다. 따라서 단어나 문서와 같은 텍스트를 자연어 처리에서 벡터로 변형하여 진행하는데 이를 워드 임베딩이라고 한다. 워드 임베딩 기법은 Bag of Words, TF-IDF, Word2Vec 등 다양한 기법이 사용되고 있는데 지금까지 감성분석에 적합한 워드 임베딩 기법에 대한 연구는 많이 진행되지 않았다. 본 연구에서는 영화 리뷰의 감성분석을 위해 다양한 워드 임베딩 기법 중 Bag of Words, TF-IDF, Word2Vec을 사용하여 그 성과를 비교 분석한다. 분석에 사용할 연구용 데이터 셋은 텍스트 마이닝에서 많이 활용되고 있는 IMDB 데이터 셋을 사용하였다. 분석 결과, TF-IDF와 Bag of Words의 성과가 Word2Vec보다 우수한 것으로 나타났으며 TF-IDF는 Bag of Words보다 성과가 우수하였으나 그 차이가 매우 크지는 않았다.

Word2vec을 활용한 문서의 의미 확장 검색방법 (Semantic Extention Search for Documents Using the Word2vec)

  • 김우주;김동희;장희원
    • 한국콘텐츠학회논문지
    • /
    • 제16권10호
    • /
    • pp.687-692
    • /
    • 2016
  • 기존의 문서 검색 방법론은 TF-IDF와 같은 벡터공간모델을 활용한 키워드 기반 방법론을 사용한다. 키워드 기반의 문서검색방법론으로는 문제가 몇몇 문제점이 나타날 수 있다. 먼저 몇 개의 키워드로 전체의 의미를 나타내기 힘들 수 있다. 또 기존의 키워드 기반의 방법론을 사용하면 의미상으로 비슷하지만 모양이 다른 동의어를 사용한 문서의 경우 두 문서 간에 일치하는 단어들의 특성치만 고려하여 관련이 있는 문서를 제대로 검색하지 못하거나 그 유사도를 낮게 평가할 수 있다. 본 연구는 문서를 기반으로 한 검색방법을 제안한다. Centrality를 사용해 쿼리 문서의 특성 벡터를 구하고 Word2vec알고리즘을 사용하여 단어의 모양이 아닌 단어의 의미를 고려할 수 있는 특성 벡터를 만들어 검색 성능의 향상과 더불어 유사한 단어를 사용한 문서를 찾을 수 있다.

한글 문서의 효과적인 검색을 위한 n-gram 기반의 색인 방법 (An n-gram-based Indexing Method for Effective Retrieval of Hangul Texts)

  • 이준호;안정수;박현주;김명호
    • 정보관리학회지
    • /
    • 제13권1호
    • /
    • pp.47-63
    • /
    • 1996
  • 기존의 한글 자동 색인 방법들은 어절 단위 색인법과 형태소 단위 색인법으로 분류될 수 있다. 전자는 문서내의 어절에서 비색인 분절을 절단함으로써 색인어를 추출하는 방법으로, 문서들이 많은 복합 명사들을 포함할 경우 검색 효과가 저하된다. 후자는 형태소 해석이나 구문 해석을 이용하여 중요한 의미를 갖는 명사나 명사구를 추출하는 방법으로 단일 명사를 추출함으로써 복합 명사의 띄어쓰기 문제를 극복할 수 있다. 그러나 색인 과정에서 요구되는 많은 언어 정보를 개발하고 유지 보수해야 하는 부담을 지니고 있다. 본 논문에서는 기존의 색인 방법들의 문제점들을 완화할 수 있는 새로운 색인 방법을 제안한다. 그리고 실험을 통하여 제안하는 방법의 성능을 평가한다.

  • PDF