• Title/Summary/Keyword: 단어학습

Search Result 814, Processing Time 0.025 seconds

Classification of Security Bugs Using emotional word (감정 단어를 활용한 보안 버그의 분류)

  • Kim, Young-Kyoung;Heo, Jin-Seok;Kim, Misoo;Lee, Eun-seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.512-514
    • /
    • 2018
  • 최근 보안 버그의 중요성이 증가함에 따라, 버그 리포트 중 보안과 관련된 리포트를 빠르게 분류하는 기술이 필요하다. 기존 기술들은 버그 리포트의 단어들을 가지고 기계학습을 위한 훈련 데이터를 생성한다. 이 때 기계학습에 잡음이 발생하면 성능을 떨어뜨릴 수 있다. 이를 보완하기 위해 본 연구에서는 감정 단어를 활용하여 잡음을 줄인 보안 버그리포트를 자동으로 식별하는 기계학습기반 기술을 제안한다. 제안 기술은 기계학습 시 사용되는 훈련 데이터의 품질을 높이기 위해 감정 단어를 활용한다. 실험 결과 감정 단어를 활용했을 때 기존 기술 대비 보안 버그를 분류하는 정확도가 3.03% 향상되었다.

Context-Aware Middleware Design for Emotion Feedback of E-Learning Learners (이러닝 학습자의 감정 피드백을 위한 상황인식 미들웨어 설계)

  • Kim, Jin-Bong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.670-672
    • /
    • 2022
  • 이러닝 시스템을 유용하게 활용하려면 학습자의 감정을 인식하여 학습자에게 적절한 피드백을 주는 것이 무엇보다 중요하다. 이러닝 시스템의 학습효율을 높이기 위해서는 학습자의 감정을 인식하여 그에 적절한 피드백을 제공하는 것이 중요하다. 본 논문에서는 학습자에 대한 적절한 피드백을 제공하기 위해서 상황인식 컴퓨팅 기술을 바탕으로 학습자의 감정표현단어를 상황정보로 사용하여 감정을 인식할 수 있는 상황인식 미들웨어로서 EF-CAM을 제안한다. EF-CAM은 감정표현단어의 범주화기술을 기반으로 온톨로지를 구축하여 학습자의 감정을 인식한다. 이러닝 학습자의 감정을 인식하기 위해서 학습자의 감정표현 단어를 상황정보로 사용하고, 학습자의 감정에 영향을 미칠 수 있는 환경정보(온도, 습도, 날씨 등)를 추가하여 인식한다. 학습자의 감정을 표현하기 위해서 OWL 언어를 사용하여 온톨로지를 구축하였다.

On Word Embedding Models and Parameters Optimized for Korean (한국어에 적합한 단어 임베딩 모델 및 파라미터 튜닝에 관한 연구)

  • Choi, Sanghyuk;Seol, Jinseok;Lee, Sang-goo
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.252-256
    • /
    • 2016
  • 본 논문에서는 한국어에 최적화된 단어 임베딩을 학습하기 위한 방법을 소개한다. 단어 임베딩이란 각 단어가 분산된 의미를 지니도록 고정된 차원의 벡터공간에 대응 시키는 방법으로, 기계번역, 개체명 인식 등 많은 자연어처리 분야에서 활용되고 있다. 본 논문에서는 한국어에 대해 최적의 성능을 낼 수 있는 학습용 말뭉치와 임베딩 모델 및 적합한 하이퍼 파라미터를 실험적으로 찾고 그 결과를 분석한다.

  • PDF

The Text-Prompt Speaker Recognition for Customer Discrimination (출입자 판별을 위한 문맥 제시형 화자인식)

  • 서광석
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.127-130
    • /
    • 1998
  • 본 연구에서는 문맥 종속 또는 문맥 독립형 화자 인식에서의 단점을 개선하는 방법으로 문맥 제시형 화자 인식을 수행하였다. 문맥 종속형 화자 인식은 제한된 문장이나 단어를 발성하여 출입 판별을 하는 방식으로 구현하기는 쉬우나 사칭자가 사용자의 목소리를 흉내낼 수 있으며[1], 문맥 독립형 화자 인식은 임의의 대화 문장이나 대화를 사용에게 유도하여 일정 시간 동안 녹음한 후에 이를 이용하여 사칭자가 접근을 허가 받을 수 있다는 단번이 있다. 또한 문맥 독립형 화자 인식에서는 접근 허가를 받기까지 많은 학습 시간이 필요하며 학습 시간이 적을 경우에 상당한 인식률의 저하가 발생된다. 문맥 제시형 화자 인식은 랜덤하게 제시된 단어만을 화자가 발성함으로써 특정한 문장이나 단어의 배열을 미리 녹음했다가 재생하는 방법을 배제할 수 있을 뿐만 아니라 동시에 학습을 위한 많은 시간을 소모하지 않는다는 장점이 있다. 본 논문에서는 화자로 하여금 랜덤하게 제시된 여러 개의 단어들을 순서적으로 발성하도록 하여, 발성 단어를 인식한 후에 인식된 단어를 통하여 화자를 판별하는 방법을 사용하였다.

  • PDF

A Design and Implementation of English Word Learning Application (영어 단어 학습 애플리케이션 설계 및 구현)

  • Lee, Won Joo;Lee, Ki Won;Lee, Min Cheol;Lee, Jin Ho;Heo, Min Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.59-60
    • /
    • 2022
  • 본 논문에서는 유아 영어 단어 학습 애플리케이션을 설계하고 구현한다. 이 애플리케이션은 키넥트 센서의 음성 인식 기능을 활용하여 동물과 음식 분야의 단어 학습 기능을 제공한다. 화면에 출력된 이미지에 해당하는 영어 단어를 말하면 키넥트 센서에서 그 음성을 인식하여 해당 단어의 발음이 정확한지 판별한다. 주어진 시간 내에 다양한 단어를 정확하게 발음함으로써 높은 점수를 취득하도록 구현한다.

  • PDF

Hypernetwork-based Natural Language Sentence Generation by Word Relation Pattern Learning (단어 간 관계 패턴 학습을 통한 하이퍼네트워크 기반 자연 언어 문장 생성)

  • Seok, Ho-Sik;Bootkrajang, Jakramate;Zhang, Byoung-Tak
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.3
    • /
    • pp.205-213
    • /
    • 2010
  • We introduce a natural language sentence generation (NLG) method based on learning of word-association patterns. Existing NLG methods assume the inherent grammar rules or use template based method. Contrary to the existing NLG methods, the presented method learns the words-association patterns using only the co-occurrence of words without additional information such as tagging. We employ the hypernetwork method to analyze and represent the words-association patterns. As training going on, the model complexity is increased. After completing each training phase, natural language sentences are generated using the learned hyperedges. The number of grammatically plausible sentences increases after each training phase. We confirm that the proposed method has a potential for learning grammatical properties of training corpuses by comparing the diversity of grammatical rules of training corpuses and the generated sentences.

A Study on the Adoption of Characteristics of Educational Game for Edutainment Contents Development - through a Case Study of English Vocabulary Learning Came for Children (에듀테인먼트 컨텐츠 개발을 위한 게임 요인 적용에 관한 연구 - 어린이용 영어 단어 학습 게임 컨텐츠 개발을 중심으로)

  • 박수정;김현정
    • Archives of design research
    • /
    • v.16 no.2
    • /
    • pp.271-280
    • /
    • 2003
  • In digital age, multimedia technology has changed the learning method as a learner-directed way. CD-rom and internet that are major two multimedia learning way, has aimed at edutainment which combine education and entertainment. However, existing educational contents can only induce temporary learning motivation, and are in short of entertaining factors enough to induce continuous and ingenuous learning motivation. Therefore, in order to be used by users efficiently, educational software have to adapt characteristics of educational game more actively. In this paper, adoption method of characteristics of educational game in learning contents is sought and the specific example of adoption is demonstrated by a case study of developing vocabulary learning educational game.

  • PDF

The Implementation of Web Page Learning Memory Platform to support efficient Learning Model (효율적인 학습 모델을 지원하는 웹 페이지 학습 기억 플랫폼 구현)

  • Kim, Seongjun;Oh, Ryumduck
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.291-294
    • /
    • 2021
  • 본 논문에서는 영어 교육에 대한 사회적인 인식은 중요해지면서 다양한 방식의 영어공부와 학습모델들을 분석하고 오랫동안 가억이 가능한 학습시스템을 검토하였다. 그러나 영어의 기초가 되는 영어 단어의 공부법이 논리적인 근거 없이 강사의 인지도와 명성에 현혹되어 강사가 추천해 주는 공부 방법에 따라 잘못된 학습하는 경우가 대부분이다. 또한 사람마다 자기에게 맞는 학습법은 분명 존재할 것이다. 하지만 그 방법 외에 효과적인 다른 방법 또한 찾아 볼 수 있다. 헤르만 에빙하우스는 사람의 망각 연구한 결과 망각의 주기를 수치로 나타내었고, 라이트너는 플래시 카드를 박스에 넣어 복습을 반복하는 아날로그 장치를 만들어 복습의 효과를 연구하였다. 본 논문에서는 헤르만 에빙하우스의 망각 곡선 이론을 통해 효율적인 영어 단어 학습방법을 논리적으로 증명하고, 웹사이트를 사용한 라이트너 박스와 망각 곡선의 이론을 적용하여 망각의 주기에 따른 복습의 효과를 적용하여 결과적으로 사용자에게 접근성이 좋은 학습형 플랫폼을 제공하여 시간 대비 학습률이 좋은 시스템을 개발하고자 하였다.

  • PDF

Segmenting and Classifying Korean Words based on Syllables Using Instance-Based Learning (사례기반 학습을 이용한 음절기반 한국어 단어 분리 및 범주 결정)

  • Kim, Jae-Hoon;Lee, Kong-Joo
    • The KIPS Transactions:PartB
    • /
    • v.10B no.1
    • /
    • pp.47-56
    • /
    • 2003
  • Korean delimits words by white-space like English, but words In Korean Is a little different in structure from those in English. Words in English generally consist of one word, but those in Korean are composed of one word and/or morpheme or more. Because of this difference, a word between white-spaces is called an Eojeol in Korean. We propose a method for segmenting and classifying Korean words and/or morphemes based on syllables using an instance-based learning. In this paper, elements of feature sets for the instance-based learning are one previous syllable, one current syllable, two next syllables, a final consonant of the current syllable, and two previous categories. Our method shows more than 97% of the F-measure of word segmentation using ETRI corpus and KAIST corpus.

Reduce Redundant Repetition Using Decoding History for Sequence-to-Sequence Summarization (단어 생성 이력을 이용한 시퀀스-투-시퀀스 요약의 어휘 반복 문제 해결)

  • Ryu, Jae-Hyun;Noh, Yunseok;Choi, Su Jeong;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.120-125
    • /
    • 2018
  • 문서 요약 문제는 최근 심층 신경망을 활용하여 활발히 연구되고 있는 문제 중 하나이다. 많은 기존 연구들이 주로 시퀀스-투-시퀀스 모델을 활용하여 요약을 수행하고 있으나, 아직 양질의 요약을 생성하기에는 많은 문제점이 있다. 시퀀스-투-시퀀스 모델을 활용한 요약에서 가장 빈번히 나타나는 문제 중 하나는 요약문의 생성과정에서 단어나 구, 문장이 불필요하게 반복적으로 생성되는 것이다. 이를 해결하기 위해 다양한 연구가 이루어지고 있으며, 이들 대부분은 요약문의 생성 과정에서 정확한 정보를 주기 위해 모델에 여러 모듈을 추가하였다. 하지만 기존 연구들은 생성 단어가 정답 단어로 나올 확률을 최대화 하도록 학습되기 때문에, 생성하지 말아야 하는 단어에 대한 학습이 부족하여 반복 생성 문제를 해결하는 것에는 한계가 있다. 따라서 본 논문에서는 기존 요약 모델의 복잡도를 높이지 않고, 단어 생성 이력을 직접적으로 이용하여 반복 생성을 제어하는 모델을 제안한다. 제안한 모델은 학습할 때 생성 단계에서 이전에 생성한 단어가 이후에 다시 생성될 확률을 최소화하여 실제 모델이 생성한 단어가 반복 생성될 확률을 직접적으로 제어한다. 한국어 데이터를 이용하여 제안한 방법을 통해 요약문을 생성한 결과, 비교모델보다 단어 반복이 크게 줄어들어 양질의 요약을 생성하는 것을 확인할 수 있었다.

  • PDF