• 제목/요약/키워드: 어휘학습

검색결과 358건 처리시간 0.03초

단어 의미 모호성 해소를 위한 군집화된 의미 어휘의 품질 향상 (Improving Clustered Sense Labels for Word Sense Disambiguation)

  • 박정연;신형진;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.268-271
    • /
    • 2022
  • 단어 의미 모호성 해소는 동형이의어의 의미를 문맥에 맞게 결정하는 일이다. 최근 연구에서는 희소 데이터 처리를 위해 시소러스를 사용해 의미 어휘를 압축하고 사용하는 방법이 좋은 성능을 보였다[1]. 본 연구에서는 시소러스 없이 군집화 알고리즘으로 의미 어휘를 압축하는 방법의 성능 향상을 위해 두 가지 방법을 제안한다. 첫째, 의미적으로 유사한 의미 어휘 집합인 범주(category) 정보를 군집화를 위한 초기 군집 생성에 사용한다. 둘째, 다양하고 많은 문맥 정보를 학습해 만들어진 품질 좋은 벡터를 군집화에 사용한다. 영어데이터인 SemCor 데이터를 학습하고 Senseval, Semeval 5개 데이터로 평가한 결과, 제안한 방법의 평균 성능이 기존 연구보다 1.5%p 높은 F1 70.6%를 달성했다.

  • PDF

의견어중심의 의존트리패턴자질을 이용한 기계학습기반 한국어 블로그 문서 의견분류시스템 (Machine Learning Based Blog Text Opinion Classification System Using Opinion Word Centered-Dependency Tree Pattern Features)

  • 곽동민;이승욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.337-338
    • /
    • 2009
  • 블로그문서의 의견극성분류 연구는 주로 기계학습기법에 기반한 방법이었고, 이때 주로 활용된 자질은 명사, 동사 등의 품사정보와 의견어 어휘정보였다. 하지만 하나의 의견어 어휘만을 고려한다면 그 극성을 판별하는데 필요한 정보가 충분하지 않아 부정확한 결과를 도출하는 경우가 발생할 수 있다. 본 논문에서는 여러 어휘를 동시에 고려하였을 때 보다 정확한 의견분류를 수행할 수 있을 것이라는 가정을 세웠다. 본 논문에서는 효과적인 의견어휘자질의 추출을 위하여 의견이 내포될 가능성이 높은 의견어휘를 기반으로 의존구문분석을 통해 의존트리패턴을 추출하였고, 제안하는 PF-IDF가중치를 적용하여 지지벡터기계(SVM)와 다항시행접근 단순베이지안(MNNB)알고리즘으로 비교 실험을 수행하였다. 기준시스템인 TF-IDF가중치 기법에 비해 정확도(accuracy)가 지지벡터기계에서 5%, 다항시행접근 단순베이지안에서 8.9% 향상된 성능을 보였다.

외국어교육 상황에서 텍스트 유형별 읽기에 따른 어휘력향상 연구 (Vocabulary Improvement in EFL Writing through Narrative and Expository Texts)

  • 신규철
    • 한국융합학회논문지
    • /
    • 제11권1호
    • /
    • pp.201-209
    • /
    • 2020
  • 이 논문의 목적은 외국어 학습자가 대화체와 설명체 텍스트를 읽기를 하는 동안, 텍스트 유형이 쓰기에 있어서 어휘향상에 어떻게 영향을 주는 지를 밝히는데 있다. 실험집단은 3개의 그룹으로 나뉘어졌다. 첫번째 그룹은 대화체 텍스트를 읽었고, 두번째 그룹은 설명체 텍스트를 읽었다. 한편, 세번째 그룹은 대화체와 설명체 글을 번갈아 가며 읽었다. 학습과정이 끝난 후, 어휘 테스트를 통해 집단 간의 비교를 하였고, ETS 에세이 평가에 나타난 평가 결과를 토대로 어휘에 나타난 특징을 분석하여 비교 하였다. 실험 결과는, 학습자의 모르는 어휘에 대한 이해에 있어서, 설명체 텍스트가 대화체 텍스트보다 우수하다는 것을 증명하였다. 더욱이, 대화체와 설명체를 동시에 읽은 집단이 대화체만 읽은 집단이나 설명체만 읽은 집단보다 어휘 향상에 이어서 더 우수함을 보여 주었다. 한편, ETS 에세이 쓰기에 나타난 결과는 상대적으로 설명체 글의 학습자가 틀린 오류가 가장 많았다.

기계가독형사전에서 상위어 판별을 위한 규칙 학습 (Learning Rules for Identifying Hypernyms in Machine Readable Dictionaries)

  • 최선화;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.171-178
    • /
    • 2006
  • 기계가독형사전(Machine Readable Dictionary)에서 단어의 정의문에 나타나는 항목 단어의 상위개념을 추출하는 대부분의 연구들은 전문가에 의해 작성된 어휘패턴을 사용하였다. 이 방법은 사람이 직접 패턴을 수집하므로 시간과 비용이 많이 소모될 뿐만 아니라, 자연언어에는 같은 의미를 가진 다앙한 표현들이 존재하므로 넓은 커버리지를 갖는 어휘패턴들을 수집하는 것이 매우 어렵다는 단점이 있다. 이런 문제점들을 해결하기 위하여, 본 논문에서는 구문적 특징만을 이용한 상위어 판별 규칙을 기계학습함으로써 기존에 사용되었던 어휘패턴의 지나친 어휘 의존성으로 인한 낮은 커버리지 및 패턴 수집의 문제를 해결하는 방법을 제안한다. 제안한 방법으로 기계학습된 규칙들을 상위어 자동추출과정에적용한 결과 정확도 92.37% 성능을 보였다. 이는 기존 연구들보다 향상된 성능으로 기계학습에 의해 수집된 판별규칙이 상위어 판별에 있어서 어휘패턴의 문제를 해결할 수 있다는 것을 입증하였다.

중국인 학습자를 위한 한국어 교재의 어휘 분석 및 개선 방안 한국어 '상징부사+용언'을 중심으로 (A Vocabulary Analysis and Improvement Plan of Korean textbooks for Chinese learners: focusing on Korean "symbol adverb+predicate")

  • 종예
    • 한국교육논총
    • /
    • 제42권1호
    • /
    • pp.35-72
    • /
    • 2021
  • 본 연구는 중국인 한국어 학습자들이 세밀한 느낌과 다양한 감정을 표현할 때 보다 정확하게 말할 수 있도록 한국어 '상징부사+용언'형을 중심으로 효과적인 교재 개선안을 마련하는 데 목적이 있다. 다수 외국인 학습자들이 어휘를 습득할 때 개별 단어를 암기하고자 노력하고 있으며, 어휘간의 결합을 중시하지 않으므로 한국어 어휘를 정확하고 자연스럽게 사용하지 못하는 문제점이 있다. 상징부사는 고립되어 사용하지 않으며 특정 어휘와 자주 공기하기 때문에 개별 어휘가 아닌 '상징부사+용언' 형태로 가르치는 것이 더 효과적이다. 따라서 본고는 상징부사 뒤에 오는 특정 어휘 또는 공통적인 의미자질을 가진 어휘 군과 자주 공기할 수 있는 것을 중심으로 고찰하였다. 이에 상징부사 뒤에 서술어가 함께 사용되는 양상의 차이를 밝히기 위하여 국내·외 대학 기관에서 사용하고 있는 한국어 7종 교재를 중심으로 비교·분석하였다. 마지막으로 교재 분석 결과를 바탕으로 중국인 학습자를 위한 한국어 '상징부사+용언'형의 개선 방안을 제시하였다.

  • PDF

A Study on the Academic vocabulary Education for Content-Based Korean Language Education: A Basic Study for Online Dictionary Development

  • Hwang, Shung-eun
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.67-74
    • /
    • 2020
  • 이 연구는 내용 중심 한국어 교육을 위해 학술어휘를 어떻게 교육할 것인지에 대한 방안으로 온라인 학술어휘 사전을 개발할 것을 제안한다. 학문 목적 한국어 학습자가 대학 수학 과정에서 접하게 되는 내용 중심 한국어 교육을 위한 학술적 텍스트에는 다양한 학술어휘가 존재한다. 학술어휘를 모르고서는 학문적 내용을 이해하거나 생산할 수 없다. 따라서 그들이 처한 교육적 환경을 고려하여 그들에게 가장 적합한 방식으로 학술어휘를 교육해 교육적 효율성을 높이는 것이 한국어 교육의 과제 중 하나가 되었다. 이에 대한 대안으로 본고는 온라인 학술어휘 사전 개발에 앞서 온라인 학술어휘 사전에는 어떠한 내용이 어떠한 방식으로 담겨야 하는지에 대한 기초 연구를 수행하고자 한다. 온라인 학술어휘 사전은 교실 안으로 한정되어 있던 교육을 교실 안팎으로 자연스럽게 연결하게 해 교육 현장이 갖는 어휘 교육의 한계를 극복하고 교육적 효과를 극대화할 수 있다.

이미지와 듣기자료를 중심으로 어휘력 향상을 위한 효율적 학습 적용 방안 (Effective Method to Improve the Competence of the Vocabulary by the Image and Listening)

  • 정일영
    • 비교문화연구
    • /
    • 제38권
    • /
    • pp.461-500
    • /
    • 2015
  • This study aims to investigate the effective method to improve the competence of the Vocabulary by the image and listening towards the ELF. In the first part, we observed the problems and point improvement on learning vocabulary based on learner survey. In the second part, we analyzed two remarkable studies: - consistent and adapt method, communicational context - method based on the lexical, morphological semantical, notional and thematic field Then we proposed effective methods that are applicable to the vocabulary's learning in the class : - learning vocabulary by combining the words - learning vocabulary based on the meaning field - learning vocabulary as concrete characters - learning vocabulary by the descriptive character - learning vocabulary with the type "who am I?" - learning vocabulary by listening For teachers, one of the difficulties to the conduct of vocabulary course is that learners take passive position. Specifically, it is the teachers who play an important role because it runs in the direction of the course. However, learners do not show the active attitude for vocabulary lessons despite the course to take to improve their vocabulary skills. Therefore, teachers must prepare course materials that can both improve the competence of the vocabulary of learners and cause their interest or desire on the current vocabulary. This is why teachers should exploit various materials depending on the skill level of the learner vocabulary.

한국어 어휘의미망을 활용한 Conditional Random Fields 기반 한국어 개체명 인식 (Conditional Random Fields based Named Entity Recognition Using Korean Lexical Semantic Network)

  • 박서연;옥철영;신준철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.343-346
    • /
    • 2020
  • 개체명 인식은 주어진 문장 내에서 OOV(Out of Vocaburary)로 자주 등장하는 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 개체명이 문장 내에서 OOV로 등장하는 문제를 해결하기 위해 외부 리소스를 활용하는 연구들이 많이 진행되었다. 본 논문은 의미역, 의존관계 분석에 한국어 어휘지도를 이용한 자질을 추가하여 성능 향상을 보인 연구들을 바탕으로 이를 한국어 개체명 인식에 적용하고 평가하였다. 실험 결과, 한국어 어휘지도를 활용한 자질을 추가로 학습한 모델이 기존 모델에 비해 평균 1.83% 포인트 향상하였다. 또한, CRF 단일 모델만을 사용했음에도 87.25% 포인트라는 높은 성능을 보였다.

  • PDF

디지털 스토리텔링을 이용한 영어어휘학습설계 (An English Vocabulary Learning Method by using Digital Storytelling)

  • 유지호;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1445-1448
    • /
    • 2011
  • 이야기를 통한 메시지 전달은 가장 강력한 소통의 기구다. 그것은 디지털미디어가 발달하면서도 마찬가지이다. 정보의 급격한 양과 질적인 변화는 인간에게 다양하고 변화되는 학습이 요구되고 있으며, 평생교육의 개념이 강화되는 상황 속에서, 디바이스의 발달은 지식정보화 사회에서의 필수적인 학습도구로서 자리잡고 있으나, 진화를 요구 받게 되어있다. 특히, 영어학습에서 디바이스들은 EFL 에서 학습한계를 극복하고, 문화적 교육을 가능하게 하는 도구로 발전하고 있으므로, 수집된 정보들은 의미전달에 있어서 효율성을 취하는 설계에 있어서 디지털 스토리텔링방법의 효과성 검증과 디지털 매체 그리고 변화된 환경의 학습자 분석을 통한 교수학습의 촉진기반연구가 필요하며, 이에 기반한 영어어휘 교수 학습설계의 개발연구를 제안하고자 한다.

어휘정보와 통사정보를 모두 이용한 문서분류 (Text Categorization Using Both Lexical Information and Syntactic Information)

  • 박성배;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.37-39
    • /
    • 2001
  • 현재 이용가능한 대부분의 자동문서분류 시스템의 가장 큰 문제는 문서에 포함된 단어 사이의 통사 정보는 무시한 채, 각 단어의 분포만 고려한다는 점이다. 하지만, 통사 정보도 문서 분류를 위해 매우 중요한 정보 중의 하나이다. 본 논문에서는 문서에 나타난 어휘 정보와 함께 통사 정보를 함께 고려하는 자동문서분류 방법을 제시한다. Reuters-21578 말뭉치에 대한 문서분류 실험결과 제시된 방법은 어휘정보만 사용하는 방법과 통사정보만 사용하는 방법 모두보다 높은 성능을 보인다 이 말뭉치에 대해서, 어휘정보만으로 학습된 Support Vector Machine으로 약 77%의 매우 높은 정확도를 얻을 수 있음에도 약 0.63%의 추가적인 성능 향상이 있었다.

  • PDF