• 제목/요약/키워드: 어휘다양성

검색결과 188건 처리시간 0.029초

컴퓨터 통신어의 어휘 유형 체계 (Lexical analysis for computer chatting language)

  • 김윤식;나동열;한경호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.396-400
    • /
    • 2004
  • 가상공간에서의 정보교류가 늘어나면서 컴퓨터 통신언어도 자연어처리의 새로운 연구 분야로 등장하였다. 가장 일상화된 컴퓨터 통신어이며 인터넷상의 실시간 대화어인 채팅언어는 신속한 정보 전달 매체의 기능과 문자언어로서 정보교류와 대화 상황을 함께 내포해야 하는 문어와 구어의 양면성을 동시에 가는 언어이다. 이러한 특수성으로 컴퓨터 통신언어의 경우 발화자의 개성에 따라한 의미의 단어도 표기법이 다양하여 어휘수가 매우 많다. 본 연구에서는 컴퓨터 통신에서 사용되는 다양한 어휘를 컴퓨터로 처리하기 위한 어휘의 유형을 체계화하는 방안을 제시한다.

  • PDF

한국어·중국어 이중 언어 사용 아동의 어휘 다양성 (A Study on the Lexical Diversity of Korean-Chinese Bilingual Children)

  • 최지영
    • 한국어교육
    • /
    • 제28권4호
    • /
    • pp.245-271
    • /
    • 2017
  • This study aimed at investigating the lexical diversity in the "Frog Story" narratives of Korean-Chinese bilingual children. Six bilingual speakers of Korean children- four boys and two girls- were audio recorded as they produced narratives based on pictures from the Mercer Mayer book "Frog, where are you?" The order of narration was counterbalanced. The vocabularies from narratives were analyzed by type, token, TTR (type-token Ratio) and D value using the CLAN (Computerized Language Analysis) program. The findings showed that the pattern of lexical diversity in Korean is similar with the Chinese, but the TTR and D value of Chinese still remain low in comparison with those of Korean. In addition, Korean language seems to have significant influence on Chinese in the language usage pattern and vice versa.

세종명사전자사전의 통사정보 (Syntactic informations in the Sejong Electronic Dictionary of Korean Nouns)

  • 홍재성;고길수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.348-355
    • /
    • 2001
  • 세종전자사전은 한국어 어휘의 정보를 총체적으로 표상하는 전산어휘자료체이다. 세종전자사전은 궁극적으로 다양한 유형과 기능의 한국어 자동처리에의 활용을 목표로 한다. 세종체언전자사전은 최종적으로 5만여 항목을 대상으로 구축될 것이다. 세종명사전자사전은 전산적 효율성을 고려하여 명사 어휘의 정보를 8개의 하위정보구획과 50여개의 세부정보항목으로 구분하여 표상한다. 특히, 명사의 어휘 통사적인 결합에 관한 정보는 한국어 명사구와 문장의 자동생성에 직접 활용될 수 있는 정보이다. 명사는 수식어 요소 또는 조사와 결합하여 명사구를 형성하고, 동사 및 형용사와 결합하여 문장의 생성에 참여한다. 개별 명사들은 이 과정에서 다양한 제약적인 양상들을 보여주고 있으며, 세종명사전자사전은 이 정보들을 명시적으로 표상한다. 또한 명사는 기능동사와 결합하는 술어명사와 그렇지 않은 비술어명사로 구분이 된다. 술어 명사가 기능동사와 결합하여 문장을 형성할 때, 명사와 그 논항들은 다양한 통사적 기능을 담당한다. 또한 술어명사는 논항과 결합하여 명사구를 형성한다. 그러나, 술어명사의 명사구 형성과 기능동사의 결합은 불규칙적이고, 명사와 기능동사의 의미적 특성에 따라 다양한 제약이 발견된다. 이 정보들의 정밀한 표상은 개별 술어명사로부터 생성될 수 있는 가능한 명사구와 문장의 형태를 구체적으로 밝혀주게 된다. 세종명사전자사전의 어휘 통사적인 결합에 관한 정보들은 명사구 또는 문장의 자동생성의 정확성과 효율성을 높여줄 것이다.

  • PDF

문맥 및 어휘 그룹 기반의 지능형 영어 어휘 학습 시스템의 개발 (Development of Context and Vocabulary Group-Based Intelligent English Vocabulary Learning System)

  • 김도현;장홍준;김병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.19-20
    • /
    • 2023
  • 영어 교육 시장 확대로 다양한 영어 학습 시스템이 개발되고 있다. 그러나 어휘의 문맥적 이해와 효과적인 학습 방법을 결합한 지능형 어휘 학습 시스템에 대한 연구는 미비하다. 본 연구에서는 임의의 n 개 영어 단어가 한 그룹으로 제시되고, 이들을 모두 포함한 예문을 제공하는 지능형 영어 어휘 학습 시스템을 개발한다. 본 연구에서는 임의의 n 개 영어 단어가 주어졌을 때 문맥에 맞는 영어 예문을 자동으로 생성하는 모델을 개발하였다. 어휘 평가를 바탕으로 자동으로 취약 어휘를 선정하며 학습자들이 해당 어휘를 학습 할 수 있도록 진행한다. 본 연구에서 개발한 지능형 영어 어휘 학습 시스템의 사용성 평가를 위해 설문 검사를 실시하였다. 설문 결과는 문맥 및 어휘 그룹 기반의 지능형 영어 학습 시스템은 사용자들이 사용하기 편리하고 어휘 능력을 향상시키는데 도움이 될 수 있음을 보여준다.

동의어와 반의어를 활용한 영어 어휘 학습 시스템 설계 (Learning English Vocabulary Using Synonyms And Antonyms System Design)

  • 옥준혁;장홍준;김병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.21-22
    • /
    • 2023
  • 영어 공인 시험에서 영어 어휘는 가장 중요한 요소 중 하나이다. 그러나 기존 영어 어휘 학습 시스템은 단순히 어휘 교재의 콘텐츠를 디지털화한 것에 그치고 있다. 영어 어휘 학습에서 동의어에 대한 학습은 언어 능력을 향상시키고 다양한 상황에서 효과적으로 의사소통할 수 있는 능력 향상에 도움이 된다. 본 연구에서는 학습자들이 영어 어휘 학습을 효과적으로 할 수 있도록 동의어 및 반의어를 활용할 수 있는 학습 시스템을 제안한다. 본 시스템은 동의어와 반의어에 대한 정보가 필요한 영어 어휘를 입력으로 받아 생성형 AI에서 동의어 및 반의어에 대한 정보를 생성한 후에 반환하는 기능을 수행한다. 본 시스템은 학습자들이 어휘 평가에서 오답으로 답한 어휘에 대해 동의어 및 반의어에 대한 추가적인 어휘와 예문을 제공하여 영어 어휘 학습의 효율성을 높일 수 있을 것이다.

내용분석 및 자유연상을 통한 미디어 파사드의 감성어휘 추출 (A Study on the Extraction of Emotional Words for Media Facade)

  • 이승민;방기천
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권5호
    • /
    • pp.741-748
    • /
    • 2015
  • 본 연구의 목적은 미디어 파사드(Media Facade)의 사용자 감성을 이해하기 위한 감성어휘를 연구하여, 정량적이고 객관적인 미디어 파사드 감성 평가척도의 기초를 마련하고자 하였다. 연구 방법은 먼저, 내용분석을 위해 다양한 분야에서 수집된 기존의 감성어휘들을 조사하여 통합하였고, 유튜브 사이트의 미디어 파사드에 남긴 사용자들의 댓글을 통해 감성어휘를 수집하였다. 또한 자유연상방법을 활용한 비구조적 설문조사를 위해, 실험실에서 사용자들에게 미디어 파사드 영상을 보여주고 자신의 느낌을 글로 표현하도록 하였다. 이렇게 수집된 어휘들은 일관성을 위해 표준어 형용사의 형태로 통일 하고, 유사 어휘 및 유사 개념의 어휘는 하나로 통합하여 설문에 사용할 수 있는 39개의 어휘로 정리하였다. 최종적으로 미디어 파사드에 의한 사용자들의 감성어휘는 '기발하다', '멋있다', '대단하다', '화려하다', '흥미롭다', '놀랍다', '신기하다', '현란하다', '굉장하다', '강렬하다', '좋다', '웅장하다', '다채롭다', '독특하다', '다양하다', '새롭다', '재미있다', '아름답다', '고급스럽다', '신비롭다', '만족스럽다' 등 총 21개로 추출되었다. 미디어 파사드의 제작에 있어 이러한 감성어휘를 다양한 효과로 활용하면 사용자의 감성을 충족시킬 수 있는 디자인 방향을 설정하는데 효과적일 뿐 아니라, 감성평가의 기본 자료로 활용될 수 있을 것으로 사료된다.

고등학교 수학 교과서에서 사용되는 어휘(語彙)와 수학 기호 표현의 다양성에 대한 소고(小考) (A View on the Diversity of the Word and Mathematical Notation Expression Used in High School Mathematics Textbooks)

  • 양성현
    • 한국학교수학회논문집
    • /
    • 제20권3호
    • /
    • pp.211-237
    • /
    • 2017
  • 고등학교 수학 교과서에서 사용되는 어휘와 기호 표현이 교과서에 따라 편차가 존재하며 수학적 정의와 내용 설명 방식에도 교과서별 상이함이 존재하고 있다. 교과서의 내용 구성뿐만 아니라 교과서의 다양한 표현 방식은 교사와 학생의 교수 학습에 상당한 영향을 미치게 되며 표현의 다양성은 동전의 양면처럼 장단이 존재할 수 있다. 교수학적 다양성을 추구할 수 있다는 긍정적 측면과 동시에, 학생의 입장에서 학습 부담으로 작용될 가능성과 평가의 평등성 측면에서 부정적 측면도 존재한다. 본고는 수학 교과서에서 사용되는 어휘와 수학 기호 표현의 다양성에 대하여 어떠한 표현이 더 옳고 그른지 판단하고자 하는 것보다 선차적으로 현 교육과정에서 사용되고 있는 교과서의 어휘와 수학 기호 표현의 다양성에 대한 실태를 분석하는데 초점을 두었다. 이를 위하여 2009 개정 수학과 교육과정에 기반하여 개발된 일반 과목 56종의 수학 교과서를 분석하여 '용어와 기호'를 포괄한 교과서 어휘 표현의 상이점을 네 가지(용어를 포함한 어휘 표현, 기호 표현, 수학적 정의, 내용 설명) 측면에서 사례와 함께 제시하였다.

  • PDF

다양한 지식을 사용한 영한 기계번역에서의 대역어 선택 (Target Word Selection for English-Korean Machine Translation System using Multiple Knowledge)

  • 이기영;김한우
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.75-86
    • /
    • 2006
  • 일반적으로 영어를 한국어로 번역할 때, 대부분의 영어 명사 어휘들은 해당 어휘가 사용되는 문맥에 따라 다양한 한국어 명사로 번역될 수 있다. 따라서 영어 원문이 갖는 의미를 손실 없이 번역문으로 전달하기 위해서는 문맥에 맞는 올바른 한국어 대역어를 선택할 수 있어야 한다. 본 논문에서는 동사구패턴, 공기 정보에 기반한 의미벡터, 공기 품사 정보 및 한국어 문맥 통계 정보 등의 다양한 지식을 사용하여 영어 명사 어휘의 대역어를 올바로 선택하는 방안을 제공한다. 동사구 패턴은 사전과 코퍼스를 사용하여 구축되었으며, 의미 벡터는 영어 어휘가 특정 한국어 어휘로 번역될 때 공기하는 정보들의 조건부 확률을 나타낸다. 한국어 문맥 통계 정보는 한국어 코퍼스로부터 추출된 N-그램 정보를 나타내며, 품사 공기 정보는 대역어 선택 모호성을 지니는 영어 어휘와 통계적으로 깊은 관련성을 지니는 품사를 나타낸다. 마지막으로 본 논문에서 제안한 대역어 선택 모호성 해소 방안을 평가하기 위한 실험을 수행하였으며, 실험 결과, 제안하는 방법이 기존의 방법보다 성능이 좋다는 것을 확인할 수 있었다.

  • PDF

단어 의미 모호성 해소를 위한 군집화된 의미 어휘의 품질 향상 (Improving Clustered Sense Labels for Word Sense Disambiguation)

  • 박정연;신형진;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.268-271
    • /
    • 2022
  • 단어 의미 모호성 해소는 동형이의어의 의미를 문맥에 맞게 결정하는 일이다. 최근 연구에서는 희소 데이터 처리를 위해 시소러스를 사용해 의미 어휘를 압축하고 사용하는 방법이 좋은 성능을 보였다[1]. 본 연구에서는 시소러스 없이 군집화 알고리즘으로 의미 어휘를 압축하는 방법의 성능 향상을 위해 두 가지 방법을 제안한다. 첫째, 의미적으로 유사한 의미 어휘 집합인 범주(category) 정보를 군집화를 위한 초기 군집 생성에 사용한다. 둘째, 다양하고 많은 문맥 정보를 학습해 만들어진 품질 좋은 벡터를 군집화에 사용한다. 영어데이터인 SemCor 데이터를 학습하고 Senseval, Semeval 5개 데이터로 평가한 결과, 제안한 방법의 평균 성능이 기존 연구보다 1.5%p 높은 F1 70.6%를 달성했다.

  • PDF

한국어 어휘 중의성 해소에서 어휘 확률에 대한 효과적인 평가 방법 (An Effective Estimation method for Lexical Probabilities in Korean Lexical Disambiguation)

  • 이하규
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1588-1597
    • /
    • 1996
  • 본 논문은 한국어 어휘 중의성 해소(lexical disambiguation)에서 어휘 확률 (lexical probability) 평가방법에 대해 기술하고 있다. 통계적 접근 방법의 어휘 중 의성 해소에서는 일반적으로 말뭉치(corpus)로부터 추출된 통계 자료에 기초하여 어 휘 확률과 문맥 확률(contextual probability)을 평가한다. 한국어는 어절별로 띄어 쓰기가 이루어지므로 어절 단위로 어휘 확률을 적용하는 것이 바람직하다. 하지만 한 국어는 어절의 다양성이 심하기 때문에 상당히 큰 말뭉치를 사용하더라도 어절 단위 로는 어휘 확률을 직접 평가할 수 없는 경우가 다소 있다. 이러한 문제점을 극복하기 위해 본 연구에서는 어휘 분석 측면에서 어절의 유사성을 정의하고 이에 기반을 둔 한국어 어휘 확률 평가 방법을 제안한다. 이 방법에서는 어떤 어절에 대해 어휘 확률 을 직접 평가할 수 없는 경우 이와 어휘 분석이 유사한 어절들을 통해 간접적으로 평 가한다. 실험결과 제안된 접근방법이 한국어 어휘 중의성 해소에 효과적인 것으로 나 타나고 있다.

  • PDF