• 제목/요약/키워드: 국립국어원

검색결과 31건 처리시간 0.033초

감정 어휘 사전을 활용한 영화 리뷰 말뭉치 감정 분석 (Movie Corpus Emotional Analysis Using Emotion Vocabulary Dictionary)

  • 장연지;최지선;박서윤;강예지;강혜린;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.379-383
    • /
    • 2021
  • 감정 분석은 텍스트 데이터에서 인간이 느끼는 감정을 다양한 감정 유형으로 분류하는 것이다. 그러나 많은 연구에서 감정 분석은 긍정과 부정, 또는 중립의 극성을 분류하는 감성 분석의 개념과 혼용되고 있다. 본 연구에서는 텍스트에서 느껴지는 감정들을 다양한 감정 유형으로 분류한 감정 말뭉치를 구축하였는데, 감정 말뭉치를 구축하기 위해 심리학 모델을 기반으로 분류한 감정 어휘 사전을 사용하였다. 9가지 감정 유형으로 분류된 한국어 감정 어휘 사전을 바탕으로 한국어 영화 리뷰 말뭉치에 9가지 감정 유형의 감정을 태깅하여 감정 분석 말뭉치를 구축하고, KcBert에 학습시켰다. 긍정과 부정으로 분류된 데이터로 사전 학습된 KcBert에 9개의 유형으로 분류된 데이터를 학습시켜 기존 모델과 성능 비교를 한 결과, KcBert는 다중 분류 모델에서도 우수한 성능을 보였다.

  • PDF

지식증류를 활용한 지속적 한국어 개체명 인식 (Continuous Korean Named Entity Recognition Using Knowledge Distillation)

  • 장준서;박성식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.505-509
    • /
    • 2023
  • 개체명 인식은 주어진 텍스트에서 특정 유형의 개체들을 식별하고 추출하는 작업이다. 일반적인 딥러닝 기반 개체명 인식은 사전에 개체명들을 모두 정의한 뒤 모델을 학습한다. 하지만 실제 학습 환경에서는 지속적으로 새로운 개체명이 등장할 수 있을뿐더러 기존 개체명을 학습한 데이터가 접근이 불가할 수 있다. 또한, 새로 모델을 학습하기 위해 새로운 데이터에 기존 개체명을 수동 태깅하기엔 많은 시간과 비용이 든다. 해결 방안으로 여러 방법론이 제시되었지만 새로운 개체명을 학습하는 과정에서 기존 개체명 지식에 대한 망각 현상이 나타났다. 본 논문에서는 지식증류를 활용한 지속학습이 한국어 개체명 인식에서 기존 지식에 대한 망각을 줄이고 새로운 지식을 학습하는데 효과적임을 보인다. 국립국어원에서 제공한 개체명 인식 데이터로 실험과 평가를 진행하여 성능의 우수성을 보인다.

  • PDF

격틀 사전과 하위 범주 정보를 이용한 한국어 의미역 결정 (Korean Semantic Role Labeling Using Case Frame Dictionary and Subcategorization)

  • 김완수;옥철영
    • 정보과학회 논문지
    • /
    • 제43권12호
    • /
    • pp.1376-1384
    • /
    • 2016
  • 기계가 사람과 같이 문장을 처리하게 하려면 사람이 쓴 문장을 토대로 사람이 문장을 통해 발현하는 모든 문장의 표현 양상을 학습해 사람처럼 분석하고 처리할 수 있어야 한다. 이를 위해 기본적으로 처리되어야 할 부분은 언어학적인 정보처리이다. 언어학에서 통사론적으로 문장을 분석할 때 필요한 것이 문장을 성분별로 나눌 수 있고, 문장의 핵심인 용언을 중심으로 필수 논항을 찾아 해당 논항이 용언과 어떤 의미역 관계를 맺고 있는지를 파악할 수 있어야 한다. 본 연구에서는 국립국어원 표준국어대사전을 기반으로 구축한 격틀사전과 한국어 어휘 의미망에서 용언의 하위 범주를 자질로 구축한 CRF 모델을 적용하여 의미역을 결정하는 방법을 사용하였다. 문장의 어절, 용언, 격틀사전, 단어의 상위어 정보를 자질로 구축한 CRF 모델을 기반으로 하여 의미역을 자동으로 태깅하는 실험을 한 결과 정확률이 83.13%로 기존의 규칙 기반 방법을 사용한 의미역 태깅 결과의 정확률 81.2%보다 높은 성능을 보였다.

발화 속도와 말차례 교체 빈도에 따른 운율 단위 변화에 관한 연구 (A study on the change of prosodic units by speech rate and frequency of turn-taking)

  • 원유권
    • 말소리와 음성과학
    • /
    • 제14권2호
    • /
    • pp.29-38
    • /
    • 2022
  • 이 연구는 국립국어원 일상 대화 음성 코퍼스(2020)에서 나타나는 발화를 분석하여 발화 속도 및 말차례 교체 빈도가 운율 단위 변화에 어떤 영향을 끼치는지 밝히는 것을 목적으로 하였다. 분석 결과, 발화 속도가 증가할수록 억양구, 어절 빈도, 발화 길이가 증가하는 양의 상관관계를 보였으나 상관관계가 낮았고, 회귀모형의 적합도는 3%-11%로 설명력이 약했다. 말차례 교체 빈도에 따른 평균 발화 속도는 유의미한 차이가 있었고, 말차례 교체 빈도가 증가할수록 발화 속도는 감소하였다. 또한 말차례 교체 빈도가 증가할수록 억양구 및 어절 빈도와 발화 길이는 감소하였으며 높은 음의 상관관계가 있는 것으로 나타났다. 회귀 모형의 적합도는 27%-32%로 계산되었다. 말차례 교체 빈도가 발화 속도와 운율 단위를 변화시키는 요인으로 작용했을 수 있다. 이는 대화체에서 나타나는 비유창성, 말차례 교체 특성, 화자 간 활발한 상호작용 등이 영향을 미쳤을 것이라 추측된다.

문화융합시대의 미디어 리터러시 활성화를 위한 국어교재 연구 (Research on Korean Language Textbooks to Activate Media Literacy for the Era of Cultural Convergence)

  • 임지원
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권7호
    • /
    • pp.389-395
    • /
    • 2020
  • 본 연구는 문화융합시대를 맞이하여 올바른 미디어 리터러시 활성화를 위해 일반화된 인지환경을 기반으로 한 미디어언어 속 서사적 의미를 긍정적으로 해석할 수 있는 전략을 국어학습자의 교재 내용에 도입을 제안한 논의라 할 수 있다. 특히 문화 해석과 관련된 창조성이 가장 강화되어있는 광고콘텐츠를 활용하여 그 시대의 정보적 현시성을 파악하고 관련성을 가진 의미해석을 재생산하고자 유도하였다. 또한 인지적 해석이 가능했던 국어학습자의 작문 재생산 과정에서 논증적 글쓰기 전략을 활용하고자 했다. 공익광고 콘텐츠 개발자의 의도는 항상 사회문화적인 측면에서 긍정적인 효과를 기대하며 학습자는 그 효과를 통해 성찰과 올바른 미래를 꿈꾸게 된다. 필자가 의도한 문화융합시대의 미디어 리터러시 활성화 연구는 아직 많은 논의가 이루지고 있지 않고 있다. 본 연구의 제안적 논의가 많은 국어학습자를 위한 교재 내용의 대중매체언어 교육에 적극 활용되길 바라며 양적인 분석 내용을 담지 못한 부분을 아쉽게 생각하고 후속 논문에 그 성과를 기대한다.

회선부호의 스크램블링을 고려한 새로운 한국표준 한글글자마디부호에 관한 연구 (Considering the scrambling code of the line Study on the New Korea joint protection Standard Hangul character)

  • 박요셉;홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.1345-1354
    • /
    • 2015
  • 본 논문은 정보통신용 표준 부호인(정보 교환용 부호계 $KS{\times}1001$ : 2004)에 정의되어 있는 한글낱자 부호집합에 대하여, Date link 계층에서 AMI/HDB-3 스크램블링 측면에서 효율적인 데이터 전송을 위한 새로운 부호집합 체계를 제시하였다. 기존 부호집합 체계와 상호비교를 위하여 ($4{\times}4$) 비트 원천부호화 규칙과 한글 빈도통계 (국립국어원)를 적용한 결과 약44 %의 데이터 전송 효율이 개선시킬 수 있음을 나타났다.

한글에 의한 외국어 표기법에서 음절표현 방법 제안 (Suggestion of syllable representation methods for foreign languages in Hangul)

  • 정태충
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2015
  • 우리 모두 소리의 표현력이 뛰어난 한글의 우수성은 너무나 잘 알고 있으며, 한글의 세계화를 외치고 있다. 그러나 그런 일을 해야할 국립국어원 등 국가기관은 외국어 표기법을 만들지 않고 있다. 외래어표기법으로 충분하다고 생각하고 있는 것이다. 외래어표기법은 현재의 한글을 유지하면서 외국어를 한글 단어로 만들 때 어떻게 만드느냐를 규정한 것이다. 한글세계화에 필요한 외국어 표기법은 한글로 외국어를 잘 표현함으로써 한글을 외국에 퍼트리는 것이 목표이다. 따라서 외국인이 쓰기에 편리해야하고 외국어 발음 왜곡을 최소화 하면서 잘 표현해 내기엔 현재 한글로는 부족한 면이 있음으로 표현력이 확장된 한글을 만들어야한다. 물론 확장된 한글이 현재의 한글과 동떨어지면 안될 것이다. 많은 분들이 여러 아이디어로 제안을 해 왔지만 대부분 자음을 추가하는 데에 집중되어 있다. 확장한글에서 다루어야할 것은 1) 추가되는 자음과 모음 2) 한글에 없는 성조나 강약 및 장단 등에 관한 규정 추가 등이면 된다고 생각하고 있다. 그러나 한글의 큰 특성인 음절이 외국어 표현 때에 왜곡되는 현상이 있는데, 어떻게 외국어와 한글의 음절개념을 일치시킬 수 있을지에 대해 관심을 가지고 방안을 제안하고자 한다. 그 방안으로는 1) 합용병서와 2) 풀어쓰기 활용법이 가능하나, 필자는 중간선으로 3) 촉진자 표기법을 제안한다. 또한, 크기조절법에 대응해 음절인 글자 위에 점을 표기하는 음절점표기법도 제안한다.

  • PDF

연기전공 대학생들의 무용신체훈련이 자기관리향상에 미치는 영향 (The effect of dance physical training of self-management college students on self-management improvement)

  • 양소정;안병순
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.295-296
    • /
    • 2018
  • 자기관리란 개인이 정한 목표에 도달하기 위해서 방법을 계획하고 점검함으로써 목표달성을 위해 스스로 정하는 자기통제적인 행위를 말한다. (국립국어원, 2014)연기전공 대학생의 경우 자기관리의 개념이 '자신이 어떤 행동을 변화시키기 위하여 기술이나 전략들을 사용하여 변화를 주도하는 과정이다. 즉 자기관리 과정이라는 것은 개인이 변화하기 위한 노력으로 스스로 환경여건을 수정하고 행동결과를 조정하며 관리하는 것이다.(Jones et al,1977)' 연기전공 대학생들은 다른 공연예술전공대학생보다 여러 분야의 지식과 기술(무용, 음악, 연출, 신체훈련, 무대표현)을 습득해야하는 종합예술의 특성을 가지고 있기 때문일 것이다.(이영일, 2015) 그렇기에 연기전공대학생들은 다른 공연예술전공의대학생보다 보다 많은 자기관리가 필요하다. 그 중 본 연구자는 연기전공대학생들에게 무용신체훈련을 적용하여 연구를 진행하였을시 대상자들 스스로가 본인의 신체를 자각하고 자기관리의 중요성을 경험 한 뒤 자기관리에 어떠한 영향을 미치는지 알아보기 위함이다. 이미 무용전공자를 위한 자기관리프로그램과 신체훈련 프로그램과 가기관리에 관한 프로그램에 관한 선행연구결과가 있다. 자기관리의 프로 연기전공대학생 1학년 14명의 대상자를 선정하고 무용신체훈련과 자기관리향상을 연계하여 논의하였다.

  • PDF

한국어 예비·경력·현지 교원을 위한 국외 파견 실습 프로그램 개발 연구 -2017 국립국어원 카자흐스탄 파견 실습 프로그램 개발을 중심으로- (Development of teacher training program for overseas Korean language teachers of preservice career local milieu: focusing on 2017 Kazakhstan project by National Institute of Korean Language)

  • 이동은;이수연
    • 한국어교육
    • /
    • 제29권2호
    • /
    • pp.101-123
    • /
    • 2018
  • The purpose of this paper is to develop a training program for overseas Korean language teachers focus on preservice teacher. This thesis based on the 2017 Korean Language (prospective) Teacher Overseas Dispatch and Practical Training Assistance Project (Almaty, Kazakhstan region). The present task established prospective teachers, career teachers, and local teachers as the targets of each assignment. We focused on developing a program that could match each of these characteristics. For prospective teachers, the program was designed and conducted with the goal of "improving real expertise through practical training," whereas for career teachers the program was developed with the goal of "improving leadership" and "retraining teachers" by focusing on their abilities as middle managers to build and maintain foreign and domestic networks. For local teachers, the goal was to provide "retraining as Korean language teacher certification". The limitations of those unable to attend domestic meetings were alleviated through training, workshops, and meetings, and a program was developed for real education practical training. For prospective teachers and career teachers in particular, the program was designed to center on a system of collaboration in which classes based on international Project Based Learning(iPBL) were conducted, and groups prepared practical training and practice modules.

사전 학습 언어 모델을 활용한 감정 말뭉치 구축 연구 (A Study on the Construction of an Emotion Corpus Using a Pre-trained Language Model )

  • 장연지 ;비립 ;강예지 ;강혜린 ;박서윤 ;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.238-244
    • /
    • 2022
  • 감정 분석은 텍스트에 표현된 인간의 감정을 인식하여 다양한 감정 유형으로 분류하는 것이다. 섬세한 인간의 감정을 보다 정확히 분류하기 위해서는 감정 유형의 분류가 무엇보다 중요하다. 본 연구에서는 사전 학습 언어 모델을 활용하여 우리말샘의 감정 어휘와 용례를 바탕으로 기쁨, 슬픔, 공포, 분노, 혐오, 놀람, 흥미, 지루함, 통증의 감정 유형으로 분류된 감정 말뭉치를 구축하였다. 감정 말뭉치를 구축한 후 성능 평가를 위해 대표적인 트랜스포머 기반 사전 학습 모델 중 RoBERTa, MultiDistilBert, MultiBert, KcBert, KcELECTRA. KoELECTRA를 활용하여 보다 넓은 범위에서 객관적으로 모델 간의 성능을 평가하고 각 감정 유형별 정확도를 바탕으로 감정 유형의 특성을 알아보았다. 그 결과 각 모델의 학습 구조가 다중 분류 말뭉치에 어떤 영향을 주는지 구체적으로 파악할 수 있었으며, ELECTRA가 상대적으로 우수한 성능을 보여주고 있음을 확인하였다. 또한 감정 유형별 성능을 비교를 통해 다양한 감정 유형 중 기쁨, 슬픔, 공포에 대한 성능이 우수하다는 것을 알 수 있었다.

  • PDF