• Title/Summary/Keyword: 한국어능력

Search Result 256, Processing Time 0.025 seconds

Llama2 Cross-lingual Korean with instruction and translation datasets (지시문 및 번역 데이터셋을 활용한 Llama2 Cross-lingual 한국어 확장)

  • Gyu-sik Jang;;Seung-Hoon Na;Joon-Ho Lim;Tae-Hyeong Kim;Hwi-Jung Ryu;Du-Seong Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.627-632
    • /
    • 2023
  • 대규모 언어 모델은 높은 연산 능력과 방대한 양의 데이터를 기반으로 탁월한 성능을 보이며 자연어처리 분야의 주목을 받고있다. 이러한 모델들은 다양한 언어와 도메인의 텍스트를 처리하는 능력을 갖추게 되었지만, 전체 학습 데이터 중에서 한국어 데이터의 비중은 여전히 미미하다. 결과적으로 이는 대규모 언어 모델이 영어와 같은 주요 언어들에 비해 한국어에 대한 이해와 처리 능력이 상대적으로 부족함을 의미한다. 본 논문은 이러한 문제점을 중심으로, 대규모 언어 모델의 한국어 처리 능력을 향상시키는 방법을 제안한다. 특히, Cross-lingual transfer learning 기법을 활용하여 모델이 다양한 언어에 대한 지식을 한국어로 전이시켜 성능을 향상시키는 방안을 탐구하였다. 이를 통해 모델은 기존의 다양한 언어에 대한 손실을 최소화 하면서도 한국어에 대한 처리 능력을 상당히 향상시켰다. 실험 결과, 해당 기법을 적용한 모델은 기존 모델 대비 nsmc데이터에서 2배 이상의 성능 향상을 보이며, 특히 복잡한 한국어 구조와 문맥 이해에서 큰 발전을 보였다. 이러한 연구는 대규모 언어 모델을 활용한 한국어 적용 향상에 기여할 것으로 기대 된다.

  • PDF

Proposing a Korean teaching method and evaluation tool using paraphrasing in learning (의역학습법을 사용한 한국어 교수법 및 평가도구 제안)

  • Kwon, Yonghae;Choi, Jungyoon
    • Journal of Korean language education
    • /
    • v.28 no.2
    • /
    • pp.265-289
    • /
    • 2017
  • 외국어를 학습하는 데 있어서 해당 외국어의 의사소통 능력을 향상시키고 평가한다는 것은 상당히 큰 중요성을 가진다. 교실에서 학습자의 듣기, 말하기, 읽기, 쓰기 능력을 통해 학습자의 언어 능력을 함양하고 평가하기 위해 어떠한 연습문제나 시험 혹은 평가방법을 사용하느냐 하는 것은 학습자의 학습동기에 지대한 영향을 미친다. 왜냐하면, 보통 학습자들은 교수자가 무엇을 가르치고 기대하며 평가하느냐에 따라 자신들의 학습방법을 맞춰 나가기 때문이다. 이러한 맥락에서 본 연구는 보다 적극적인 학습자들의 참여를 유도하고 유연성 있는 학습자 중심의 학습법을 고양시키며 다양한 언어능력을 고취시키기 위하여, 효과적인 외국어 학습법의 하나로 알려진 paraphrasing을 학습에 활용하고자 한다. 특히 paraphrasing은 일상생활 속에서도 의사소통을 원활히 하기 위한 수단으로서 글 바꿔 쓰기 혹은 말 바꿔 말하기로 활용되기도 하나, 본 소논문에서는 paraphrasing이 학습을 목적으로 하는 학습현장에서 활용되었다는 것을 감안하여 의역을 통한 학습 혹은 의역학습법을 소개하고자 한다. 실제로 paraphrasing은 언어 및 외국어 학습자들에게 상당히 효과가 있는 것으로 알려진 것에 비해 실제로 한국어 교육현장에서 사용한 연구들은 거의 찾아 볼 수가 없다고 해도 과언이 아니다. 따라서, 의역학습법을 학습현장에서 도입했을 때 경험한 여러 시행착오를 바탕으로 실질적으로 교실에서 사용된 예시들을 소개하고, 한국어를 가르치는 교수자들과 한국어를 배우는 외국인 학습자들에게 paraphrasing을 사용한 새로운 한국어 교수방법과 평가 도구를 제안하고자 한다. 이를 통해, paraphrasing이 한국어를 가르치는 교수자들과 한국어를 배우고자 하는 외국 학습자들에게 효과적인 언어학습 도구로서 실질적으로 교육현장에서 널리 사용될 수 있는 계기가 되었으면 한다.

A Study on the Evaluation Method of Korean Comprehension Abilities of Large Language Model (대규모 언어모델의 한국어 이해 능력 평가 방법에 관한 연구)

  • Ki Jun Son;Seung Hyun Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.733-736
    • /
    • 2024
  • 최근 GTP4, LLama와 같은 초거대 언어모델을 활용한 서비스가 공개되어 많은 사람의 주목을 받고 있다. 해당 모델들은 사용자들의 다양한 질문에 대하여 유창한 결과를 생성하고 있지만 한국어 데이터에 대한 학습량이 부족하여 한국어 이해 및 한국 문화 등에 대한 잘못된 정보를 제공하는 문제를 야기할 수 있다. 이에 본 논문에서는 한국어 데이터를 학습한 주요 공개 모델 6개를 선정하고 5개 분야(한국어 이해 및 문화 영역으로 구성)에 대한 평가 데이터셋을 구성하여 한국어 이해 능력에 대한 평가를 진행하였다. 그 결과 한국어 구사 능력은 Bookworm 모델이, 한국어 이해 및 문화와 관련한 부문은 LDCC-SOLAR 모델이 우수한 것으로 확인할 수 있었다.

  • PDF

The Effect on Safety Awareness of Korean Language Level of International Students (유학생의 한국어 수준이 안전의식에 미치는 영향)

  • Lee, Jai Young;Kong, Ha-Sung
    • The Journal of the Convergence on Culture Technology
    • /
    • v.7 no.3
    • /
    • pp.529-535
    • /
    • 2021
  • The purpose of this study is to reveal the causal relationship between the demographic characteristics of international students living in Korea and the effect of Korean language level on safety awareness. It was confirmed that there was a significant difference in all areas such as life safety awareness, fire safety awareness, and disaster safety awareness depending on the area of residence. The results to analyze the effect of Korean language expression and comprehension ability on safety consciousness are as follows. First, it was found that Korean expression ability had a positive (+) effect on life safety awareness but did not have a significant effect. Comprehension ability had a negative (-) effect on life safety awareness but did not have a significant effect. Second, it was found that Korean expression ability had a significant effect on fire safety awareness and had a positive (+) influence relationship. Finally, it was found that the Korean language expression ability had a significant effect on disaster safety awareness and had a positive (+) influence relationship. It is necessary to strengthen the awareness of safety for international students while staying and living in Korea, and when teaching Korean, Korean language comprehension education on safety-related topics as well as daily Korean must be strengthened.

Examining the Feasibility of Utilizing a Large Language Model for Korean Grammatical Error Correction (한국어 맞춤법 교정을 위한 초거대 언어 모델의 잠재적 능력 탐색)

  • Seonmin Koo;Chanjun Park;JeongBae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.61-65
    • /
    • 2023
  • 최근, 대부분의 태스크가 초거대 언어 모델로 통합되고 있을 정도로 많은 관심 및 연구되고 있다. 초거대 언어 모델을 효과적으로 활용하기 위해서는 모델의 능력에 대한 분석이 선행되어야 하나, 한국어에 대한 분석 및 탐색은 상대적으로 부족하다. 본 논문에서는 한국어 맞춤법 교정 태스크를 통해 초거대 언어 모델의 능력을 탐색한다. 맞춤법 교정 태스크는 문장의 구조 및 문법을 이해하는 능력이 필요하며, 사용자의 만족도에 영향을 미칠 수 있는 중요한 태스크이다. 우리는 맞춤법 세부 유형에 따른 ChatGPT의 제로샷 및 퓨샷성능을 평가하여 초거대 언어 모델의 성능 분석을 수행한다. 실험 결과 제로샷의 경우 문장부호 오류의 성능이 가장 우수했으며, 수사 오류의 성능이 가장 낮았다. 또한, 예제를 더 많이 제공할수록 전체적인 모델의 성능이 향상되었으나, 제로샷의 경우보다 오류 유형 간의 성능 차이가 커지는 것을 관찰할 수 있었다.

  • PDF

A study on the path that the linguistic competence of Marriage migrants affects to the quality of life (결혼이주민의 언어능력이 삶의 질에 영향을 미치는 경로에 관한 연구)

  • Lee, Yong-Kyu;Moon, Hyung-Ran
    • Journal of Digital Convergence
    • /
    • v.13 no.3
    • /
    • pp.37-47
    • /
    • 2015
  • This study intends to investigate the path that their language competence impacts on the quality of life through family relationships and social relationships. We conducted a questionnaire survey of marriage immigrants, living in metropolitan areas of Korea. The results are summarized as follows: First, including linguistic competence paths directly and indirectly through family relationships and social relationships, all paths that affect the quality of life has been noted. Secondly, in highly educated, high-income and spontaneous-marriage-immigrants population groups, relationships among linguistic competence, family relationships, social relationships and the quality of life were turned out to be relatively high than comparative groups. third, every groups investigated in this study have different paths that the linguistic competence influence the quality of life, but family relationship has a stronger effect on the quality of life than any other variables including linguistic competence.

KommonGen: A Dataset for Korean Generative Commonsense Reasoning Evaluation (KommonGen: 한국어 생성 모델의 상식 추론 평가 데이터셋)

  • Seo, Jaehyung;Park, Chanjun;Moon, Hyeonseok;Eo, Sugyeong;Kang, Myunghoon;Lee, Seounghoon;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.55-60
    • /
    • 2021
  • 최근 한국어에 대한 자연어 처리 연구는 딥러닝 기반의 자연어 이해 모델을 중심으로 각 모델의 성능에 대한 비교 분석과 평가가 활발하게 이루어지고 있다. 그러나 한국어 생성 모델에 대해서도 자연어 이해 영역의 하위 과제(e.g. 감정 분류, 문장 유사도 측정 등)에 대한 수행 능력만을 정량적으로 평가하여, 생성 모델의 한국어 문장 구성 능력이나 상식 추론 과정을 충분히 평가하지 못하고 있다. 또한 대부분의 생성 모델은 여전히 간단하고 일반적인 상식에 부합하는 자연스러운 문장을 생성하는 것에도 큰 어려움을 겪고 있기에 이를 해결하기 위한 개선 연구가 필요한 상황이다. 따라서 본 논문은 이러한 문제를 해결하기 위해 한국어 생성 모델이 일반 상식 추론 능력을 바탕으로 문장을 생성하도록 KommonGen 데이터셋을 제안한다. 그리고 KommonGen을 통해 한국어 생성 모델의 성능을 정량적으로 비교 분석할 수 있도록 평가 기준을 구성하고, 한국어 기반 자연어 생성 모델의 개선 방향을 제시하고자 한다.

  • PDF

Automatic Analysis Service for Korean Speaking by Age (연령별 한국어 발화 자동 분석 서비스)

  • Choi, Ji-Eun;Oh, Byoung-Doo;Heo, Tak-Sung;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.557-558
    • /
    • 2018
  • 언어를 구사하는 능력은 연령별, 개인별로 차이가 있다. 이 능력은 평가 분류에 따라 수치적으로 평가될 수 있다. 그러나 수치로 평가하는 것 보다 비슷한 연령의 평균적인 능력과 비교를 통하여 능력을 평가하는 것이 일반적이다. 언어 병리학에서 평가를 하는 보편적인 방법은 언어 병리 전문가가 하는 것이다. 그러나 사람을 통한 평가 방법은 시간과 비용이 많이 소요될 뿐만 아니라 객관적이지 못한 평가라 할 수 있다. 따라서 이번 연구에서는 한국어 발화에 대한 분석을 자동화 하는 시스템을 제안한다.

  • PDF

Android Based Korean Education Application for Foreigners (외국인을 위한 안드로이드 기반 한국어 교육 애플리케이션)

  • Choi, Sun-A;Lee, Hwa-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1480-1483
    • /
    • 2011
  • 스마트 기기 사용자가 급증하면서 애플리케이션의 수도 급격히 많아지고 있다. 다양한 종류의 교육용 애플리케이션이 많이 개발되어 졌지만 외국인을 위한 한국어 교육 애플리케이션의 수는 매우 적다. 이에 본 논문은 외국인 사용자가 한국어를 학습할 수 있는 애플리케이션을 설계 구현하였다. 한국어 어휘능력이 부족한 외국인을 주 대상으로 단어와 예문 및 시각적인 요소인 이미지와 청각적인 요소인 듣기를 결합하여 학습 효과를 극대화시킴으로써 효과적인 어휘능력의 향상을 목표로 구현하였다.

Effect of the Level of Proficiency in Korean Language and Experience in Local Society Activity Influencing Community Sense of Married Immigrant Women in Korean Rural Areas (농촌 결혼이민여성들의 한국어 능력과 지역사회활동참여경험이 공동체의식에 미치는 영향)

  • Yang, Soon Mi
    • Journal of Agricultural Extension & Community Development
    • /
    • v.21 no.4
    • /
    • pp.1061-1091
    • /
    • 2014
  • Language is connected with culture, and have a function of social and cultural integration. Also social participation is known to conduct an important role in promoting identity of immigrants. This study aimed to investigate the effect of variables such as the level of proficiency in Korean language, and experience in local society activity on community sense of married immigrant women in Korean rural areas. The result showed that the level of proficiency in Korean language had the greatest effect on their sense of community, and experience in local society activity seemed to have intermediation effect on it. In conclusion, based on results of this study, plans improving proficiency of Korean language of the immigrants and participation in local society activities were suggested.