• Title/Summary/Keyword: 언어공학

Search Result 3,028, Processing Time 0.03 seconds

The Design of Hangul Programing Language (Hangual Cobol) (한글 프로그래밍 언어(한글 코볼)의 설계에 관한 연구)

  • Her, Young-Do;Baik, Doo-Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.35-38
    • /
    • 1989
  • 컴퓨터의 소형화 추세와 더불어 퍼스널 컴퓨터가 직장과 학교는 물론 일반 가정에까지 널리 보급되기 시작하였다. 아울러 이들 퍼스널 컴퓨터 사용자들에게 편리를 제공하기 위한 응용 소프트웨어에 대한 연구가 활발히 이루어지고 있으며 특히 영어를 모르는 사용자들을 위한 컴퓨터의 한글화 문제가 매우 중요시하게 대두되었다. 더구나 오늘날 대중화되고 보편적인 이용 수단이 된 컴퓨터의 교육이나 프로그래밍 언어의 한글화는 상당히 낙후되었던 것이 사실이다. 이에 본 연구에서는 사무처리에 적합한 코볼 언어와 유사한 한글 코볼언어에 대한 설계를 하였다. 한글 코볼 언어의 설계의 궁극적인 목적은 한글의 음운체계에 맞는 좋은 프로그래밍 언어를 개발해서 프로그래머들이 프로그램 작성에 효율을 갖게 하려는데 있다. 이러한 좋은 프로그래밍 언어를 설계해서 구현하는 작업은 상당히 어려운 작업이므로 본 논문에서는 일차적으로 영문 명령어의 한글화와 조사처리에 대한 방법들을 연구하였다.

  • PDF

Rated Recall: Evaluation Method for Constructing Bilingual Lexicons (등급 재현율: 이중언어 사전 구축에 대한 평가 방법)

  • Seo, Hyeong-Won;Kwon, Hong-Seok;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.146-151
    • /
    • 2013
  • 이중언어 사전 구축 방법을 평가하는 방법에는 정확률, 재현율, MRR(Mean Reciprocal Rank) 등이 있다. 이들 방법들은 평가 집합에 있는 대역어를 정확하게 찾는 것에 초점을 맞추고 있다. 그러나 어떤 대역어가 얼마나 많이 사용되는지는 전혀 고려하지 않는다. 즉 자주 사용되는 대역어를 빨리 찾을 수 있는 방법이 좋은 방법이라고 말할 수 있다. 이와 같은 문제를 해결하기 위해서 본 논문에서는 이중언어 사전 구축의 새로운 평가 방법인 등급 재현율을 제안한다. 등급 재현율(rated recall)은 대역어가 학습 말뭉치에 나타난 정도를 반영하는 재현율이며, 자주 사용되는 대역어를 얼마나 정확하게 찾는지를 파악할 수 있는 좋은 측도이다. 본 논문에서는 문맥벡터와 중간언어를 이용한 이중언어 사전 구축 시스템의 성능을 평가하고 기존의 방법과 비교 분석하였다.

  • PDF

Knowledge Transfer in Multilingual LLMs Based on Code-Switching Corpora (코드 스위칭 코퍼스 기반 다국어 LLM의 지식 전이 연구)

  • Seonghyun Kim;Kanghee Lee;Minsu Jeong;Jungwoo Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.301-305
    • /
    • 2023
  • 최근 등장한 Large Language Models (LLM)은 자연어 처리 분야에서 눈에 띄는 성과를 보여주었지만, 주로 영어 중심의 연구로 진행되어 그 한계를 가지고 있다. 본 연구는 사전 학습된 LLM의 언어별 지식 전이 가능성을 한국어를 중심으로 탐구하였다. 이를 위해 한국어와 영어로 구성된 코드 스위칭 코퍼스를 구축하였으며, 기본 모델인 LLAMA-2와 코드 스위칭 코퍼스를 추가 학습한 모델 간의 성능 비교를 수행하였다. 결과적으로, 제안하는 방법론으로 학습한 모델은 두 언어 간의 희미론적 정보가 효과적으로 전이됐으며, 두 언어 간의 지식 정보 연계가 가능했다. 이 연구는 다양한 언어와 문화를 반영하는 다국어 LLM 연구와, 소수 언어를 포함한 AI 기술의 확산 및 민주화에 기여할 수 있을 것으로 기대된다.

  • PDF