• Title/Summary/Keyword: 언어공학

Search Result 3,037, Processing Time 0.028 seconds

A Study on Proficiency in Solving Riddles of Large Language Model (초거대 언어모델의 재치에 관한 고찰: 수수께끼 해결 능력을 중심으로)

  • Sugyeong Eo;Chanjun Park;Hyeonseok Moon;Jaehyung Seo;Yuna Hur;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.25-30
    • /
    • 2023
  • 초거대 언어모델은 과연 수수께끼 문제에 재치있는 답변을 할 수 있을까? 최근 초거대 언어모델(Large language model, LLM)은 강력한 성능 및 유저 만족도를 보이며 세계의 이목을 집중시키고 있다. 여러 태스크들에 대한 정량 평가를 넘어서 최근에는 LLM의 창의력 및 고도화된 언어능력을 평가하는 연구들이 등장하고 있다. 본 논문에서는 이러한 연구 흐름에 따라 LLM의 재치에 관해 고찰해본다. 이때 재치를 평가하기 위한 태스크로 이를 요구하는 말놀이인 수수께끼를 활용한다. 본 논문은 LLM이 수수께끼를 잘 수행하는지를 모델 추론을 통해 평가하며, 모델 추론 시 활용되는 프롬프트들의 성격에 따른 성능 변화를 관찰한다. 또한 수수께끼의 종류에 따른 모델의 능력을 비교 분석하며 LLM의 추론 결과에 대한 오류 분석을 수행한다. 본 논문은 실험을 통해 GPT-4가 가장 높은 성능을 보이며, 설명글이나 데이터 예시를 추가할 시 성능을 한층 더 향상시킬 수 있음을 확인한다. 또한 단어 기반보다는 특성 기반의 수수께끼에 더욱 강력한 성능을 보이며, 오류 유형 분석을 통해 LLM이 환각(hallucination) 문제와 창의력을 동시에 가지고 있다고 분석한다.

  • PDF

Allophonic Information Necessary for Speech Technology (음성공학을 위한 변이음 정보)

  • Lee, Ho-Young;Zhi, Min-Je;Kim, Young-Song
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.131-139
    • /
    • 1993
  • 하나의 음소는 보통 음성환경에 따라 여러 변이음으로 실현된다. 음성합성기로 한국어의 문장을 자연스럽게 합성해 내려고 할 때나 음성인식기가 한국어의 문장을 정확하게 인식하도록 개발하고자 할 때 변이음에 관한 정보는 필수적이다. 따라서 이 논문의 목적은 음성공학에 필요한 변이음 정보를 제공하는 것이다. 이 논문에서는 음성공학에 필요한 한국어의 주오 변이음 규칙들을 간단히 논의하고 몇몇 중요한 변이음들의 음향적 특징을 논의한다.

  • PDF

Design of Translator for Stack-Based Code (스택 기반 코드 변환기 설계)

  • Kim, Kyung-Soo;Kim, Ki-Tae;Jo, Sun-Moon;Sim, Hyun-Jin;Yoo, Weon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.337-340
    • /
    • 2004
  • 자바는 객체 지향언어로 네트워크 기반의 환경에서 응용프로그램을 효율적으로 개발을 위해 설계되었으며 특정 하드웨어나 운영체제에 영향을 받지 않고 동작 할 수 있는 높은 이식성을 가지고 있다. 하지만 자바 언어로 응용프로그램을 개발하면 다른 언어로 작성하는 것 보다 일반적으로 실행이 느리다는 단점이 발생하게 된다. 이를 극복하기 위해 자바 언어에 대한 최적화가 필요하다. 일반적으로 많이 쓰는 최적화 방법으로는 JIT와 같이 실행시간에 필요에 따라 컴파일하여 실행하는 방법과 바이트코드를 수행하고자 하는 특정 프로세서에 적합한 네이티브 코드를 생성하는 방법을 사용하고 있다. 하지만 이러한 방법들은 고유의 최적화 기법과 구현된 프로그램을 이용해서만이 최적화가 가능했고 또한 코드의 추출부터 최적화를 위한 모든 부분까지 구현해야하는 문제점이 있다. 또한 자바 바이트코드는 스택기반의 코드로써 명령어가 많고 표현이 명백하지 않다는 문제점을 가지고 있다. 따라서 분석과 변환이 어렵기 때문에 자바 바이트코드를 스택 기반이 아닌 분석과 최적화가 용이한 3-주소 형태로 변환하여 최적화 기법을 적용해야 한다 본 논문에서는 자바 바이트코드와 3-주소 형태의 중간 코드인 CTOC-B에 대해서 설계한다.

  • PDF

Adding New Information in DCS (DCS의 정보확장)

  • Lee, Chang-In
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.253-257
    • /
    • 1995
  • 본 논문은 DCS(Dynamic Comprehension System) 정보확장 과정을 어휘 정보의 첨가를 통해 묘사하고자한다. 즉, 현존의 사전정보의 보완작용없이, 시스템을 확장하는 과정이 이 논문에서 보여진다. 새로운 언어정보에 유연하게 대처하기 위해 화자와 청자간의 새로운 지식의 학습과정이 나무구조 형식의 보조메뉴를 통해 상호 교환방식으로 나타내진다. 본 논문은 새로운 지식의 인지과정 중 현존의 정보망(network)에 각 단위망(nection)이 첨가될 때의 과정을 구현시키고자 시도된 것이다.

  • PDF

Subcategorization of Dependent Nouns for NLP (자연어 처리를 위한 의존 명사 하위 범주 분류)

  • Yu, Jae-Won
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.136-142
    • /
    • 1997
  • 의존 명사와 이를 꾸미는 관형어는 통사적으로 긴밀한 언어학적 단위를 이루므로 의존 명사에 대한 하위 범주 분류는 한국어 자연어 처리에 있어서 중요하다. 그러나 기존 국어 문법에서는 이 문제가 일관성 있게 다루어지지 않았다. 이 논문에서는 국어 사전(조재수 1997)에 올라 있는 의존 명사 600여 개를 허웅(1996)의 분류 기준을 보완하여 일관성 있게 하위 범주 분류를 시도하였다. 또 수량 단위 명사는 앞에 오는 수사의 종류에 따라 더 세분하였다.

  • PDF

Selection Criteria of Texts for the Korean Corpus (한국어 어휘뭉치의 표본 선정 기준)

  • Chung, Chan-Sup
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.257-263
    • /
    • 1989
  • 신뢰롭고 타당한 우리말 어휘뭉치의 표본 선정 기준을 정하기 위하여 언어 관계 전문가와 일반인을 대상으로 독서물의 중요성 및 독서량을 묻는 현장 조사를 실시하였다. 어휘 뭉치 표본으로서 17개의 독서물 유목 및 구어 대본이 선정되었으며 각 독서물 유목별 표집 비율이 산출되었다.

  • PDF

Parameter. Subset Principle, and the Acquisition of Korean Reflexive Anaphora (매개변항, 부분집합원리, 재귀대명사습득)

  • Cho, Sook-Whan
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.296-301
    • /
    • 1989
  • 본 논문의 목적은 매개변항(parameter)과 부분집합원리(subset principle)를 재귀대명사 구조분석 및 습득에 적용하여 보편문법(Universal Grammar)과 언어습득의 상호관계를 검토하는 데에 있다. 본 논문은 첫째, 재귀대명사 '자기'를 매개변항이론에 근거하여 분석하고, 둘째, 재귀사의 구조를 부분집합원리에 적용하여 '자기'의 습득과정을 관찰한다. 본 논문의 목적을 위해 두 가지 가설을 세워 실험적으로 검증하였다. 실험결과, 선행사자격 습득단계의 가설이 확증되었으며, 지배변항 습득단계의 가설은 결정적 증거가 미비해 앞으로의 과제로 남아 있다.

  • PDF

Extraction of the Training Data for Building Case Frames from a Corpus (말뭉치로부터 격틀 구축에 필요한 학습 데이터 추출)

  • Yang, Dan-Hee;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.287-292
    • /
    • 1998
  • 실용적인 격틀(Case frame) 정보를 말뭉치로부터 자동구축하기 위해서는 대량의 홀문장이 필요하다. 그리고 국어 문장 형식은 영어와 많은 차이점이 있다. 또한 기존의 격틀 구축 연구에서 전제했던 광범위한 학습 데이터와 언어학적 지식은 국어에 대해 현재 존재하지 않는다. 그러므로 본 연구는 그러한 문제점들을 밝히고 현실적인 접근 방법을 제시한다. 그리고 겹문장을 홑문장 형태의 문장들로 바꾸기 위한 알고리즘을 제시한다.

  • PDF

Overview of Problems and Methodologies for Korean Language Processing (한국어 정보처리의 문제점 및 방법론 고찰)

  • Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.329-334
    • /
    • 1998
  • 자연언어 처리 시스템은 시제품 개발이 비교적 용이한 반면에 이를 실용적인 시스템으로 발전 시키는데 많은 어려움이 있다. 본 논문에서는 형태소 분석기와 구문분석기, 기계번역 시스템 등을 개발할 때 발생하는 문제점과 방법론을 고찰하고, 실용적인 시스템을 개발하기 위한 효율적인 방법으로 2-step 패러다임과 이를 실현하는 방안으로 기능별 모듈화에 의한 divide and conquer 기법, 단순화 기법, 예외처리 기법 등을 활용하는 방법을 제안한다.

  • PDF

Comprehension and Production Processes of Korean: A Review on Psychological Research (한국어의 이해와 산출의 심리적 과정)

  • Lee, Jung-Mo;Lee, Jae-Ho;Kim, Young-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.3-22
    • /
    • 1994
  • 한국어의 이해와 산출의 심리적 과정에 대한 인지심리학적 연구들을 개관하였다. 한국어의 통사적 구분분석처리 과정, 대용어 참조 해결 과정, 덩이글 이해와 지식구조의 활용 과정, 말실수와 글쓰기의 언어 산출 과정 등에 대한 심리학적 연구를 개관하여 주요 실험적 결과와 이론적 의의를 논하고, 이들이 앞으로의 한국어 이해와 산출 과정에 대한 인지과학적 연구에 시사하는 바를 논의하였다.

  • PDF