• 제목/요약/키워드: 자연어 이해

검색결과 177건 처리시간 0.026초

인공지능 기반 사회적 지지를 위한 대형언어모형의 공감적 추론 향상: 심리치료 모형을 중심으로 (Enhancing Empathic Reasoning of Large Language Models Based on Psychotherapy Models for AI-assisted Social Support)

  • 이윤경;이인주;신민정;배서연;한소원
    • 인지과학
    • /
    • 제35권1호
    • /
    • pp.23-48
    • /
    • 2024
  • 대형언어모형(LLM)을 현실에 적용하려는 지속적인 노력에도 불구하고, 인공지능이 맥락을 이해하고 사람의 의도에 맞게 사회적 지지를 제공하는 능력은 아직 제한적이다. 본 연구에서는 LLM이 사람의 감정 상태를 추론하도록 유도하기 위해, 심리 치료 이론을 기반으로 한 공감 체인(Chain of Empathy, CoE) 프롬프트 방법을 새로 개발했다. CoE 기반 LLM은 인지-행동 치료(CBT), 변증법적 행동 치료(DBT), 인간 중심 치료(PCT) 및 현실 치료(RT)와 같은 다양한 심리 치료 방식을 참고하였으며, 각 방식의 목적에 맞게 내담자의 정신 상태를 해석하도록 설계했다. CoE 기반 추론을 유도하지 않은 조건에서는 LLM이 사회적 지지를 구하는 내담자의 글에 주로 탐색적 공감 표현(예: 개방형 질문)만을 생성했으며, 추론을 유도한 조건에서는 각 심리 치료 모형을 대표하는 정신 상태 추론 방법과 일치하는 다양한 공감 표현을 생성했다. 공감 표현 분류 과제에서 CBT 기반 CoE는 감정적 반응, 탐색, 해석 등을 가장 균형적으로 분류하였으나, DBT 및 PCT 기반 CoE는 감정적 반응 공감 표현을 더 잘 분류하였다. 추가로, 각 프롬프트 조건 별로 생성된 텍스트 데이터를 정성적으로 분석하고 정렬 정확도를 평가하였다. 본 연구의 결과는 감정 및 맥락 이해가 인간-인공지능 의사소통에 미치는 영향에 대한 함의를 제공한다. 특히 인공지능이 안전하고 공감적으로 인간과 소통하는 데 있어 추론 방식이 중요하다는 근거를 제공하며, 이러한 추론 능력을 높이는 데 심리학의 이론이 인공지능의 발전과 활용에 기여할 수 있음을 시사한다.

상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소 (Homonym Disambiguation based on Mutual Information and Sense-Tagged Compound Noun Dictionary)

  • 허정;서희철;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1073-1089
    • /
    • 2006
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구는 상호정보량과 기 분석된 복합명사 의미사전에 기반한 동음이의어 의미 중의성 해소를 위한 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 기술들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료 부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 언어적인 특징을 반영하기 위해서 상호정보량을 가지는 어휘 쌍의 비율 가중치, 의미 별 비율 가중치와 뜻풀이의 길이 가중치를 사용하였다. 그리고, 복합명사를 구성하는 단일명사들은 서로의 의미를 제약한다는 것에 기반하여 고빈도 복합명사에 대해서 의미를 부착한 의미사전을 구축하였고, 이를 동음이의어 중의성 해소에 활용하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 200 여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 네 유형의 실험을 수행하였다. 실험 결과는 상호 정보량만을 이용하였을 때 65.06%의 정확률을 보였고, 가중치를 활용하였을 때 85.35%의 정확률을 보였다. 또한, 복합명사 의미분석 사전을 활용하였을 때는 88.82%의 정확률을 보였다.

자질 선택 기법을 이용한 한국어 화행 결정 (Decision of the Korean Speech Act using Feature Selection Method)

  • 김경선;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.278-284
    • /
    • 2003
  • 화행(speech act)이란 화자의 발화를 통해 나타나는 화자의 의도를 가르키며 자연어로 된 발화를 이해하고 이에 대한 응답을 생성하기 위해 중요한 요소이다. 본 논문에서는 한국어 화행 결정의 성능을 높이기 위해 두 단계 방법을 제안한다. 첫 번째 단계는 형태소 분석결과만을 이용하여 추출된 문장자질과 이전 화행을 이용하여 추출된 문맥자질 중 정보량이 높은 자질을 선택하는 단계이다. 이 단계에서는 형태소 분석 시스템을 사용하여 전체 자질을 구성하고 문서분류 분야의 자질 선택에서 높은 성능을 보인 카이제곱 통계량을 이용하여 효과적인 자질 선택한다. 두 번째 단계는 선택된 자질과 신경망을 이용하여 화행을 분석하는 단계이다. 본 논문에서 제시한 방법은 형태소 분석 결과만을 이용하여 자동적으로 화행을 결정할 수 있는 가능성을 제시하였으며 효과적인 자질 선택을 통해 자질의 수를 감소시키고 정보량이 높은 자질을 사용하여 속도와 성능을 향상 시켰다 본 논문은 제안된 시스템을 실제 영역에서 수집되어 전사된 10,285개의 발화와 17개의 화행으로 이루어진 대화 코퍼스에 대해 실험하였다. 본 논문은 이 코퍼스에서 8,349개 발화를 학습 코퍼스로 사용하여, 실험 코퍼스의 1,936개 발화에 대해 1,709개에 대해 정확한 화행을 제시하여, 88.3%의 정확도를 보였다. 이는 자질 선택을 하지 않았을 때 보다 약 8%가 증가된 결과이다.

온톨로지기반 추론을 이용한 시맨틱 검색 시스템 (Semantic Search System using Ontology-based Inference)

  • 하상범;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권3호
    • /
    • pp.202-214
    • /
    • 2005
  • 시맨틱 웹은 단순한 문서들의 링크가 아닌 문서들의 의미와 관계를 표현하는 웹으로 소프트웨어 에이전트가 이해할 수 있도록 구성되어 있다 본 논문에서 제안하는 검색방식은 온톨로지기반의 추론을 통한 시맨틱 검색방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치(exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것 보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적으로 찾게 한다. 이러한 방식은 데이타베이스의 질의문을 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 검색 시스템보다 정화한 검색을 가능하게 한다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시맨틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다.

게르만어의 공명음 중복현상과 후두음이론 (Germanische Resonantengemination und Laryngaltheorie)

  • 전순환
    • 한국독어학회지:독어학
    • /
    • 제5집
    • /
    • pp.1-22
    • /
    • 2002
  • 본 논문의 목적은 게르만제어(예를들어 고트어, 고대북구어, 고고지독일어, 고대영어 등)에 나타나는 공명음중복 현상이 원-인도유럽어시기의 후두음에 기인함을 보이는 것이다. 고트어의 ddj/ggw, 고대북구어의 ggi/ggr, 고고지독일어 ij/uw (이상 소위 '예음화현상'으로 불림)와 그 외 게르만제어에 공통적으로 나타나는 공명음들의 중복, -rr-, -ll-, -nn-, -mm- 등은 원-게르만어시기에 각각 $\ast-ii-,\;\ast-uu-,\;\ast-rr-,\;\ast-ll-,\;\ast-nn-,\;\ast-mm-$ 등으로 소급된다. 그러나 이러한 자음군이 게르만어 이외의 다른 인도유럽어들( 대표적으로 고대인도이란어, 고전희랍어, 라전어 등)과 비교되어 원-인도유럽어시기로 소급되는 경우, 각각 $\ast-iH-,\;\ast-uH-,\;\ast-rH-,\;\ast-lH-,\;\ast-nH-,\;\ast-mH-$ 등으로 재구된다. 따라서 원-게르만어의 자음중복 현상이 후두음의 영향으로 나타난 것으로 해석되는데, 아마도 후두음이 선행하는 공명음에 동화되어 일어난 것으로 보인다. 소쉬르(1987)이래 발전해 온 후두음이론은 현재 그 이론적 틀을 확립한 상태이다. 이 이론은 고전 인도유럽어학에서 설명하지 못했던 여러 언어현상들을 설명하였고, 현대 인도유럽어 역사비교언어학에서 언어변화에 대한 필수적인 설명기재로서 사용되고 있다. 원-인도유럽어의 많은 특징들을 계승한 전형적인 다른 고대 인도유럽어들과는 달리, 시기적으로 늦은 고대 게르만어에서 음운론적 층위에서 공명음중복 현상이 후두음에 기인함은 인도유럽어 역사비교언어학에서 뿐만 아니라 게르만어학에서도 큰 의미를 갖는다고 볼 수 있다.간접으로 본동사 앞에 놓여 있어야 되는 모든 문장성분과 부문장 때문에, 즉 한국어의 전면적인 전위수식 현상으로 흔히 큰 부담/복잡함을 야기한다는 데에 그 원인이 있다. 이러한 상황에서 동사는 가능한 한 그의 문장성분을 줄이려 한다. 통사적으로 보장되어 이미 있으니 말이다. 그래서 한국어 동사의 부정성은 일종의 부담해소 대책으로 간주될 수 있을 것이다. $\ast$ 두 비교 대상에서의 핵 및 최소문장 가능성은 역시 원자가에 대한 비구속성에서 비롯된다. $\ast$ 우리 한국인이 빨리 말할 때 흔히 범하는 부정성으로 인한 인칭변화에서의 오류는 무엇보다도 정형성/제한성을 지닌 독일어 정동사가 인칭 변화하는 데 반해 한국어에서는 부정성/비구속성을 지닌 동사가 그것과는 무관한 페 기인한다. 동사의 속성을 철저히 분석함으로써 이런 과오를 극복해야 할 것이다. 한국어 동사의 부정성은 지금까지 거의 연구되지 않았다. 이 문제는 또한 지속적으로 수많은 다른 자연어들과의 비교분석을 통해 관찰돼야 할 것이다. 이 논문이 이런 연구와 언어습득을 위한 작업에 도움이 되기를 바란다.적 성분구조가 다르다는 것을 알 수 있다. 우리는 이 글이 외국어로서의 독일어를 배우는 이들에게 독일어의 관용구를 보다 올바르게 이해할 수 있는 방법론적인 토대를 제공함은 물론, (관용어) 사전에서 외국인 학습자를 고려하여 관용구를 알기 쉽게 기술하는 데 도움을 줄 수 있기를 바란다.되기 시작하면서 남황해 분지는 구조역전의 현상이 일어났으며, 동시에 발해 분지는 인리형 분지로 발달하게 되었다. 따라서, 올리고세 동안 발해 분지에서는 퇴적작용이, 남황해 분지에서는 심한 구조역전에 의한 분지변형이 동시에 일어났다 올리고세 이후 현재까지, 남황해

  • PDF

한국어 단어 및 문장 분류 태스크를 위한 분절 전략의 효과성 연구 (A Comparative study on the Effectiveness of Segmentation Strategies for Korean Word and Sentence Classification tasks)

  • 김진성;김경민;손준영;박정배;임희석
    • 한국융합학회논문지
    • /
    • 제12권12호
    • /
    • pp.39-47
    • /
    • 2021
  • 효과적인 분절을 통한 양질의 입력 자질 구성은 언어모델의 문장 이해력을 향상하기 위한 필수적인 단계이다. 입력 자질의 품질 제고는 세부 태스크의 성능과 직결된다. 본 논문은 단어와 문장 분류 관점에서 한국어의 언어적 특징을 효과적으로 반영하는 분절 전략을 비교 연구한다. 분절 유형은 언어학적 단위에 따라 어절, 형태소, 음절, 자모 네 가지로 분류하며, RoBERTa 모델 구조를 활용하여 사전학습을 진행한다. 각 세부 태스크를 분류 단위에 따라 문장 분류 그룹과 단어 분류 그룹으로 구분 지어 실험함으로써, 그룹 내 경향성 및 그룹 간 차이에 대한 분석을 진행한다. 실험 결과에 따르면, 문장 분류에서는 단위의 언어학적 분절 전략을 적용한 모델이 타 분절 전략 대비 최대 NSMC: +0.62%, KorNLI: +2.38%, KorSTS: +2.41% 높은 성능을, 단어 분류에서는 음절 단위의 분절 전략이 최대 NER: +0.7%, SRL: +0.61% 높은 성능을 보임으로써, 각 분류 그룹에서의 효과성을 보여준다.

대학수학교육에서의 챗GPT 활용과 사례 (Use of ChatGPT in college mathematics education)

  • 이상구;박도영;이재윤;임동선;이재화
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권2호
    • /
    • pp.123-138
    • /
    • 2024
  • 본 연구는 S대학 <인공지능을 위한 기초수학[Math4AI]> 강좌의 교수·학습과정에서 맞춤형 챗GPT를 개발하여 활용한 경험을 공유한다. 연구진은 ① 먼저 강좌 맞춤형 챗GPT (https://math4ai.solgitmath.com/)를 개발하였다. 이때 챗GPT가 부정확한 정보를 주지 않도록 수년간의 해당 강좌 주요 데이터(교재, 실습실, 토론 기록, 코드 등)를 우선적으로 학습하는 챗GPT의 기능을 적용하였다. ② 학생들이 교재를 스스로 학습하다 궁금한 부분이 생기면, 맞춤형 챗GPT 인터페이스를 통해 자연어로 수학 용어, 정리, 예제, 열린 문제 번호, 핵심어 등을 질문하여 도움을 얻을 수 있도록 하였다. 그러면 챗GPT는 관련된 주요 문제나 용어, 그리고 이전 학생들의 토론에 기반한 몇 가지 샘플 답안 또는 토론 내용과 함께 사용되었던 코드 샘플을 제공한다. ③ 학생들이 챗GPT를 통해 얻은 내용을 스스로 윤문하여 공유하고, 상호 토론하면서, 교재에서 제시하는 주요 개념과 열린 문제의 대부분을 이해하도록 하였다. ④ 학기 말에는 그간 본인이 얻은 열린 문제들에 대한 학습기록을 모아 PBL (Problem-Based Learning) 보고서로 제출하고, 발표하여 강좌를 수료하도록 하였다. 이러한 방식은 학생들이 학습을 포기하지 않고 한 단계 앞으로 더 나아갈 추진력과 동기를 주며, 궁극적으로 각각의 문제를 스스로 해결하는 자기 주도적 학습을 도울 수 있다. 또한 학생들 각자의 수준에 맞추어 실시간으로 최적화된 조언을 제시하므로 강좌뿐만 아니라 대학수학교육 전반에 대한 학생별 맞춤형 교육(personalized education)을 제공할 수 있다. 즉, 학생들이 담당교수(또는 조교)와 AI 조교의 도움으로 실시간 답변과 효과적인 조언을 받을 수 있게 됨을 의미한다. 이는 양질의 조교 부족에 대한 고민을 추가 비용 없이 획기적으로 해결할 수 있다. 본 연구는 강좌의 교수·학습과정에 교재 맞춤형 챗GPT를 접목한 것으로, 인공지능(AI) 기술을 기타 대학수학 과목들(미적분학, 선형대수학, 이산수학, 공학수학, 기초통계학 등)과 초·중·고 수학교육에 적용할 수 있는 새로운 방법을 제시한다. 특히 AI 기술을 적용하여 이전 수강생들의 학습기록(열린 문제 풀이, 토론 자료, 코드 등)을 참고하며, 각자 실습한 결과를 공유 및 상호 토론하여 문제를 해결하는 방식은, 다양한 전공의 학생들이 내용을 더 효과적으로 이해하고, 본인 전공 관련 문제 해결 능력을 향상시키는 데 획기적인 도움을 줄 것으로 예상된다. 또한 교재 맞춤형 챗GPT와 함께 자기주도적인 학습을 경험토록 하는 교수학습 방법은 평생 교육(lifelong learning, extension school, extension college, extended college) 또는 평생학습의 관점에서 중요하다.