• 제목/요약/키워드: 언어유도

검색결과 236건 처리시간 0.023초

LLM을 활용한 오픈 도메인 대화 시스템의 유해성을 완화하는 데이터 증강 기법 (Data Augmentation for Alleviating Toxicity of Open-Domain Dialogue System using LLM)

  • 김산;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.346-351
    • /
    • 2023
  • 오픈 도메인 대화 시스템은 산업에서 다양하게 활용될 수 있지만 유해한 응답을 출력할 수 있다는 위험성이 지적되어 왔다. 본 논문에서는 언급된 위험성을 완화하기 위해 데이터 측면에서 대화 시스템 모델을 개선하는 방법을 제안한다. 대화 모델의 유해한 응답을 유도하도록 설계된 데이터셋을 사용하여 모델이 올바르지 못한 응답을 생성하게 만들고, 이를 LLM을 활용하여 안전한 응답으로 수정한다. 또한 LLM이 정확하게 수정하지 못하는 경우를 고려하여 추가적인 필터링 작업으로 데이터셋을 보완한다. 생성된 데이터셋으로 추가 학습된 대화 모델은 기존 대화 모델에 비해 대화 일관성 및 유해성 면에서 성능이 향상되었음을 확인했다.

  • PDF

언어 정보가 반영된 문장 점수를 활용하는 삭제 기반 문장 압축 (Deletion-Based Sentence Compression Using Sentence Scoring Reflecting Linguistic Information)

  • 이준범;김소언;박성배
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.125-132
    • /
    • 2022
  • 문장 압축은 원본 문장의 중요한 의미는 유지하면서 길이가 축소된 압축 문장을 생성하는 자연어처리 태스크이다. 문법적으로 적절한 문장 압축을 위해, 초기 연구들은 사람이 정의한 언어 규칙을 활용하였다. 또한 시퀀스-투-시퀀스 모델이 기계 번역과 같은 다양한 자연어처리 태스크에서 좋은 성능을 보이면서, 이를 문장 압축에 활용하고자 하는 연구들도 존재했다. 하지만 언어 규칙을 활용하는 연구의 경우 모든 언어 규칙을 정의하는 데에 큰 비용이 들고, 시퀀스-투-시퀀스 모델 기반 연구의 경우 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 이를 해결할 수 있는 방법으로 사전 학습된 언어 모델인 BERT를 활용하는 문장 압축 모델인 Deleter가 제안되었다. Deleter는 BERT를 통해 계산된 perplexity를 활용하여 문장을 압축하기 때문에 문장 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않다는 장점이 있다. 하지만 Deleter는 perplexity만을 고려하여 문장을 압축하기 때문에, 문장에 속한 단어들의 언어 정보를 반영하여 문장을 압축하지 못한다. 또한, perplexity 측정을 위한 BERT의 사전 학습에 사용된 데이터가 압축 문장과 거리가 있어, 이를 통해 측정된 perplexity가 잘못된 문장 압축을 유도할 수 있다는 문제점이 있다. 이를 해결하기 위해 본 논문은 언어 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 계산에 반영하는 방법을 제안한다. 또한 고유명사가 자주 포함되어 있으며, 불필요한 수식어가 생략되는 경우가 많은 뉴스 기사 말뭉치로 BERT를 fine-tuning하여 문장 압축에 적절한 perplexity를 측정할 수 있도록 하였다. 영어 및 한국어 데이터에 대한 성능 평가를 위해 본 논문에서 제안하는 LI-Deleter와 비교 모델의 문장 압축 성능을 비교 실험을 진행하였고, 높은 문장 압축 성능을 보임을 확인하였다.

음악적 단서 및 후속 자극에 따른 자폐스펙트럼장애 아동의 공동주의 반응 행동 비교 (Analysis of Joint Attention Behaviors in Children With Autism Spectrum Disorder Depending on the Type of Attentional Cue and Reinforcing Stimulus)

  • 김온유
    • 인간행동과 음악연구
    • /
    • 제21권1호
    • /
    • pp.69-87
    • /
    • 2024
  • 본 연구는 자폐스펙트럼장애(Autism Spectrum Disorder, 이하 ASD) 아동을 대상으로 음악적 단서 및 후속 자극에 따른 공동주의 반응 행동이 달라지는지 알아보고, 비장애(neurotypically developing, 이하 NT) 아동 그룹과 비교하는 실험연구이다. 본 연구의 대상자는 만 3세에서 5세 사이의 ASD 아동 13명과 NT 아동 14명이다. 본 연구에서는 공동주의 반응을 유도하는 단서(음악적 단서 대 언어적 단서)와 아동의 공동주의 반응 행동에 대한 후속 자극(언어 자극 대소리 자극 대 음악 자극)을 구성하고 총 6가지 과제 조건을 2회씩 총 12회 제시하였다. 먼저, 주의 유도 단서를 제공하고 3초 이내 대상자의 주의 전환을 평가하였고 대상자의 공동주의 반응 행동이 나타난 경우, 후속 자극을 제공하였으며 후속 자극을 제공하는 동안 대상자의 사회적 참조 행동의 발생 빈도를 측정하여 비교 분석하였다. 연구 결과, 주의 유도 단계에서는 음악적 단서를 제공했을 때 ASD 아동의 공동주의 반응 행동 수준을 높게 유도하는 것으로 나타나 선행연구와 일치한 결과를 보였다. 이어 후속 자극 제공 단계에서는 음악 후속 자극이 ASD 아동의 사회적 참조 행동의 빈도를 증가시킨 것으로 확인되었다. 이는 음악 후속 자극이 단서로서의 감각자극에서 나아가 대상자로 하여금 타인의 사회적, 정서적 정보를 이해하고 반응하도록 유도하는데 그 적용 범위가 확장된 것에 의의가 있다. 또한, ASD 아동의 공동주의 행동 이후 제공하는 후속 음악 자극이 효과적인 사회적 강화 요인이 될 수 있음을 시사한다.

과학고 토론수업을 위한 수업모형 개발과 적용과정에서 나타난 언어적 상호작용의 특징 (Development of the Instructional Model Emphasizing Discussion and the Characteristics of Verbal Interactions during its Implementation in a Science High School)

  • 김현정;최병순
    • 한국과학교육학회지
    • /
    • 제29권4호
    • /
    • pp.359-372
    • /
    • 2009
  • 이 연구에서는 과학 영재를 위한 토론수업을 위해 새로운 FPHER (problem finding, prediction & discussion, hands-on & experiment, explanation & arrangement, enrichment) 수업 모형을 개발하고, 이를 적용하는 과정에서 나타나는 언어적 상호작용의 특징을 분석하여, 수업 과정에서 나타난 언어적 상호작용의 전반적인 특징 및 수업단계별 특징을 알아보았다. 연구를 위해 과학고등학교 1학년 화학수업 시간을 이용하여 학생들에게 수업 처치를 하였으며, 각 모둠별로 학생들의 토론 내용을 녹음하고, 분석하였다. 연구 결과, 개발된 FPHER 수업 모형은 대부분 과제와 관련된 인지적 영역의 상호작용을 유도하였으나, 의견받기 보다는 의견제시가 우세하였다. F 단계에서 전반적으로 상호작용이 적었고, P 단계에서는 과제해결 관련 제안과 자신감 부족이 많았다. H 단계에서는 과제진행 관련제안이 많고 지시가 많았다. E 단계에서는 질문과 설명, 불만과 자신감 부족이 많았다. R 단계는 상위수준 상호작용을 유도하였으며, 주로 활동지와 상호작용을 하며 상당히 수준 높은 문제 해결력을 보였다. 앞으로 FPHER 수업 모형에 따른 학생-학생 간 상호작용과 교사가 학생의 설명에 반론을 제기하거나 정교화나 정당화를 요구함으로써 사고를 유도하는 형태의 수업에 익숙해 질 수 있도록 교사와 학생 간의 상호작용이 활발할 수 있는 수업전략의 심층적인 연구가 필요하다.

인공지능 기반 사회적 지지를 위한 대형언어모형의 공감적 추론 향상: 심리치료 모형을 중심으로 (Enhancing Empathic Reasoning of Large Language Models Based on Psychotherapy Models for AI-assisted Social Support)

  • 이윤경;이인주;신민정;배서연;한소원
    • 인지과학
    • /
    • 제35권1호
    • /
    • pp.23-48
    • /
    • 2024
  • 대형언어모형(LLM)을 현실에 적용하려는 지속적인 노력에도 불구하고, 인공지능이 맥락을 이해하고 사람의 의도에 맞게 사회적 지지를 제공하는 능력은 아직 제한적이다. 본 연구에서는 LLM이 사람의 감정 상태를 추론하도록 유도하기 위해, 심리 치료 이론을 기반으로 한 공감 체인(Chain of Empathy, CoE) 프롬프트 방법을 새로 개발했다. CoE 기반 LLM은 인지-행동 치료(CBT), 변증법적 행동 치료(DBT), 인간 중심 치료(PCT) 및 현실 치료(RT)와 같은 다양한 심리 치료 방식을 참고하였으며, 각 방식의 목적에 맞게 내담자의 정신 상태를 해석하도록 설계했다. CoE 기반 추론을 유도하지 않은 조건에서는 LLM이 사회적 지지를 구하는 내담자의 글에 주로 탐색적 공감 표현(예: 개방형 질문)만을 생성했으며, 추론을 유도한 조건에서는 각 심리 치료 모형을 대표하는 정신 상태 추론 방법과 일치하는 다양한 공감 표현을 생성했다. 공감 표현 분류 과제에서 CBT 기반 CoE는 감정적 반응, 탐색, 해석 등을 가장 균형적으로 분류하였으나, DBT 및 PCT 기반 CoE는 감정적 반응 공감 표현을 더 잘 분류하였다. 추가로, 각 프롬프트 조건 별로 생성된 텍스트 데이터를 정성적으로 분석하고 정렬 정확도를 평가하였다. 본 연구의 결과는 감정 및 맥락 이해가 인간-인공지능 의사소통에 미치는 영향에 대한 함의를 제공한다. 특히 인공지능이 안전하고 공감적으로 인간과 소통하는 데 있어 추론 방식이 중요하다는 근거를 제공하며, 이러한 추론 능력을 높이는 데 심리학의 이론이 인공지능의 발전과 활용에 기여할 수 있음을 시사한다.

도메인 온톨로지 구축을 위한 UML 모델의 OWL 변환 연구 (A Research for Converting UML model to Domain Ontology with OWL)

  • 나홍석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.183-186
    • /
    • 2006
  • 독립적으로 구축되고 운영되어온 정보 자원의 공유와 통합된 서비스를 위해서 공통 온톨로지를 구축하고 활용하는 방법에 대한 연구가 활발히 진행되고 있지만, 온톨로지의 구축에 소요되는 많은 시간과 높은 비용은 온톨로지를 이용한 정보 통합의 있어 큰 장애가 된다. 본 논문에서는 UML 로 작성된 시스템 모델로부터 온톨로지 구축에 필요한 지식을 유도하여 초기 단계 도메인 온톨로지를 구축하는 방법을 제시하였다. 특히, UML 모델을 온톨로지 언어인 OWL로 변환할 수 있는 구체적인 방향을 제시함으로써, 향후 자동화된 도구 개발의 이론적 기반을 될 것으로 기대한다.

  • PDF

실시간 시스템 및 제어 컴퓨터의 기본 특성

  • 김학배
    • 전기의세계
    • /
    • 제46권5호
    • /
    • pp.19-27
    • /
    • 1997
  • 본 논문은 제 2장에서 실시간 시스템의 기본 특성에 대해 보다 자세하게 살펴본 후, 제 3장에서 플랜트의 동적 특성을 관련 제어이론을 활용하여 실시간 시스템의 가장 중요한 정보인 작업 데드라인을 유도하는 방법을 살펴본다. 제 4장에서는 효율적인 실시간 제어 컴퓨터를 설계 및 평가하기 위해 실시간 시스템 분야에서 수행되는 연구동향으로 다음과 같은 세부 분야를, i) 스케줄링, ii)실시간 컴퓨터 언어, iii)실시간 운영체계(O/S), iv)실시간 동기화, v) 실시간 H/W 구조(architecture), vi) 실시간 통신, vii) 고장허용기법(fault-tolerance)에 대해 설명하고, 마지막 장에서 향후의 관련 연구 과제들에 대해 간단한 소개로 결론짓는다.

  • PDF

제한 영역 대화에 나타난 화행 흐름에 관한 연구 (Speech Act Flow in Natural Language Dialogues)

  • 송도규;차건회;박재득
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.168-170
    • /
    • 1998
  • 본 논문에서는 화행처리를 기반으로 한 중고자동차 매매 영역 대화시스템[1] 구축 과정에서 참조한 대화 시나리오에 나타난 화행의 흐름을 살펴보고자 한다. 자연언어 특히 대화에 나타나는 발화들은 어떤 행위를 구성하는 경향이 강하고 이 행위들은 각 발화의 언표내적 행위로 결정되며 대화의 흐름은 이 언표내적 행위를 교환함으로써 이루어진다. 다라서 단일 발화들이 모여서 이루는 대화에는 화행의 흐름이 있기 마련이다. 우리는 본 논문에서 대화시스템의 효율적이 대화관리를 위해서 제한 영역 대화에 나타난 화행의 흐름을 올바로 분석하고 규명하여 대화를 자연스럽게 유도하도록 한다.

  • PDF

분산환경의 결험허용 응용소프트웨어 개발을 위한 명세방법

  • 김정술;강병욱
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1998년도 춘계공동학술대회 발표논문집 IMF시대의정보화 추진전략
    • /
    • pp.229-233
    • /
    • 1998
  • 이 논문에서 우리는 분산환경의 결함허용 응용소프트웨어 개발을 위한 명세방법을 제안한다. 즉, 시스템의 오류시에도 복구 가능한 논리전달을 위한 명세언어를 제공하는데 분산환경에 적합한 package개념과 객체에 기반하여 시스템을 이끈다. 이 명세방법을 이용하면 triple modular redundancy 나 voted-process pairs 등이 쉽게 명세 가능하다. 특히 , 본 논문은 DARTS 설계방법의 모듈객체와의 접목을 통하여 자연스럽게 실시간 설계로 유도한다.

불량식품 앱 (Junk Food App)

  • 김영철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.425-426
    • /
    • 2018
  • 현재 사회적인 이슈가 되고 있는 불량 식품에 대한 경각심을 아이들에게 심어주어 좋은 식습관을 유지하도록 교육하는 앱을 개발하고자 한다. 개발하고자 하는 앱은 몸에 안좋은 불량식품을 좋아하는 아이들에게 경각심을 일깨워 주며, 불량 식품에 첨가된 발암불질, 표백제 등이 성장기 아이들에게 치명적임을 인식시키는 정보제공을 하며, 게임 형식을 통해 스스로 좋은 것과 나쁜 것에 대해 확인하여 창의적 자아활동을 유도 한다. 음식에 대한 올바른 이해와 함께 성장기 어린이들의 인지 및 언어 능력을 학습하고자 개발하였다.

  • PDF