• 제목/요약/키워드: 언어 융합

검색결과 526건 처리시간 0.034초

제 2 언어 학습자의 의사소통 전략: 자료융합 분석 (L2 Learners' Communication Strategies: A Data Convergence Analysis)

  • 강수자
    • 한국융합학회논문지
    • /
    • 제6권6호
    • /
    • pp.263-270
    • /
    • 2015
  • 제2언어 학습자들은 의사소통전략을 사용하여 그들이 구두 의사소통에서 직면하게 되는 문제들에 대처한다. 이 전략들이 의사소통과 언어학습에서 주요한 역할을 하기 때문에 제2언어 연구에서 의사소통을 용이하게 하는 전략을 찾아내는 것이 중요하다. 그러나 어떻게 전략을 확인하는가, 특히 연구 자료로 대화 자료, 회상인터뷰 자료, 또는 두 가지의 융합된 자료를 사용하는 것에 대해 논란이 있다. 이 연구에서는 융합자료 분석을 통해 제2언어 학습자들이 사용하는 의사소통전략을 발견해 내고자 하였다. 이 질적 사례연구를 위해 한국인 제2언어 학습자들의 대화 자료와 전략사용을 회고하는 인터뷰 자료가 수집되었다. 이 수집된 자료들의 융합분석을 통해 한국인 제2언어 학습자들이 사용하는 정의대치 전략, 메시지변환 전략, 시간얻기 전략, 이해전략 등의 다양한 의사소통전략들이 확인되었다. 이 연구는 제2언어 의사소통시의 문제점을 해결하는 데 의사소통전략들이 효율적임을 보여주며, 의사소통 연구에 융합자료 분석이 유용하다는 것을 시사해준다.

사실관계 확인을 위한 다중 대규모 언어모델의 입출력 제어 구조화 방법 (Structuring Input and Output Control of Multiple Large Language Models for Fact-Checking)

  • 정지수;이치현;강현석;정상근;노윤형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-161
    • /
    • 2023
  • 최근 대규모 언어 모델의 활용 방법에 대한 많은 관심이 지속되고 있다. LLM이 생성한 정보의 가장 중요한 도전 과제는 출력 문장이 사실인지 판단하기 어렵다는 점이다. 본 논문은 하나 또는 복수의 LLM를 구조화하여, 생산되는 다양한 결과를 활용하는 방안을 탐구한다. LLM이 생성한 출력 정보를 고려하여 사실 관계 확인 과제를 수행함에 있어서, 성능 향상 가능성을 평가하기 위한 실험을 진행했다. 대규모 언어모델의 구조화를 통해 입력 정보의 제어를 할 경우, 기존 최고 성능보다 4.75의 정확도 향상을 관찰할 수 있었다.

  • PDF

복수 대규모 언어 모델에 기반한 제어 가능형 데이터 증강 프레임워크 (Controllable data augmentation framework based on multiple large-scale language models)

  • 강현석;남궁혁;정지수;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2023
  • 데이터 증강은 인공지능 모델의 학습에서 필요한 데이터의 양이 적거나 편향되어 있는 경우, 이를 보완하여 모델의 성능을 높이는 데 도움이 된다. 이미지와는 달리 자연어의 데이터 증강은 문맥이나 문법적 구조와 같은 특징을 고려해야 하기 때문에, 데이터 증강에 많은 인적자원이 소비된다. 본 연구에서는 복수의 대규모 언어 모델을 사용하여 입력 문장과 제어 조건으로 프롬프트를 구성하는 데 최소한의 인적 자원을 활용한 의미적으로 유사한 문장을 생성하는 방법을 제안한다. 또한, 대규모 언어 모델을 단독으로 사용하는 것만이 아닌 병렬 및 순차적 구조로 구성하여 데이터 증강의 효과를 높이는 방법을 제안한다. 대규모 언어 모델로 생성된 데이터의 유효성을 검증하기 위해 동일한 개수의 원본 훈련 데이터와 증강된 데이터를 한국어 모델인 KcBERT로 다중 클래스 분류를 수행하였을 때의 성능을 비교하였다. 다중 대규모 언어 모델을 사용하여 데이터 증강을 수행하였을 때, 모델의 구조와 관계없이 증강된 데이터는 원본 데이터만을 사용하였을 때보다 높거나 그에 준하는 정확도를 보였다. 병렬 구조의 다중 대규모 언어 모델을 사용하여 400개의 원본 데이터를 증강하였을 때에는, 원본 데이터의 최고 성능인 0.997과 0.017의 성능 차이를 보이며 거의 유사한 학습 효과를 낼 수 있음을 보였다.

  • PDF

병원(임상) 실습 시 응급구조학과 학생이 경험하는 언어폭력에 대한 융합적 반응 및 영향 (Convergent responses and impacts of verbal abuse during clinical training practice of Paramedic students)

  • 안희정
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.183-190
    • /
    • 2018
  • 본 연구는 병원(임상) 실습 시에 응급구조학과 학생의 언어폭력 경험, 융합적 반응 및 예상되는 부정적인 영향을 파악하기 위해 253명의 응급구조학과 학생을 대상으로 설문조사를 실시하였다. 연구결과는 첫째, 언어폭력은 34%(86명)가 경험하였고, 언어폭력의 가해자는 환자와 보호자가 가장 많았다. 둘째, 환자 및 보호자, 응급구조사, 간호사 및 의사로부터의 언어폭력의 내용으로 '나에게 반말이나 막말을 한 적이 있다'가 가장 많았다. 셋째, 언어폭력 경험 시 대상자의 감정 반응으로는 '화난다'가, 대처 반응으로는 '참는다'가 가장 많았다. 넷째, 예상되는 부정적인 영향으로 '실습 생산성이 저하될 것이다'가 가장 많았다. 다섯째, 응급구조사에 의한 언어폭력 경험 시 감정반응과 상관관계를 보였으며(r=.458 p=.000), 감정반응은 스트레스와 예상되는 부정적인 영향과 상관관계를 보였다(r=.553 p=.000, r=.540 p=.000). 결론적으로 병원(임상) 실습 전 언어폭력에 대한 예방 교육과 프로토콜 화 된 적극적인 대처 방법이 필요할 것이다.

강화된 지배소-의존소 제약규칙을 적용한 의존구문분석 모델 : 심층학습과 언어지식의 결합 (Dependency parsing applying reinforced dominance-dependency constraint rule: Combination of deep learning and linguistic knowledge)

  • 신중민;조상현;박승렬;최성기;김민호;김미연;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.289-294
    • /
    • 2022
  • 의존구문분석은 문장을 의존관계(의존소-지배소)로 분석하는 구문분석 방법론이다. 현재 사전학습모델을 사용한 전이 학습의 딥러닝이 좋은 성능을 보이며 많이 연구되지만, 데이터셋에 의존적이며 그로 인한 자료부족 문제와 과적합의 문제가 발생한다는 단점이 있다. 본 논문에서는 언어학적 지식에 기반한 강화된 지배소-의존소 제약규칙 에지 알고리즘을 심층학습과 결합한 모델을 제안한다. TTAS 표준 가이드라인 기반 모두의 말뭉치로 평가한 결과, 최대 UAS 96.28, LAS 93.19의 성능을 보였으며, 선행연구 대비 UAS 2.21%, LAS 1.84%의 향상된 결과를 보였다. 또한 적은 데이터셋으로 학습했음에도 8배 많은 데이터셋 학습모델 대비 UAS 0.95%의 향상과 11배 빠른 학습 시간을 보였다. 이를 통해 심층학습과 언어지식의 결합이 딥러닝의 문제점을 해결할 수 있음을 확인하였다.

  • PDF

대구·경북지역 언어재활사의 공감능력과 직무만족도 간의 관련성에 대한 융합 연구 (A Convergence Study on the Relationship between Empathy Abilities and Job Satisfaction of Speech and Language Rehabilitation in Daegu and Gyeongbuk)

  • 김선희
    • 한국융합학회논문지
    • /
    • 제12권6호
    • /
    • pp.57-63
    • /
    • 2021
  • 본 연구는 대구·경북지역 언어재활사의 개인적 특성과 공감능력 및 직무만족도 간의 관계와 특히 인지적 및 정서적 공감능력과 직무만족도 간의 관계를 파악하여 언어재활사의 직무만족도 향상을 위한 기초 자료를 제공하기 위한 융합연구이다. 연구대상은 대구·경북지역에서 근무하는 언어재활사를 대상으로 총 111명의 설문조사를 분석하였다. 자료분석은 연구 목적에 따라 SPSS/PC 21.0 통계 프로그램을 이용하여 t-test와 ANOVA 및 상관분석을 실시하였다. 연구결과 개인적 특성과 공감능력 및 직무만족도 간의 관련성이 높게 나타났고, 공감능력의 하위 요인인 인지적 및 정서적 공감능력과 직무만족도 간의 관련성이 높은 것으로 나타났다. 이러한 결과를 토대로 추후 집체 및 소집단이나 온·오프라인 교육 등 다양한 교육 프로그램 연계와 대학에서의 공감능력 향상을 위한 비교과 및 교과목 개설이 필요하다는 것을 알 수 있었다. 그리고 향후 공감능력 향상을 위한 전국 단위 언어재활사를 대상으로 한 비교과 및 교과목 이수여부에 따른 언어재활사의 공감능력과 직무만족도를 알아보기 위한 후속연구가 필요하다.

거대 언어 모델(LLM)을 이용한 비훈련 이진 감정 분류 (Utilizing Large Language Models for Non-trained Binary Sentiment Classification)

  • 안형진;황태욱;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.66-71
    • /
    • 2023
  • ChatGPT가 등장한 이후 다양한 거대 언어 모델(Large Language Model, LLM)이 등장하였고, 이러한 LLM을 목적에 맞게 파인튜닝하여 사용할 수 있게 되었다. 하지만 LLM을 새로 학습하는 것은 물론이고, 단순 튜닝만 하더라도 일반인은 시도하기 어려울 정도의 많은 컴퓨팅 자원이 필요하다. 본 연구에서는 공개된 LLM을 별도의 학습 없이 사용하여 zero-shot 프롬프팅으로 이진 분류 태스크에 대한 성능을 확인하고자 했다. 학습이나 추가적인 튜닝 없이도 기존 선학습 언어 모델들에 준하는 이진 분류 성능을 확인할 수 있었고, 성능이 좋은 LLM의 경우 분류 실패율이 낮고 일관적인 성능을 보여 상당히 높은 활용성을 확인하였다.

  • PDF

대형 언어 모델 기반 신경망을 활용한 강구조물 부재 중량비 예측 (Predicting Steel Structure Product Weight Ratios using Large Language Model-Based Neural Networks)

  • 박종혁;유상현;한수희;김경준
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.119-126
    • /
    • 2024
  • 건물 정보 모델(BIM: Building Information Model)은 관련 기업의 개별화된 프로젝트와 학습 데이터양 부족으로 인해 인공지능(AI: Artificial Intelligence) 기반 BIM 애플리케이션 개발이 쉽지 않다. 본 연구에서는 데이터가 제한적인 상황에서 BIM의 강구조물 부재 중량비를 예측하기 위해 사전 학습이 된 대형 언어 모델을 기반으로 신경망을 학습하는 방법을 제시하고 실험하였다. 제안된 모델은 대형 언어 모델을 활용하여 BIM에 내재하는 데이터 부족 문제를 극복할 수 있어 데이터의 양이 부족한 상황에서도 성공적인 학습이 가능하며 대형 언어 모델과 연계된 신경망을 활용하여 자연어와 더불어 숫자 데이터까지 처리할 수 있다. 실험 결과는 제안된 대형 언어 모델 기반 신경망이 기존 소형 언어 모델 기반보다 높은 정확도를 보였다. 이를 통해, 대형 언어 모델이 BIM에 효과적으로 적용될 수 있음이 확인되었으며, 향후 건물 사고 예방 및 건설 비용의 효율적인 관리가 기대된다.

Sent2Vec을 이용한 아동 발화의 화제 변경 탐지 (Detection of Topic Changes in Child Speech Using Sent2Vec)

  • 허탁성;이윤경;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.343-346
    • /
    • 2019
  • 언어 병리학에서는 연령별 대화 능력 발달에 관한 연구에 관심이 많다. 하지만 이러한 연구는 많은 시간과 비용이 소모된다. 이를 해결하기 위해, 본 연구에서는 대화 능력 발달의 많은 연구 중 한 가지 방법인 화제 변경을 Sent2Vec을 이용하여 자동적으로 탐지해주는 방법을 제안한다. 아동의 연속된 두 발화를 비교하여 화제의 변경을 Sent2Vec의 코사인 유사도를 통해 찾아냈다. 본 연구에서는 언어 병리학에서의 연구 결과와 비교를 하기 위해 초등학생 1학년, 3학년, 5학년 집단의 데이터를 사용하였다. 본 연구에서 제안한 방법의 결과와 언어 병리학에서 연구한 결과의 상관관계가 99.95%로 매우 높음을 확인할 수 있었다. 이러한 화제 변경 탐지를 자동화함으로써, 언어 연구에 필요한 시간과 비용을 크게 절감할 수 있다.

  • PDF

도메인 변화에 강건한 사전학습 표 언어모형 (Domain-agnostic Pre-trained Language Model for Tabular Data)

  • 조상현;최제훈;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.346-349
    • /
    • 2021
  • 표 기계독해에서는 도메인에 따라 언어모형에 필요한 지식이나 표의 구조적인 형태가 변화하면서 텍스트 데이터에 비해서 더 큰 성능 하락을 보인다. 본 논문에서는 표 기계독해에서 이러한 도메인의 변화에 강건한 사전학습 표 언어모형 구축을 위한 의미있는 표 데이터 선별을 통한 사전학습 데이터 구축 방법과 적대적인 학습 방법을 제안한다. 추출한 표 데이터에서 구조적인 정보가 없이 웹 문서의 장식을 위해 사용되는 표 데이터 검출을 위해 Heuristic을 통한 규칙을 정의하여 HEAD 데이터를 식별하고 표 데이터를 선별하는 방법을 적용했으며, 구조적인 정보를 가지는 일반적인 표 데이터와 엔티티에 대한 지식 정보를 가지는 인포박스 데이터간의 적대적 학습 방법을 적용했다. 기존의 정제되지 않는 데이터로 학습했을 때와 비교하여 데이터를 정제하였을 때, KorQuAD 표 데이터에서 f1 3.45, EM 4.14가 증가하였으며, Spec 표 질의응답 데이터에서 정제하지 않았을 때와 비교하여 f1 19.38, EM 4.22가 증가한 성능을 보였다.

  • PDF