• Title/Summary/Keyword: 언어 융합

Search Result 526, Processing Time 0.025 seconds

L2 Learners' Communication Strategies: A Data Convergence Analysis (제 2 언어 학습자의 의사소통 전략: 자료융합 분석)

  • Kang, Su-Ja
    • Journal of the Korea Convergence Society
    • /
    • v.6 no.6
    • /
    • pp.263-270
    • /
    • 2015
  • L2 learners deal with communication problems encountered during the course of their oral communication by employing what are known as communication strategies(CSs). As CSs play a significant role in communication and language learning, identifying CSs that facilitate communication has become important in L2 research. However, there have been some controversies about how to identify CSs, especially about data sources: conversation data, retrospective interview data, or combining two types of data. Drawing on the advantages of converged data, this study aimed to identify CSs that L2 learners use in their English communication through a convergence analysis of data. In this qualitative case study, the data were collected from Korean L2 learners' conversations and retrospective verbal reports in stimulated recall interviews. Using a data convergence approach, various CSs were identified: definition replacement CSs, message change CSs, time-gaining CSs, and comprehension CSs. This study suggests the effectiveness of CSs in handling L2 communication problems and the usefulness of data convergence in L2 CS research.

Structuring Input and Output Control of Multiple Large Language Models for Fact-Checking (사실관계 확인을 위한 다중 대규모 언어모델의 입출력 제어 구조화 방법)

  • Jeesu Jung;Chihyeon Lee;Hyeonseok Kang;Sangkeun Jung;Yoonhyung Roh
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.155-161
    • /
    • 2023
  • 최근 대규모 언어 모델의 활용 방법에 대한 많은 관심이 지속되고 있다. LLM이 생성한 정보의 가장 중요한 도전 과제는 출력 문장이 사실인지 판단하기 어렵다는 점이다. 본 논문은 하나 또는 복수의 LLM를 구조화하여, 생산되는 다양한 결과를 활용하는 방안을 탐구한다. LLM이 생성한 출력 정보를 고려하여 사실 관계 확인 과제를 수행함에 있어서, 성능 향상 가능성을 평가하기 위한 실험을 진행했다. 대규모 언어모델의 구조화를 통해 입력 정보의 제어를 할 경우, 기존 최고 성능보다 4.75의 정확도 향상을 관찰할 수 있었다.

  • PDF

Controllable data augmentation framework based on multiple large-scale language models (복수 대규모 언어 모델에 기반한 제어 가능형 데이터 증강 프레임워크)

  • Hyeonseok Kang;Hyuk Namgoong;Jeesu Jung;Sangkeun Jung
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.3-8
    • /
    • 2023
  • 데이터 증강은 인공지능 모델의 학습에서 필요한 데이터의 양이 적거나 편향되어 있는 경우, 이를 보완하여 모델의 성능을 높이는 데 도움이 된다. 이미지와는 달리 자연어의 데이터 증강은 문맥이나 문법적 구조와 같은 특징을 고려해야 하기 때문에, 데이터 증강에 많은 인적자원이 소비된다. 본 연구에서는 복수의 대규모 언어 모델을 사용하여 입력 문장과 제어 조건으로 프롬프트를 구성하는 데 최소한의 인적 자원을 활용한 의미적으로 유사한 문장을 생성하는 방법을 제안한다. 또한, 대규모 언어 모델을 단독으로 사용하는 것만이 아닌 병렬 및 순차적 구조로 구성하여 데이터 증강의 효과를 높이는 방법을 제안한다. 대규모 언어 모델로 생성된 데이터의 유효성을 검증하기 위해 동일한 개수의 원본 훈련 데이터와 증강된 데이터를 한국어 모델인 KcBERT로 다중 클래스 분류를 수행하였을 때의 성능을 비교하였다. 다중 대규모 언어 모델을 사용하여 데이터 증강을 수행하였을 때, 모델의 구조와 관계없이 증강된 데이터는 원본 데이터만을 사용하였을 때보다 높거나 그에 준하는 정확도를 보였다. 병렬 구조의 다중 대규모 언어 모델을 사용하여 400개의 원본 데이터를 증강하였을 때에는, 원본 데이터의 최고 성능인 0.997과 0.017의 성능 차이를 보이며 거의 유사한 학습 효과를 낼 수 있음을 보였다.

  • PDF

Convergent responses and impacts of verbal abuse during clinical training practice of Paramedic students (병원(임상) 실습 시 응급구조학과 학생이 경험하는 언어폭력에 대한 융합적 반응 및 영향)

  • Ahn, Hee Jeong
    • Journal of the Korea Convergence Society
    • /
    • v.9 no.10
    • /
    • pp.183-190
    • /
    • 2018
  • This study was conducted to investigate experiences, convergent responses and expected negative impacts of verbal abuse of 253 paramedic students when they were doing clinical training practice. The results were as follows. First, 34%(86 people) experienced verbal abuse, the most frequently verbal abuse was done by Patients and Patient's family. Second, the most frequently contents of verbal abuse by Patient and Patient's family, Paramedic, Doctor and Nurse was 'Talking down or rude talk to me'. Third, the most frequently emotional responses of the students was 'Angry' and coping was 'Tolerate'. Fourth, the most frequently expected negative impacts was 'Practice productivity will be compromised'. Fifth, when experiencing verbal abuse by Paramedic was correlated with emotional responses(r=.458 p=.000), emotional responses was correlated with stress and expected negative impacts(r=.553 p=.000, r=.540 p=.000). In conclusion, it will be necessary to provide preventive education on verbal abuse before clinical training practice and to take active measures that have been protocolized.

Dependency parsing applying reinforced dominance-dependency constraint rule: Combination of deep learning and linguistic knowledge (강화된 지배소-의존소 제약규칙을 적용한 의존구문분석 모델 : 심층학습과 언어지식의 결합)

  • JoongMin Shin;Sanghyun Cho;Seunglyul Park;Seongki Choi;Minho Kim;Miyeon Kim;Hyuk-Chul Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.289-294
    • /
    • 2022
  • 의존구문분석은 문장을 의존관계(의존소-지배소)로 분석하는 구문분석 방법론이다. 현재 사전학습모델을 사용한 전이 학습의 딥러닝이 좋은 성능을 보이며 많이 연구되지만, 데이터셋에 의존적이며 그로 인한 자료부족 문제와 과적합의 문제가 발생한다는 단점이 있다. 본 논문에서는 언어학적 지식에 기반한 강화된 지배소-의존소 제약규칙 에지 알고리즘을 심층학습과 결합한 모델을 제안한다. TTAS 표준 가이드라인 기반 모두의 말뭉치로 평가한 결과, 최대 UAS 96.28, LAS 93.19의 성능을 보였으며, 선행연구 대비 UAS 2.21%, LAS 1.84%의 향상된 결과를 보였다. 또한 적은 데이터셋으로 학습했음에도 8배 많은 데이터셋 학습모델 대비 UAS 0.95%의 향상과 11배 빠른 학습 시간을 보였다. 이를 통해 심층학습과 언어지식의 결합이 딥러닝의 문제점을 해결할 수 있음을 확인하였다.

  • PDF

A Convergence Study on the Relationship between Empathy Abilities and Job Satisfaction of Speech and Language Rehabilitation in Daegu and Gyeongbuk (대구·경북지역 언어재활사의 공감능력과 직무만족도 간의 관련성에 대한 융합 연구)

  • Kim, Sun-Hee
    • Journal of the Korea Convergence Society
    • /
    • v.12 no.6
    • /
    • pp.57-63
    • /
    • 2021
  • The purpose of the convergence study is to provide basic data for improving job satisfaction of speech and language therapists by identifying the relationship between personal characteristics, empathy ability, and job satisfaction of speech and language therapists, especially between cognitive and emotional empathy ability and job satisfaction. The subjects of the study were 111 people of speech and language therapists working in Daegu and Gyeongbuk. For data analysis, t-test, ANOVA, and correlation analysis were performed using the SPSS/PC 21.0 statistical program according to the purpose of the study. As a result of the study, the relationship between empathy ability and job satisfaction was found to be high, and there was a high correlation between cognitive and emotional empathy ability, which is a sub-factor of empathy ability, and job satisfaction. Therefore, follow-up research is needed to identify the empathy and job satisfaction about nationwide speech and language therapists for implementing various education programs and improving empathy skills in the future.

Utilizing Large Language Models for Non-trained Binary Sentiment Classification (거대 언어 모델(LLM)을 이용한 비훈련 이진 감정 분류)

  • Hyungjin Ahn;Taewook Hwang;Sangkeun Jung
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.66-71
    • /
    • 2023
  • ChatGPT가 등장한 이후 다양한 거대 언어 모델(Large Language Model, LLM)이 등장하였고, 이러한 LLM을 목적에 맞게 파인튜닝하여 사용할 수 있게 되었다. 하지만 LLM을 새로 학습하는 것은 물론이고, 단순 튜닝만 하더라도 일반인은 시도하기 어려울 정도의 많은 컴퓨팅 자원이 필요하다. 본 연구에서는 공개된 LLM을 별도의 학습 없이 사용하여 zero-shot 프롬프팅으로 이진 분류 태스크에 대한 성능을 확인하고자 했다. 학습이나 추가적인 튜닝 없이도 기존 선학습 언어 모델들에 준하는 이진 분류 성능을 확인할 수 있었고, 성능이 좋은 LLM의 경우 분류 실패율이 낮고 일관적인 성능을 보여 상당히 높은 활용성을 확인하였다.

  • PDF

Predicting Steel Structure Product Weight Ratios using Large Language Model-Based Neural Networks (대형 언어 모델 기반 신경망을 활용한 강구조물 부재 중량비 예측)

  • Jong-Hyeok Park;Sang-Hyun Yoo;Soo-Hee Han;Kyeong-Jun Kim
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.19 no.1
    • /
    • pp.119-126
    • /
    • 2024
  • In building information model (BIM), it is difficult to train an artificial intelligence (AI) model due to the lack of sufficient data about individual projects in an architecture firm. In this paper, we present a methodology to correctly train an AI neural network model based on a large language model (LLM) to predict the steel structure product weight ratios in BIM. The proposed method, with the aid of the LLM, can overcome the inherent problem of limited data availability in BIM and handle a combination of natural language and numerical data. The experimental results showed that the proposed method demonstrated significantly higher accuracy than methods based on a smaller language model. The potential for effectively applying large language models in BIM is confirmed, leading to expectations of preventing building accidents and efficiently managing construction costs.

Detection of Topic Changes in Child Speech Using Sent2Vec (Sent2Vec을 이용한 아동 발화의 화제 변경 탐지)

  • Heo, Tak-Sung;Lee, Yoon-Kyoung;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.343-346
    • /
    • 2019
  • 언어 병리학에서는 연령별 대화 능력 발달에 관한 연구에 관심이 많다. 하지만 이러한 연구는 많은 시간과 비용이 소모된다. 이를 해결하기 위해, 본 연구에서는 대화 능력 발달의 많은 연구 중 한 가지 방법인 화제 변경을 Sent2Vec을 이용하여 자동적으로 탐지해주는 방법을 제안한다. 아동의 연속된 두 발화를 비교하여 화제의 변경을 Sent2Vec의 코사인 유사도를 통해 찾아냈다. 본 연구에서는 언어 병리학에서의 연구 결과와 비교를 하기 위해 초등학생 1학년, 3학년, 5학년 집단의 데이터를 사용하였다. 본 연구에서 제안한 방법의 결과와 언어 병리학에서 연구한 결과의 상관관계가 99.95%로 매우 높음을 확인할 수 있었다. 이러한 화제 변경 탐지를 자동화함으로써, 언어 연구에 필요한 시간과 비용을 크게 절감할 수 있다.

  • PDF

Domain-agnostic Pre-trained Language Model for Tabular Data (도메인 변화에 강건한 사전학습 표 언어모형)

  • Cho, Sanghyun;Choi, Jae-Hoon;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.346-349
    • /
    • 2021
  • 표 기계독해에서는 도메인에 따라 언어모형에 필요한 지식이나 표의 구조적인 형태가 변화하면서 텍스트 데이터에 비해서 더 큰 성능 하락을 보인다. 본 논문에서는 표 기계독해에서 이러한 도메인의 변화에 강건한 사전학습 표 언어모형 구축을 위한 의미있는 표 데이터 선별을 통한 사전학습 데이터 구축 방법과 적대적인 학습 방법을 제안한다. 추출한 표 데이터에서 구조적인 정보가 없이 웹 문서의 장식을 위해 사용되는 표 데이터 검출을 위해 Heuristic을 통한 규칙을 정의하여 HEAD 데이터를 식별하고 표 데이터를 선별하는 방법을 적용했으며, 구조적인 정보를 가지는 일반적인 표 데이터와 엔티티에 대한 지식 정보를 가지는 인포박스 데이터간의 적대적 학습 방법을 적용했다. 기존의 정제되지 않는 데이터로 학습했을 때와 비교하여 데이터를 정제하였을 때, KorQuAD 표 데이터에서 f1 3.45, EM 4.14가 증가하였으며, Spec 표 질의응답 데이터에서 정제하지 않았을 때와 비교하여 f1 19.38, EM 4.22가 증가한 성능을 보였다.

  • PDF