• 제목/요약/키워드: 한국어 지식 기반 대화

검색결과 23건 처리시간 0.02초

중간 문맥 식별 및 검색을 활용한 문서간 관계 추출 (Cross-document Relation Extraction using Bridging Context Identification)

  • 손준영;김진성;임정우;장윤나;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.654-658
    • /
    • 2023
  • 관계 추출은 질의응답이나 대화 시스템의 기반이 되는 지식을 구추하기 위한 작업으로, 정보 추출의 기초가 되는 기술이기도 하다. 최근 실세계 지식의 희소한 형태를 구현한 문서간 관계 추출 데이터셋이 제안되어, 여러 문서를 통해 분산되어 언급된 두 개체 사이의 관계 추론을 수행 및 평가할 수 있게 되었다. 이 작업에서 추론의 대상이 되는 개체쌍은 한 문서 안에 동시에 언급되지 않기 때문에 여러 문서에 언급된 중간 개체를 통하여 직/간접적으로 추론해야 하나, 원시 텍스트에서 이러한 정보를 수집하는 작업은 쉽지 않다. 따라서, 본 연구에서는 개체의 동시발생빈도에 기반하여 중간 개체의 중요도를 정량화하고, 이 중요도에 기반화여 중요한 문맥을 식별하는 방법론을 제안한다. 제안하는 방법론은 기존의 두 문서로 구성된 추론 경로를 식별된 중간 개체를 활용하여 확장하여, 관계 추론 모델의 수정 없이 추가된 문맥만을 활용하여 문서간 관계 추출 시스템의 성능을 개선할 수 있었다.

  • PDF

학문 목적 한국어 학습자의 한국어 능력과 학업 적응에 관한 연구 (The narrative inquiry on Korean Language Learners' Korean proficiency and Academic adjustment in College Life)

  • 정연숙
    • 국제교류와 융합교육
    • /
    • 제4권1호
    • /
    • pp.57-83
    • /
    • 2024
  • 이 연구는 외국인 유학생들의 한국어 능력 시험(TOPIK) 등급이 학업 적응에 미치는 영향을 알아보고자 하였다. IRB의 승인을 거쳐 모집한 학생은 모두 7명으로 이들의 면담 내용은 실용적 절충주의에 기초한 포괄적 분석절차 (이동성, 김영천, 2014)의 6단계를 활용해 분석했으며 그 결과 학문 목적 한국어 학습자의 학업 적응에 영향을 미치는 요인을 학업, 생활, 심리·정서의 범주로 나눌 수 있었다. 학업적 측면에서 인터뷰 대상자들은 적응하기 힘들었던 전공 용어와 전공 공부를 지적하였고, 한자 및 한자어에 큰 어려움을 경험했다. 다음으로 생활 측면에서는 고급 수준의 토픽 등급 소지자인 연구 참여자들도 대학 생활 적응에 어려움이 있었고 한국 생활에 제대로 적응하기 위해서는 실용적인 표현과 풍부한 어휘 지식이 필요함을 토로했다. 마지막으로 심리·정서적인 범주에서는 이들이 한국인들과의 대화나 발표에 상당한 스트레스를 받고 있음을 파악할 수 있었다. 사회 문화 및 일상 생활 문화에 관한 지식도 부족했기 때문에 한국어를 잘하더라도 화용적인 면에서 실수나 오류를 범하기도 했고 이것이 심리·정서적인 어려움에 처하는 요인이 되기도 했다. 이러한 이야기들을 근거로 한국어 학습자의 학업 적응을 촉진하기 위해서는 한국어 학습의 다양한 기회 부여라는 목표를 기반으로 학습자의 전공 관련 학업 능력 강화, 한국어 숙달도 향상, 학내 관계 형성에 도움을 주어야 한다는 결론을 내렸다. 그리고 연구자는 이를 위한 해결 방안으로 외국인 학습자들을 위한 다양한 비교과 활동을 계획·설계하여 시도해 볼 것을 제안했다.

DPR의 효과적인 하드 네거티브 샘플링을 통한 효율적인 대조학습 방법 (Efficient contrastive learning method through the effective hard negative sampling from DPR)

  • 박성흠;김홍진;황금하;권오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.348-353
    • /
    • 2022
  • 최근 신경망 기반의 언어모델이 발전함에 따라 대부분의 검색 모델에서는 Bi-encoder를 기반으로한 Dense retrieval 모델에 대한 연구가 진행되고 있다. 특히 DPR은 BM25를 통해 정답 문서와 유사한 정보를 가진 하드 네거티브를 사용하여 대조학습을 통해 성능을 더욱 끌어올린다. 그러나 BM25로 검색된 하드 네거티브는 term-base의 유사도를 통해 뽑히기 때문에, 의미적으로 비슷한 내용을 갖는 하드 네거티브의 역할을 제대로 수행하지 못하고 대조학습의 효율성을 낮출 가능성이 있다. 따라서 DRP의 대조학습에서 하드 네거티브의 역할을 본질적으로 수행할 수 있는 문서를 샘플링 하는 방법을 제시하고, 이때 얻은 하드 네거티브의 집합을 주기적으로 업데이트 하여 효과적으로 대조학습을 진행하는 방법을 제안한다. 지식 기반 대화 데이터셋인 MultiDoc2Dial을 통해 평가를 수행하였으며, 실험 결과 기존 방식보다 더 높은 성능을 나타낸다.

  • PDF