Acknowledgement
본 논문은 2023 년도 정부(교육부)의 제원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(NRF-2021R1G1A1006381)
DOI QR Code
개체명 인식은 자연어 처리의 핵심적인 작업으로, 특정 범주의 명칭을 문장에서 식별하고 분류한다. 이러한 기술은 헬스케어 분야에서 진단 지원 및 데이터 관리에 필수적이다. 그러나 기존의 사전 학습된 모델을 특정 도메인에 대해 전이학습하는 방법은 대량의 데이터에 크게 의존하는 한계를 가지고 있다. 본 연구는 방대한 데이터로 학습된 거대 언어 모델(LLM) 활용을 중심으로, 한국어의 교착어 특성을 반영하여 형태소 정보를 활용한 Few-Shot 프롬프트를 통해 한국어 헬스케어 도메인에서의 개체명 인식 방법을 제안한다.
본 논문은 2023 년도 정부(교육부)의 제원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(NRF-2021R1G1A1006381)