Two-Stage Contrastive Learning for Representation Learning of Korean Review Opinion

Jisu Seo;Seung-Hoon Na;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
/
Pages.262-267
/
2022
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

두 단계 대조 학습 기반 한국어 리뷰 의견 표현벡터 학습

Two-Stage Contrastive Learning for Representation Learning of Korean Review Opinion

서지수 (버즈니) ;
나승훈 (전북대학교)

Jisu Seo (BUZZNI Corp.) ;
Seung-Hoon Na (Jeonbuk National University)

발행 : 2022.10.18

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

이커머스 리뷰와 같은 특정 도메인의 경우, 텍스트 표현벡터 학습을 위한 양질의 오픈 학습 데이터를 구하기 어렵다. 또한 사람이 수동으로 검수하며 학습데이터를 만드는 경우, 많은 시간과 비용을 소모하게 된다. 따라서 본 논문에서는 수동으로 검수된 데이터없이 양질의 텍스트 표현벡터를 만들 수 있도록 두 단계의 대조 학습 시스템을 제안한다. 이 두 단계 대조 학습 시스템은 레이블링 된 학습데이터가 필요하지 않은 자기지도 학습 단계와 리뷰의 특성을 고려한 자동 레이블링 기반의 지도 학습 단계로 구성된다. 또한 노이즈에 강한 오류함수와 한국어에 유효한 데이터 증강 기법을 적용한다. 그 결과 스피어먼 상관 계수 기반의 성능 평가를 통해, 베이스 모델과 비교하여 성능을 14.03 향상하였다.

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

두 단계 대조 학습 기반 한국어 리뷰 의견 표현벡터 학습

Two-Stage Contrastive Learning for Representation Learning of Korean Review Opinion

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)