제로샷 분류를 활용한 성별 편향 완화 성별 예측 방법

Gender Bias Mitigation in Gender Prediction Using Zero-shot Classification

  • 김연희 (이화여자대학교 인공지능융합전공 ) ;
  • 최병주 (이화여자대학교 컴퓨터공학과 ) ;
  • 김종길 (이화여자대학교 사이버보안학과 )
  • Yeonhee Kim (Dept. of Artificial Intelligence Convergence, Ewha Womans University) ;
  • Byoungju Choi (Dept. of Computer Science and Engineering, Ewha Womans University) ;
  • Jongkil Kim (Dept. of Cyber Security, Ewha Womans University)
  • 발행 : 2024.05.23

초록

자연어 처리 기술은 인간 언어의 이해와 처리에서 큰 진전을 이루었으나, 학습 데이터에 내재한 성별 편향이 모델의 예측 정확도와 신뢰성을 저하하는 주요한 문제로 남아 있다. 특히 성별 예측에서 이러한 편향은 더욱 두드러진다. 제로샷 분류 기법은 기존에 학습되지 않은 새로운 클래스를 효과적으로 예측할 수 있는 기술로, 학습 데이터의 제한적인 의존성을 극복하고 다양한 언어 및 데이터 제한 상황에서도 효율적으로 작동한다. 본 논문은 성별 클래스 확장과 데이터 구조 개선을 통해 성별 편향을 최소화한 새로운 데이터셋을 구축하고, 이를 제로샷 분류 기법을 통해 학습시켜 성별 편향성이 완화된 새로운 성별 예측 모델을 제안한다. 이 연구는 다양한 언어로 구성된 자연어 데이터를 추가 학습하여 성별 예측에 최적화된 모델을 개발하고, 제한된 데이터 환경에서도 모델의 유연성과 범용성을 입증한다.

키워드

과제정보

이 연구는 2022학년도 이화여자대학교 교내연구비 지원과 2024년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원(No.RS-2022-00155966, 인공지능융합혁신인재양성(이화여자대학교))에 의한 연구임.

참고문헌

  1. Min, B., Ross, H., Sulem, E., Veyseh, A. P. B., Nguyen, T. H., Sainz, O., ... & Roth, D. "Recent advances in natural language processing via large pre-trained language models: A survey." ACM Computing Surveys, 56(2), 1-40 (2023).
  2. Prates, M. O., Avelar, P. H., & Lamb, L. C. "Assessing gender bias in machine translation: a case study with google translate." Neural Computing and Applications, 32, 6363-6381. (2020).
  3. Levy, S., Lazar, K., & Stanovsky, G. "Collecting a large-scale gender bias dataset for coreference resolution and machine translation." arXiv preprint arXiv:2109.03858. (2021).
  4. Pagano, T. P., Loureiro, R. B., Lisboa, F. V., Peixoto, R. M., Guimaraes, G. A., Cruz, G. O., ... & Nascimento, E. G. "Bias and unfairness in machine learning models: a systematic review on datasets, tools, fairness metrics, and identification and mitigation methods." Big data and cognitive computing, 7(1), 15 (2023).
  5. Pagano, T. P., Loureiro, R. B., Lisboa, F. V. N., Cruz, G. O. R., Peixoto, R. M., Guimaraes, G. A. D. S., ... & Nascimento, E. G. S. "Bias and unfairness in machine learning models: a systematic literature review." arXiv preprint arXiv:2202.08176. (2022).
  6. Wais, K. "Gender prediction methods based on first names with genderizeR." R J., 8(1), 17. (2016).
  7. Veronika, C. V. A. S. T., Illes, S. Z., & Dahiya, S. "Gender prediction of the European school's teachers using machine learning: Preliminary results." In Proceeding of 8th IEEE International Advance Computing Conference, India, (2018, December) (pp. 213-220).
  8. van der Goot, R., Ljubesic, N., Matroos, I., Nissim, M., & Plank, B. "Bleaching text: Abstract features for cross-lingual gender prediction." arXiv preprint arXiv:1805.03122. (2018).
  9. Abdallah, E. E., Alzghoul, J. R., & Alzghool, M. "Age and gender prediction in open domain text." Procedia Computer Science, 170, 563-570. (2020).
  10. Bolukbasi, T., Chang, K. W., Zou, J. Y., Saligrama, V., & Kalai, A. T. "Man is to computer programmer as woman is to homemaker? debiasing word embeddings." Advances in neural information processing systems, 29. (2016).
  11. Zhao, J., Zhou, Y., Li, Z., Wang, W., & Chang, K. W. "Learning gender neutral word embeddings." arXiv preprint arXiv:1809.01496. (2018).
  12. Gaut, A., Sun, T., Tang, S., Huang, Y., Qian, J., ElSherief, M., ... & Wang, W. Y. "Towards understanding gender bias in relation extraction." arXiv preprint arXiv:1911.03642.
  13. Rudinger, R., May, C., & Van Durme, B. "Social bias in elicited natural language inferences." In Proceedings of the First ACL Workshop on Ethics in Natural Language Processing, Spain (2017, April) (pp. 74-79).
  14. Vanmassenhove, E., Hardmeier, C., & Way, A. "Getting gender right in neural machine translation." arXiv preprint arXiv:1909.05088. https://doi.org/10.18653/v1/D18-1334
  15. Yin, W., Hay, J., & Roth, D. "Benchmarking zero-shot text classification: Datasets, evaluation and entailment approach." arXiv preprint arXiv:1909.00161.
  16. Puri, R., & Catanzaro, B. "Zero-shot text classification with generative language models." arXiv preprint arXiv:1912.10165. (2019).