3D 포인트 클라우드와 텍스트 연관성에 관한 연구

A Study on the Correlation between 3D Point Clouds and Text

  • 김다영 (전남대학교 소프트웨어공학과) ;
  • 조영준 (전남대학교 인공지능융합학과)
  • Da-Yeong Kim (Dept. of Software Engineering, Chonnam National University) ;
  • Yeong-Jun Cho (Dept. of AI Convergence, Chonnam National University)
  • Published : 2024.10.31

Abstract

최근 몇 년의 3D, 텍스트의 멀티 모달 연구의 방향성을 파악하고, 3D 포인트 클라우드 데이터와 텍스트 사이의 연관성을 파악할 수 있는 새로운 방법론을 제시한다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부및정보통신기획평가원의 인공지능융합혁신인재양성사업 연구 결과로 수행되었으며(IITP-2023-RS-2023-00256629) 과학기술정보통신부 및 정보통신기획평가원의 소프트웨어중심대학사업의 연구결과로 수행되었습니다.(No. 2021-0-01409)

References

  1. Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021, July). Learning transferable visual models from natural language supervision. In International conference on machine learning (pp. 8748-8763). PMLR.
  2. Ramesh, A., Pavlov, M., Goh, G., Gray, S., Voss, C., Radford, A., ... & Sutskever, I. (2021, July). Zero-shot text-to-image generation. In International conference on machine learning(pp. 8821-8831). Pmlr.
  3. Dosovitskiy, A. (2020). An image is worth16x16 words: Transformers for image recognition at scale. arXiv preprint arXiv:2010.11929.
  4. Hegde, D., Valanarasu, J. M. J., &Patel, V. (2023). Clip goes 3d: Leveraging prompt tuning for language grounded 3d recognition. InProceedings of the IEEE/CVF International Conference on Computer Vision (pp. 2028-2038).
  5. Zhang, R., Guo, Z., Zhang, W., Li, K., Miao, X., Cui, B., ... & Li, H. (2022). Pointclip: Point cloud understanding by clip. In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (pp. 8552-8562).
  6. Zhao, H., Jiang, L., Jia, J., Torr, P. H., & Koltun, V. (2021). Point transformer. In Proceedings of the IEEE/CVF international conference on computer vision (pp. 16259-16268).