A Study on Performance Improvement of GVQA Model Using Transformer

Park, Sung-Wook;Kim, Jun-Yeong;Park, Jun;Lee, Han-Sung;Jung, Se-Hoon;Sim, Cun-Bo;

doi:10.3745/PKIPS.y2021m11a.749

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

한국정보처리학회 2021년도 추계학술발표대회
/
Pages.749-752
/
2021
/
2005-0011(pISSN)
/
2671-7298(eISSN)

한국정보처리학회 (Korea Information Processing Society)

DOI QR Code

트랜스포머를 이용한 GVQA 모델의 성능 개선에 관한 연구

A Study on Performance Improvement of GVQA Model Using Transformer

박성욱 (순천대학교 IT-Bio융합시스템전공) ;
김준영 (순천대학교 IT-Bio융합시스템전공) ;
박준 (순천대학교 IT-Bio융합시스템전공) ;
이한성 (안동대학교 창의융합학부) ;
정세훈 (안동대학교 창의융합학부) ;
심춘보 (순천대학교 IT-Bio융합시스템전공)

Park, Sung-Wook (Interdisciplinary Program in IT-Bio Convergence System, Sunchon National University) ;
Kim, Jun-Yeong (Interdisciplinary Program in IT-Bio Convergence System, Sunchon National University) ;
Park, Jun (Interdisciplinary Program in IT-Bio Convergence System, Sunchon National University) ;
Lee, Han-Sung (School of Creative Convergence, Andong National University) ;
Jung, Se-Hoon (School of Creative Convergence, Andong National University) ;
Sim, Cun-Bo (Interdisciplinary Program in IT-Bio Convergence System, Sunchon National University)

발행 : 2021.11.04

https://doi.org/10.3745/PKIPS.y2021m11a.749 인용 PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

오늘날 인공지능(Artificial Intelligence, AI) 분야에서 가장 구현하기 어려운 분야 중 하나는 추론이다. 근래 추론 분야에서 영상과 언어가 결합한 다중 모드(Multi-modal) 환경에서 영상 기반의 질의 응답(Visual Question Answering, VQA) 과업에 대한 AI 모델이 발표됐다. 얼마 지나지 않아 VQA 모델의 성능을 개선한 GVQA(Grounded Visual Question Answering) 모델도 발표됐다. 하지만 아직 GVQA 모델도 완벽한 성능을 내진 못한다. 본 논문에서는 GVQA 모델의 성능 개선을 위해 VCC(Visual Concept Classifier) 모델을 ViT-G(Vision Transformer-Giant)/14로 변경하고, ACP(Answer Cluster Predictor) 모델을 GPT(Generative Pretrained Transformer)-3으로 변경한다. 이와 같은 방법들은 성능을 개선하는 데 큰 도움이 될 수 있다고 사료된다.

키워드

과제정보

This work was supported by the BK21 plus program through the National Research Foundation (NRF) funded by the Ministry of Education of Korea(5199990214660)

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

트랜스포머를 이용한 GVQA 모델의 성능 개선에 관한 연구

A Study on Performance Improvement of GVQA Model Using Transformer

초록

키워드

과제정보

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)