Improved Semantic Segmentation in Multi-modal Network Using Encoder-Decoder Feature Fusion

Sohn, Chan-Young;Ho, Yo-Sung;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2018.11a
/
Pages.81-83
/
2018

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Improved Semantic Segmentation in Multi-modal Network Using Encoder-Decoder Feature Fusion

인코더-디코더 사이의 특징 융합을 통한 멀티 모달 네트워크의 의미론적 분할 성능 향상

Sohn, Chan-Young (Gwangju Institute of Science and Technology (GIST)) ;
Ho, Yo-Sung (Gwangju Institute of Science and Technology (GIST))

손찬영 (광주과학기술원 전기전자컴퓨터공학부) ;
호요성 (광주과학기술원 전기전자컴퓨터공학부)

Published : 2018.11.02

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

Fully Convolutional Network(FCN)은 기존의 방법보다 뛰어난 성능을 보였지만, FCN은 RGB 정보만을 사용하기 때문에 세밀한 예측이 필요한 장면에서는 다소 부족한 성능을 보였다. 이를 해결하기 위해 인코더-디코더 구조를 이용하여 RGB와 깊이의 멀티 모달을 활용하기 위한 FuseNet이 제안되었다. 하지만, FuseNet에서는 RGB와 깊이 브랜치 사이의 융합은 있지만, 인코더와 디코더 사이의 특징 지도를 융합하지 않는다. 본 논문에서는 FCN의 디코더 부분의 업샘플링 과정에서 이전 계층의 결과와 2배 업샘플링한 결과를 융합하는 스킵 레이어를 적용하여 FuseNet의 모달리티를 잘 활용하여 성능을 개선했다. 본 실험에서는 NYUDv2와 SUNRGBD 데이터 셋을 사용했으며, 전체 정확도는 각각 77%, 65%이고, 평균 IoU는 47.4%, 26.9%, 평균 정확도는 67.7%, 41%의 성능을 보였다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Improved Semantic Segmentation in Multi-modal Network Using Encoder-Decoder Feature Fusion

인코더-디코더 사이의 특징 융합을 통한 멀티 모달 네트워크의 의미론적 분할 성능 향상

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)