DOI QR코드

DOI QR Code

모바일 멀티모달 센서 정보의 앙상블 학습을 이용한 장소 인식

Place Recognition Using Ensemble Learning of Mobile Multimodal Sensory Information

  • 투고 : 2014.09.04
  • 심사 : 2014.10.28
  • 발행 : 2015.01.15

초록

본 논문에서는 시각, 음향, 위치 정보를 포함하는 멀티모달 센서 입력 정보로부터 사용자가 위치한 장소의 환경 정보를 학습하고 기계학습 추론을 통해 장소를 인식하는 방법을 제안한다. 이 방법은 음영 지역에서의 정확도 감소나 추가 하드웨어 필요 등 기존 위치 정보 인식 방법이 가지는 제약을 극복 가능하고, 지도상의 단순 좌표 인식이 아닌 논리적 위치 정보 인식을 수행 가능하다는 점에서 해당 위치와 관련된 특정 정보를 활용하여 다양한 생활편의를 제공하는 위치 기반 서비스를 수행하는데 보다 효과적인 방법이 될 수 있다. 제안하는 방법에서는 스마트폰에 내장된 카메라, 마이크로폰, GPS 센서 모듈로부터 획득한 시각, 음향, 위치 정보로부터 특징 벡터들을 추출하여 학습한다. 이때 서로 다른 특성을 가진 특징 벡터들을 학습하기 위해 각각의 특징 벡터들을 서로 다른 분류기를 통해 학습한 후, 그 결과를 기반으로 최종적인 하나의 분류 결과를 얻어내는 앙상블 기법을 사용한다. 실험 결과에서는 각각의 데이터를 따로 학습하여 분류한 결과와 비교하여 높은 성능을 보였다. 또한 사용자 상황인지 기반 서비스의 성능 향상을 위한 방법으로서 제안하는 모델의 스마트폰 앱 구현을 통한 활용 가능성에 대해 논의한다.

Place awareness is an essential for location-based services that are widely provided to smartphone users. However, traditional GPS-based methods are only valid outdoors where the GPS signal is strong and also require symbolic place information of the physical location. In this paper, environmental sounds and images are used to recognize important aspects of each place. The proposed method extracts feature vectors from visual, auditory and location data recorded by a smartphone with built-in camera, microphone and GPS sensors modules. The heterogeneous feature vectors were then learned by an ensemble learning method that learns each group of feature vectors for each classifier respectively and votes to produce the highest weighted result. The proposed method is evaluated for place recognition using a data group of 3000 samples in six places and the experimental results show a remarkably improved recognition accuracy when using all kinds of sensory data comparing to results using data from a single sensor or audio-visual integrated data only.

키워드

과제정보

연구 과제 주관 기관 : 한국연구재단, 한국산업기술평가관리원

참고문헌

  1. K. Whitehouse and D. Culler, "Macro-calibration in sensor/actuator networks," Mobile Networks and Applications, Vol. 8, No. 4, pp. 463-472, 2003. https://doi.org/10.1023/A:1024548100497
  2. J. Hightower and G. Borriello, "Location systems for ubiquitous computing," Computer, Vol. 34, No. 8, pp. 57-66, 2001. https://doi.org/10.1109/2.940014
  3. H. Koyuncu and S. H. Yang, "A survey of indoor positioning and object locating systems," International Journal of Computer Science and Network Security, Vol. 10, No. 5, pp. 121-128, 2010.
  4. F. B. Abdesslem and A. Lindgren, "Demo: Mobile Opportunistic System for Experience Sharing (MOSES) in Indoor Exhibitions," Proc. of the 20th ACM annual international conference on Mobile computing and networking (MobiCom), pp. 267-270, 2014.
  5. D. C. Herath, S. Kodagoda and G. Dissanayake, "A Two-tier Map Representation for Compact stereovision- based SLAM," Robotica, Vol. 30, No. 2, pp. 245- 256, 2012. https://doi.org/10.1017/S0263574711000543
  6. T. Dietterich, "Ensemble methods in machine learning," Multiple Classifier Systems, pp. 1-15, Springer Berlin Heidelberg, 2011.
  7. D. Marbach et al., "Wisdom of crowds for robus gene network inference," Nature Methods, Vol. 9, No. 8, pp. 796-804, 2012. https://doi.org/10.1038/nmeth.2016
  8. P. L. Vidale, D. Luthi, R. Wegmann, C. Schar, "European summer climate variability in a heterogeneous multi-model ensemble," Climatic Change, Vol. 81, No. 1, pp. 209-232, 2007. https://doi.org/10.1007/s10584-006-9218-z
  9. X. Shi, J-F. Paiement, D. Gragier and P. S. Yu, "Learning from heterogeneous sources via gradient boosting consensus," Proc. of the 12th SIAM Int'l Conf. on Data Mining (SDM 2012), pp. 22-235, 2012.
  10. M. Xu et al., "HMM-based audio keyword generation," Advances in Multimedia Information Processing, Springer, 2004.
  11. D. G. Lowe, "Distinctive Image Features from Scale- Invariant Keypoints," International Journal of Computer Vision, Vol. 60, No. 2, pp. 91-110, 2004. https://doi.org/10.1023/B:VISI.0000029664.99615.94
  12. B. Kuipers & P. Beeson, "Bootstrap learning for place recognition," Proc. of 18th National Conference on Artificial Intelligence (AAAI 2002), pp. 174-180, 2002.

피인용 문헌

  1. An Ensemble Method for Latent Interest Reasoning of Mobile Users vol.21, pp.11, 2015, https://doi.org/10.5626/KTCP.2015.21.11.706