DOI QR코드

DOI QR Code

Estimating Personal and Social Information for Mobile User

모바일 사용자의 개인 및 소셜 정보 추정

  • 손정우 (경북대학교 전자전기컴퓨터학부) ;
  • 한용진 (경북대학교 전자전기컴퓨터학부) ;
  • 송현제 (경북대학교 전자전기컴퓨터학부) ;
  • 박성배 (경북대학교 IT대학 컴퓨터학부) ;
  • 이상조 (경북대학교 IT대학 컴퓨터학부)
  • Received : 2013.07.16
  • Accepted : 2013.08.06
  • Published : 2013.09.30

Abstract

The popularity of mobile devices provides their users with a circumstance that services and information can be accessed wherever and whenever users need. Accordingly, various studies have been proposed personalized methods to improve accessibility of mobile users to information. However, since these personalized methods require users' private information, they gives rise to problems on security. An efficient way to resolve security problems is to estimate user information by using their online and offline behavior. In this paper, for this purpose, it is proposed a novel user information identification system that identifies users' personal and social information by using both his/her behavior on social network services and proximity patterns obtained from GPS data. In the proposed system, personal information of a user like age, gender, and so on is estimated by analyzing SNS texts and POI (Point of Interest) patterns, while social information between a pair of users like family and friend is predicted with proximity patterns between the users. Each identification module is efficiently designed to handle the characteristics of user data like much noise in SNS texts and missing signals in GPS data. In experiments to evaluate the proposed system, our system shows its superiority against ordinary identification methods. This result means that the proposed system can efficiently reflect the characteristics of user data.

모바일 디바이스의 발달은 사용자가 언제 어디서나 원하는 서비스에 접근하고, 정보를 소비할 수 있는 환경을 마련했다. 이에 맞춰 다양한 연구들이 모바일 사용자의 정보 접근성을 향상 시키기 위한 개인화 방법을 제안해 왔다. 하지만, 이와 같은 개인화는 사용자 개인과 관련된 정보를 요구하기에, 사용자 정보에 대한 보안과 관련된 우려를 낳고 있다. 이를 해결할 수 있는 효과적인 방법 중 하나로 사용자 정보를 사용자의 온라인 혹은 오프라인 상의 행동 패턴으로부터 추정하는 것을 들 수 있다. 본 논문에서는 SNS(Social Network Service) 상에서의 사용자 패턴과 사용자 간 물리적인 근접성 패턴을 분석하여 사용자 개인의 정보와 타 사용자와의 사회 관계정보를 식별하는 사용자 정보 식별 시스템을 제안하고자 한다. 제안한 시스템은 SNS 텍스트와 GPS 데이터에 기반한 POI(Point of Interest) 패턴으로부터 사용자의 나이, 성별 등 개인정보를 식별하고, 사용자 GPS 데이터를 이용하여 얻어진 사용자 간 근접성 패턴을 이용하여 두 사용자 간의 가족, 동료 등 관계 정보를 추정한다. 각각의 사용자 식별 모듈은 해당 데이터의 특성을 고려하여 SNS 데이터의 노이즈와 사용자 GPS 데이터의 손실을 감안함으로써 더 정확한 사용자 식별 성능을 보이도록 설계되었다. 이를 검증하기 위한 실험에서 제안한 시스템은 기존의 방법에 비해 더 나은 성능을 보였으며, 이는 본 논문에서 제안하는 방법이 사용자 데이터의 특성을 효과적으로 반영하고 있음을 의미한다.

Keywords

Acknowledgement

Supported by : 지식경제부

References

  1. Q. Li, Y. Zheng, X. Xie, and W.-Y. Ma, "Mining User Similarity based on Location History," In Proceedings of GIS2008, pp.298-307, 2008.
  2. C. Boulis and M. Ostendorf. "A Quantitative Analysis of Lexical Differences between Genders in Telephone Conversations," In Proceedings of ACL, pp.435-442, 2005.
  3. N. Garera and D. Yarosky, "Modeling Latent Biographic Attributes in Conversational Genres," In Proceedings of ACL and IJCNLP, pp.710-718, 2009.
  4. J. Otterbacher, "Inferring Gender of Movie Reviewers: Exploiting Writing Style, Content and Metadata," In Proceedings of CIKM, pp.369-378, 2010.
  5. L. Hemphill and J. Otterbacher, "Learning the Lingo? Gender, Prestige and Linguistic Adaptation in Review Communities," In Proceedings of CSCW, pp.305-314, 2012.
  6. T. G. Dietterich, R. H. Lathrop, and T. Lozano-Perez. "Solving the Multiple-Instance Problem with Axis-Parallet Rectangles," Artificial Intelligence, Vol.89, No.1-2, pp.31-71, 1997. https://doi.org/10.1016/S0004-3702(96)00034-3
  7. J. Goldenberg and M. Levy. "Distance is Not Dead: Social Interaction and Geographical Distance in the Internet Era," CoRR, abs/0906.3202, 2009.
  8. N. Eagle, A. Pentland, and D. Lazer, "Inferring Friendship Network Structure by Using Mobile Phone Data," In Proceedings of the National Academy of Sciences of the United States of America, pp.15274-15278, 2009.
  9. E. Cho, S. Myers, and J. Leskovec, "Friendship and Mobility: User Movement in Location-Based Social Networks," In Proceedings of SIGKDD, pp.1082-1090. 2011.
  10. D. Crandall, L. Backstrom, D. Cosley, S. Suri, D. Huttenlocher, and J. Kleinberg. "Inferring Social Ties from Geographic Coincidences," PNAS, 2010.
  11. H.-J. Lee, J.-H. Choi, and Y.-T. Park, "Semantic Point of Interest Detection from Large-scale GPS Data of Mobile Users," KISSE: Software and Application, 39(3), pp.175-184, 2012.
  12. P. W. Foltz, D. Laham, and T.K Landauer, "Automated Essay Scoring: Applications to Educational Technology," In Proceedings of EdMedia, 1999.
  13. D. Rao, D. Yarosky, A. Shreevats, and M. Gupta, "Classifying Latent User Attributes in Twitter," In Proceedings of SMUC, pp.37-44, 2010.
  14. M. Pennacchiotti and A.-M. Popescu, "A Machine Learning Approach to Twitter User Classification," In Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media, pp.281-288, 2011.
  15. J. D. Burger, J. Henderson, G. Kim, and G. Zarrella, "Discriminating Gender on Twitter," In Proceedings of the EMNLP, pp.1301-1309, 2011.
  16. O. Maron and A. L. Ratan, "Multiple-Instance Learning for Natural Scene Classification," In Proceedings of ICML, pp.341-349, 1998.
  17. C. Yang and T. Lozano-Perez, "Image Database Retrieval with Multiple-Instance Learning Techniques," In Proceedings of ICDE, pp.233-243, 2000.
  18. J. Ramon and L. De Raedt, "Multi Instance Neural Networks," In Proceedings of ICML-2000 Workshop on Attribute- Value and Relational Learning, 2000.
  19. J. Wang and J.-D. Zucker, "Solving the Multiple-Instance Problem: a Lazy Learning Approach," In Proceedings of ICML, pp.1119-1125, 2002.
  20. S. Andrews, I. Tsochantaridis, and T. Hofmann, "Support Vector Machines for Multi-Instance Learning", In Advances in NIPS, pp.577-584, 2002.
  21. Y. Matsuo, N. Okazaki, K. Izumi, Y. Nakamura, T. Nishmura, K. Hasida, and H. Nakashima, "Inferring Long-term User Properties based on Users' Location History," In Proceedings of IJCAI, pp.2159-2165, 2007.
  22. C. Chang and C. Lin, "LIBSVM : a Library for Support Vector Machines," ACM Transactions on Intelligent Systems and Technology, 2(27), pp.1-27, 2011.
  23. R. Rifkin and A. Klautau, "In Defense of One-Vs-All Classification," Journal of Machine Learning Research, Vol.5, pp.101-141, 2004.
  24. A. Madan, and A. Pentland, "Modeling Social Diffusion Phenomena Using Reality Mining," In Proceedings of AAAI Spring Symposium on Human Behavior Modeling, 2009.