DOI QR코드

DOI QR Code

Automatic Expansion of ConceptNet by Using Neural Tensor Networks

신경 텐서망을 이용한 컨셉넷 자동 확장

  • 최용석 (충남대학교 전자전파정보통신공학과) ;
  • 이경호 (충남대학교 전자전파정보통신공학과) ;
  • 이공주 (충남대학교 전자전파정보통신공학과)
  • Received : 2016.10.04
  • Accepted : 2016.10.13
  • Published : 2016.11.30

Abstract

ConceptNet is a common sense knowledge base which is formed in a semantic graph whose nodes represent concepts and edges show relationships between concepts. As it is difficult to make knowledge base integrity, a knowledge base often suffers from incompleteness problem. Therefore the quality of reasoning performed over such knowledge bases is sometimes unreliable. This work presents neural tensor networks which can alleviate the problem of knowledge bases incompleteness by reasoning new assertions and adding them into ConceptNet. The neural tensor networks are trained with a collection of assertions extracted from ConceptNet. The input of the networks is two concepts, and the output is the confidence score, telling how possible the connection between two concepts is under a specified relationship. The neural tensor networks can expand the usefulness of ConceptNet by increasing the degree of nodes. The accuracy of the neural tensor networks is 87.7% on testing data set. Also the neural tensor networks can predict a new assertion which does not exist in ConceptNet with an accuracy 85.01%.

컨셉넷은 일반상식을 노드(개념)와 에지(관계)로 표현해 놓은 그래프 형태의 지식 베이스이다. 완전한 지식 베이스를 구축하는 것은 매우 어려운 문제이기 때문에 지식 베이스는 미완결된 형태의 데이터를 담고 있는 경우가 많다. 불완전한 지식을 담고 있는 지식 베이스로부터의 추론 결과는 신뢰하기 어렵기 때문에 지식의 완결성을 높이기 위한 방법이 필요하다. 본 논문에서는 신경 텐서망을 이용하여 컨셉넷의 지식 미완결성 문제를 완화해 보고자 한다. 컨셉넷에서 추출한 사실주장(assertion)을 이용하여 신경 텐서망을 학습시킨다. 학습된 신경 텐서망은 두 개의 개념 정보를 입력으로 받고, 그 두 개념이 특정 관계로 연결될 수 있는지를 나타내는 점수값을 출력한다. 이와 같이 신경 텐서망은 노드들의 연결 차수(degree)를 높여, 컨셉넷의 완결성을 증대시킬 수 있다. 본 연구에서 학습시킨 신경 텐서망은 평가데이터에 대해서 약 87.7%의 정확도를 보였다. 또한 컨셉넷에 연결이 없는 노드 쌍에 대하여 85.01%의 정확도로 새로운 관계를 예측할 수 있었다.

Keywords

References

  1. Speer, Robert and Catherine Havasi, "Representing General Relational Knowledge in ConceptNet 5," LREC, 2012.
  2. George A. Miller, "WordNet: a lexical database for English," Communications of the ACM, Vol.38, No.11, pp.39-41, 1995. https://doi.org/10.1145/219717.219748
  3. Jens Lehmann, et al., "DBpedia: A large-scale, multilingual knowledge base extracted from Wikipedia," Semantic Web, Vol.6, No.2, pp.167-195, 2015.
  4. Richard Socher, et al., "Reasoning with neural tensor networks for knowledge base completion," Advances in Neural Information Processing Systems, 2013.
  5. Danqi Chen, et al., "Learning new facts from knowledge bases with neural tensor networks and semantic word vectors," arXiv, 2013.
  6. Kurt Bollacker, et al., "Freebase: a collaboratively created graph database for structuring human knowledge," Proceedings of the 2008 ACM SIGMOD International Conference on Management of Data, 2008.
  7. Tomas Mikolov, et al., "Recurrent neural network based language model," Interspeech, Vol.2, 2010.
  8. Word embedding [Internet], https://code.google.com/archive/p/word2vec/.