Topic Analysis of Science and Technology Articles using CiteSeer Corpus

CiteSeer 말뭉치를 이용한 과학기술 문헌의 주제 분석

  • Published : 2008.07.15

Abstract

There have been enormous technological advances in science & technology domain and frequent convergences between its sub-domains. Topic analysis with science & technology corpus is a key process to grasp topic trends and relations between topics. The main objective of this research is to show various analytic approaches with topics extracted from CiteSeer corpus, which is widely used in information technology domain. This paper will also show a case study of Onto-Frame, an R&D support system developed by KISTI, to reveal the role of topics on the system.

과학기술 분야는 매우 빠른 발전 속도를 보이며 세부 분야 간 융 복합 현상이 빈번하게 일어나는 특징을 가지고 있다. 과학기술정보 말뭉치로부터 상기 특성을 분석해 내는 작업은 연구 주제 추이를 분석하고 주제 간 연관 관계를 파악하기 위해 필요하다. 본 연구는 과학기술 분야 - 특히 정보기술(Information Technology) 분야 - 에서 광범위하게 활용되고 있는 Citeseer 말뭉치로부터 추출된 주제를 이용하여 다양한 주제 분석을 수행하는 방안을 보이는 것을 목표로 한다. 특히, 연구개발 전주기 지원 시스템인 OntoFrame에서 주제가 어떠한 역할을 할 수 있는지 사례를 통해 실증하고자 한다.

Keywords

References

  1. Glance, N., Hurst, M., and Tomokiyo, T., "BlogPulse: Automated Trend Discovery for Weblogs, Proceedings of WWW 2004 Workshop on the Weblogging Ecosystem: Aggregation, Analysis and Dynamics," 2004
  2. Steyvers, M., Smyth, P., Rosen-Zvi, M., and Griffiths, T., "Probabilistic Author-Topic Models for Information Discovery," Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2004
  3. Lent, B., Agrawal, R., and Srikant, R., "Discovering Trends in Text Databases, Proceedings of the 3rd International Conference on Knowledge Discovery and Data Mining," 1997
  4. Rajaraman K. and Tan, A., Topic Detection, "Tracking, and Trend Analysis Using Self-Organizing Neural Networks," Proceedings of the 5th Pacific- Asia Conference on Knowledge Discovery and Data Mining, 2001
  5. 정한민, 강인수, 성원경, "시소러스와 분야분류체계를 이용한 과학기술문헌에의 주제 및 분야할당", 제7회 한국언어정보학회 하계학술대회, 2006
  6. Jung, H., Lee, M., Sung, W., and Park, D., "Semantic Web-Based Services for Supporting Voluntary Collaboration among Researchers Using an Information Dissemination Platform," Data Science Journal, Vol.6, 2007
  7. Sung, W., Jung, H., Kim, P., Kang, I., Lee, S., Lee, M., Park, D., and Hahn S., "A Semantic Portal for Researchers Using OntoFrame," Proceedings of the 6th International Semantic Web Conference and the 2nd Asian Semantic Web Conference, 2007