Analysis System of Web Contents

웹 사이트 콘텐츠 분석 시스템

  • Published : 2009.05.22

Abstract

As the amount of web contents in the Internet increases, it becomes hard to find out statistics that users want. In this paper we propose an analysis system based on the statistics of words, which can be used to prospect trends in a specific area. We applied this system to job recruiting site and we can find out trend and statistics about what part of technology is needed in job market and the result of this paper can be used for an application such as restructuring curriculum of a department in universities. It can also be used to predict trend in other areas.

사회가 복잡해짐에 따라 처리하고 분석해야 할 콘텐츠의 양은 점점 더 많아지며, 이러한 많은 정보들을 자동적으로 체계적으로 분류하여 필요한 통계를 바로 추출하는 기능이 점점 더 중요해지고 있다. 본 논문에서는 직업 정보 사이트인 jobkorea 사이트에서 IT 분야의 구인 관련 공고를 추출하고 추출된 문서들에 있는 단어들의 통계 처리를 통해 현재 IT 관련 산업체에서 필요로 하는 기술 분야 및 직종을 자동으로 분석하여 보여줄 수 있는 시스템을 개발하였다. 개발된 시스템은 IT 관련 학과의 교과과정 개편 등의 다양한 응용에 활용할 수 있을 것이라 기대된다. 또한, 본 시스템은 직업 정보 사이트의 분석 이외에 콘텐츠 동향 분석이나 관련 분야의 통계 처리를 필요로 하는 다른 사이트에도 쉽게 확대 적용될 수 있을 것으로 기대된다.

Keywords