Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2009.10a
- /
- Pages.136-140
- /
- 2009
- /
- 2005-3053(pISSN)
Twitter Corpus Collection and Analysis
트위터 말뭉치 수집과 분석
- Yoo, Daehoon (Department of Computer Science and Engineering, POSTECH) ;
- Lee, Cheongjae (Department of Computer Science and Engineering, POSTECH) ;
- Kim, Seokhwan (Department of Computer Science and Engineering, POSTECH) ;
- Lee, Gary Geunbae (Department of Computer Science and Engineering, POSTECH)
- Published : 2009.10.09
Abstract
최근 기존 블로그와 다른 마이크로 블로그의 한 종류로 트위터가 인터넷 상에서 화두로 대두되고 있다. 트위터는 기존 블로그나 미니홈피의 여러 가지 기능을 간소화하고 짧은 내용의 텍스트만을 올릴 수 있는 마이크로 블로그이다. 그런 이유로 트위터는 단순함과 즉시성이라는 고유의 특성을 가지고 일반적인 인터넷 이용자들에게 급속하게 알려지고 있다. 이러한 트위터를 분석하면 다양한 주제에 대해서 인터넷상의 대중들의 생각과 의견들을 알 수 있는 창구가 될 수 있다. 또한 다른 언어권 국가들의 트위터와 비교하면 양 국가간의 문화적 차이를 알 수 있다. 본 논문에서는 한국어 및 영어권 이용자들의 트위터 상의 메시지를 주제별, 목적별 등으로 분석하였다. 그 결과, 한국에서는 트위터 이용을 개인적인 생각을 적는 일기장으로 많이 사용되지만, 영어권 에서는 그 외에도 보도 자료나 광고등 여러 가지 목적으로 사용되고 있다는 것을 알 수 있다.