작은 화면 기기에서의 출력을 위한 신문기사 헤드라인 형식의 문장 축약 시스템

Sentence Compression of Headline-style Abstract for Displaying in Small Devices

  • 이공주 (충남대학교 전기정보통신공학부)
  • 발행 : 2005.10.01


모바일 디바이스와 같이 작은 필기의 화면을 갖는 기기에서는 긴 문장의 내용을 한눈에 파악하기가 쉽지 않다. 본 논문에서는 신문기사와 그 헤드라인으로부터 추출한 정보로부터 문장을 자동으로 축약할 수 있는 시스템을 제안하고자 한다. 축약된 문장은 문장 내의 필수적이지 않은 요소들을 제거함으로써 그 기본 의미는 그대로 전달하되 문장의 길이를 축소시킨 것이다. 신문기사의 헤드라인으로부터 문장 축약 방법을 학습하였기 때문에 매우 간결한 형태로 문장을 축약할 수 있다 예비 실험을 통해 본 논문에서 제안하고 있는 시스템이 생성해 내는 축약문장이 유용함을 보이고자 한다.

In this paper, we present a pilot system that tn compress a Korean sentence automatically using knowledge extracted from news articles and their headlines. A sot of compressed sentences can be presented as an abstraction of a document. As a compressed sentence is of headline-style, it could be easily displayed on small devices, such as mobile phones and other handhold devices. Our compressing system has shown to be promising through a preliminary experiment.



  1. 맹성현, 장동현, 송사광, 김지영, 이석훈, 이응봉, 이준호, 서정현, (1999) '정보검색 테스트 컬렉션 구축 및 유효성 평가', 제11회 한글 및 한국어 정보처리 학술대회 학술지
  2. Dorr, Bonnie, Zajic, D., and Schwartz R. (2003). 'Hedge Trimmer: A Parse-and-Trim Approach to Headline Generation.' Proc. of the HLT-NAACL 2003 Text Summarization Workshop
  3. Chung, H. and Rim, H.-C. (2003). 'A New Probabilistic Dependency Parsing Model for Head-final, Free Word-order Languages.' IEICE Trans. on Information and Systems, vol. E86-D, no. 11
  4. Collins, M. (1999). Head-Driven Statistical Models for Natural Language Parsing, Ph.D. Thesis. Department of Computer and Information Science, University of Pennsylvania
  5. Gaifman, H. (1965). 'Dependency Systems and Phrase-structure Systems.' Information and Control, 8:304-307
  6. Hovy, E. and Lin, C.-Y. (1999). 'Automated Text Summarization in SUMMARIST system.' Eds. I. Mani and M. T. Maybury, Advances in Automatic Text Summarization. MIT Press. pp.81-94
  7. Kato, Y., Matsubara, S., Toyama, K., and Inagaki, Y. (2001). 'Efficient Incremental Dependency Parsing.' Proceedings of IWPT 2001
  8. Knight, K. and Marcu, D. (2002). 'Summarization Beyond Sentence Extraction: A Probabilistic Approach to Sentence Compression.' Artificial Intelligence, 139:91-107
  9. Lee, K. J., Kim, J.-H., Han, Y. S. and G. C. Kim (1997). 'Restricted Representation of Phrase Structure Grammar for Building a Tree Annotated Corpus of Korean.' Natural Language Engineering, vol. 3, part 2&3, pp. 215-230
  10. Manning, C. D. and Schutze, Hinrich. (1999), Foundations of Statistical Natural Language Processing, The MIT Press
  11. Mani, I. and Maybury, M. T. (1999). Advances in Automatic Text Summarization, The MIT Press
  12. Vandeghinste, V. and Tjong Kim Sang, E. (2004). 'Using a Parallel Transcript/Subtitle Corpus for Sentence Compression.' Proceedings of LREC2004. ELRA. Paris
  13. Wasson, M. (1998). 'Using leading text for news summaries: Evaluation Results and Implications for Commercial Summarization Applications.' Proceedings of COLING-ACL 98, pp. 1364-1368
  14. Yang, C. C. and Wang, F. L. (2003). 'Fractal Summarization: Summarization Based on Fractal Theory.' Proceedings of SIGIR 2003, pp. 391-392
  15. Yoshihiro, U, Mamiko, O., Takahiro, K., and Tadanobu, M. (2000) 'Toward the at-a-glance Summary: Phrase-representation Summarization Method.' Proceedings of the International Conference on Computational Linguistics, pp. 878-884