DOI QR코드

DOI QR Code

2단계 문장 추출 방법을 이용한 회의록 요약

Meeting Minutes Summarization using Two-step Sentence Extraction

  • 이재걸 (경북대학교 컴퓨터공학과) ;
  • 박성배 (경북대학교 컴퓨터공학과) ;
  • 이상조 (경북대학교 컴퓨터공학과)
  • 투고 : 2010.10.21
  • 심사 : 2010.11.29
  • 발행 : 2010.12.25

초록

본 논문은 회의록의 특징을 반영한 회의록을 요약 방법을 제안한다. 회의록은 일반 문서와 달리 회의의 진행자가 전체 흐름을 주도하고, 회의 진행에 사용하는 단어들이 존재하며, 발언자들 간의 대화에 종속관계가 있다는 특징이 있다. 제안한 방법은 먼저 회의의 흐름을 찾기 위해 사전에 구축된 회의 진행에 특화된 단어사전과 TextRank 알고리즘을 사용하여 진행자의 주제 문장들을 추출한다. 다음으로 추출된 문장들을 회의록에 있는 참석자들의 문장과 유사도를 계산하여 회의의 주제 문장과 관련있는 중요 문장을 추출한다. 마지막으로 사용자가 흐름을 편히 알 수 있도록 추출된 문장들 사이에 종속 관계를 분석하여 최종적으로 회의록을 요약한다. 국회 전자회의록을 대상으로 실험한 결과, 제안한 방법이 회의록을 요약하는 비율 전 구간에서 기존의 요약 방법들보다 더 나은 성능을 보인다.

These days many meeting minutes of various organizations are publicly available and the interest in these documents by people is increasing. However, it is time-consuming and tedious to read and understand whole documents even if the documents can be accessed easily. In addition, what most people want from meeting minutes is to catch the main issues of the meeting and understand its contexts rather than to know whole discussions of the meetings. This paper proposes a novel method for summarizing documents considering the characteristics of the meeting minutes. It first extracts the sentences which are addressing the main issues. For each issues expressed in the extracted sentences, the sentences related with the issue are then extracted in the next step. Then, by transforming the extracted sentences into a tree-structure form, the results of the proposed method can be understood better than existing methods. In the experiments, the proposed method shows remarkable improvement in performance and this result implies that the proposed method is plausible for summarizing meeting minutes.

키워드

참고문헌

  1. 대한민국 국회 회의록 시스템, Available: http://likms.assembly.go.kr/record/index.html, 2002, [Accessed: October 21, 2010]
  2. J. Goldstein, M. Kantrowitz, V.Mittal, and J.Carbonell, "Summarizing Text Documents: Sentence Selection and Evaluation Metrics", In Proceedings of ACM-SIGIR'99, pp.121-128, 1999
  3. M.Sanderson, "Accurate User Directed Summarization from Existing Tools", In Proceedings of 7th International Conference on Information and Knowledge Management, pp.45-51, 1998
  4. Rada Mihalcea, Paul Tarau, "TextRank: Bringing Order into Texts", In Proceedings of the Conference on Empirical Methods in Natural Language Processing, pp. 404-411, 2004.
  5. S.Brin and L.Page, "The Anatomy of a Large-scale Hypertextual Web Search Engine", Journal of Computer Networks and ISDN Systems, Vol. 30, No. 1-7, pp. 107-117, 1998. https://doi.org/10.1016/S0169-7552(98)00110-X
  6. 홍진표, 차정원, "TextRank 알고리즘을 이용한 한국어 중요 문장 추출", 2009 한국컴퓨터종합학술대회 논문집, Vol. 36, No. 1(C), pp. 311-314, 2009
  7. H. P. Luhn, "The Automatic Creation of Literature Abstracts", IBM Journal of Research and Development, Vol. 2, No.2, pp. 159-165, 1958. https://doi.org/10.1147/rd.22.0159
  8. H. P. Edmundson, "New Methods in Automatic Extracting", Journal of the Association for Computing Machinery, Vol. 16, No. 2, pp. 264-285, 1969. https://doi.org/10.1145/321510.321519
  9. J. Kupiec, J. Pedersen, and F. Chen, "A Trainable Document Summarizer", In Proceedings of 18th ACM-SIGIR Conference, pp. 68-73, 1995.
  10. Document Understanding Conferences, Available: http://duc.nist.gov/index.html, 2000, [Accessed: September 15, 2010]
  11. hin-Yew Lin, "ROUGE: A Package for Automatic Evaluation of Summaries", In Proceedings of the ACL-04 Workshop: Text Summarization Branches Out, pp. 74-81, 2004.
  12. 송원문, 김영진, 김은주, 김명원, "동적 연결 그래프를 이용한 자동 문서 요약 시스템", 정보과학회 논문지: 소프트웨어 및 응용, Vol. 36, No. 1(C), pp. 311-314, 2009
  13. 강승식, 한국어 형태소 분석과 정보 검색, 홍릉과학출판사, 2002
  14. Inderjeet Mani, Automatic Summarization, John Benjamins Publishing Company, 2001.