한국어 복합문에서의 제로 대용어 처리를 위한 분해 알고리즘과 복원규칙

Splitting Algorithms and Recovery Rules for Zero Anaphora Resolution in Korean Complex Sentences

  • 김미진 (경북대학교 컴퓨터공학과) ;
  • 박미성 (경북대학교 컴퓨터공학과) ;
  • 구상옥 (경북대학교 컴퓨터공학과) ;
  • 강보영 (경북대학교 컴퓨터공학과) ;
  • 이상조 (경북대학교 컴퓨터공학과)
  • Kim, Mi-Jin (Dept.of Computer Engineering, Kyungpook National University) ;
  • Park, Mi-Sung (Dept.of Computer Engineering, Kyungpook National University) ;
  • Koo, Sang-Ok (Dept.of Computer Engineering, Kyungpook National University) ;
  • Kang, Bo-Yeong (Dept.of Computer Engineering, Kyungpook National University) ;
  • Lee, Sang-Jo (Dept.of Computer Engineering, Kyungpook National University)
  • 발행 : 2002.10.01

초록

한국어에는 복합문에서 영 대용이 빈번하게 발생하여 해석을 어렵게 한다. 따라서 본 논문에서는 한국어 영 대용어 처리를 위해 복합문 분해 알고리즘과 복합문 영 대용어 복원 규칙을 제안하고, 해결방법을 제시한다. 본 논문은 신문 기사의 복합문 중에서 보조용언 내포문을 제외한 인용문, 접속문, 내포문을 처리 대상으로 한다. 복합문 분해를 위해서는 복합문 구성에 관여하는 어미들의 어미 분류표를 이용하고, 영 대용어 복원을 위해서는 생략될 때 적용된 통사규칙을 역으로 이용한다. 인용문은 주어 인칭제약에 따른 동일 명사구 탈락규칙을, 명사화 내포문은 동일 명사구 탈락규칙을, 관형화 내포문은 관계 명사구 탈락규칙을 그리고 접속문은 접속 삭감규칙을 역으로 이용하여 처리한다. 제안한 방법을 이용한 결과 전체 영 대용어 중 83.53%가 해결 가능하며 11.52%는 부분적으로 해결 가능하다.

Zero anaphora occurs frequently in Korean complex sentences, and it makes the interpretation of sentences difficult. This paper proposes splitting algorithms and zero anaphora recovery rules for the purpose of handling zero anaphora, and also presents a resolution methodology. The paper covers quotations, conjunctive sentences and embedded sentences out of the complex sentences shown in the newspaper articles, with an exclusion of embedded sentences of auxiliary verb. We manage the quotations using the equivalent noun phrase deletion rule according to subject person constraint, the nominalized embedded sentences using the equivalent noun phrase deletion rule, the adnominal embedded sentences using the relative noun phrase deletion rule and the conjunctive sentences using the conjunction reduction rule in reverse. The classified table of the endings which relate to a formation of the complex sentences is used for splitting the complex sentences, and the syntactic rules, applied when being omitted, are used in reverse for recovering zero anaphora. The presented rule showed the result of 83.53% in perfect resolution and 11.52% in partial resolution.

키워드

참고문헌

  1. 한재현, '생략과 대용현상 -한국어와 영어를 중심으로-', 한신문화사, 1984
  2. 김일웅, '우리말 대용어의 연구', 부산대학교 박사학위 논문, 1982
  3. 양명희, '현대국어 대용어에 대한 연구', 서울대 박사 논문, 1996
  4. 남기심, '언어학 개론', 탑출판사, 1985
  5. 김옥, '국어 접속문의 생략에 관한 고찰', 전남대학교 교육학과 국어교육전공 석사학위 논문, 1998
  6. Ik-Hwan Lee, Minhaeng Lee (2000a) 'Anaphora Resolution and Discourse Structure: A Controlled Information Packaging Approach,' In: Language and Information 4(1), 67-82, 2000, 6[in English]
  7. Ik-Hwan Lee, Minhaeng Lee, (2000b) 'On the Discourse Analysis in Korean Dialogues,' In : Proceedings in PACLIC14. pp. 207-218, 2000 [in English]
  8. Ik-Hwan Lee, Minhaeng Lee, 'On the Anaphora Resolution in Korean Dialogues,' In : Harvard Studies in Korean Linguistics Vol. 7, 1999
  9. 한승연, 송만석, '개념 그래프를 이용한 대용어 해결 시스템,' 한국정보처리학회 추계 학술발표논문집, 제2권 제2호, pp.844-851, 1995
  10. 한승연, '지식 기반을 이용한 대용어 해결 시스템,' 연세대학교 전산과학과 석사학위논문, 1995
  11. 차건희, 송도규, 박재득, '한국어 대용과 생략 해결을위한 센터링 이론의 적용,' 한글 및 한국어정보처리 발표 논문집, pp.347-352, 1997
  12. 김정해, 이상국, 이상조, '한국어 문장내 체언류 조응대용어의 해결방안,' 대한 전자공학회 논문지 B편 제 4호, pp.183-190, 1996
  13. 김정해, 'HPSG 파서에 기반한 한국어 문맥 조응대용어의 해결', 경북대학교 박사학위 논문, 1996
  14. S. Lappin and M. McCord, 'Anaphora Resolution in Slot Grammar,' Computational Linguistics, Vol.16, No.4, pp. 197-212, 1990
  15. Walker, Marilyn, 'Centering, Anaphora Resolution, and Discourse Structure,' Cemtering in Discourse, eds. Marilyn A. Walker, Aravind K. Joshi and Ellen F. Prince, Oxford University Press, 1997
  16. Walier, Marilyn, Massayo Iida & Sharon Cote, 'Centering in Japanese Discourse,' Proceedings of the 13th International Conference on Computational Linguistics(Coling 90), 1990
  17. Walker, M.; M. Iida and Cote, S., 'Japanese Discourse and the Process of Centering,' Computational Linguistics, 20, pp. 193-232, 1994
  18. Nakaiwa, H., 'Automatic Extraction of Rules for Anaphora Resolution of Japanese Zero Pronouns from Aligend Sentence Pairs,' Proc. of ACL-97/EACL-97 Workshop on Operational Factors in Practical, Roubust, Anaphora Resolution for Unerestricted Texts, Madrid, Spain, pp. 22-29, 1997
  19. 권재일, '국어의 복합문 구성연구,' 집문당, 1985
  20. 김홍규, '국어 기초 자료 구축', 21세기 세종계획 연구 보고서, 문화관광부, 2000
  21. Saliha Azzam, 'Resolving Anaphor in Embedded Sentences,' 1997
  22. Young-Giu Jung, 'Implementation of a parser for news summarization,' IC-AI, 2001
  23. 남기심, '국어 완형보문법 연구', 한국연구총서(叢書) (1), 계명대학교 출판부, 1983
  24. 이필영, '국어의 인용구문 연구', 탑 출판사, 1993