Entitymetrics Analysis of the Research Works of Dong-ju Yun using Textmining

텍스트마이닝을 이용한 윤동주 연구의 개체계량학적 분석

  • 박진균 (연세대학교 문헌정보학과) ;
  • 김택윤 (연세대학교 문헌정보학과) ;
  • 송민 (연세대학교 문헌정보학과)
  • Received : 2017.02.20
  • Accepted : 2017.03.14
  • Published : 2017.03.30


This paper employs entitymetrics analysis on the research works of Dong-ju Yun. He was a Korean poet who was studied by many researchers on his works, religion and life. We collected 1,076 papers about Dong-ju Yun and conducted various approaches including co-author citation analysis, topic modeling analysis to identify the topic trend in the study of Dong-ju Yun. Also we extracted entities like person's name and literature's title from abstract to examine the relationship among them. The result of this paper enables us to objectively identify the topic trend and infer implicit relationships between key concept associated with Dong-ju Yun based on text data. Moreover, we observed sub-research topics such as life, poem, aesthetic existence, comparative literature, literary translation, and religious beliefs. This paper shows how entitymetrics can be utilized to study intellectual structures in the humanities.

이 연구는 텍스트마이닝 기술을 이용한 개체계량학적 분석을 인문학 분야 인물 연구에 적용하기 위해 수행하였다. 연구 대상으로 한 인물은 작품뿐만 아니라 종교, 생애에 대해 많은 연구가 이루어진 윤동주를 선정하였다. 본 논문에서는 윤동주 관련 연구 1,076건을 수집하여 이중에서 초록 정보를 가지고 있었던 220건의 논문을 대상으로 LDA(Latent Dirichlet Allocation) 방식의 토픽모델링 분석을 수행하였으며, 참고문헌 정보를 추출할 수 있었던 121건의 논문을 대상으로 저자동시인용 분석을 통해 연구의 동향을 살펴보았다. 또한 초록에서 인명, 작품명의 개체를 추출하여 이들의 관계를 살펴보았다. 이 연구를 통해 윤동주에 관련한 연구 동향은 생애, 시, 실존의식, 비교문학, 번역문학, 종교적 신념에 대한 연구로 다양한 분야에 걸쳐 이루어졌다는 것을 데이터를 기반으로 보다 객관적으로 분석해 볼 수 있었으며, 윤동주와 함께 연구되는 다른 인물이 어떤 작품을 매개로 하여 연구되어 왔는지에 대해서도 알 수 있었다. 이러한 결과는 인문학 분야의 지적구조를 밝히는데 개체계량학적 방법이 유용함을 증명하는 한편 인문학연구의 새로운 시각적 접근을 제안했다는 데에 의의가 있다.



  1. 권혁웅. 2013. 소리-뜻을 중심으로 구성되는 현대시의 리듬: 님의 침묵, 별헤는 밤을 중심으로. 한국문학이론과 비평, 59: 27-48. (Kwon, Hyuk-woong. 2013. "The Study on the Rhythm which Consists of a Sound-Meaning (Prosodie) in Korean Modern Poetry." Korean literary theory and criticism, 59: 27-48.)
  2. 김병호. 2002. 한국 근대시 연구. 박사학위논문. 중앙대학교 대학원, 문예창작전공. (Kim, Byung-Ho. 2002. A Study on Modern Korean Poetry. PhD diss. Chung-Ang University.)
  3. 김학용. 2012. 대하소설 토지 등장인물 네트워크의 동적 변화 분석. 한국콘텐츠학회논문지, 12(11): 519-526. (Kim, Hak-Yong. 2012. "Analysis of Network Dynamics from the Roman-Fleuve, Togi." Journal of the Korea Contents Association, 12(11): 519-526.)
  4. 김형태. 2015. 윤동주 시의 실존의식 연구. 박사학위논문. 한국교원대학교 대학원, 국어교육전공. (Kim, Hyung-Tae. 2015. Study on the existential consciousness in the poetry of Yun Dong-Ju. PhD diss. Korea National University of Education.)
  5. 김희전, 조현양. 2010. 저자동시인용분석과 저자서지결합분석에 의한 지적 구조 분석. 정보관리학회지, 27(3): 283-306. (Kim, Hee-Jeon and Hyun-Yang Cho. 2010. "A Study on Intellectual Structure Using Author Co-Citation Analysis and Author Bibliographic Coupling Analysis in the Field of Social Welfare Science." Journal of the Korean Society for Information Management, 27(3): 283-306.)
  6. 류양선. 2011. 윤동주의 시에 나타난 기독교 신앙. 한국시학연구, 31: 141-168. (Ryu, Yang-seon. 2011. "The Christian faith in Yun, Dong-ju's poetry." The Korean Poetics Studies, 31: 141-168.)
  7. 박용민, 이재성. 2014. 한국어 제목 개체명 인식 및 사전 구축: 도서, 영화, 음악, TV 프로그램. 정보처리학회논문지/소프트웨어 및 데이터 공학, 3(7): 285-292. (Park, Yong-min and Jae-Sung Lee. 2014. "Named Entity Recognition and Dictionary Construction for Korean Title: Books, Movies, Music and TV Programs." Korea Information Processing Society, 3(7): 285-292.)
  8. 박자현, 송민. 2013. 토픽모델링을 활용한 국내 문헌정보학 연구동향 분석. 정보관리학회지, 30(1): 7-32. (Park, Ja-Hyun and Min Song. 2013. "A study on the research trends in library & information science in Korea Using topic modeling." Journal of the Korean Society for Information Management, 30(1): 7-32.)
  9. 박호영. 2012. 일제강점기 바이런과 셸리의 수용과 의의. 어문연구, 40(4): 277-295. (Park, Ho-young. 2012. "Reception and Significance of Byron and Shelley during the Japanese Ruling Era of Korea." The Society for Korean Language and Literary Research, 40(4): 277-295.)
  10. 오문석. 2012. 윤동주와 다문화적 주체성의 문학. 한국근대문학연구, 25: 149-176. (Oh, Moon-seok. 2012. "Multicultural Subjectivity in Yun Dong-ju's Literature." Journal of Modern Korean Literature, 25: 149-176.)
  11. 윤순근. 1992. 황무지연구의 계량서지학적 고찰. 서지학연구, 8: 135-206. (Yun, Soon-Keun. 1992. "A Study of the bibliometrics on the Waste Land by T.S. Eliot." The Institute of Bibliography, 8: 135-206.)
  12. 윤여탁. 2015. 한국 근대시의 만주 체험 - 시적 형상화와 그 의미 -. 한중인문학연구, 46: 121-140. (Yoon, Yeo-Tak. 2015. "A study on Manchuria Erlebnis of Korean Modern Poetry." Studies of Korean & Chinese Humanities, 46: 121-140.)
  13. 이승하. 1999. 일제하 기독교 시인의 죽음의식 - 정지용․윤동주의 경우. 어문논집, 27: 133-161. (Lee, Seung-ha. 1999. "The death ceremony of a Christian poet under Japanese rule: In the case of Jung, Ji-yong and Yun, dong-ju." The Journal of Language and Literature, 27: 133-161.)
  14. 이재윤. 2005. 문헌동시인용 분석을 통한 한국 문헌정보학의 연구 전선 파악. 정보관리학회지, 32(4): 77-106. (Lee, Jae-Yun. 2005. "Identifying the Research Fronts in Korean Library and Information Science by Document Co-citation Analysis." Journal of the Korean Society for Information Management, 32(4): 77-106.)
  15. 이재윤. 2008. 서지적 저자결합분석. 정보관리학회지, 25(1): 173-190. (Lee, Jae-Yun. 2008. "Bibliographic author coupling analysis: a new methodological approach for identifying research trends." Journal of the Korean Society for Information Management, 25(1): 173-190.)
  16. 정은아. 2016. 윤동주 시 교육 방법론 연구. 우리문학연구, 49: 375-402. (Chung, Eun-Ah. 2016. "A Study on the Methodology of Yun Dong Ju's Poetry Education - Focusing on a Pre-Reading Activity About the Poem: ." The Studies of Korean Literature, 49: 375-402.)
  17. 함정은, 송민. 2015. 인용정보를 고려한 미발견 공공 지식 추출 - Swanson의 ABC 모델 재현 및 확장. 정보관리학회지, 32(2): 87-103. (Ham, Jung Eun and Song Min. 2015. "Detection of Hidden Knowledge Using a Citation-Based Approach Based on Swanson's ABC Model." Journal of the Korean Society for Information Management, 32(2), 87-103.)
  18. Asuncion, H. U., A. U. Asuncion, and R. N. Taylor. 2010. "Software traceability with topic modeling." Proceedings of the 32nd ACM/IEEE International Conference on Software Engineering-Volume 1, 95-104
  19. Blei, D. M. 2012. "Probabilistic topic models." Communications of the ACM, 55(4): 77-84.
  20. Blei, D. M., A. Y. Ng, and M. I. Jordan. 2003. "Latent dirichlet allocation." Journal of Machine Learning Research, 3(Jan): 993-1022.
  21. Ding, Y., M. Song, J. Han, Q. Yu, E. Yan, L. Lin, and T. Chambers. 2013. "Entitymetrics: Measuring the impact of entities." PloS one, 8(8): e71416.
  22. Griffiths, T. L. and M. Steyvers. 2004. "Finding scientific topics." Proceedings of the National Academy of Sciences, 101(suppl 1): 5228-5235.
  23. Hammarfelt, B. 2011. "Citation analysis on the micro level: The example of Walter Benjamin's Illuminations." Journal of the American Society for Information Science and Technology, 62(5): 819-830.
  24. McCain, K. W. 1983. "The author cocitation structure of macroeconomics." Scientometrics, 5(5): 277-289.
  25. Shineware. 2014. 한글형태소분석기 Komoran 2.0.
  26. Small, H. 1973. "Co-citation in the scientific literature: A new measure of the relationship between two documents." Journal of the American Society for Information Science, 24(4): 265-269.
  27. Song, M. and S. Y. Kim. 2013. "Detecting the knowledge structure of bioinformatics by mining full-text collections." Scientometrics, 96(1): 183-201.
  28. Tonussi, P. 2013. "Branwell Brontë and TS Eliot, April Rain and Aching Memories: History of a Reading?" Bronte Studies, 38(2): 139-144.
  29. Wang, X. and A. McCallum. 2006. "Topics over time: a non-Markov continuous-time model of topical trends." The 12th ACM SIGKDD international conference on Knowledge discovery and data mining.
  30. White, H. D. 1990. "Author co-citation analysis: Overview and defense." Scholarly Communication and Bibliometrics, 84: 106.
  31. White, H. D. and B. C. Griffith. 1981. "Author cocitation: A literature measure of intellectual structure." Journal of the American Society for Information Science, 32(3): 163-171.

Cited by

  1. 인용가중 저자프로파일링을 이용한 학교도서관 연구의 지적구조 분석 vol.54, pp.2, 2020,
  2. Analyzing knowledge entities about COVID-19 using entitymetrics vol.126, pp.5, 2017,