DOI QR코드

DOI QR Code

앙상블모형을 이용한 공백기술예측

Vacant Technology Forecasting using Ensemble Model

  • 전성해 (청주대학교 바이오정보통계학과)
  • 투고 : 2011.03.16
  • 심사 : 2011.06.01
  • 발행 : 2011.06.25

초록

공백기술예측은 기술경영 분야에서 중요하게 다루어지는 주제이다. 다양한 분야에서 현재까지의 기술개발결과를 분석하여 상대적으로 연구개발이 이루어지지 못한 분야를 찾아내어 개발하는 것은 국가와 기업의 발전에 중요한 영향을 미친다. 현재 특허는 기술개발결과에 대한 가장 객관적인 데이터 중 하나이다. 본 논문에서는 특허데이터를 이용하여 공백기술을 정량적으로 예측할 수 있는 방법에 대하여 연구한다. 하나의 정량적 기술예측모형이 완벽하다는 보장을 할 수 없기 때문에 본 연구에서는 여러 가지 모형들의 결과를 결합하여 예측하는 앙상블모형을 제안한다. 통계적 분석기법과 기계학습 알고리즘을 결합하여 보다 객관적이고 정확한 공백기술예측모형을 구축한다. 제안방법의 객관적인 성능평가를 위하여 각 기술분야에 대하여 최초 특허가 이루어진 시점부터 최근까지 출원, 등록된 특허데이터를 이용한다.

A vacant technology forecasting is an important issue in management of technology. The forecast of vacant technology leads to the growth of nation and company. So, we need the results of technology developments until now to predict the vacant technology. Patent is an objective thing of the results in research and development of technology. We study a predictive method for forecasting the vacant technology quantitatively using patent data in this paper. We propose an ensemble model that is to vote some clustering criteria because we can't guarantee a model is optimal. Therefore, an objective and accurate forecasting model of vacant technology is researched in our paper. This model combines statistical analysis methods with machine learning algorithms. To verify our performance evaluation objectively, we make experiments using patent documents of diverse technology fields.

키워드

참고문헌

  1. 법률지식정보시스템, likms.assembly.go.kr
  2. 나까야마 노부히로, 특허법, 법문사, 2001.
  3. 제대식, 이은철, 윤국섭 역, 지식경영과 특허전략, 세종서적, 2000.
  4. 황종환, 특허법, 한빛지적소유권센터, 2001.
  5. 남영준, 정의섭 "인용정보를 이용한 신 특허지수 개발에 관한 연구," 정보관리학회지, vol. 23, no. 1, pp. 221-241, 2006. https://doi.org/10.3743/KOSIM.2006.23.1.221
  6. 유선희, "특허인용 분석을 통한 기술수명예측모델 개발에 관한 연구," 정보관리연구, vol. 35, no. 1, pp. 93-112, 2004. https://doi.org/10.1633/JIM.2004.35.1.093
  7. 전성해, 박상성, 신영근, 장동식, 정호석, "자기조직화지도와 매트릭스분석을 이용한 특허분석시스템의 공백기술 예측," 한국콘텐츠학회논문지, vol. 10, no. 2, pp. 462-480, 2010.
  8. 전성해, 특허분석을 이용한 지능형시스템의 기술예측, 한국지능시스템학회 논문지, vol. 21, no. 1, pp. 100-105, 2011. https://doi.org/10.5391/JKIIS.2011.21.1.100
  9. B. Yoon, Y. Park, "Development of New Technology Fore casting Algorithm: Hybrid Approach for Morphology Analysis and Conjoint Analysis of Patent Information," IEEE Transactions on Engineering Management, vol. 54, no. 3, pp. 588-599, 2007. https://doi.org/10.1109/TEM.2007.900796
  10. 특허청 정보기획팀, 한국발명진흥회 정보활용지원팀, 특허와 정보분석 (개정판), 성민, 2007.
  11. B. Yoon, S. Lee, "Patent analysis for technology forecasting: Sector-specific applications," Proceeding of IEEE International Conference on Engineering Management, pp. 1-5, 2008. https://doi.org/10.1109/IEMCE.2008.4617997
  12. 특허정보검색서비스, www.kipris.or.kr
  13. 전성해, 엄대호, "특허와 통계학, 그 연결은?" 한국통계학회논문집, vol. 17, no. 2, pp. 205-222, 2010. https://doi.org/10.5351/CKSS.2010.17.2.205
  14. S. Lee, B. Yoon, Y. Park, "An approach to discovering new technology opportunities: Keyword-based patent map approach," Technovation, vol. 29, pp. 481-497, 2009. https://doi.org/10.1016/j.technovation.2008.10.006
  15. P. Wang, I. M. Cockburn, M. L. Puterman, "Analysis of Patent Data-A Mixed Poisson Regression Model Approach," Journal of Business & Economic Statistics, vol. 16, no. 1, pp. 27-41, 1998. https://doi.org/10.2307/1392013
  16. J. Han, M. Kamber, Data Mining Concepts and Techniques, Morgan Kaufmann, 2001.
  17. M. Fattori, G. Pedrazzi, R. Turra, "Text mining applied to patent mapping: a practical business case," World Patent Information, vol. 25, pp. 335-342, 2003. https://doi.org/10.1016/S0172-2190(03)00113-3
  18. G. H. Golub, C. Reinsch, "Singular value decomposition and least squares solutions," Numerische Mathematik, vol. 14, no. 5, pp. 403-420, 1970. https://doi.org/10.1007/BF02163027
  19. 오일석, 패턴인식, 교보문고, 2008.
  20. J. F. Hair, B. Black, B. Babin, R. E. Anderson, Multivariate Data Analysis, Prentice Hall, 1992.
  21. R. A. Johnson, D. W. Wichern, Applied Multivariate Statistical Analysis, Pearson, 2007.
  22. 김병천 역, 통계학을 위한 행렬대수학, 자유아카데미, 2001.
  23. 강근석, 김충락, 회귀분석, 교우사, 2005.
  24. P. J. Rousseeuw, "Silhouettes: a graphical aid to the interpretation and validation of cluster analysis," Journal of Computational and Applied Mathematics, vol. 20, pp. 53-65, 1987. https://doi.org/10.1016/0377-0427(87)90125-7
  25. T. M. Mitchell, Machine Learning, McGraw-Hill, 1997.
  26. USPTO (United States Patent and Trademark Office), www.uspto.gov
  27. I. Feinerer, K. Hornik, D. Meyer, "Text Mining Infrastructure in R," Journal of Statistical Software, vol. 25, iss. 5, pp. 1-54, 2008.
  28. R Development Core Team, R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, http://www.R-project.org, 2010.
  29. X. Chen, W. Yin, P. Tu, H. Zhang, "Weighted k-Means Algorithm Based Text Clustering," Proceedings of International Symposium on Information Engineering and Electronic Commerce, pp. 51-55, 2009.
  30. T. Kanungo, D. M. Mount, N. S. Netanyahu, C. D. Piatko, R. Silverman, A. Y. Wu, "An efficient k-means clustering algorithm: Analysis and implementation," IEEE transaction on pattern analysis and machine intelligence, vol. 24, pp. 881-892, 2002. https://doi.org/10.1109/TPAMI.2002.1017616

피인용 문헌

  1. A Big Data Learning for Patent Analysis vol.23, pp.5, 2013, https://doi.org/10.5391/JKIIS.2013.23.5.406
  2. Technology Strategy based on Patent analysis vol.26, pp.2, 2016, https://doi.org/10.5391/JKIIS.2016.26.2.141
  3. Development of On-In-One Web Solution for Technology Marketing vol.26, pp.2, 2016, https://doi.org/10.5391/JKIIS.2016.26.2.099