Searching Patents Effectively in terms of Keyword Distributions

키워드 분포를 고려한 효과적 특허검색기법

  • 이우기 (인하대학교 산업공학과) ;
  • 송종수 (인하대학교 산업공학과) ;
  • 강민구 (인하대학교 산업공학과)
  • Published : 2012.09.30

Abstract

With the advancement of the area of knowledge and information, Intellectual Property, especially, patents have captured attention more and more emergent. The increasing need for efficient way of patent information search has been essential, but the prevailing patent search engines have included too many noises for the results due to the Boolean models. This has occasioned too much time for the professional experts to investigate the results manually. In this paper, we reveal the differences between the conventional document search and patent search and analyze the limitations of existing patent search. Furthermore, we propose a specialized in patent search, so that the relationship between the keywords within each document and their significance within each patent document search keyword can be identified. Which in turn, the keywords and the relationships have been appointed a ranking for this patent in the upper ranks and the noise in the data sub-ranked. Therefore this approach is proposed to significantly reduce noise ratio of the data from the search results. Finally, in, we demonstrate the superiority of the proposed methodology by comparing the Kipris dataset.

지식정보화 시대의 본격화와 함께 지식재산권, 그 중에서도 특허의 중요성이 더욱 커져가고 있다. 이에 따라 효율적인 특허정보 검색방법의 필요성이 높아지고 있지만, 기존의 특허검색 엔진은 불리언 모델을 기반으로 단어의 존재 여부만을 파악하는 방식으로 검색결과에 노이즈 데이터가 너무 많이 포함되어 특허 검색에 오랜 시간을 허비하게 만들므로 '전문검색가'들이 수동으로 찾아주고 있는 실정이다. 이에 본 논문에서는 기존의 일반적 문서검색과 특허검색과의 차이점을 밝히고, 기존 특허검색의 한계성을 분석한다. 나아가 특허검색에 특화된 효과적 방법론 제안하여 검색 키워드가 각 특허 문서 내에서 차지하는 중요도와 각 문서 내에서 키워드 사이의 관계성을 파악하고 이에 대한 랭킹을 정하여 키워드와 관계성이 높은 특허가 상위에 랭크하며 노이즈 데이터를 하위에 랭크 함으로써 검색 결과에서 노이즈 데이터의 비율을 대폭 줄이는 방법을 제안한다. 마지막으로 실험을 통하여 Kipris 검색 결과와 비교함으로써 제안한 방법론의 우수성을 입증하였다.

Keywords

References

  1. 강민규, 정인상, 강승식, "특허 문서 분류를 위한 영역-자질 선택," 한국정보과학회논문지, 제36권, 제1호, pp.284-287, 2009.
  2. 백종범, 김성민, 이수원, "특허 정보 검색을 위한 대체어 후보 추출 방법 연구," 한국정보과학회논문지, 제35권, 제2호(A), pp. 95-96, 2008.
  3. 신원섭, "특허정보의 효율적 활용을 위한 통합형 특허지표 설계," 경영과학, 제24권 제2호, pp. 1-18, 2007.
  4. Http://www.wips.co.kr
  5. Http://www.KIPRIS.or.kr
  6. Debasis, G., Johannes, L., Walid, M., and Gareth, J. F. Jones, "Patent query reduction using pseudo relevance feedback," CIKM, pp. 1953-1956, 2011.
  7. Fall, C. J., Torcsvari, A., Benzineb, K., and Karetka, G., "Automated Categorization in the International Patent Classification," In: ACM SIGIR Forum, Vol. 37, Issue 1, 2003.
  8. Gaff, B. M., Loren, R. A., and McCool, G. J., "Intellectual Property, Part I," IEEE Computer, Vol. 45l Issue. 1, pp. 14-16, 2012.
  9. Gaff, B. M., Loren, R. A., and Spinney, E. A., "Intellectual Property, Part II," IEEE Computer, Vol. 45, Issue. 2, pp.9-11, 2012.
  10. Jiancheng, G., Zifeng, C., "Patent collaboration and international knowledge flow," Information Processing Management, Vol. 48. Issue. 1, pp. 170-181, 2012. https://doi.org/10.1016/j.ipm.2011.03.001
  11. New York Times: www.nytimes.com
  12. Sohn, Y. K., "Legal Method of Defending against Patent Trolls," 한국법학원, 저스티스, 통권 제115호, pp. 381-401, 2010.
  13. Walid, M., Patrice, L., and Gareth, J. F. Jones, "Simple vs. Sophisticated Approaches for Patent Prior-Art Search," ECIR, pp. 725-728, 2011.
  14. Wookey, L., and Park, S. H., "Task Assignment and Assessment based on Hierarchical Knowledge Structure as a Reference Model," Journal of Information Technology and Architecture, Vol. 8. No. 4, pp. 395-401, 2011.
  15. Wookey, L., and Lim, S. H., "Architecture Measurements on the World Wide Web as a Graph," Journal of Information Technology and Architecture, Vol. 4. No. 1, pp. 61-69, 2007.
  16. Xiao, T., Cao, F., Li, T., Song, G., Zhou, K., Zhu, J., and Wang, H., "KNN and Re-ranking Models for English Patent Mining at NTCIR-7," In: Proc. NTCIR-7 Workshop, 2008.