DOI QR코드

DOI QR Code

An Advanced Search that Converts Natural Language into the Logic Advanced Search and with Developed History Search Method

자연어의 논리식으로의 변환을 이용한 고급검색 및 이를 활용한 히스토리 검색

  • 이대홍 (한국외국어대학교 정보통신공학과) ;
  • 유한석 (한국외국어대학교 정보통신공학과) ;
  • 박상원 (한국외국어대학교 정보통신공학과)
  • Received : 2020.01.14
  • Accepted : 2020.03.11
  • Published : 2020.06.30

Abstract

Nowadays there are over 1.6 billion web pages and it is hard to get necessary results that user wants. Most search engines allow you to search with logical form to get accurate results. However, normal users are not familiar to search information as logical form. Therefore, they search in natural language rather than in complicated logical form. In this paper there are some suggestions to improve quality of searching results, converting natural language input by the user into logical form which can able to use advanced search engine. Users tend to make short searches due to the 'Simplicity' which is one of the features of the search form. Therefore we suggest history retrieval method; advanced version of previous suggestion to provide convenience to the normal users. We had improvement on accuracy of the search results converting natural languages to logical form and also can contain every keyword without missing any keywords using searching methods on this paper. It is expected that these search methods will contribute to the development of search engines.

현재 웹에서 존재하는 웹페이지는 16억개 이상이며 이중에서 원하는 검색결과를 얻기란 쉽지 않은 일이다. 대부분의 검색엔진에서는 정밀한 검색결과를 제공하기 위하여 논리식의 형태로 검색할 수 있게 하고 있다. 하지만 일반적인 경우 사람들은 원하는 정보를 논리식 형태로 검색하는데 익숙하지 않다. 때문에 복잡한 논리식 형태로 검색하기 보다는 자연어로 검색한다. 따라서 본 논문에서는 사용자가 입력하는 자연어 질의를 검색엔진의 고급검색을 사용할 수 있는 논리식으로 변환하여 검색결과의 품질을 향상시켜주는 검색방법을 제안한다. 또한 사용자들은 검색형태의 특징 중 하나인 단순성에 의해 길게 검색하기 보다는 여러 번의 짧은 검색을 이용하는 경우가 훨씬 많다. 이에 따라 사용자들에게 편리성을 제공하기 위하여 앞에서 제안한 검색방법을 활용한 히스토리 검색방법을 제안한다. 본 논문의 검색방법들을 사용한 결과 자연어 상태의 검색결과보다 논리식으로 변환한 검색결과의 정확도가 개선되었고 누락되는 키워드 없이 사용자가 검색하고자하는 모든 키워드를 반영할 수 있다. 이러한 검색방법이 검색엔진의 발전에 기여할 것으로 기대한다.

Keywords

References

  1. Ministry of Science and ICT(2019). 2018 Survey on Internet Use.
  2. Total Number of Website [Internet], http://www.internetlivestats.com/total-number-of-websites/.
  3. In K. Lee, Seo H. Son, and Soon H. Kwon, "Knowledge-based semantic meta-search engine," Journal of Korean Institute of Systems, Vol.14, No.6, pp.737-744, 2004. https://doi.org/10.5391/JKIIS.2004.14.6.737
  4. 김준태, 윤견아 "인터넷 정보검색 시스템의 연구 동향," The Korean Institute of Electrical Engineers, Vol.48, No.3, pp.52-59, 1999.
  5. Young-Duk Seo, Jeong-Dong Kim, Chonghyeon Lee, and Doo-Kwon Baik, "A page rank algorithm for information retrieval in real time," Proceedings of KIISE Fall Conference, Vol.38, No.2C, pp.57-60, 2011.
  6. Wikipedia, "Google Fred" [Internet], https://en.wikipedia.org/wiki/Google_Fred.
  7. Dong Kwon Kim, "Tips for using Google search," Magazine of the SAREK, Vol.44, No.2, pp.80-81, 2015.
  8. Sung-Hee Lee, "Syntactic analysis and keyword expansion for performance enhancement of information retrieval system," Korea Academy Industrial Cooperation Society, pp.139-142, 2004.
  9. Sung Hee Yoon, "Personalized web search using query based user profile," Journal of the Korea Academia-Industrial Cooperation Society, Vol.17, No.2, pp.690-696, 2016. https://doi.org/10.5762/KAIS.2016.17.2.690
  10. Myung-Seok Yang, Seok-Hyung Lee, Nam-Kyu Kang, and Hwa-Mook Yoon, "A ranking method using link & description information in meta searching," Proceedings of KIISE Fall Conference, Vol.29, No.2, pp.118-120, 2002.
  11. 김성희, "인터넷상의 메타검색엔진 검색효율성에 관한 비교 연구," Korean Library and Information Society Summer Conference, pp.75-91, 1997.
  12. Yong-Woon Han, "Applying korean linguistics to natural language question-answer search system," International Language and Literature, Vol.10-1, pp.36-51, 2004.
  13. Myeong Hee Lee, "An exploratory study of performances between a subject directory and keyword search engine in the network databases," Journal of The Korean Society for Library and Information Science, Vol.31, No.2, pp.177-197, 1997.
  14. Yong Kim and Ju Won Kyun, "Design and implementation of tag coupling-based boolean query matching system for ranked search result," Korea Society for Information Management, Vol.29, No.4, pp.101-121, 2012. https://doi.org/10.3743/KOSIM.2012.29.4.101
  15. Ryen W. White and Dan Morris, "Investigating the querying and browsing behavior of advanced search engine users," SIGIR '07 Proceedings of the 30th Annual International ACM SIGIR Conference, pp.255-262, 2007.
  16. Daehong Lee, Hansuk Yu, and Sangwon Park, "Searching system using advanced search of search engine," Korea Software Congress 2019.