DOI QR코드

DOI QR Code

지능형 검색엔진을 위한 색상 질의 처리 방안

Color-related Query Processing for Intelligent E-Commerce Search

  • 홍정아 (한양대학교 경영학부) ;
  • 구교정 (한양대학교 파이낸스경영학과) ;
  • 차지원 (한양대학교 경영학부) ;
  • 서아정 (한양대학교 컴퓨터공학부) ;
  • 여운영 (한양대학교 비즈니스인포매틱스학과) ;
  • 김종우 (한양대학교 경영대학 경영학부)
  • 투고 : 2018.11.02
  • 심사 : 2019.02.28
  • 발행 : 2019.03.31

초록

지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.

As interest on intelligent search engines increases, various studies have been conducted to extract and utilize the features related to products intelligencely. In particular, when users search for goods in e-commerce search engines, the 'color' of a product is an important feature that describes the product. Therefore, it is necessary to deal with the synonyms of color terms in order to produce accurate results to user's color-related queries. Previous studies have suggested dictionary-based approach to process synonyms for color features. However, the dictionary-based approach has a limitation that it cannot handle unregistered color-related terms in user queries. In order to overcome the limitation of the conventional methods, this research proposes a model which extracts RGB values from an internet search engine in real time, and outputs similar color names based on designated color information. At first, a color term dictionary was constructed which includes color names and R, G, B values of each color from Korean color standard digital palette program and the Wikipedia color list for the basic color search. The dictionary has been made more robust by adding 138 color names converted from English color names to foreign words in Korean, and with corresponding RGB values. Therefore, the fininal color dictionary includes a total of 671 color names and corresponding RGB values. The method proposed in this research starts by searching for a specific color which a user searched for. Then, the presence of the searched color in the built-in color dictionary is checked. If there exists the color in the dictionary, the RGB values of the color in the dictioanry are used as reference values of the retrieved color. If the searched color does not exist in the dictionary, the top-5 Google image search results of the searched color are crawled and average RGB values are extracted in certain middle area of each image. To extract the RGB values in images, a variety of different ways was attempted since there are limits to simply obtain the average of the RGB values of the center area of images. As a result, clustering RGB values in image's certain area and making average value of the cluster with the highest density as the reference values showed the best performance. Based on the reference RGB values of the searched color, the RGB values of all the colors in the color dictionary constructed aforetime are compared. Then a color list is created with colors within the range of ${\pm}50$ for each R value, G value, and B value. Finally, using the Euclidean distance between the above results and the reference RGB values of the searched color, the color with the highest similarity from up to five colors becomes the final outcome. In order to evaluate the usefulness of the proposed method, we performed an experiment. In the experiment, 300 color names and corresponding color RGB values by the questionnaires were obtained. They are used to compare the RGB values obtained from four different methods including the proposed method. The average euclidean distance of CIE-Lab using our method was about 13.85, which showed a relatively low distance compared to 3088 for the case using synonym dictionary only and 30.38 for the case using the dictionary with Korean synonym website WordNet. The case which didn't use clustering method of the proposed method showed 13.88 of average euclidean distance, which implies the DBSCAN clustering of the proposed method can reduce the Euclidean distance. This research suggests a new color synonym processing method based on RGB values that combines the dictionary method with the real time synonym processing method for new color names. This method enables to get rid of the limit of the dictionary-based approach which is a conventional synonym processing method. This research can contribute to improve the intelligence of e-commerce search systems especially on the color searching feature.

키워드

JJSHBB_2019_v25n1_109_f0001.png 이미지

Procedure of the Proposed Model

JJSHBB_2019_v25n1_109_f0002.png 이미지

Korean Standard Color Digital Palette

JJSHBB_2019_v25n1_109_f0003.png 이미지

Wikipedia ‘Color List’ search result

JJSHBB_2019_v25n1_109_f0004.png 이미지

Area where RGB values are extracted

JJSHBB_2019_v25n1_109_f0005.png 이미지

DBSCAN Cluster result

JJSHBB_2019_v25n1_109_f0006.png 이미지

Result of listing colors by RGB range

JJSHBB_2019_v25n1_109_f0007.png 이미지

Result of Color Synonym Solution

JJSHBB_2019_v25n1_109_f0008.png 이미지

First question of the experiment

Part of final color database

JJSHBB_2019_v25n1_109_t0001.png 이미지

Explanation of 4 methods in experiment

JJSHBB_2019_v25n1_109_t0002.png 이미지

Paired T-Test Result for 3 Cases

JJSHBB_2019_v25n1_109_t0003.png 이미지

참고문헌

  1. Apple Inc. (2015). Patent No.10-2015-7004968. Washington, DC: U.S. Patent and Trademark Office
  2. Apple Inc. (2017). Patent No.10-2017-0069606. Washington, DC: U.S. Patent and Trademark Office
  3. Cao Y., Ju T., Xu J., Hu S‐M. (2016). Extracting Sharp Features from RGB‐D Images. Computer Graphics Forum. 36. 10.1111/cgf.13069.
  4. Chakraborty S., Nagwani N-K., Dey L. (2014). Performance comparison of incremental k-means and incremental dbscan algorithms. arXiv preprint arXiv:1406.4751.
  5. Cho Y., Kim Y. (2011). Color Expression by Information Extraction. Proceedings of KIIT Summer Conference, 618-620.
  6. ClickZ Intelligence. "Seven Ways Artificial Intelligence Can Be Used for Marketing." ClickZ, May 31, 2013.clickz.com/seven-ways-artificial-intelligence-can-be-used-for-marketing/96572,(accessed September 2018).
  7. Davis, B. "15 Examples of Artificial Intelligence in Marketing." Econsultancy, April 19, 2016. econsultancy.com/blog/67745-15-examples-of-artificial-intelligence-in-marketing (accessed September 2018).
  8. Ester M., Kriegel H. P., Sander J., Xu X. (1996, August). A density-based algorithm for discovering clusters in large spatial databases with noise. In Kdd (Vol. 96, No. 34, pp. 226-231).
  9. Google Image Search https://www.google.co.kr/imghp?hl=ko&tab=wi&authuser=0 (accessed September 2018).
  10. Google LLC. (2017). U.S. Patent No.10-2017-7031186. Washington, DC: U.S. Patent and Trademark Office
  11. Gomez-Perez A., Fernandez-Lopez M., Corcho O. (2006) Ontological Engineering: With Examples From the Areas of Knowledge Management, e-Commerce and the Semantic Web. Springer, London. https://doi.org/10.1007/b97353.
  12. HTML chart. https://html-color-codes.info/ (accessed September 2018).
  13. Hwang M.-N., Lee S., Cho M., Kim S.-Y., Choi S.-P., Jung H. (2012). Ontology Construction of Technological Knowledge for R&D Trend Analysis, Journal of the Korea Contents Association, 12(12), 35-45 https://doi.org/10.5392/JKCA.2012.12.12.035
  14. Kim S., Kim G. (2012). Ontology-based User Customized Search Service Considering User Intention, Journal of Intelligence and Information Systems, 18(4), 129-143 https://doi.org/10.13088/JIIS.2012.18.4.129
  15. Kim T., Yang J., Lee J., Son J., Jeong Y. (2005). Efficient production of Ontology for Intelligent E-Commerce. Journal of Intelligence and Information Systems, 273-279.
  16. Lei Y., Uren V., Motta E. (2006) SemSearch: A Search Engine for the Semantic Web. In: Staab S., Svatek V. (eds) Managing Knowledge in a World of Networks. EKAW 2006. Lecture Notes in Computer Science, vol 4248. Springer, Berlin, Heidelberg.
  17. Lin S., Hanrahan P. 2013. Modeling how people extract color themes from images. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (CHI '13). ACM, New York, NY, USA, 3101-3110. DOI: https://doi.org/10.1145/2470654.2466424
  18. Mahama S., A. T., Dossa, A. S., Gouton, P. (2016). Choice of distance metrics for RGB color image analysis. Electronic Imaging, 2016(20), 1-4. https://doi.org/10.2352/ISSN.2470-1173.2016.20.COLOR-349
  19. Naver Corp. (2007). Patent No.10-2007-0115690. Seoul: Republic of Korea Patent and Trademark Office
  20. Qu, Y., Cheng, G. (2011). Falcons concept search: A practical search engine for web ontologies. IEEE Transactions on Systems, Man, and Cybernetics-Part A: Systems and Humans, 41(4), 810-816. https://doi.org/10.1109/TSMCA.2011.2132705
  21. Rose D., Levinson D. 2004. Understanding user goals in web search. In Proceedings of the 13th international conference on World Wide Web (WWW '04). ACM, New York, NY, USA, 13-19.
  22. Sudeepthi, G., Anuradha, G., Babu, M. S. P. (2012). A survey on semantic web search engine. International Journal of Computer Science Issues (IJCSI), 9(2), 241.
  23. Tran T., Cimiano P., Rudolph S., Studer R. (2007) Ontology-Based Interpretation of Keywords for Semantic Search. In: Aberer K. et al. (eds) The Semantic Web. ISWC 2007, ASWC 2007. Lecture Notes in ComputerScience, vol 4825. Springer, Berlin, Heidelberg.
  24. Turban E., Outland J., King D., Lee J.K., Liang TP., Turban D.C. (2018) Intelligent (Smart) E-Commerce. In: Electronic Commerce 2018. Springer Texts in Business and Economics. Springer, Cham.
  25. Wikipedia color name chart. https://ko.wikipedia.org/wiki/%EC%83%89_%EB%AA%A9%EB%A1%9D (accessed September 2018).
  26. Woo S., Kim K., Kim C. (2005). User Category - Based Intelligent E-Commerce Meta - Search Engine. Journal of Intelligence and Information Systems, 346-355.
  27. WordNet. http://www.wordnet.co.kr/ (accessed September 2018).