Weight-based Wellbeing Food Retrieval System

가중치 기반 웰빙식품 정보 검색 시스템

  • 편광범 (충북대학교 컴퓨터과학과) ;
  • 윤은일 (충북대학교 전자정보대학 컴퓨터) ;
  • 류근호 (충북대학교 전자정보대학 컴퓨터)
  • Received : 2009.12.08
  • Accepted : 2010.05.12
  • Published : 2010.06.30

Abstract

As the interests in health grow higher, necessity of Well-being relation informations get more importance. We get the information of well-being, tinternet retrieval system or blog, homepage and media. Although, it is not easy to find informations of well-being food. So, retrieval system has been requiring information about well-being food. In this paper, Weight-based Wellbeing Food Retrieval System is designed and implemention. Finding numerous pages and if well-being keywords includes page, it was identified and add weight. User searching for keywords, it implement, well-being food pages comes at the first. Keywords for discrimination makes type of dictionary, so it can insert, delete, modify. Inverted files saves hasing(direct-based file). Retrieval System in this paper is experimental result, at keywords of well-being food show 5~15% imprement than another Retrieval System. In this paper, Weight-based Wellbeing Food Retrieval System's designed and proposed way to raking for well-being food.

건강에 대한 관심이 높아지면서 웰빙 관련 정보의 필요성이 중요해졌다. 웰빙 정보검색은 인터넷 검색 엔진이나 블로그, 개인 홈페이지 또는 대중매체를 이융한다. 하지만, 웰빙 식품에 관한 정보는 구하기 어렵다. 그래서 검색엔진은 웰빙식품에 대한 정보검색이 필요하게 되었다. 본 논문은 가중치기반의 웰빙식품 검색엔진을 설계하고 구현한다. 수많은 페이지를 탐색해 웰빙 식품 키워드가 포함되어있으면 이것을 식별하여 가중치를 추가하는 방식이다. 사용자가 키워드를 이용하여 검색하면 웰빙 관련 페이지가 우선적으로 나올 수 있게 구현했다. 웰빙관련 식품의 식별에 사용되는 키워드들은 사전형식으로 되어있다. 그래서 삽입, 삭제, 수정이 가능하다. 역 파일은 직접파일인 해싱 방식으로 저장한다. 본 논문의 엔진을 이용하여 성능평가를 한 결과 웰빙식품 키워드에 대하여 타 검색엔진에 비해 5~15%의 향상된 결과를 보였다. 본 논문에서는 검색엔진의 설계방식과 웰빙식품에 특화된 랭킹선정방식을 제안한다.

Keywords

References

  1. 통계청(2008) 2008 한국의 사회지표.
  2. 곽창근, 장종근, 웰빙식품산업 활성화 방안 - 신선편의식품 시장을 중심으로 -, 식품산업과 영양, 제13권, 제1호, pp.17-27, 2008.
  3. 강혜경, 강명희, 유경혜, 이선영, 인터넷 영양 정보의 모니터링-메타데이터의 분석, 한국영양학회지, 제37권, 제8호, 한국영양학회, 2004년, pp688-700.
  4. 제미경, 전향란, 식생활관련 웰빙지향 소비가치와 웰빙식품 소비행동, 대한가정학회지, 제 45권, 제9호, 2007년, pp.63-74.
  5. Thomas Roelleke, A frequency-based and a poisson-based definition of the probab ility of being informative, Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, pp.227-234, July 28-August 01, 2003.
  6. 이재문, 빈발단어집합을 이용한 NaiveBayes의 정확도 개선, 한국인터넷정보학회논문지, v.7, no.3, pp.169-178 , 2006
  7. Carlo Altamirano, Alberto Robledo, "Generalized thermodynamics underlying the laws of Zipf and Benford", in Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, Vol.5, pp.2232-2237, 2009
  8. 정영미, 이태영, 자동색인의 통계적기법과 한 국어문헌의 실험, 한국문헌정보학회지 제9권, 99-118p, 1982. 12
  9. 구태완, 홍성준, 이광모, 웹 서비스에서 개인 성향 모듈의 설계 및 구현, 한국인터넷정보학회논문지, v.10, no.4, pp.161-176, 2009
  10. 이영민, 백수련, 박홍주, 심근섭, 이희주, 전혜 경, 인구사회학적 특성에 따른 웰빙식품관련 정보의 요구도, 한국지역사회생활과학회지, 제17권, 제3호, 2006년 9월, pp.175-182.
  11. Cambridge University Press Information Retrieval, 'Inverse document frequency', 2008.
  12. Akiko Aizawa, An information-theoretic perspective of tf-idf measures, Information Processing and Management: an International Journal, v.39 n.1, p.45-65, January 2003. https://doi.org/10.1016/S0306-4573(02)00021-3
  13. 김혜영, 최신성 가중치를 고려한 검색 모형에 대한 연구, 연세대학교 문헌정보학과 대학원, 2007.
  14. 최미숙, 효율적인 시스템 설계를 위한 클래스 간의 결합척도, 한국인터넷정보학회논문지, v.9, no.5, pp.85-97, 2008
  15. 김성진, 웹 문서 변경 예측, 한국인터넷정보학회논문지, v.8, no.4, pp.149-158, 2007
  16. 윤보현, 구조화된 웹 문서에 대한 자동 정보 추출, 한국인터넷정보학회논문지, v.6, no.3, pp.129-145, 2005
  17. 정창후, 최윤수, 진두석, 김진숙, 윤화묵, 대용 량 XML 문서의 효율적인 검색과 관리를 위 한 SCOF 모델, 한국인터넷정보학회논문지, v.9, no.1, pp.103-113, 2008
  18. 국민대학교 언어공학 정보검색 연구실, 강승식, KLT2008 형태소 분석기, http://nlp.kookmin.ac.kr/HAM/kor/index.html.
  19. F. Qiu and J. Cho, 'Automatic Identification of User Interest For Personalized Search", In Proceedings of the 15th international conference on World Wide Web, pp. 727-736, 2006.
  20. Donald Metzler, Generalized Inverse Document Frequency, Conference on Information and Knowledge Management, pp. 399-408, 2008
  21. 윤성웅, 채진기 이상훈, 질의 내부 단어 인접도를 이용한 검색 효율 향상 기법, 정보과학회논문지 : 데이터베이스, 제 35권, 제 2호, 192-198p, 2006.