퍼지관계곱을 이용한 내용기반 정크메일 분류 모델

A Junk Mail Checking Model using Fuzzy Relational Products

  • 박정선 (경상대학교 컴퓨터학과 및 정보통신연구원) ;
  • 김창민 (경상대학교 컴퓨터학과 및 정보통신연구원) ;
  • 김용기 (경상대학교 컴퓨터학과 및 정보통신연구원)
  • 발행 : 2002.10.01

초록

인터넷의 발전을 기반으로 전자메일 서비스는 기존 우편 기능을 대체하여 현재의 대표적인 정보 전달 수단으로 자리잡고 있다. 전자메일 사용자의 확산에 따라 많은 기업들은 전자메일을 통한 개인별 카탈로그 보급 식의 광고에 투자를 하게 되었는데, 이는 개인별 취향을 고려한 광고가 가능하다는 잇점을 가진다. 그러나 전자메일 사용자들은 인터넷상에 개인 전자메일 주소가 노출됨에 의해서 많은 정크메일(junk mail)을 수신하게 되었는데, 정크메일이란 기업의 광고 선전물과 같이 수신을 원하지 않는 전자메일을 의미한다. 정크메일의 증가에 따라 정크메일을 분류하는 수단이 필요하게 되었는데, 현재까지는 사용자가 입력한 송신자의 전자메일 주소 또는 도메인 주소를 등록하여 차단하거나 제목에 특정 단어를 포함한 메일을 완전히 삭제하여 버리는 기술수준에 머무르고 있다. 본 논문에서는 퍼지관계곱을 기반으로 메일의 내용에 의미적으로 접근하여 정크메일을 추출하는 정크메일 분류 모델을 제안한다. 이는 퍼지관계곱 연산을 이용하여 미리 정의한 정크용어들과 사용자에게 수신되는 전자메일 내의 용어들 간 의미적 포함관계를 분석하고 그를 통해 전자메일의 정크도(degree of junk)를 추출한다. 각 전자메일별로 추출된 정크도는 사용자가 부여하는 정크 기준치(SVJ, Standard Value of Junk)를 기준으로 정크메일과 비정크메일로 분류한다. 제안된 기법은 사용자가 특정 개수의 동일한 전자메일에 대해 느끼는 정크도를 기준으로 분류한 정크메일 수를 비교하여 그 효용성을 증명하였다.

E-mail service has been a general method for communication as internet is widely used instead of post mails. Many companies have invested in e-mail advertisement as e-mail service is spread. E-mail advertisement has an advantage that it can consider personal characters. A lot of e-mail users have been given e-mails that they did not want to receive because their e-mail addresses were opened out to companies on internet. Therefore, they need junk mail checking systems and several e-mail service providers have supported junk mail filters. However, the junk mail filters can check the junk mail with constraint because they don't check the junk degree of mails by the contents of e-mail. This paper suggests a content-based junk mail checking model using fuzzy relational products. The process of the junk mail checking model using fuzzy relational products is as following: (1) analyzes semantic relation between junk words-base and e-mails, (2) checks the junk degree of the e-mail using the semantic relation, (3) checks the mails with SVJ(Standard Value of Junk) if those are junk mail or non-junk mail. The efficiency of the proposed technique is proved by comparing the junk degree of the e-mail and the number of junk mails that was checked by e-mail users and checked by the proposed junk mail checking model.

키워드

참고문헌

  1. Technology News, January 2000
  2. 야마우치 요시유키, 니시다 도오루, 이메일 마케팅, 삼각형프레스, 2001
  3. 정재윤, 이메일 마케팅.com, 비비컴, 2001
  4. 이재규, 전자상거래원론, 법영사, 2000
  5. Daum, http://www.daum.net
  6. Yahoo, http://www.yahoo.co.kr
  7. Hotmail, http://www.hotmail.com
  8. Zero junk mail, http://www.zerojunkmail.com
  9. 전인홍, 이광로, 퍼지이론과 응용, 교학사, 1992
  10. 이광형, 오길록, 퍼지이론 및 응용, 홍릉출판사, 1997
  11. 김도현, 권기호 공역, 핵심 퍼지시스템 이론 및 응용서, 에드텍, 1994
  12. Kohout, L. J., Keravnou E. and Bandler W., Automatic Documentary Information Retrieval by means of Fuzzy Relational Products, In Gaines, B. R., Zadeh L. A.and Zimmermann, H. J., editors Fuzzy Sets in Decision Analysis, pages 308-404, North-Holland, Amsterdam, 1984
  13. Kohout, L. K., Bandler, W., Fuzzy Relational Products as a Tool for Analysis and Synthesis of the Behaviour of Complex Natural and Artitical Systems, in: Wang S. K. and Chang P. P. eds., Fuzzy Sets: Theory and Application to Policy Analysis and Information Systems, Plenum Press, New York, 341-367, 1980
  14. Bandler, W., and Kohout, J., Semantics of Implication operators and fuzzy relational products, Intl. Journal of Man-Machine Studies, 1980
  15. Bandler, W., and Kohout L. J., Fuzzy Power Sets and Fuzzy Implication Operator, Fuzzy Set and System 4, 13-30, 1980 https://doi.org/10.1016/0165-0114(80)90060-3
  16. Kim, Yong-Gi and Kohout, L. J., Use of Fuzzy Relational Products and Algorithms for generating Control strategies in resoultion based Automated Reasoning, Proceedings of the fourth International Fuzzy System Association (IFSA) world congress, (Brussels, Belgium), p109-p112, July 7-12 1991
  17. Ying Zou, Elicitation of the Groups and Group Cognitive Structures: An Application of Ternary Fuzzy Relational Products, The Florida State University, Feb. 5, 1997
  18. 김창민, 김용기, 개선된 BK-퍼지정보검색모델(A-FIRM)과 BK-퍼지정보검색모델(BK-FIRM)의 성능평가, 한국 퍼지 및 지능시스템학회 추계학술발표논문집, 8(2), 1998
  19. 김창민, A-FIRM: 개선된 BK-퍼지정보검색모델, 전자계산학과, 경상대학교, 1999
  20. 이영일, 퍼지기법을 이용한 자율수중운동체의 휴리스틱 항행 탐색, 경상대학교, 2001
  21. Kohout, L. J., and Harris, M., Computer Representation of Fuzzy and Crisp Relations by Means of Threaded Trees Using Foresets and Aftersets, Journal of Fuzzy Logic and Intelligent Systems, 3(1), 1993
  22. Kim, Yong-Gi and Kohout, L. J., March 1-3, Comparison of Fuzzy Implication Operators by means of Weighting Strategy in on Applied Computing (SAC'92), Kansas City, 1992 https://doi.org/10.1145/143559.143667
  23. Keravnou, E., June-July, System for Experimental Verification of Deviance of Fuzzy Connectives in Information Retrieval Application, Second World Conference on Mathematics at the Service of Man. Topic 7, Measuring 'Devuance in Non-Classical Logics and Modelling, Las Palmas(Canary Islands), 1982
  24. 박정선, 김창민, 김용기, 퍼지관계곱을 이용한 전자메일의 정크도 추출, 한국퍼지 및 지능 시스템을 학회 춘계 학술대회 학술발표논문집, 11(1) : 224-227, 2001
  25. 박정선, 김창민, 김용기, 퍼지관계곱을 이용한 정크메일 분류 시스템, 한국퍼지 및 지능시스템 학회 추계 학술대회 학술발표논문집, 11(2), 2001
  26. William B. Frakes, Ricardo Baeza-Yates, Information Retrieval : Data Structures & Algorithms, PRENTICE HALL, 1992
  27. IETF(Intermet Engineering Task Froce), http://www.ietf.org/
  28. Dave Wood, Mark Stone, Programming Internet Email, Oreilly, 1999
  29. Santon, G., and M. McGill, Introduction to Modern Information Retrieval, New York: McGraw-Hill, 1983
  30. Introduction to Modern Information Retrieval Santon, G.;M. McGill