An Approach to Structuralizing Business Information for Internet Shopping Malls

인터넷쇼핑몰의 사업자신원정보 구조화 방안

  • 장용식 (한신대학교 경상대학 e-비즈니스학과)
  • Published : 2004.06.01

Abstract

While on-line shopping is increasing, the "Consumer Protection Law in Electronic Commerce" obliges each internet shopping mall to provide its business information. Although most internet shopping malls provide their business information in the semi-structured format on the bottom of their homepages, the attributes and expression forms of business information are different each other. It makes consumers difficult to identify their business information and lowers public confidence. Hence this study proposes three approaches - HTML-based structure, XML-based structure, and XML data island-based structure - to structuralizing business information for correct expression. The experiment results showed that the business information extraction time by XML data island-based structure is independent of the size of the web document, while the time by HTML-based structure is dependent on the size. By comparing the business information extraction times, we show that XML data island-based structure is more efficient and effective than HTML-based structure.structure.

온라인 쇼핑이 증가하고 있는 가운데, 우리나라는 "전자상거래 등에서의 소비자보호에 관한 법률"로 사업자신원 정보의 기재를 의무화하고 있다. 인터넷쇼핑몰들은 대부분 홈페이지 하단에 반구조적인 형태로 사업자신원정보를 기재하고 있으나, 기재항목과 표현형식이 구조화되어 있지 않아 사업자의 신원파악이 어렵기 때문에 소비자의 신뢰도에 나뿐 영향을 미칠 수 있다. 이에 본 연구는 사업자신원정보를 정확하게 표현하는 세 가지 구조화 방안 -HTML기반 구조, XML기반 구조, XML data island기반 구조 - 을 제시하고 비교하였으며, HTML기반구조와 XML data island 기반구조의 추출성능을 실험으로 비교하였다. 60개의 인터넷쇼핑몰 표본에 대해 실험결과, XML data island 기반구조는 사업자신원정보 추출시간이 웹문서의 크기와는 관계가 없으나, HTML기반구조는 웹문서의 크기에 비례하였다. 또한, 평균 추출시간을 비교한 결과 XML data island 기반구조가 HTML기반구조보다 정보 추출면에서 더 효율적이며 효과적임을 검정하였다.적임을 검정하였다.

Keywords

References

  1. Information Systems Review(Forthcoming) 에이전트 기반의 인터넷쇼핑몰 사업자신원 정보 조사 성낙현
  2. 2002 한국경영정보학회 춘계학술대회 에이전트 기술을 이용한 전자쇼핑몰 필수기재사항 조사 성낙현;장용식
  3. 2003년 6월 및 2-4분기 사이버쇼핑몰통계조사 결과 통계청
  4. In Proceedings of the International Conference on Cooperative Information Systems(Coopis-97) Semi-automatic Wrapper Generation for Internet Information Sources Ashish,N.;Knoblock,C.A.
  5. In Proceedings of the $17^th$ACM SIGAT- SIGMOD-SIGART symposium on principles of database systems(POD-97) Cut and Paste Atzeni,P.;Mecca,G.
  6. In Proceedings of the First International Conference on Autonomous Agents A Scalable Comparision-Shopping Agent for the World-Wide Web Doorenbos,R.B.;Etzioni,O.;Weld,D.S.
  7. Information Systems v.23 no.8 Generating Finite-State Transducers for Semi-Structured Data Extraction from the Web Hsu,C.N.;Dung,M.T.
  8. In Proceedings of the Fourteenth National Conference on Artificial Intelligence(AAAI-97) Template-based Information Mining from HTML Documents Hsu,J.Y.J.;Yih,W.T.
  9. Wrapper Induction for Information Extraction,Ph.D. Thesis Kushmerick,N.
  10. In Proceedings of AAAI-98 Workshop on AI and Information Integration,Technical Report WS-98-01 STALKER:Learning Extraction Rules for Semistructured,Web-based Information Sources Muslea,L.;Minton,S.;Knoblock,C.A.
  11. Recommendation of OECD Council Concerning Guidelines for Comsumer Protection in the Context of Electronic Commerce OECD