내용기반 검색을 이용한 선박매매 정보추출 에이전트의 구현에 관한 연구

A Study on the Implementation of Information Extraction Agency for Ship Sale and Purchase using Content Based Retrieval

  • 하창승 (동명대학교 항만물류학부) ;
  • 정이상 (동명대학교 국제통상학부)
  • 발행 : 2007.03.31

초록

정보 추출 작업에서의 처리지연은 인터넷 문서의 분류나 표현규칙이 아직 표준화되어 있지 않아 특정 요소에 대한 사용자의 정보 요구를 정확하게 인식하지 못하기 때문이다. 또한 정보추출에 wrapper 규칙을 사용하는 경우 같은 규칙을 서로 다른 문서에는 적용할 수 없는 확장성의 결여와 같은 문제점이 있다. 선박매매와 같이 선박의 거래를 위해 선박가격, 선박 제원, 인도 장소, 검사장소 등의 판매정보만으로도 거래가 가능한 경우에는 선박매매와 관련된 온톨로지(Ontology)를 이용하여 내용기반 검색 (content based retrieval)을 수행하면 선박 매매에 필요한 정보를 선택적으로 추출할 수 있다. 이 방법은 사이트마다 개별적으로 wrapper를 구성하거나 인터넷 문서에서 불필요한 정보를 단계적으로 제거해 나가는 방법을 개선하여 정보 추출 과정을 단순화시키는 이점을 제공한다.

Delay in the process of Information Extraction, IE, is largely due to inability to correctly recognize the user's information requirement of particular search factors. Especially if the wrapper rules are used in a search engine, the search generally fails to classify internet documents properly and efficiently since the application of the same wrapper rules lacks extensibility throughout various types of existing internet document. In case of buying or selling a ship, if the price range, type. place of delivery, inspection site and other information relevant to the sales would be available through the internet for proper retrieval the sales could more readily succeed by using Ontology relating to sales or purchase information and by selectively searching for the desired information through the content based retrieval system. This system proposes to improve various wrapper systems existing throughout different internet sites and to eliminate unnecessary information tagged on the existing internet documents in order to create a more advanced information retrieval system.

키워드