• 제목/요약/키워드: Information Retrieval Engine

검색결과 136건 처리시간 0.019초

추론엔진을 활용한 웹서비스 기반 추천 시스템 (Web Service based Recommendation System using Inference Engine)

  • 김성태;박수민;양정진
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.59-72
    • /
    • 2004
  • 인터넷의 활용범위는 정보의 검색 및 수집을 넘어서 여러 범위로 확대되고 있고 정보의 양 또한 방대해졌다. 그러나 필요한 정보를 찾기는 더욱 어려워지고 있고, 그에 따라 개인에게 맞는 정보를 제공해주는 시스템이 절실해지고 있다. 본 연구에서는 웹 서비스 기반위에 추론엔진을 사용하여 사용자에게 가장 적합한 상품을 검색하여 추천해주는 추천 시스템의 모델을 제시하고 있다. 현재의 웹 애플리케이션이 사용자에게 필요한 서비스를 제공하는데 비하여 애플리케이션마다 상이한 플랫폼의 구조와 분산된 환경에서 객체간의 통신을 쉽게 하고 통일된 개발을 위해 표준이 필요하게 되었다. 웹 서비스는 프로그램 언어에 독립적이고 상호 운용적 환경을 제공하기 위한 것으로 네트워크를 통해 기술하고 배포하여 실행시킬 수 있는 모듈화된 애플리케이션을 의미한다. 본 논문은 웹 서비스 기반위에 시스템을 구축함으로써 표준 웹 서비스의 실현 가능성을 가늠하고, 추론엔진과 결합하여 사용자의 정보와 변화하는 성향을 토대로 필요한 정보를 예측하여 추천하는 추천시스템 개발에 중점을 둔다.

  • PDF

웹 환경에서의 개인정보 검색기법 (A Retrieval Technique of Personal Information in a Web Environment)

  • 서영덕;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.145-151
    • /
    • 2015
  • 최근 개인정보 보호에 대한 관심이 높아지면서 웹 환경에 노출된 개인정보를 효율적으로 검색할 수 있는 시스템의 필요성이 증대되었다. 현재 웹 환경에 노출된 개인정보는 자신이 알고 있는 단편적인 단서를 이용한 검색을 통해 노출여부를 판단하고 있다. 그러나 이 방법은 검색결과의 우선순위가 개인정보의 노출도와 관계가 없어 효율적이지 못하다. 본 논문에서는 사용자 입력을 근거로 웹 환경에 노출된 사용자의 개인정보를 효율적으로 검색하고 삭제할 수 있도록 지원하는 프로세스를 제안한다. 또한 기존 검색 방법과의 비교를 통하여 검색성능의 향상 정도를 평가한다.

포털사업자의 검색서비스에 관한 법률문제 (Some Legal Arguments on the Portal Service Providers' Information Retrieval)

  • 김윤명
    • 정보관리연구
    • /
    • 제38권3호
    • /
    • pp.183-209
    • /
    • 2007
  • 정보검색을 이용한 비즈니스 모델의 대표적인 예는 인터넷 포털서비스라고 할 수 있다. 네이버, 엠파스, 구글과 같은 포털사이트가 정보검색을 기반으로 하는 대표적인 비즈니스 모델이다. 포털사이트에서 제공하는 정보검색은 이용자에게 다양한 정보를 손쉽게 제공하며 정보격차의 해소에 일조한다는 점에서 커다란 사회적 기여를 하고 있다고 본다. 그렇지만 최근 검색서비스를 제공하는 포털사이트를 통하여 많은 이슈들이 제기되고 있다. 따라서 이러한 이슈들을 해결하기 위해 정보검색의 공공성에도 불구하고 그에 대한 규제론이 강력히 제기되고 있는 것이 사실이다. 즉, 검색사업자에 대한 법적 잣대를 대려는 시도가 이루어지고 있다. 포털사이트를 통하여 이루어지는 많은 문제에 대해 온라인서비스 제공자(online service provider, 이하 'OSP'라 한다)로서 법적 지위를 가지고 있는 포털사업자를 통하여 직접적인 책임을 물으려고 하는 것이다. 그러나 과연 포털사업자에게 인터넷을 통하여 이루어지는 많은 문제의 관련성을 가지고 책임을 물으려는 시도가 합리적인 지는 의문이라고 하겠다. 왜냐하면, 포털사업자에게 표현의 자유를 저해하는 사적 검열이라는 의무를 부과하는 것과 같은 결과가 도출될 수 있기 때문이다. 더욱이, 인터넷을 통하여 많은 논란들이 포털사업자가 의도하여 도출시킨 것인지, 아니면 이용자의 정보이용 행태에 따른 것인지, 인터넷 산업의 특성에 따른 것인지, 이에 대한 충분한 검토와 법적 평가 없이 무조건적인 책임이 있음을 주장하는 것은 과연 합리성이 담보된 것인지 의문이라고 하겠다. 따라서 포털사업자의 정보검색과 관련된 서비스에 대한 비판에 관하여 법적 측면에서 살펴보고자 한다.

A Study on the DB-IR Integration: Per-Document Basis Online Index Maintenance

  • Jin, Du-Seok;Jung, Hoe-Kyung
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.275-280
    • /
    • 2009
  • While database(DB) and information retrieval(IR) have been developed independently, there have been emerging requirements that both data management and efficient text retrieval should be supported simultaneously in an information system such as health care, customer support, XML data management, and digital libraries. The great divide between DB and IR has caused different manners in index maintenance for newly arriving documents. While DB has extended its SQL layer to cope with text fields due to lack of intact mechanism to build IR-like index, IR usually treats a block of new documents as a logical unit of index maintenance since it has no concept of integrity constraint. However, In the DB-IR integrations, a transaction on adding or updating a document should include maintenance of the posting lists accompanied by the document. Although DB-IR integration has been budded in the research filed, the issue will remain difficult and rewarding areas for a while. One of the primary reasons is lack of efficient online transactional index maintenance. In this paper, performance of a few strategies for per-document basis transactional index maintenance - direct index update, pulsing auxiliary index and posting segmentation index - will be evaluated. The result shows that the pulsing auxiliary strategy and posting segmentation indexing scheme, can be a challenging candidates for text field indexing in DB-IR integration.

동적 로봇에이전트를 이용한 주문형 검색엔진의 설계 및 구현 (Design and Realization of Retrieval Engine On Demand Using a Dynamic Robot Agent)

  • 김성;박철우;이충석;박규석
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.631-636
    • /
    • 2001
  • 전자상거래 관련기술은 짧은 기간에 급속한 발전을 이루었으며, 최근에는 그 영역이 B2B로 까지 확장되고 있다. 이와 같은 전자상거래의 발전에 발맞추어서 수많은 사이트들이 상품들에 비교.분석 정보도 요구되고 있다. 현재 국내에도 쇼핑몰간의 가격비교 정보가 제공되고 있으나 그 갱신주기가 길어 효율적이지 못하며 보다 빠른 갱신을 위한 무절제한 정보 수집으로 인해 대상 쇼핑몰에 많은 부하를 발생시키고 있다. 본 논문에서는 대상 쇼핑몰의 상태에 다라 로봇의 동작이 동적으로 변경되는 동적 로봇에이전트를 이용하여 대상 쇼핑몰의 상품정보에 대해 대상 서버의 부하를 최소로 줄이면서 최단 시간 내에 수집. 분석하여 고객에게 동일 상품에 대한 최저가의 쇼핑몰을 제시하여 맞춤서비스를 제공할수 있는 주문형 검색엔진을 설계 및 구현하였다.

  • PDF

Known-Item Retrieval Performance of a PICO-based Medical Question Answering Engine

  • Vong, Wan-Tze;Then, Patrick Hang Hui
    • Asia pacific journal of information systems
    • /
    • 제25권4호
    • /
    • pp.686-711
    • /
    • 2015
  • The performance of a novel medical question-answering engine called CliniCluster and existing search engines, such as CQA-1.0, Google, and Google Scholar, was evaluated using known-item searching. Known-item searching is a document that has been critically appraised to be highly relevant to a therapy question. Results show that, using CliniCluster, known-items were retrieved on average at rank 2 ($MRR@10{\approx}0.50$), and most of the known-items could be identified from the top-10 document lists. In response to ill-defined questions, the known-items were ranked lower by CliniCluster and CQA-1.0, whereas for Google and Google Scholar, significant difference in ranking was not found between well- and ill-defined questions. Less than 40% of the known-items could be identified from the top-10 documents retrieved by CQA-1.0, Google, and Google Scholar. An analysis of the top-ranked documents by strength of evidence revealed that CliniCluster outperformed other search engines by providing a higher number of recent publications with the highest study design. In conclusion, the overall results support the use of CliniCluster in answering therapy questions by ranking highly relevant documents in the top positions of the search results.

WebDBs: 사용자 중심의 웹 검색 엔진 (WebDBs : A User oriented Web Search Engine)

  • 김홍일;임해철
    • 한국통신학회논문지
    • /
    • 제24권7B호
    • /
    • pp.1331-1341
    • /
    • 1999
  • 본 연구에서는 SQL과 유사한 질의어를 사용하여 웹에 등록된 정보를 검색하는 시스템인 WebDBs(Web DataBase system)를 제안한다. 제안된 시스템에서는 웹에 산재되어 있는 HTML 문서로부터 검색에 필요한 정보들을 자동으로 추출한다. 추출된 자료에 대하여 SQL 기반의 질의 처리가 가능하도록 하였다. 웹 데이터베이스 시스템에서는 대부분의 질의 수행 시간이 통신 회선을 통한 문서 획득에 소요된다. 따라서, 웹 검색의 경우 웹 지역성에 많이 의존한다는 점에 착안하여, 사용자 검색 결과를 캐쉬에 저장하고 유사한 응용에서 이를 재사용 하고자 한다. 이때 캐쉬에 저장된 정보들을 검색된 질의와 연관하여 저장함으로써 좀더 사용자 응용을 고려한 캐쉬 관리기법을 제안하였다. 또한 위와 같은 개념에 입각한 웹 검색엔진을 구하였다.

  • PDF

유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안 (Semantic Process Retrieval with Similarity Algorithms)

  • 이홍주
    • Asia pacific journal of information systems
    • /
    • 제18권1호
    • /
    • pp.79-96
    • /
    • 2008
  • One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in order to support inter-organizational collaborations. Most approaches for finding services that have certain features and support certain business processes have relied on some type of logical reasoning and exact matching. This paper presents our approach of using imprecise matching for expanding results from an exact matching engine to query the OWL(Web Ontology Language) MIT Process Handbook. MIT Process Handbook is an electronic repository of best-practice business processes. The Handbook is intended to help people: (1) redesigning organizational processes, (2) inventing new processes, and (3) sharing ideas about organizational practices. In order to use the MIT Process Handbook for process retrieval experiments, we had to export it into an OWL-based format. We model the Process Handbook meta-model in OWL and export the processes in the Handbook as instances of the meta-model. Next, we need to find a sizable number of queries and their corresponding correct answers in the Process Handbook. Many previous studies devised artificial dataset composed of randomly generated numbers without real meaning and used subjective ratings for correct answers and similarity values between processes. To generate a semantic-preserving test data set, we create 20 variants for each target process that are syntactically different but semantically equivalent using mutation operators. These variants represent the correct answers of the target process. We devise diverse similarity algorithms based on values of process attributes and structures of business processes. We use simple similarity algorithms for text retrieval such as TF-IDF and Levenshtein edit distance to devise our approaches, and utilize tree edit distance measure because semantic processes are appeared to have a graph structure. Also, we design similarity algorithms considering similarity of process structure such as part process, goal, and exception. Since we can identify relationships between semantic process and its subcomponents, this information can be utilized for calculating similarities between processes. Dice's coefficient and Jaccard similarity measures are utilized to calculate portion of overlaps between processes in diverse ways. We perform retrieval experiments to compare the performance of the devised similarity algorithms. We measure the retrieval performance in terms of precision, recall and F measure? the harmonic mean of precision and recall. The tree edit distance shows the poorest performance in terms of all measures. TF-IDF and the method incorporating TF-IDF measure and Levenshtein edit distance show better performances than other devised methods. These two measures are focused on similarity between name and descriptions of process. In addition, we calculate rank correlation coefficient, Kendall's tau b, between the number of process mutations and ranking of similarity values among the mutation sets. In this experiment, similarity measures based on process structure, such as Dice's, Jaccard, and derivatives of these measures, show greater coefficient than measures based on values of process attributes. However, the Lev-TFIDF-JaccardAll measure considering process structure and attributes' values together shows reasonably better performances in these two experiments. For retrieving semantic process, we can think that it's better to consider diverse aspects of process similarity such as process structure and values of process attributes. We generate semantic process data and its dataset for retrieval experiment from MIT Process Handbook repository. We suggest imprecise query algorithms that expand retrieval results from exact matching engine such as SPARQL, and compare the retrieval performances of the similarity algorithms. For the limitations and future work, we need to perform experiments with other dataset from other domain. And, since there are many similarity values from diverse measures, we may find better ways to identify relevant processes by applying these values simultaneously.

모바일 환경에서 파일 검색 엔진을 위한 효과적인 방식 (Effective Scheme for File Search Engine in Mobile Environments)

  • 조종근;하상은
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.41-48
    • /
    • 2008
  • 본 논문에서는 파일 검색 엔진에 대해 모델링하고, 파일 검색의 정확도와 속도 향상을 위해 파일내의 내용들을 이용한 가중치 값 기반의 파일 검색 방식을 제안한다. 대부분의 파일 검색 엔진들은 빠른 검색 속도의 한계로 KMP와 같은 스트링 매칭 알고리즘을 사용해 왔다. 그러나, 이런 종류의 알고리즘들은 사용자가 원하는 파일들을 정확하게 찾아 주지는 못한다. 따라서, 모바일 환경에서 파일내의 내용들을 이용한 가중치 값 기반의 검색 엔진을 제안하고, 기존 방법들과 비교를 통해 제안한 방법의 우수한 성능을 증명한다.

인터넷에서 서블릿을 이용한 지리정보시스템의 설계 및 구현 (Design and Implementation of GIS using Servlet on the Internet)

  • 김병학
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.49-52
    • /
    • 2001
  • 본 논문의 시스템은 GIS솔루션인 ArcView를 이용하여 인터넷에서 지리정보검색 시스템을 설계 및 구현하였다. 이를 위해 PC 서버의 리눅스 환경에서 아파치 웹 서버와 데이터베이스 엔진으로 Oracle을 사용하였다. 또한 데이터베이스 연동과 지도이미지를 보여주기 위해서 JSP(Java Server Page)와 Servlet를 사용하였다.

  • PDF