• 제목/요약/키워드: Web search

검색결과 1,646건 처리시간 0.028초

Implementation of Search Engine to Minimize Traffic Using Blockchain-Based Web Usage History Management System

  • Yu, Sunghyun;Yeom, Cheolmin;Won, Yoojae
    • Journal of Information Processing Systems
    • /
    • 제17권5호
    • /
    • pp.989-1003
    • /
    • 2021
  • With the recent increase in the types of services provided by Internet companies, collection of various types of data has become a necessity. Data collectors corresponding to web services profit by collecting users' data indiscriminately and providing it to the associated services. However, the data provider remains unaware of the manner in which the data are collected and used. Furthermore, the data collector of a web service consumes web resources by generating a large amount of web traffic. This traffic can damage servers by causing service outages. In this study, we propose a website search engine that employs a system that controls user information using blockchains and builds its database based on the recorded information. The system is divided into three parts: a collection section that uses proxy, a management section that uses blockchains, and a search engine that uses a built-in database. This structure allows data sovereigns to manage their data more transparently. Search engines that use blockchains do not use internet bots, and instead use the data generated by user behavior. This avoids generation of traffic from internet bots and can, thereby, contribute to creating a better web ecosystem.

RepWeb: A Web-Based Search Tool for Repeat-Related Literatures

  • Woo, Tae-Ha;Kim, Young-Uk;Kwon, Je-Keun;Seo, Jung-Min
    • Genomics & Informatics
    • /
    • 제5권2호
    • /
    • pp.88-91
    • /
    • 2007
  • Repetitive sequences such as SINE, LINE, and LTR elements form a major part of eukaryotic genomes. A literature search tool that summarizes the information contained within repeat elements would provide biologists in the field of genomics with a useful tool for analyzing genomic sequence features. We developed a java program designed to make literature access easier by using two search engines simultaneously. RepWeb is a web-based search system that provides a user friendly interface for searching the reference data and journals for information related to repeat elements by using the search engines, Google Scholar and PubMed, simultaneously. It provides an interface that displays the repeat element- related biological information, and includes useful functions such as the production of a repeat tree, clickable links to PubMed and Google Scholar, exporting, and sorting a field into date, author, journal and title.

로그분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구 (Investigating Web Search Behavior via Query Log Analysis)

  • 박소연;이준호
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.111-122
    • /
    • 2002
  • 본 연구에서는 웹 검색 이용자들의 전반적인 검색 행태를 이해하기 위하여 국내에서 널리 사용되고 있는 웹 검색 서비스 네이버에서 생성된 검색 트랜잭션 로그를 분석하였다. 본 연구에서는 웹 검색 트랜잭션 로그 분석에 필요한 세션 정의 방법을 설명하고 로그 정제 및 질의 유형 분류방법을 제시하였으며, 한글 검색 트랜잭션 로그 분석에 필수절인 검색어 정의 방법을 제안하였다. 본 연구의 결과는 보다 효과적인 국내 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

XML-based Retrieval System for E-Learning Contents using mobile device PDA

  • Park Yong-Bin;Yang Hae-Sool
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2006년도 춘계 국제학술대회 논문집
    • /
    • pp.241-248
    • /
    • 2006
  • Web is greatly contributing in providing a variety of information. Especially, as media for the purpose of development and education of human resources, the role of web is important. Furthermore, E-Learning through web plays an important role for each enterprise and an educational institution. Also, above all, fast and various searches are required in order to manage and search a great number of educational contents in web. Therefore, most of present information is composed in HTML, so there are lots of restrictions. As a solution to such restriction, XML a standard of Web document, and its various search functions is being extended and studied variously. This paper proposes a search system able to search XML in E-Learning or var ious contents of non-XML using mobile device PDA.

  • PDF

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저 (e-Cohesive Keyword based Arc Ranking Measure for Web Navigation)

  • 이우기;이병수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.22-29
    • /
    • 2009
  • 웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 질의어 오타 교정 시스템 구축 (Analyzing of Hangul Search Query Spelling Error Patterns and Developing Query Spelling Correction System Based on User Logs)

  • 전희원;다니엘 흥;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.15-21
    • /
    • 2010
  • 본 논문은 검색 서비스 기능 중에 빼놓을 수 없는 기능인 한글 검색 질의어(query) 교정 시스템을 '야후!'에서 구축하며 분석한 한글 오타 패턴 그리고 사용자 로그를 기반으로 설계한 질의어 교정 서비스에 대한 설명을 하고 있다. 이 교정 서비스는 현재 '야후! 코리아'에 적용되어 있으며, 한글을 고려한 키스트 로크를 기반으로 한 설계 방식 그리고 동적으로 에러모델을 구축하는 방법을 소개하고 있으며 또한 구축된 모델의 성능을 다른 검색 서비스와 비교한 결과를 소개한다.

  • PDF

국내 포털의 개별형 콘텐츠 검색 영역 데이터에 기반을 둔 효율적인 반응형 웹 디자인에 관한 연구 (Study on Efficient Responsive Web Design for Individual Search Contents of Korean Portal)

  • 임경규;조희준;이구연
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.513-522
    • /
    • 2015
  • 비약적인 모바일 기기의 기술 발전에 따라 PC 모니터부터 스마트 워치까지 다양한 형태의 디스플레이 환경이 제공되고 있다. 이에 웹 콘텐츠 생산자들은 하나의 콘텐츠를 다양한 디스플레이 환경에 최적화된 형태로 제공할 필요성을 갖게 된다. 디바이스별 콘텐츠 제작 대응은 제작 시간과 비용의 증가로 이어질 수밖에 없다. 이를 극복하기 위한 기술로서 반응형 웹이 제안되었는데, 이는 디스플레이 종류에 따라 화면의 크기가 자동으로 최적화되도록 조절되는 웹페이지를 의미한다. 국내 포털의 콘텐츠 검색 영역에서도 반응형 웹 방식이 많이 구현되고는 있으나 아직까지 PC용 또는 모바일용으로 이중으로 콘텐츠를 구현하는 경우가 많다. 이에 본 논문에서는 국내 포털의 개별형 콘텐츠 검색영역의 반응형 웹 구현 형태를 조사하고, 반응형 웹이 적용되지 않은 콘텐츠에 대하여 효율적인 새로운 UI를 제안한다.

시맨틱 웹 규칙 언어를 이용한 지능형 상품 정보 검색 에이전트 개발 (Intelligent Product Search Agent based on SWRL)

  • 김우주;김정명;최대우
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.316-320
    • /
    • 2005
  • We developed Intelligent Product Search Agent based on SWRL, and this agent can search product information with knowledge(facts and rules) on the web, implement price comparison for searched products considering delivery rates. Existing keyword based product search engines is poor at searching intent products though a user has already prefect knowledge about intent produces. Furthermore if a user has insufficient knowledge, it is impossible to implement search. Also, existing price comparison shopping mall gives users comparison service considering total price(product prices, taxes, delivery rates), this service is valid to single product and has limitations of system expansion and up-dating because of not rule base but programming base. If there is appropriate knowledge on the Semantic web and this makes product information retrieval possible, above problems can be solved clearly. In this research, we developed Intelligent Product Search Agent based on SWRL that can search product information efficiently by making agent to handle facts and rules by itself.

  • PDF

네트워크 및 웹 서버의 부하를 고려한 지능적인 검색시스템의 설계 및 구현 (Intelligential Search Engine Considering the Load of Web Servers and Networks)

  • 김창근;탁한호
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권8호
    • /
    • pp.1035-1044
    • /
    • 2001
  • 기존의 검색엔진은 분산된 불특정 다수의 웹 서버에 대해 웹 서버 부하, 네트워크 부하를 고려하지 않고 로봇을 동작시키므로 웹서버 및 네트워크의 과부하를 초래한다. 또한 정보의 갱신 기간도 3∼4주 간격으로 필요한 시기에 정보가 갱신되지 않는 경우가 많으며, 웹서버의 내용 변경이 없음에도 불구하고 무조건 웹서버의 내용을 수집하여 갱신한다. 본 논문에서는 네트워크 및 웹서버 부하를 고려한 지능적인 검색시스템을 제안하고, 이 시스템에 필요한 실시간 제어 검색엔진 및 분산되어 있는 정보를 모아서 갱신해 주는 지능적인 로봇을 설계 및 구현하였으며, 네트워크 부하 및 웹 서버의 부하를 모니터링하여 전체 시스템의 성능을 향상시킬 수 있는 로봇 제어 정책을 수립하였다.

  • PDF

Design and Implementation of Web Crawler utilizing Unstructured data

  • Tanvir, Ahmed Md.;Chung, Mokdong
    • 한국멀티미디어학회논문지
    • /
    • 제22권3호
    • /
    • pp.374-385
    • /
    • 2019
  • A Web Crawler is a program, which is commonly used by search engines to find the new brainchild on the internet. The use of crawlers has made the web easier for users. In this paper, we have used unstructured data by structuralization to collect data from the web pages. Our system is able to choose the word near our keyword in more than one document using unstructured way. Neighbor data were collected on the keyword through word2vec. The system goal is filtered at the data acquisition level and for a large taxonomy. The main problem in text taxonomy is how to improve the classification accuracy. In order to improve the accuracy, we propose a new weighting method of TF-IDF. In this paper, we modified TF-algorithm to calculate the accuracy of unstructured data. Finally, our system proposes a competent web pages search crawling algorithm, which is derived from TF-IDF and RL Web search algorithm to enhance the searching efficiency of the relevant information. In this paper, an attempt has been made to research and examine the work nature of crawlers and crawling algorithms in search engines for efficient information retrieval.