• 제목/요약/키워드: Retrieval Efficiency

검색결과 324건 처리시간 0.026초

An Automatic and Scalable Application Crawler for Large-Scale Mobile Internet Content Retrieval

  • Huang, Mingyi;Lyu, Yongqiang;Yin, Hao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권10호
    • /
    • pp.4856-4872
    • /
    • 2018
  • The mobile internet has grown ubiquitous across the globe with the widespread use of smart devices. However, the designs of modern mobile operating systems and their applications limit content retrieval with mobile applications. The mobile internet is not as accessible as the traditional web, having more man-made restrictions and lacking a unified approach for crawling and content retrieval. In this study, we propose an automatic and scalable mobile application content crawler, which can recognize the interaction paths of mobile applications, representing them as interaction graphs and automatically collecting content according to the graphs in a parallel manner. The crawler was verified by retrieving content from 50 non-game applications from the Google Play Store using the Android platform. The experiment showed the efficiency and scalability potential of our crawler for large-scale mobile internet content retrieval.

농촌어메니티자원 검색을 위한 온톨로지 활용방안 (Ontology-based Information Retrieval Algorithm in Rural Amenity Resources)

  • 이지민;박미정;이정재
    • 한국농공학회:학술대회논문집
    • /
    • 한국농공학회 2005년도 학술발표논문집
    • /
    • pp.450-455
    • /
    • 2005
  • Effective information "query and retrieval" process is one of the fundamental problems in the field communication and information science and has become especially important due to dramatic increase in magnitude of information to be processed in modern era. Of particular importance at information exchange process, our study focuses on compositions of proper queries and retrieval of rural amenity resources. This particular task has been difficult because the rural amenity resources does not necessarily carry measurable traits and also contains huge amount of data. In this Letter, we propose an alternative approach to the architecture of the resource information system by use of a noble retrieval algorithm based on ontology. Test of efficiency and applicability of this new scheme was conducted, and it showed that this has possibility to be effective information retrieval process of rural amenity resources.

  • PDF

애니메이션을 이용한 전기 안전 교육용 모바일 에이전트 기반 비디오 검색 시스템 (A Video Retrieval System for Animation Using Electric Safety Education Based on Mobile Agent)

  • 조현섭;민진경;유인호
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.320-323
    • /
    • 2006
  • Recently, retrieval of various video data has become an important issue as more and more multimedia content services are being provided. To effectively deal with video data, a semantic-based retrieval scheme that allows for processing diverse user queries and saving them on the database is required. In this regard, this paper proposes a semantic-based video retrieval system that allows the user to search diverse meanings of video data for electrical safetyrelated educational purposes by means of automatic annotation processing. If the user inputs a keyword to search video data for electrical safety-related educational purposes, the mobile agent of the proposed system extracts the features of the video data that are afterwards learned in a continuous manner, and detailed information on electrical safety education is saved on the database. The proposed system is designed to enhance video data retrieval efficiency for electrical safety-related educational purposes.

  • PDF

A Study on Effective Internet Data Extraction through Layout Detection

  • Sun Bok-Keun;Han Kwang-Rok
    • International Journal of Contents
    • /
    • 제1권2호
    • /
    • pp.5-9
    • /
    • 2005
  • Currently most Internet documents including data are made based on predefined templates, but templates are usually formed only for main data and are not helpful for information retrieval against indexes, advertisements, header data etc. Templates in such forms are not appropriate when Internet documents are used as data for information retrieval. In order to process Internet documents in various areas of information retrieval, it is necessary to detect additional information such as advertisements and page indexes. Thus this study proposes a method of detecting the layout of Web pages by identifying the characteristics and structure of block tags that affect the layout of Web pages and calculating distances between Web pages. This method is purposed to reduce the cost of Web document automatic processing and improve processing efficiency by providing information about the structure of Web pages using templates through applying the method to information retrieval such as data extraction.

  • PDF

Shannon의 정보이론과 문헌정보 (Shannon's Information Theory and Document Indexing)

  • 정영미
    • 한국문헌정보학회지
    • /
    • 제6권
    • /
    • pp.87-103
    • /
    • 1979
  • Information storage and retrieval is a part of general communication process. In the Shannon's information theory, information contained in a message is a measure of -uncertainty about information source and the amount of information is measured by entropy. Indexing is a process of reducing entropy of information source since document collection is divided into many smaller groups according to the subjects documents deal with. Significant concepts contained in every document are mapped into the set of all sets of index terms. Thus index itself is formed by paired sets of index terms and documents. Without indexing the entropy of document collection consisting of N documents is $log_2\;N$, whereas the average entropy of smaller groups $(W_1,\;W_2,...W_m)$ is as small $(as\;(\sum\limits^m_{i=1}\;H(W_i))/m$. Retrieval efficiency is a measure of information system's performance, which is largely affected by goodness of index. If all and only documents evaluated relevant to user's query can be retrieved, the information system is said $100\%$ efficient. Document file W may be potentially classified into two sets of relevant documents and non-relevant documents to a specific query. After retrieval, the document file W' is reclassified into four sets of relevant-retrieved, relevant-not retrieved, non-relevant-retrieved and non-relevant-not retrieved. It is shown in the paper that the difference in two entropies of document file Wand document file W' is a proper measure of retrieval efficiency.

  • PDF

과학기술문헌 데이터베이스의 검색효율 향상을 위한 색인 보완 방안 (A Study on Adding Index Terms for improving the retrieval efficiency of the STI database)

  • 김병규;김태중;강무영;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.293-294
    • /
    • 2011
  • ISTI는 국내에서 발간되는 과학기술 학술논문을 가공해서 데이터베이스로 구축, 제공하고 있으며 그 규모는 2010년에 100만건을 넘어서고 있다. 규모가 늘어남에 따라 체계적인 주제 분류 등 검색의 효율화를 위한 부가적인 가공이 필요하다. 전통적으로 정보를 가공하는 방법으로 초록화, 분류, 색인, 추록화 등을 혼용하여 사용하고 있다. 이 가운데 색인과 분류는 특히 정보 검색에 유용한 도구로 활용되고 있다. 이 논문에서는 기 구축된 과학기술문헌 데이터베이스에 분류 코드와 색인어를 부여하여 검색효율을 향상시키기 위한 방안을 제안한다.

  • PDF

객체의 모양 변화를 이용한 동작 표현 및 검색 방법 (A Method of Describing and Retrieving Movement of an Object by Using the Shape Variation of an Object)

  • 최민석
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.15-21
    • /
    • 2022
  • 동영상의 내용 기반 검색에 있어 객체의 움직임에 대한 정보는 내용의 분류와 구분에 있어 중요하게 이용될 수 있다. 특히 사람의 동작을 분석하고 구분하는 것은 검색뿐 아니라 다양한 분야에 활용할 수 있다. 본 논문에서는 객체의 움직임에 따라 변화하는 모양 정보를 이용하여 동작을 표현하고 구분하기 위해 제안된 모양 변화 기술자와 모양 시퀀스의 성능을 높이는 방법을 제안한다. 변화하는 객체의 모양 정보를 더 효율적으로 표현하기 위한 모양 기술자의 선택과 유사도 측정을 위해 사용되는 거리함수의 비교를 통하여 동작 정보의 표현 및 검색 효율을 높일 수 있도록 하였다. 실험을 통하여 제안된 방법이 기존의 방법에 비해 더 효율적으로 동작 정보를 표현하여 검색의 성능을 높일 수 있음을 보였다.

초등학생의 인지양식에 따른 검색전략비교 (A Comparison of Information Retrieval Strategies according to cognitive patterns in Elementary Students)

  • 윤미소;김한일
    • 컴퓨터교육학회논문지
    • /
    • 제6권3호
    • /
    • pp.143-150
    • /
    • 2003
  • 인터넷에 많은 정보가 있지만, 검색자가 자신이 필요한 정확한 정보를 찾기는 쉽지 않다. 따라서 정보 효율적으로 수집, 분석, 활용하는 능력을 길러주는 교육이 요구된다. 일반적으로 검색자들은 저마다의 방법을 통해 정보 검색 과정을 수행하므로, 이때 검색된 결과물은 개인에 따라 상이하게 나타난다. 본 연구는 초등학생의 정보 검색 활동을 관찰하여 검색자의 개인별 특성, 특히 인지 양식에 따른 정보 검색 전략과 검색 결과의 차이를 분석한다. 또한 이를 통해 정보 검색 능력 신장 및 정보 검색 시스템의 효율성 제고를 위한 교육 방안을 제안한다.

  • PDF

사물인터넷에서 소셜 네트워크 사용자 친밀도를 이용한 점진적 검색 기법 (Progressive Retrieval Method using Intimacy between SNS Users in Internet of Things)

  • 김성림;권준희
    • 디지털산업정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.1-10
    • /
    • 2018
  • Social network services allow you to share your thoughts and preferences more easily. They share your views with a large number of people who are friends with you without restriction of time or place. In the IoT environment, the amount of data is massively increasing as social network services spread rapidly. This change in the environment is driving the need for research into new retrieval methods that are different from conventional retrieval methods. In this paper, we propose a progressive retrieval method using the intimacy of social network users in the IoT. The first thing is to extract the user with the highest intimacy by using the property that the number of the owner of the information stored in the IoT environment is small. By accessing information in objects owned by these extracted users, the amount of information retrieved is reduced. It also improves retrieval efficiency by gradually retrieving information according to the user's level of interest. We present a new retrieval method and algorithm. The scenario also illustrates the effectiveness of the proposed method.

자동서고의 자료 수장 효율성에 관한 연구 (A Study on the Retention Efficiency of Library Materials of Automated Storage and Retrieval System)

  • 김영석
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.437-456
    • /
    • 2015
  • 본 연구의 목적은 선행연구에서 밝혀진 자동서고의 자료 수장 효율을 다른 유형의 서고와 비교 분석하는데 있다. 국내외의 대학도서관은 장서 증가에 따라 자료 수장 효율을 높이기 위한 방안으로 자동서고시스템을 도입하였다. 선행연구에 의하면 자동서고는 개가제 서고나 고정서가형 및 이동서가형 보존서고보다 자료 수장 효율이 높다. 본 연구는 우리나라 S대학교도서관 자동서고의 자료 수장량을 개가제 서고와 가상의 고정서가 형 및 이동서가형 보존서고의 수장량과 비교하였다. 조사결과 자동서고는 개가제 서고보다 최대 6배, 고정서가형 보존서고보다 최대 3.61배 그리고 이동서가형 보존서고보다 최대 1.45배 높은 것으로 나타나, 선행연구에서 밝혀진 것보다는 자료 수장 효율이 낮았다.